Cohesity propose de traiter les données dormantes pour ne pas pénaliser la production
La nouvelle version 6.4 de DataPlatform sait installer des applications sur les nœuds de stockage secondaires afin de lancer des traitements sur les données fraîches mais peu sollicitées qui se trouvent dans les sauvegardes.
Et si les sauvegardes, plutôt que végéter en attendant une hypothétique restauration, se rendaient utiles ? Telle est l’idée que Cohesity vient d’implémenter dans DataPlatform 6.3, la dernière version de son système de stockage en cluster qui doit sortir ce mois-ci.
« Le problème des sauvegardes est qu’elles occupent de la place en permanence alors qu’elles ne servent que de temps en temps lorsqu’il est nécessaire de récupérer des données. Nous avons donc imaginé proposer à nos clients et partenaires un SDK pour développer des applications exploitant les métadonnées de notre stockage afin de lancer des traitements sur ces informations dormantes mais perpétuellement à jour, plutôt qu’aller ralentir celles en production », explique au MagIT Christophe Lambert, le directeur technique de Cohesity pour la zone EMEA.
Selon lui, l’idée avait été lancée par un client de Cohesity qui souhaitait analyser les archives de sa vidéo-surveillance sans toutefois impacter les performances de ses serveurs de production, occupés à enregistrer et diffuser en permanence une multitude de flux vidéo.
Sondes Splunk, conformité RGPD et anti-ransomwares constituent les premières fonctions
La technologie faisant ses premiers pas, les applications ne sont pas encore nombreuses mais remplissent des fonctions courantes. Dès qu’ils auront installé la dernière version du système, les clients de Cohesity pourront ainsi télécharger gratuitement depuis une marketplace : des antivirus qui détectent et éliminent les ransomwares qui se seraient insinués dans les sauvegardes, un agent Splunk pour effectuer divers diagnostics, Imanis Data qui crée des backups lisibles par différentes bases analytiques NoSQL, ou encore les logiciel Cohesity Spotlight et Insight qui servent à vérifier que les droits d’accès et les contenus sauvegardés sont conformes au RGPD.
Le fournisseur propose en outre la plateforme EasyScript pour que les responsables informatiques puissent créer simplement des scripts Python qui interfacent les métadonnées de Cohesity avec d’autres solutions d’administration système. Les développeurs disposent quant à eux d’un SDK complet pour bâtir des applications, éventuellement commerciales.
« Nos premiers retours indiquent que nos clients se serviront de cette nouvelle fonction pour réaliser divers reportings métier ou, au niveau des DSI, pour traiter des données de manière transversale entre les silos, puisque nos solutions de stockage servent le plus souvent à consolider plusieurs sauvegardes », indique Christophe Lambert.
Un stockage scale-out pour les données froides
Lancé en 2013 par le cofondateur de Nutanix et ex-créateur du système de fichiers de Google, Cohesity est une sorte d’Isilon du stockage secondaire, qui mise plus sur la capacité que sur les performances. A l’instar de OneFS chez Isilon, son système de fichiers SpanFS distribue son espace de stockage sur plusieurs nœuds, assure la redondance d’informations en cas de défaillance, indexe ses contenus au moyen de métadonnées (ici, une base NoSQL) et partage l’ensemble comme un NAS très volumineux sur le réseau.
À la différence de OneFS, SpanFS n’est pas limité aux nœuds physiques et peut intégrer à sa capacité de l’espace de stockage en cloud ; il dispose à ce titre de fonctions de réplications qui permettent de continuer l’activité depuis un site distant ou depuis un cloud en cas d’incident. En plus des classiques NFS et SMB, il partage aussi ses contenus via le protocole objet S3 sur lequel se greffent les applications web, ou des moteurs de recherche.
SpanFS fait partie du système plus global DataPlatform qui donne aussi accès aux fonctions d’administration (attribution/déduplication/réplication/monitoring des espaces de stockage), dont une fonction SnapTree qui permet de déployer des clones de contenus afin, par exemple, de tester des projets avec des données réelles.
L’ensemble est proposé soit sous la forme d’un package logiciel qui s’accapare des nœuds physiques de marque HPE, Dell ou Cisco pour en faire des appliances, soit sous la forme de machines virtuelles. En option, la console SaaS Helios permet de centraliser l’administration de plusieurs Clusters Data Platform situés sur plusieurs sites ou en cloud.
Même si un cluster DataPlatform est capable de remplir toutes les fonctions d’un NAS, la grande scalabilité de la solution alliée à son absence d’efforts particulier sur les performances l’ont plutôt cantonnée jusqu’ici au stockage des sauvegardes Veeam, Veritas et autres Data Domain. Cohesity édite d’ailleurs lui-même une solution de backup, DataProtect, ce qui achève de le rapprocher de son concurrent Rubrik, lui aussi fournisseur d’une solution de stockage Scale-out plutôt spécialisée en sauvegardes.
Cohesity n’étant pas encore côté en bourse, il est difficile d’avoir des détails sur sa santé financière. Des sources externes indiquent toutefois que 50 % de son activité se ferait en Europe auprès d’une centaine de grands comptes. La France serait son troisième marché européen, juste derrière le Royaume-Uni et l’Allemagne.