alex_aldo - Fotolia
Stockage : Hammerspace unifie les données des succursales
La startup présente dans un répertoire local les documents hébergés sur une multitude de sites. En éliminant toutes les contraintes de synchronisation, cette approche favoriserait les collaborations distantes.
Présenter tous les fichiers comme s’ils étaient réunis sur un seul NAS local, alors qu’ils sont en réalité éparpillés dans les succursales, en cloud, sur des architectures différentes. Telle est la promesse de Global Data Environment (GDE), un logiciel mis au point par la startup californienne Hammerspace. Celle-ci est née en 2018 des cendres de Primary Data, une autre startup qui avait déjà essayé de développer un concept similaire, sans jamais y parvenir. Hammerspace estime qu’il réussira là où Primary Data a échoué, car, entretemps, les entreprises ont basculé dans les problématiques du cloud hybride et du télétravail.
David FlynnPDG d’Hammerspace
« Ce qu’il y a de compliqué aujourd’hui pour les entreprises, c’est le fait que le stockage et les utilisateurs soient distribués sur plusieurs sites, dans plusieurs filiales. Nous apportons un accès et une orchestration globale, en unifiant toutes les données dans un système de fichier global. Ce système de fichiers global abstrait toutes les ressources de stockage, où qu’elles se trouvent physiquement », lance, dans un discours que l’on sent répété depuis des années, David Flynn, le PDG d’Hammerspace.
DataSphere, le logiciel que Primary Data n’a jamais réussi à commercialiser, avait juste pour ambition de casser les silos géographiques entre tous les NAS que pouvait posséder une entreprise. GDE, son descendant, enrichit la promesse de départ en regroupant dans une même fenêtre les données en NAS, mais aussi celles hébergées par des systèmes objets et celles en production sur des baies SAN, en mode bloc. Il ne s’agit plus seulement de réunir les informations. Il s’agit d’uniformiser l’administration du stockage dans un contexte où, d’ordinaire, tantôt on navigue dans des dossiers et tantôt on envoie des requêtes dans un moteur de recherche.
« Les entreprises ont à présent besoin d’une approche révolutionnaire dans la manière d’accéder aux données. Notre solution consiste à casser les contraintes techniques imposées par la multitude des possibilités de stockage. En faisant cela, nous soulageons les équipes informatiques des tâches infinies qu’elles doivent accomplir pour marier leurs solutions de stockage, » argumente le PDG.
Sur le plan marketing, DataSphere se voulait une « plateforme de gestion des données ». GDE est désormais présenté comme un stockage virtuel pour le cloud hybride, ou, en version originale, un « Software-Defined Hybrid Cloud Storage. »
Un Control Plane pour synchroniser l’état des données sur chaque site
Côté utilisateur, il suffit de se connecter au système pour accéder à toutes les données. Qu’elles soient hébergées à Paris, à Marseille, à New York ou chez AWS, chez Azure, chez GCP, elles apparaissent dans les mêmes dossiers que ceux présentés par un NAS sur le réseau local. L’accès se fait en NFS ou en SMB, pour les collaborateurs, comme pour les applications, mais aussi via des pilotes CSI si les données doivent être lues ou écrites par des clusters de containers Kubernetes. En revanche, il n’est pas encore possible d’y accéder en S3 et, ce, même si des données sont bel et bien hébergées par un service S3.
David FlynnPDG d’Hammerspace
Côté cuisine interne, chaque site d’utilisateurs, ou de serveurs applicatifs, passe par un « Control Plane », un serveur qui indexe l’endroit réel où se trouve chaque donnée et apporte des fonctions de stockage de haut niveau, comme on en trouve sur les baies NAS. En tant que gardien des accès, le Control Plane rapatrie dans son cache local les fichiers les plus susceptibles d’être utilisés pour accélérer leur lecture à un instant T.
Il se charge aussi de les compresser, de les chiffrer, de les dédupliquer. Il synchronise les écritures avec la source, clone des fichiers si plusieurs versions doivent coexister, produit des sauvegardes, des archives immuables, permet de revenir à une version précédente en cas d’erreur humaine. Il sait aussi passer les données au crible d’un antivirus et produire des audits.
Toutes les informations de fonctionnement du Control Plane sont contenues dans une base de métadonnées. Cette base est synchronisée en permanence entre tous les Control Planes que l’entreprise a déployés sur ses sites.
Sur chaque site, le Control Plane prend la forme d’un double serveur – pour des questions de redondance. Ces deux serveurs peuvent fonctionner directement sur deux machines physiques ou en machines virtuelles. Les applications en cloud passent, elles aussi, par un double Control Plane qui, dans leur cas, correspond à une double machine virtuelle hébergée dans le même cloud.
Permettre à toutes les succursales de travailler sur les mêmes documents
Floyd Christofferson, chef produit d’Hammerspace, illustre les fonctions de GDE avec un cas d’usage, celui des studios d’animation canadiens Global GFX. Cette entreprise aurait des animateurs répartis sur toute la surface du globe pour assurer une production en continu. Grâce à GDE, les animateurs se loguent sur les travaux en cours quand le soleil se lève chez eux, puis, en fin de journée, laissent leurs collègues installés plus à l’ouest prendre la relève. « Tous collaborent comme s’ils étaient dans la même pièce, alors que plusieurs fuseaux horaires les séparent. »
« Grâce à GDE, Global GFX a gagné en agilité et a pu remporter de nombreux contrats, notamment sur des séries où il faut savoir produire des épisodes dans des délais très contraints », dit-il.
« L’idée de produire en continu en suivant le soleil n’est pas neuve. Mais, auparavant, ils utilisaient l’outil Rsync pour synchroniser les travaux entre tous les fuseaux horaires et se heurtaient à de nombreuses contraintes techniques, dues à la multitude de baies de stockage, différentes sur chaque site. À cause des tâches d’administration qu’il fallait effectuer entre chaque site, le rythme de travail était saccadé. GDE a éliminé ces tâches d’administration. Les fichiers passent d’un fuseau horaire à l’autre de manière transparente. »
Selon Floyd Christofferson, Hammerspace aurait déjà plusieurs clients dans les secteurs des télécoms, des médias et des banques. « Cependant, nous considérons les besoins de toutes les entreprises qui ont entendu que le cloud serait un bon moyen pour faire collaborer leurs succursales, mais qui découvrent que cette promesse n’est pas tenue dès lors que l’on parle de documents qui doivent être accessibles à chacune de ces succursales », conclut-il.