New Africa - stock.adobe.com

Quel rôle joue l’open source dans les solutions de stockage ?

Les communautés Open source planchent sur de nombreuses solutions de stockage, avec le renfort des fournisseurs commerciaux. Tour d’inventaire.

En 2016, plusieurs entreprises ont fédéré leurs efforts pour relever un défi majeur que leur posait la gestion du stockage. Le pool de stockage à gérer était tellement hétérogène qu’il empêchait le déploiement de services adéquats. À cette époque, le groupe constitué de Dell EMC, Fujitsu, Hitachi, Huawei, Intel et Vodafone participait au projet OpenSDS (stockage à définition logicielle Open source), lancé à l’initiative de la Linux Foundation, de façon à créer une communauté qui réglerait ces problèmes avec des normes.

« Comme aucun client ne fait appel qu’à un seul fournisseur en matière de stockage, il était question de créer une plateforme – ou un framework – permettant de relier les différentes formes de stockage et de collaborer au niveau de la surveillance et du déploiement », explique Steven Tan, président de la Soda Foundation, constituée en juin 2020 pour étendre la portée du projet OpenSDS.

Alors que l’OpenSDS était à l’origine du stockage virtualisé, qui fédère plusieurs systèmes de stockage, la Soda Foundation va plus loin en développant un écosystème d’outils et de solutions de gestion de données Open source, de la périphérie – c’est-à-dire depuis les succursales d’une entreprise, avec leurs serveurs d’appoint que l’on appelle edge computing – jusqu’au cloud.

La fondation Soda, acronyme récursif de Soda Open Data Autonomy, œuvre à la mobilité des données. Elle chapeaute sept projets importants visant à offrir différentes solutions, comme la gestion de l’infrastructure, la gestion des données multicloud et les interfaces de programmation (API).

« Selon moi, le but ultime de l’OpenSDS et de la Soda Foundation est de convaincre chacun de collaborer pour arriver à une solution », précise Steven Tan ; ajoutant que Soda constitue un cadre neutre suffisamment flexible pour que chaque utilisateur ou fournisseur puisse l’adapter ou l’étendre en fonction de ses besoins.

Le fait est que des communautés d’utilisateurs et d’importants fournisseurs de logiciels et de stockage Open source ont emboîté ce pas, qu’ils travaillent ou non dans le cadre de la Soda.

L’informatique de périphérie (« edge ») tire les développements

« Compatible avec n’importe quelle distribution Kubernetes, Longhorn facilite, accélère et garantit la fiabilité du déploiement d’un stockage persistant en blocs haute disponibilité dans votre environnement Kubernetes […]. »
Vishal GhariwalaCTO région Asie-PAcifique, Japon et Chine, SUSE

C’est sous l’égide de Rancher Labs, par exemple, que s’est développé le projet Open source Longhorn. Il vise à fournir une plateforme de stockage distribuée dite « cloud-native », c’est-à-dire pour Kubernetes.

« Compatible avec n’importe quelle distribution Kubernetes, Longhorn facilite, accélère et garantit la fiabilité du déploiement d’un stockage persistant en blocs haute disponibilité dans votre environnement Kubernetes, qu’il se trouve sur les architectures x86 ou ARM64 du centre de données, du cloud public ou des succursales », souligne Vishal Ghariwala, directeur technique (CTO) chez SUSE pour la région Asie-Pacifique, Japon et Chine.

SUSE, qui a fait l’acquisition de Rancher Labs en 2020, contribue encore activement au projet de stockage Longhorn. Il en a transmis la tutelle à la Cloud Native Computing Foundation (CNCF) sous forme de projet sandbox (c’est-à-dire « de laboratoire »). La CNCF est la fondation qui a la tutelle de Kubernetes.

SUSE, qui édite le Linux éponyme, est un spécialiste des questions de stockage puisqu’il contribue dans le même temps à Ceph. Cette technologie Open source, déjà déployée dans les datacenters depuis quelques années, propose à la fois les trois types de protocoles classiques du stockage : en mode objet, bloc et fichier.

Mais revenons au stockage pour l’informatique edge, qui a incité plusieurs fournisseurs de solutions commerciales pour le datacenter à rejoindre des développements Open source. NetApp, ainsi, contribue à la Soda Foundation, en intégrant dans KubeEdge – une mini-distribution Kubernetes – la prise en charge du mode fichiers de son système de stockage propriétaire OnTap. Dell, de son côté, contribue à la parie stockage de StarlingX, une version allégée du système Open source d’infrastructure virtualisée OpenStack, plutôt destinée aux équipements informatiques des sites de production (usines, lieux événementiels).

En 2019, Dell a aussi transmis un code prototype à la Linux Foundation dans le cadre du projet Alvarium. Celui-ci vise à transmettre les données entre équipements et applications avec un degré de confiance mesurable. Dell a également conçu le projet Nautilus, une solution de stockage capable d’analyser et de diffuser les données en temps réel. Construite à partir de zéro, elle sert de socle aux sites de streaming signés numériquement.

Les avantages du stockage Open source

Matthew Hurford, responsable de l’ingénierie des solutions et directeur technique de NetApp pour la région Asie-Pacifique, voit l’accès à l’innovation comme le principal avantage du stockage Open source.

« La communauté des logiciels open source tire parti d’un vaste réservoir de talents technologiques du monde entier. »
Mathew HurfordResponsable ingénierie des solutions et directeur technique NetApp, région Asie-Pacifique

« La communauté des logiciels open source tire parti d’un vaste réservoir de talents technologiques du monde entier », affirme-t-il. « Résolument prêts à relever les défis, ces talents contribuent aux codes Open source existants. La collaboration, principe fondamental des communautés open source, fait naître un cercle vertueux selon lequel les logiciels créés s’améliorent au fil du temps, au gré des révisions collectives des différents contributeurs. »

Pour Apache Spark par exemple, on compte plus de 2 000 développeurs et plus de 3 000 validations chaque année. Il aurait fallu pas loin de 270 ans pour développer Spark en dehors d’une initiative Open source. Pour Linux, on parle de 23 000 développeurs et de 75 000 validations pour les 12 derniers mois seulement.

« Chez NetApp, nous continuerons à contribuer aux communautés et aux projets Open source, comme la CNCF (Kubernetes, Helm et Istio), le noyau Linux et bien d’autres », poursuit Matthew Hurford.

Autre avantage de taille : le délai de commercialisation est plus court. Les processus métier gagnent en agilité grâce à une automatisation et une gestion efficaces des données. Il est possible de modifier rapidement les produits et ainsi d’en accélérer le déploiement.

« L’intégration continue et le déploiement continu en sont de parfaits exemples, » constate Matthew Hurford. « En outre, l’open source peut être personnalisé en fonction des besoins des entreprises. En raison de sa modularité, les fournisseurs n’ont aucun mal à ajuster le code. L’Open source peut alors fonctionner de manière aussi complète que les logiciels propriétaires à n’importe quel niveau de la pile de l’entreprise. »

Selon Vishal Ghariwala, l’Open source laisse la part belle à l’agilité et à la flexibilité. Lors de la définition d’une architecture logicielle pour le stockage et la gestion des données, par exemple, les entreprises ont la liberté de choisir les technologies Open source issues de plusieurs fournisseurs, plutôt que de dépendre d’un seul d’entre eux.

« Vous avez aussi la possibilité de passer à un autre fournisseur Open source offrant des capacités similaires, pour des raisons de coûts, de technologies ou d’enjeux commerciaux. C’est le cas, par l’exemple, lors du rachat d’un fournisseur Open source par un fournisseur de plus grande envergure qui n’entretient pas avec le client les mêmes relations commerciales », explique-t-il. « En cas de solutions propriétaires, ce niveau d’agilité et de disponibilité ne peut être atteint que si vous utilisez les solutions de ce même fournisseur ou de certains de ses partenaires exclusifs. »

Les points à retenir avant l’adoption

Si le stockage des données Open source est plus économique, il reste toutefois une grande différence entre télécharger un projet gratuitement, l’essayer sur une machine de développeur, et mettre en œuvre des applications stratégiques dont la stabilité, la haute disponibilité et la sécurité constituent des impératifs.

Vishal Ghariwala précise que les entreprises auront besoin de solides ressources techniques pour mettre au point une solution qui satisfasse les exigences de leurs applications critiques. Cela peut s’avérer très complexe pour bon nombre d’entreprises.

En outre, la flexibilité, qui est loin d’être garantie en cas d’utilisation de technologies Open source, peut constituer un deuxième défi. Selon Vishal Ghariwala, le problème se pose généralement lorsque les fournisseurs ne prennent en charge que leurs propres technologies quand ils commercialisent des solutions Open source. Se crée alors une sorte d’enfermement qui empêche l’entreprise de choisir le système le mieux adapté à ses besoins.

Danny Elmarji, vice-président avant-vente chez Dell Technologies pour la région Asie-Pacifique et Japon, souligne que certains de ses clients assemblent eux-mêmes des solutions de stockage logicielles à partir de briques Open source. Ces entreprises disposent des capacités et des talents voulus pour prendre en charge, concevoir, créer et maintenir leur pile stockage personnalisée. Pour autant, elles peinent systématiquement à intégrer ces couches de stockage à leurs plateformes matérielles, à gérer leur cycle de vie et à en assurer la maintenance.

Cyber-résilience

« Pour s’inscrire dans la durée, les offres de stockage et de gestion des données doivent afficher des qualités immuables ; l’efficacité, la performance, le débit et la résilience face aux incidents. »
Danny ElmarjiV-P avant-vente, Dell Technologies région Asie-Pacifique et Japon

Compte tenu de la hausse incessante des cybermenaces depuis 2020, Danny Elmarji invite aussi les entreprises à tenir compte de la cyber-résilience lors de l’adoption de projets Open source. « Pour s’inscrire dans la durée, les offres de stockage et de gestion des données doivent afficher des qualités immuables ; l’efficacité, la performance, le débit et la résilience face aux incidents font toujours partie des critères de premier plan à prendre en compte lors de la décision d’achat », rappelle-t-il.

Pour tirer parti d’un logiciel de stockage Open source, Matthew Hurford explique que les entreprises doivent déterminer si le logiciel prend en charge un environnement hybride et multicloud, s’intègre facilement avec Kubernetes et offre la capacité d’évolution requise.

Par ailleurs, il leur faut aussi veiller à optimiser l’espace lors de la protection et de l’archivage des données.

« Une solution complète de gestion du stockage dans le cloud permet une utilisation et une intégration immédiates avec les ressources dans le cloud et sur site », déclare M. Hurford. « Ainsi, vous accélérez la mise en place d’un service de fichiers et limitez la charge de travail et les coûts liés à la maintenance de la solution. »

Pour approfondir sur Stockage de conteneurs