Cet article fait partie de notre guide: Le Stockage Objet, l’autre révolution du stockage

Les avantages de l’utilisation d’un système de stockage objet

Découvrez les avantages de la mise en œuvre d’un système de stockage en mode objet dans votre environnement de stockage de données.

Les systèmes de stockage objet deviennent une alternative viable au stockage scale-out rattaché au réseau (ou scale-out NAS) grâce à leurs caractéristiques suivantes : évolutivité illimitée, importance moindre accordée au traitement et aux réseaux haut débit, accès via des protocoles Internet plutôt que par commandes de stockage, métadonnées personnalisées et compatibilité avec des composants prêts à l’emploi.

Les anciens systèmes en mode fichier ou bloc sont maintenant remplacés par des systèmes de stockage en mode objet, en particulier lorsqu’il s’agit de stockage en cloud public ou privé. Dans cet article spécialisé, Jacob N. Gsoedl explique en détail le fonctionnement des systèmes de stockage orientés objet et montre comment ils sont devenus les composants fondamentaux d’une infrastructure de stockage en cloud.

Comparaison entre stockage objet et stockage traditionnel

Stockage

Étant donné le choix de systèmes de stockage en modes bloc et fichier qui s’offre déjà à nous, la question qui s’impose est : pourquoi faire appel à une autre technologie de stockage ? Les modes bloc et fichier étant à la fois évolués et éprouvés, on pourrait croire qu’il suffirait de les améliorer encore pour répondre aux besoins d’un écosystème informatique de plus en plus distribué et optimisé pour le Cloud.

Avec le stockage en mode bloc, l’accès aux blocs des disques se fait par l’intermédiaire de protocoles de stockage basiques, tels que les commandes SCSI, à peu de frais et sans couche d’abstraction supplémentaire. C’est la méthode la plus rapide d’accès aux données placées sur disques, tandis que toutes les tâches plus complexes, comme l’accès multiutilisateur, le partage, le verrouillage et la sécurité sont généralement dévolues aux systèmes d’exploitation. En d’autres termes, le stockage en mode bloc s’occupe de toute la tuyauterie interne, mais dépend d’applications de plus haut niveau pour tout le reste. Chaque système de stockage objet comporte un noeud de stockage en mode bloc, la pile logicielle de stockage objet assurant toutes les autres fonctionnalités.

Si le stockage en mode bloc peut être considéré comme complémentaire au stockage objet, le stockage en mode fichier en serait un concurrent direct. Les systèmes scale-out NAS peuvent revendiquer l’attribut clé de l’évolutivité puisque, au même titre que les systèmes de stockage en mode objet, ils s’étendent horizontalement par l’ajout de noeuds. Mais comme ils reposent sur des structures de fichier hiérarchiques avec un espace de noms restreint, ils sont moins souples que le stockage purement objet, dont la structure linéaire, évolutive pratiquement à l’infini, n’est en effet limitée que par le nombre de bits de l’ID d’objet. Ceci étant, les systèmes scale-out NAS partagent un grand nombre des caractéristiques du stockage objet, et les fournisseurs s’empressent d’ajouter les fonctionnalités qui leur font défaut comme la prise en charge du protocole de transfert d’état représentatif (REST), afin de pouvoir classer leurs systèmes scale-out NAS dans les rangs du stockage objet. « Avec le stockage HP Ibrix X9000 qui prend en charge WebDAV, REST, en plus de CIFS, de NFS et de l’évolutivité massive, nous nous plaçons incontestablement comme leader sur le marché du stockage objet »,  affirme Patrick Osborne, chef de produits à la division Stockage de Hewlett-Packard (HP).

Définition du stockage objet

Chacun l’interprétant à sa façon, il n’existe pas de définition universellement reconnue du stockage objet. Ainsi, pour déterminer dans quelle mesure un système de stockage est orienté objet, il faut distinguer les attributs indispensables de ceux qui ne sont qu’accessoires.

Les objets. Au lieu de gérer des blocs ou des fichiers, un système de stockage purement objet gère des objets. Plus précisément, tous les systèmes de stockage objet actuels gèrent des fichiers comme des objets. Ces derniers reçoivent une adresse par le biais d’un identifiant unique, un peu comme le chemin d’accès aux fichiers dans un système de stockage en mode fichier. Ces objets sont stockés dans un espace d’adressage linéaire, qui permet d’éviter les problèmes de complexité et d’évolutivité des systèmes de fichiers hiérarchiques utilisés par le stockage en mode fichier.

Les métadonnées. Les objets sont constitués, d’une part, de métadonnées qui fournissent des informations contextuelles sur les données contenues dans chaque objet et, d’autre part, d’une « charge utile », c’est-à-dire des données réelles. Dans les systèmes de stockage en mode fichier, les métadonnées se limitent aux attributs des fichiers ; dans les systèmes de stockage purement objet, elles peuvent s’enrichir d’attributs personnalisés. Pour obtenir le même résultat avec un système en mode fichier, il vous faut une application (avec une base de données) permettant de traiter les informations complémentaires relatives aux fichiers. Avec des métadonnées personnalisées, en revanche, vous pouvez stocker toutes les informations liées à un fichier (objet) dans l’objet lui-même. « Les métadonnées personnalisées permettent de créer des objets fichiers riches et autonomes qui se conservent dans la zone de stockage d’objets. Ainsi, il est possible de constituer d’énormes entrepôts de données non structurées avec un minimum de frais d’administration », indique Terri McClure, analyste senior chez Enterprise Strategy Group (ESG) à Milford, Mass.

Les objets fixes. Le stockage purement objet représente un référentiel de contenu fixe ; cela signifie que les objets peuvent être créés, supprimés et lus, mais pas mis à jour sur place. La mise à jour d’un objet s’effectue en créant une nouvelle version de cet objet. La conséquence est que les problèmes de verrouillage et d’accès multiutilisateur (le fléau des systèmes en mode fichier) ne se posent tout simplement pas avec le stockage objet. « Si plusieurs utilisateurs mettent à jour le même fichier [objet] au même moment, le système de stockage objet écrira simplement des versions différentes du fichier », souligne Tim Russell, vice-président du groupe chargé de l’écosystème du cycle de vie des données chez NetApp Inc. L’avantage de ne pas avoir à procéder à des mises à jour sur place rend le stockage objet particulièrement adapté au stockage et à l’accès distribués.

La redondance. Le stockage objet assure la redondance et la haute disponibilité en stockant des copies d’un même objet sur plusieurs noeuds. Lorsqu’un objet est créé, il l’est sur un seul noeud, avant d’être copié sur un ou plusieurs autres noeuds, en fonction des règles en vigueur. Les noeuds peuvent se trouver dans le même datacenter ou être géographiquement dispersés. L’absence de prise en charge des mises à jour sur place permet de pratiquer sans trop de complexité la redondance des objets à l’aide de copies sur plusieurs noeuds. Pour les systèmes de stockage traditionnels, la synchronisation de fichiers et blocs copiés (répliqués) entre plusieurs instances constitue un véritable casse-tête ; c’est un processus complexe qui ne peut être mené qu’au prix de restrictions très sévères, telles que les contraintes de latence définies.

La prise en charge de protocoles. Les protocoles traditionnels en modes bloc et fichier fonctionnent bien au sein du datacenter, où les performances sont correctes et la latence ne pose pas de problème. En revanche, ils ne conviennent pas en cas d’accès géographiquement distribué ni dans le Cloud, où la latence est imprévisible. Par ailleurs, les protocoles de système de fichiers classiques (CIFS et NFS) communiquent via des ports TCP qui sont accessibles sur des réseaux internes, mais rarement exposés à Internet. A l’inverse, le stockage objet est généralement accessible par le biais d’une API REST sur HTTP. Les commandes envoyées sur HTTP au stockage objet sont simples : put pour créer un objet, get pour lire un objet, delete pour éliminer un objet et list pour afficher la liste des objets.

La prise en charge et l’intégration d’applications. Puisque les protocoles de stockage de données traditionnels ne sont pas reconnus et qu’il faut passer par une API REST, des efforts d’intégration sont nécessaires pour rendre le stockage objet accessible. S’il est bien sûr possible de procéder à une intégration personnalisée, certaines applications commerciales, notamment pour la sauvegarde et l’archivage, ont ajouté des fonctions prenant en charge l’intégration du stockage objet, principalement en lien avec le stockage en cloud Amazon S3. Cependant, l’intégration du stockage objet est encore peu répandue, du fait que le secteur peine encore à s’entendre sur des normes communes. Les passerelles de stockage objet, généralement appelées passerelles de stockage en cloud, constituent un autre moyen de communiquer avec le stockage objet. A mi-chemin entre le stockage traditionnel et le stockage objet, elles acheminent les données entre les deux, généralement selon des règles prédéfinies.

Les fonctionnalités Cloud. Le stockage en cloud et les applications Web 2.0 étant les cibles privilégiées du stockage objet, les fonctionnalités liées à l’accès partagé sur Internet sont importantes. Ainsi, le multitenancy et la capacité à isoler de façon sécurisée les données d’utilisateurs différents s’avèrent incontournables pour un produit de stockage objet devant être utilisé en dehors de l’entreprise. La sécurité ne se résume pas au chiffrement et doit comprendre des dispositifs permettant de contrôler l’accès aux tenants, espaces de noms et objets. La gestion des accords de niveau de service (SLA) et la capacité à prendre en charge plusieurs niveaux de service sont des paramètres importants pour l’utilisation du Cloud. Un moteur de règles permettant d’appliquer des SLA, tels que le nombre d’instances objet et l’emplacement de stockage de chacune, constitue un mécanisme fondamental que tout produit de stockage objet doit pouvoir fournir. De plus, un suivi de l’utilisation et une analyse automatique des frais/changements sont indispensables pour le Cloud.

Le cas d’utilisation. Le stockage purement objet ne convient pas aux données transactionnelles qui sont constamment modifiées, comme les bases de données. Il n’est pas non plus conçu pour remplacer le NAS pour l’accès aux fichiers partagés car il ne possède pas les fonctionnalités de verrouillage et de partage qui garantissent l’unicité d’un fichier ; le stockage objet permet en effet de générer plusieurs versions, parfois contradictoires, d’un fichier. En revanche, le stockage objet se prête bien à l’entreposage des données non structurées rarement mises à jour. On peut mettre à profit sa grande évolutivité soit pour ajouter un niveau de stockage supplémentaire au-delà du stockage transactionnel des données inactives, soit à des fins d’archivage. Dans l’environnement du Cloud, il est parfaitement adapté aux contenus de type fichier, en particulier les images et les vidéos. « De nos jours, le stockage objet convient aux données de type post-traitement générées par les secteurs des médias, des loisirs et de la santé, ainsi qu’à l’archivage », indique Jeff Lundberg, directeur du marketing produits chez Hitachi Data Systems (HDS). « A terme, grâce à l’évolution de ses performances et fonctionnalités, il pourra prendre en charge non seulement le stockage en cloud, mais aussi les environnements informatiques distribués ». 

Les diverses approches du stockage objet

Le stockage orienté objet se classe en trois catégories :

Le stockage dédié aux contenus fixes (Content-addressed storage, CAS) : En coulisses, le CAS stocke les fichiers sous forme d’objets avec des métadonnées personnalisées et en autorise l’accès par le biais d’identifiants numériques. Conçus pour l’espace d’archivage sur disque avec une forte composante de conformité, les systèmes CAS sont généralement déployés au sein du datacenter. Ils n’ont donc pas besoin de fonctionnalités Cloud, comme l’accès distribué par Internet et le multitenancy. EMC Corp. domine le marché du CAS avec Centera, concurrencé sur le secteur des entreprises par d’autres acteurs comme Caringo Inc. Pour transformer leurs applications en systèmes de stockage objet, les fournisseurs de CAS peuvent améliorer leurs plates-formes en leur ajoutant des fonctionnalités Cloud ou créer une nouvelle plate-forme dédiée. EMC a opté pour la deuxième solution avec Atmos, sa plate-forme de stockage en cloud, tandis que Caringo a renforcé son système CAS existant, en le rebaptisant Caringo Object Storage Platform. Caringo prend en charge le multitenancy et les objets jusqu’à 1 téraoctet depuis le lancement de la version 5 de sa plate-forme de stockage objet.

« Au deuxième trimestre 2012, nous avons lancé CloudScaler, qui renforce notre plate-forme de stockage objet grâce à une interface RESTful, à des fonctions de suivi, à un contrôle d’accès amélioré et à des quotas, ainsi qu’un portail Web destiné aux administrateurs », annonce Adrian Herrera, directeur principal du marketing de Caringo. La plate-forme DX Object Storage Platform de Dell Inc. est basée sur celle de Caringo. « Bien que la plate-forme DX Object Storage Platform ait été conçue par Caringo, nous l’avons améliorée par des options d’intégration et d’autres fonctionnalités comme la déduplication Ocarina », affirme Brandon Canaday, ancien collaborateur de Dell, maintenant vice-président des comptes stratégiques chez Caringo.

Les systèmes de stockage objet de deuxième génération : La plupart des autres acteurs du domaine ont développé de toutes pièces leurs logiciels de stockage objet . Conçu pour fonctionner avec des noeuds x86 peu coûteux, chaque noeud de stockage offre à la fois des ressources de traitement et de stockage. Les capacités et les performances évoluent de manière linéaire par le simple ajout de noeuds. Le logiciel de stockage objet est généralement indépendant du matériel et se compose de services modulables : une couche de présentation qui gère l’interface avec les clients via des protocoles HTTP (REST ou SOAP), voire des protocoles de système de fichiers traditionnels ; une couche de gestion des métadonnées qui régit les emplacements de stockage des objets de données, ainsi que leur protection et leur distribution sur les noeuds de stockage ; enfin, une couche de cible de stockage qui communique avec les noeuds de stockage.

EMC commercialise son système de stockage objet Atmos comme appliance virtuelle, sous forme 100 % logicielle ou en tant que logiciel avec serveurs standard et JBODS. « La principale caractéristique d’Atmos est que chaque noeud supplémentaire ajoute des ressources au niveau de la capacité, du traitement et du réseau, et que vous pouvez en ajouter un nombre pratiquement illimité », déclare Mike Feinberg, vice-président chargé du groupe Cloud Infrastructure Group chez EMC.

En 2010, NetApp a racheté Bycast, qui développait des logiciels de stockage orienté objet, dont la technologie a inspiré NetApp StorageGrid. L’offre de NetApp en matière de stockage objet combine le logiciel StorageGrid avec les systèmes de stockage NetApp E-Series. « StorageGrid se place dans la même catégorie qu’Atmos, avec plusieurs avantages non négligeables, tels que la protection RAID dans les noeuds de stockage E-Series, qui permet d’assurer une redondance locale ainsi que plusieurs copies de reprise sur incident », indique Tim Russell, de NetApp.

Amplidata affirme que son produit de stockage objet AmpliStor allie durabilité, évolutivité et hautes performances. D’après Paul Speciale, vice-président produits d’Amplidata, « en associant notre technologie propriétaire BitSpread, un codec qui remplace les contrôleurs RAID pour assurer une durée pratiquement illimitée des données et des noeuds hautes performances capables d’utiliser des disques SSD pour la mise en cache, AmpliStor est en mesure de fournir un débit de 720 MBps par contrôleur ».

Hitachi Content Platform (HCP) combine un logiciel de stockage objet avec des baies HDS pour offrir une solution optimale, bien intégrée à la fois à Hitachi NAS Platform (anciennement BlueArc) et à d’autres systèmes de stockage HDS.

Scale-out NAS pour le Cloud : Bien que ne reposant pas sur des architectures de stockage objet, ces systèmes présentent une évolutivité horizontale par l’ajout de noeuds qui leur permet de soutenir la concurrence sur le marché du stockage objet. Comme les concepteurs de systèmes CAS, les fournisseurs de stockage scale-out NAS ajoutent des fonctionnalités de stockage objet, tels que la prise en charge du protocole HTTP. Les systèmes scale-out NAS étant, comme leur nom l’indique, du stockage rattaché au réseau déguisé en stockage objet, ils ont un avantage sur les produits de stockage purement objet dans les déploiements de cloud internes.

Conclusion

En combinant évolutivité sans précédent et accès distribué, le stockage objet s’est imposé sur le marché du stockage en cloud et du Web 2.0. Dans les datacenters d’entreprise, ces systèmes sont déployés en complément du stockage de données traditionnel, sous la forme de niveaux de stockage destinés à l’archivage et à l’agrégation de fichiers. Toutefois, le stockage objet ne représente encore qu’une infime partie du marché du stockage, toujours dominé par le stockage traditionnel en mode bloc et fichier. L’adoption généralisée de ce mode de stockage repose sur sa normalisation et son intégration aux applications, aux systèmes de stockage traditionnels et aux autres systèmes de stockage orientés objet.

 

Pour approfondir sur Stockage objet