IBM s'appuie sur GPFS et Watson pour Elastic Storage

Pour sa couche de Software-Defined Storage, Elastic Storage, IBM s'est appuyé sur plusieurs de ses technologies existantes, dont GPFS, et sur les technologies analytiques issues de Watson

IBM n’entend pas laisser à ses concurrents l’initiative sur le marché des technologies de stockage à base de logiciel dites Software-defined Storage. Big Blue a récemment dévoilé un nouvel ensemble de technologies, baptisé Elastic Storage, qui s’appuie sur son système de fichier parallèle GPFS (General Parallel File System) et sur les technologies analytiques développées dans le cadre de Watson.

« Le monde a besoin d’un nouveau type de stockage capable de déplacer automatiquement des données en local et au niveau global », explique Vincent Hsu, le directeur des technologies stockage d’IBM au sein de la division STG (Systems and Technology Group). "Elastic Storage est extrêmement flexible. Son but est d’éliminer les silos de stockage en permettant un accès universel aux fichiers de données. Il est extrêmement adaptable et capable de gérer des ressources de stockage de types variés, allant de la Flash au disque en passant par la bande. »

IBM a présenté Elastic Storage une semaine après le lancement par EMC de son offre Elastic Cloud Storage (ECS) qui incorpore sa technologie ViPR. ECS et Elastic Storage ont en commun leur aptitude à supporter à la fois des accès au stockage en mode fichiers, blocs et objet et agissent comme une couche d’abstraction entre les applications et le stockage physique.

Elastic Storage agit comme un plan de contrôle intelligent qui gère les données. Le système peut déplacer automatiquement des données dormantes ou accédées peu fréquemment vers une couche de stockage moins coûteuse tout en laissant disponibles les ressources les plus rapides et les plus coûteuses pour les données « chaudes ». Les politiques de déplacement sont pilotées via une couche analytique qui prend en compte les modèles d’usage, les caractéristiques du stockage et la charge réseau pour déterminer quand, comment et où déplacer les données.

Le système incorpore aussi des mécanismes de protection de données tels que le snapshot et la sauvegarde automatiques. Le logiciel gère les copies de données, en utilisant une copie pour les snapshots et la réplication. Cela permet de réduire la quantité de stockage consommée et de réduire les coûts. Elastic Storage supporte l’API OpenStack Swift pour permettre aux utilisateurs de gérer et d’accéder à leurs données depuis des clouds privés comme publics. Le logiciel supporte aussi HDFS.

Elastic Storage embarque enfin des capacités de chiffrement natives ainsi que des fonctions d’effacement sécurisé de données et sait utiliser des caches Flash locaux pour accroître les performances I/O.

« L’idée d’Elastic Storage est de permettre aux applications de parler à une couche logicielle ou à une API de plan de contrôle qui assurera l’interface avec l’infrastructure de stockage sous-jacente, qu’elle soit on-premise ou dans le cloud » explique Steve Wojtowecz, vice-président de la division stockage de Tivoli. "Vous pouvez installer Elastic Storage, insérer tout type de baie de stockage et lui permettre de gérer les données, de les déplacer et de gérer leur croissance ».

Watson fournit la couche analytique utilisée pour la couche de déplacement automatisée de données d’Elastic. Dans le cadre de Jeopardy !, Watson avait accès à 200 millions de pages de données structurées et non structurées, soit approximativement 5 To de données chargées dans la mémoire de l’ordinateur en quelques minutes. IBM indique que pour Elastic Storage, la technologie peut scanner jusqu’à 10 milliards de fichiers en 43 minutes. « Les technologies analytiques sont utilisées pour optimiser la pile de stockage », affirme Tom Clark, un ingénieur distingué d’IBM et l’architecte en chef pour les logiciels de stockage, le cloud et l’offre « smarter infrastructure » chez IBM. "Il s’agit de gérer des workloads qui sont devenues très dynamiques. Nous nous appuyons sur nos capacités analytiques pour cela ».

En fait, IBM entend s’appuyer sur sa technologie de Storlets, développée au sein d’IBM Research pour Elastic Storage. Les Storlets sont des modules de calcul développés pour gérer le stockage objet. Ils sont construits au-dessus d’OpenStack Swift et intégrés avec Hadoop et OpenStack Cinder, qui fournit des services en mode as-a-service . Les Storlets utilisent des métadonnées pour gérer le comportement des objets et permettent de fournir une analyse plus détaillée dans des applications comme l’édition de trames vidéos, ou l’identification d’éléments suspects dans des applications d’imagerie médicale, par exemple. "Dans un futur proche, vous pouvez anticiper le fait que les capacités des Storlets deviendront des fonctions d’Elastic Storage software », conclut Wojtowecz.

Adapté d'un article en anglais de Sonia Lelii, SearchCloudStorage.com

Pour approfondir sur Virtualisation du stockage