polygraphus - Fotolia
Le CEA teste le stockage objet de Scality
Le CEA a choisi le stockage objet de Scality, Scality Ring , comme potentiel remplaçant de ses outils de stockage en mode bloc et de fichiers. L’institution compte gagner avec cela une certaine indépendance côté hardware et accroître l’efficacité de ses disques.
Le Commissariat à l’énergie atomique et aux énergies alternatives a opté pour la solution de stockage objet de Scality pour réaliser un environnement de test visant au développement d’une architecture de stockage supportant ses importants besoins en calcul.
Le CEA espère pouvoir intégrer Scality dans l’architecture de stockage de sa division DAM (Direction des applications militaires). Le commissariat compte bien ainsi devenir plus agnostique en matière de hardware et augmenter l’efficacité de ses disques.
Le CEA, ainsi que sa division DAM, localisés près de Paris, mènent des recherches qui impliquent de traiter plusieurs péaflops de données avec des centaines de milliers de CPU et des dizaines de pétaoctets de capacités de stockage. Actuellement, ils s’adossent à des outils DNN ainsi qu’à un stockage en mode bloc basé sur le système de fichier parallèle Lustre.
La division DAM a débuté les tests du programme en utilisant la solution SDS (Software-Defined Storage) objet de Scality, Ring, avec la volonté de remplacer le stockage de fichier et en mode bloc pour soutenir toutes les opérations HPC d’ici 2020. Outre le fait de pouvoir utiliser tout type de hardware – Scality étant une offre logicielle –, l’organisation compte également obtenir un accroissement des I/O et une amélioration de la bande passante vers le stockage physique, explique Jacques-Charles Lafoucrière, en charge du département informatique scientifique du CEA. « Avec des accès fichier et bloc, nous obtenons des gains de 20 à 30% sur des disques rotatifs. En passant au stockage objet, nous pensons progresser de presque 100% », indique-t-il.
Contourner les problèmes de performances
Selon lui, ce manque d’efficacité est dû à l’interface POSIX et à la structure en arborescence des outils de stockage en mode bloc et fichiers. Avec une telle structure, les applications et le stockage ne peuvent pas exploiter pleinement le hardware. « Si nous passons à une interface objet, le hardware pourra manipuler les objets de centaines de mégaoctets de données, opérer des optimisations d’I/O et ne pas avoir à gérer la complexité liées aux données et métadonnées. »
« Le stockage en mode fichier et bloc a certaines limites, du fait de sa structure en arborescences et de la répartition des jeux de données dans plusieurs répertoires qui doivent être collectées et s’aligner sur la sémantique POSIX. Cela crée des problèmes de dimensionnement, avec des centaines de milliers de CPU opérant sur le même jeu de données. » Il ajoute : «Le stockage objet interagit avec les I/O à un niveau plus élevé que le mode fichier et bloc. Il ne considère pas les petits blocs, mais l’objet dans son ensemble. Le mode fichier et bloc n’est pas prévu pour les flux en parallèle de façon simultané. Le stockage objet est plus flexible en termes de taille et d’interaction avec la donnée. »
Scality Ring fonctionne sur des serveurs de commodité, et s’appuie sur un cœur objet pour être dimensionné comme un unique système distribué répartis sur plusieurs sites et potentiellement des milliers de serveurs x86 standards. Son architecture permet des accès concurrents aux données.
Scality, tout comme les autres acteurs du stockage objet, s’appuie sur REST pour gérer les grandes quantités de données dans un système à plat où les fichiers sont identifiés uniquement par les métadonnées. Cela tranche avec les systèmes de fichiers traditionnels qui s’appuient sur des structures en arborescence hiérarchisée. Cela impose des limites au niveau du système de fichiers à cause de problèmes de performances liés à l’augmentation de la taille du système. Le stockage objet vise ainsi à contourner ces problèmes avec une structure à plat.
« Nous avons choisi Scality car nous croyons qu’il s’agit d’une technologie prometteuse et que le stockage objet nous apporte la flexibilité nécessaire pour obtenir les meilleures I/O pour notre système de stockage », ajoute enfin Jacques-Charles Lafoucrière.