Un datacenter 100 % flash : une opportunité à envisager sous certaines conditions
La mise en œuvre d’une stratégie de datacenter 100 % flash soulève des problèmes de gestion des coûts et des données. Avant de franchir le pas, il est important de réfléchir à la meilleure façon de contourner ces problèmes.
Depuis l’arrivée sur le marché des baies 100 % flash, les professionnels de l’informatique ont évalué la possibilité d’opérer des datacenters uniquement équipés de systèmes flash. Un tel centre de données répondrait théoriquement en un clin d’œil aux besoins des bases de données de production, mais aussi aux demandes de données non structurées, aux rappels d’archives et même aux tâches de sauvegarde et de restauration. L’idée paraît séduisante, mais un centre de données 100 % flash est-il réaliste ?
En fait, une telle idée paraît raisonnable pour plusieurs bonnes raisons. Tout d’abord, le prix du stockage flash d’entreprise n’a cessé de chuter au cours des cinq dernières années. Deuxièmement, les technologies de réduction des données, telles que la déduplication et la compression, fonctionnent très bien dans un environnement flash car les performances de la NAND permettent à ces processus de fonctionner sans impact notable sur les utilisateurs et les applications. Le résultat est qu’une baie de stockage flash typique peut bénéficier d’une efficacité de données de trois à cinq fois supérieure à celle d’un stockage traditionnel.
La troisième raison qui rend un centre de données 100 % flash envisageable est que les SSD délivrent des densités sans précédent — les disques 2,5 pouces de 16 To sont courants et des périphériques de 50 To et plus sont à l’horizon proche. Pour les centres de données confrontés à des problèmes d’espace au sol, la densité de la flash peut permettre d’économiser des millions de dollars en coûts de construction de centres de données supplémentaires et en énergie.
La justification la plus importante pour le stockage Flash Enterprise est probablement sa haute performance. Dans de nombreux centres de données, la généralisation de la flash éliminerait le besoin d’optimiser les performances. En l’état, la plupart des baies flash offrent plus de performances que les besoins typiques d’un centre de données.
POURQUOI LE 100 % FLASH N’A PAS DE SENS
Malgré tous ces bénéfices, un design 100 % flash présente des inconvénients. Malgré la diminution du coût de la flash et l’ajout de techniques d’efficacité des données, le prix du stockage d’entreprise flash reste élevé par rapport aux disques durs à haute capacité. De plus, si la plupart des baies flashs ont la possibilité de répliquer leurs données sur un site secondaire, il leur faut le faire sur un système similaire utilisant le même matériel. Si le fournisseur de baies ne commercialise que des systèmes 100 % flash, cela signifie que le site de reprise après sinistre (DR) devra être équipé de même, alors qu’il est généralement inactif en attendant un sinistre. Cela revient à immobiliser un équipement qui a un coût non négligeable.
Le plus grand défi potentiel d’un centre de données 100 % flash est que, jusqu’à 80 % des données stockées en production sont inactives et qu’aucun utilisateur n’y accède pendant des années. Or, il est difficile de justifier que des données froides et périmées soient stockées sur un système de stockage coûteux.
RELEVER LES DÉFIS DU 100 % FLASH
Étant donné que le stockage Flash d’entreprise est encore plus cher, les deux problèmes fondamentaux mentionnés ci-dessus doivent être résolus pour qu’un centre de données 100 % flash ait un sens. Tout d’abord, une organisation doit élaborer une stratégie de reprise après sinistre viable qui ne nécessite pas de système flash sur le site de secours (ce que permettent désormais certains constructeurs en offrant la possibilité de répliquer vers le cloud). Deuxièmement, il doit tenir compte du fait que la plupart des données aujourd’hui sont stockées sur les stockages primaires, sont anciennes et ne sont plus utilisées.
Il y a plusieurs façons de relever le défi de la reprise après sinistre. La première est d’opter pour un fournisseur de systèmes de stockage qui peut se répliquer sur un système de DR (disaster recovery) sur disque dur. Dans la plupart des cas, ces fournisseurs — Dell EMC, Hitachi Vantara, IBM, NetApp ou Western Digital Tegile — ont d’abord commercialisé des baies de stockage hybrides, avant d’offrir des systèmes 100 % flash. Ils utilisent généralement le même logiciel de stockage pour l’hybride et leurs baies flash et peuvent donc répliquer des données d’un système de stockage primaire flash vers un système de stockage secondaire hybride. Cette configuration réduit le coût du système de stockage sur le site de DR tout en offrant une performance quasi instantanée en cas de sinistre.
Une autre option consiste à utiliser un logiciel tiers pour effectuer la réplication des données sur le site DR. La plupart des produits de DR basés sur un logiciel — par exemple, ceux de Zerto ou de DoubleTake — peuvent répliquer des données de n’importe quel système de stockage vers n’importe quel autre système de stockage, de sorte que le système de stockage sur site de DR peut même être basé sur un disque dur.
Certains logiciels de réplication peuvent également fonctionner dans le nuage ou chez un fournisseur de services gérés, créant ainsi une troisième option, le DR en nuage. Ces applications pourraient répliquer des données dans le nuage, éliminant ainsi non seulement le besoin d’un système de stockage sur le site DR, mais aussi sur le site DR lui-même, car certains de ces produits de réplication peuvent lancer des instances virtuelles d’applications critiques dans le nuage. Il est à noter que des constructeurs comme NetApp ou Pure Storage proposent aussi des versions virtuelles de leurs baies dans ces clouds que l’on peut utiliser à des fins de réplication de données.
DONNÉES PÉRIMÉES ET SYSTÈMES HYBRIDES
Les données périmées sont des données auxquelles les utilisateurs n’accèdent plus, mais que l’organisation veut ou doit conserver pendant un certain temps. La plupart des entreprises ne peuvent pas facilement identifier et gérer ces données, et elles les stockent en général sur leurs baies de stockage primaires. Si ce stockage primaire est une baie 100 % flash, alors l’entreprise jette littéralement de l’argent par les fenêtres. Les organisations peuvent résoudre le problème des données périmées de plusieurs façons. Elles peuvent utiliser une baie hybride dotée de fonctions de tiering, pour déplacer automatiquement les données froides de la classe flash vers une classe moins performante à base de disques durs.
Le problème éventuel est l’impact s’il devient de nouveau nécessaire d’accéder aux données depuis le disque dur. Il y a un delta de performance entre les deux niveaux, c’est vrai, mais la question est de savoir si les utilisateurs et les applications en ressentiront l’impact. Dans la plupart des cas, la réponse est non. Mais la préoccupation est suffisamment légitime pour que de nombreux centres de données aient décidé d’utiliser des systèmes 100 % Flash pour le stockage primaire.
Il est essentiel de comprendre la performance d’un système hybride. La clé est de profiter du coût réduit du stockage flash pour créer une classe de stockage flash plus capacitive. Lorsque les systèmes hybrides sont apparus sur le marché, le flash était tellement coûteux et sa capacité si faible que la classe flash représentait environ 3 à 5 % de la capacité totale d’un système hybride. Par conséquent, le risque qu’un accès aux données ne se fasse pas sur la classe la plus rapide était relativement élevé. Maintenant, grâce à la baisse des prix du stockage flash et à l’augmentation des densités, la classe flash peut représenter entre 25 et 50 % de la capacité d’une baie de stockage hybride. Dans la plupart des cas, cela est suffisant pour stocker toutes les données actives des deux dernières années et éviter tout problème de performance lié à un accès hors du cache. Cela permet aussi de bénéficier d’une tarification plus économique liée au mix SSD/disques durs.
La deuxième option consiste à combiner un système de stockage dédié au tout flash avec un système de stockage objet. Avec un logiciel adapté, on peut déplacer les données qui n’ont pas été activement accédées depuis le système de stockage vers le système objet en fonction de stratégies définies par l’utilisateur. Les entreprises peuvent définir des politiques différentes pour différents ensembles de données. Par exemple, tous les documents de productivité bureautiques peuvent être déplacés dans le stockage objet, 90 jours après le dernier accès, alors que les images ne migreront qu’au bout d’un an.
La sélection d’une application pour effectuer cette identification et ce mouvement est une étape supplémentaire, mais elle crée une excellente base pour la gestion des données. C’est la façon la moins chère d’implémenter la flash. Essentiellement, le centre de données est tout flash pour le stockage primaire tandis que le stockage secondaire, à base de technologie objet, reste 100 % basé sur des disques durs économiques. Le logiciel de gestion des données ralentit la croissance du stockage primaire et réduit l’investissement dans le stockage de protection.
TOUT EST UNE QUESTION DE GESTION DES DONNÉES
Le centre de données tout flash est une possibilité, mais il est difficile d’ignorer les deux problèmes fondamentaux qu’il crée : le coût de la mise en place d’un centre de données 100 % flash pour la reprise après sinistre et la gestion efficace des données froides. Les organisations peuvent choisir de laisser les données obsolètes sur leur stockage 100 % flash si elles sont prêtes à en absorber le coût. Cependant, la question de la reprise après sinistre ne peut être ignorée. Le fait d’avoir une baie 100 % flash en mode veille dans un centre de données distant est un gaspillage d’argent.
Une approche plus réaliste est de créer une stratégie où toutes les données actives et quasi-actives sont sur un stockage 100 % flash. Lorsque les utilisateurs n’accèdent pas aux données pendant un an, le système les archive automatiquement sur des disques durs.
Un système hybride qui inclut un stockage d’entreprise flash résout ces deux problèmes, en déplaçant automatiquement les données vers le stockage sur disque dur au fur et à mesure qu’elles vieillissent. Alternativement, une stratégie de gestion des données résout le problème des données périmées et simplifie le problème de la RD. Une stratégie de cloud hybride est également une option intéressante.
Le choix le plus judicieux pour le centre de données dépend de l’organisation. La plupart résistent à une stratégie de gestion des données, la trouvant difficile à maintenir. Une approche hybride automatise dans une certaine mesure la gestion des données et peut s’avérer plus réaliste qu’une approche 100 % flash pour de nombreuses organisations.
GEORGE CRUMP est président de Storage Switzerland, une société d’analystes spécialisée dans le stockage et la virtualisation.