ludodesign - Fotolia

Avec MAX Data 1.3, NetApp ajoute un tiers de stockage en mémoire

Prenant en charge les dernières mémoires Optane DC d’Intel, le logiciel permet de stocker 9 To de fichiers dans un espace 20 fois plus rapide qu’une baie NVMe.

NetApp met à jour son logiciel de tiering de stockage en mémoire, MAX Data, pour supporter les dernières barrettes mémoire Optane DC d’Intel. L’enjeu de ce logiciel est d’accélérer l’accès aux fichiers d’un facteur 20. Couplé avec un autre logiciel Max Recovery, il permet par ailleurs de faire de la redondance de mémoire entre deux serveurs et, dans ce cas, peut même servir à protéger les bases In-Memory.

« MAX Data intéresse au premier chef tous les utilisateurs de bases de données qui voient ainsi leurs accès passer de plus de 200 microsecondes à moins de 10 microsecondes, soit la possibilité de travailler en millions d’IOPS. Nos clients l’utilisent aussi bien pour les bases SQL comme Oracle et MySQL, que pour celles qui ne le sont pas : MongoDB, Elasticsearch, Couchbase, ainsi qu’Apache Spark ou Tensorflow », assure Mathias Robichon, le directeur technique de NetApp en France.

« Outre simplement créer un système de fichiers en mémoire, il gère surtout une LUN virtuelle entre la mémoire et une baie Flash NetApp AFF. Il s’interface avec le système ONTAP de celle-ci afin de faire de l’auto-tiering. Ainsi, des snapshots de la mémoire sont automatiquement réalisés à intervalle régulier pour protéger les données sur disques en cas de défaillance », ajoute-t-il.

L’avantage d’Optane DC PMEM : de la RAM peu chère et persistante 

Entré dans le portefeuille NetApp suite au rachat de PlexiStor en 2017, MAX Data est le plus utile quand la RAM du serveur qui l’exécute est volumineuse et peu chère. Jusqu’à présent, MAX Data fonctionnait ainsi le plus souvent avec des barrettes NVDIMM (composées de puces NAND pour la capacité et de chips DDR pour la vitesse d’accès). La gestion des barrettes Optane DC PMEM, conçues à base de mémoire 3D X Point, apporte de meilleures caractéristiques ; elle permet typiquement de profiter d’un tiers de stockage d’environ 9 To sur le serveur bi-socket hôte pour le prix habituel de 4,5 To de RAM DDR.

Techniquement, la nouvelle version 1.3 de MAX data apporte surtout la prise en charge du mode mémoire persistante typique des Optane DC PMEM. Ce mode évite de devoir recharger les données depuis les disques après le redémarrage du serveur, une situation qui a régulièrement lieu lorsque le système sous-jacent est mis à jour avec des patches de sécurité. Les applications profitent directement de cette fonction et aucune réécriture n’est nécessaire.

De l’auto-tiering pour les données les plus chaudes jusqu’aux plus froides

MAX Data se compose d’une part du système de fichiers MAX FS (anciennement ZuFS) pour systèmes Linux et l’hyperviseur de VMware. Il présente aux applications un volume de stockage POSIX à cheval entre la RAM très rapide du serveur et les disques plus capacitifs d’une baie NetApp reliée en Fiber Channel ou iSCSI. Un pilote permet par ailleurs à VMware ESX de découper ce stockage en volumes virtuels. Le système déplace tout seul les fichiers sur la partie la plus adéquate du stockage, en estimant le degré de leur importance dans les traitements en cours.

« Nos baies NetApp AFF sont elles-mêmes capables de faire de l’auto-tiering vers une kyrielle d’espaces encore plus capacitifs et à chaque fois un peu moins rapides et moins chers, jusqu’au stockage en cloud. Nous proposons ainsi la solution la plus complète pour attribuer automatiquement le meilleur stockage possible à un spectre de données qui va des informations les plus chaudes possibles aux plus froides », argumente Mathias Robichon.

Des snapshots asynchrones et des serveurs synchrones pour parer aux pannes

D’autre part, MAX Data comprend deux fonctions pour protéger les fichiers stockés en mémoire. Celle de snapshot fait une copie intégrale de la mémoire toutes les 10 à 15 minutes, de sorte qu’il soit possible de poursuivre l’activité si le serveur tombe en panne.

La seconde fonction va plus loin en faisant du mirroring, c’est-à-dire que les données sont écrites en double : dans le RAM du serveur, mais également sur une carte réseau supportant le RDMA over Converged Ethernet (RoCE). Ce mode permet d’avoir une copie synchrone des données sur un serveur redondant relié en réseau. Toutefois, elle ne fonctionne que si le second serveur est équipé du logiciel MAX Recovery, commercialisé à part.

« Bien entendu, les bases de données disposent elles-mêmes d’options pour répliquer leurs contenus vers des serveurs tiers au fil de l’eau. Mais regardez les tarifs : dans de nombreux cas, il coûte moins cher de passer par MAX Data + MAX Recovery plutôt que de prendre le module Cluster d’un éditeur de bases de données », avance Mathias Robichon, sans toutefois pouvoir nous communiquer de listes de prix.

Pas de mirroring vers le stockage mais une protection pour les bases In-Memory

Pour fonctionner, MAX Data doit s’exécuter sur un serveur relié à l’une des dernières baies AFF de NetApp, à savoir les modèles A300, A700, A700S et A800, et celle-ci doit être équipée du dernier contrôleur NVMe-over-Fabric (NVMe-oF). A priori, seul l’auto-tiering tire parti du protocole NVMe et il n’est pour l’heure pas possible que la fonction de mirroring copie ses données vers la baie de stockage. De fait, sans serveur redondant, la reprise d’activité depuis un snapshot se fera sans les données créées lors des dernières minutes qui ont précédé la panne d’une machine.

Parmi les autres subtilités de la solution, il en est une qui pourrait devenir l’un de ses principaux avantages. Il s’avère en effet que les fonctions de snapshot et de mirroring prennent aussi en charge les fichiers stockés en RAM par les applications elles-mêmes, via l’API mmap du standard POSIX, c’est-à-dire en dehors de l’espace réservé par MAX FS. Cette API étant souvent utilisée par les applications qui se revendiquent « In-Memory », cela signifie que MAX Data pourrait tout à la fois servir à accélérer les applications traditionnelles et à protéger celles qui ne reposent pas sur du stockage disque.

Pour approfondir sur Virtualisation du stockage

Close