Isilon ajoute la déduplication à son stockage en cluster

Comme annoncé lors d'EMC World 2013, EMC vient d'ajouter la déduplication de données à la version 7.1 de l'OS de stockage de ses baies Isilon, OneFS, pour un gain moyen de 30% de capacité.

EMC a officiellement ajouté la déduplication à son système de stockage en cluster Isilon. La fonction Smart Dedupe, montrée pour la première fois lors d’EMC World 2013 en mai, fait parti de la mise à jour 7.1 du système d’exploitation OneFS (nom de code « Waikiki ») dévoilée en fin de semaine dernière.

Cette mise à jour est la première évolution majeure de l’OS d’Isilon depuis le lancement de  OneFS 7.0 (nom de code « Mavericks ») en début d’année. Mavericks a été conçu pour permettre aux baies Isilon d’offrir des services NAS et iSCSI à assez faible latence, de façon à rendre les baies plus exploitables dans des environnements d’entreprise. Smart Dedupe a pour objectif de renforcer encore un peu plus l’attrait des baies Isilon pour les entreprises. Comme dans les baies VNX ou dans des systèmes concurrents tels que les baies FAS de NetApp, la déduplication dans les baies Isilon fonctionne en mode Post process (ce qui veut dire que la déduplication ne s’effectue pas au fil de l’eau, à l’ingestion des données, mais a posteriori).

Selon Isilon Smart Dedupe opère sur des blocs de 8K et permet de réduire de près de 30 % l’espace de stockage sur une baie. La déduplication peut être activée par répertoire ou à l’échelle d’un cluster. La fonction fait l’objet d’une licence séparée, facturée par nombre de nœuds et à la capacité. Cette approche tarifaire est un peu étonnante dans la mesure où un concurrent comme NetApp propose la déduplication gratuitement et avec des gains en capacité assez similaires. Signalons qu’Isilon propose un outil dans OneFS permettant d’estimer le ratio de déduplication possible sur un répertoire existant.

Notons pour conclure sur la déduplication, qu’EMC met aussi en avant les bénéfices de la déduplication dans un cas bien précis, celui ou un cluster Isilon est utilisé comme stockage sous-jacent pour un cluster Hadoop. Selon le constructeur, stocker des données HDFS sur un cluster Isilon occuperait jusqu’à 5 fois moins d’espace que sur un cluster HDFS (le stockage sur Isilon  fait qu’il n’y a pas à faire trois copies des données en différents points du cluster Hadoop, et la déduplication améliore encore l’efficacité). Reste que l’efficacité ne fait pas tout, ne serait-ce que parce que le coût d’une infrastructure de stockage Isilon n’a rien à voir avec celui de disques banalisés dans les nœuds d’un cluster Hadoop…

 

Chiffrement des données et intégration avec les outils d'audit tiers

Une autre nouveauté de  cette version 7.1 de l'OS d'Isilon est le support du chiffrement de données via l'utilisation de disques à chiffrement intégré (SDE, ou Self Encrypting Drives). L'objectif est d'assurer aux utilisateurs des baies Isilon que les données seront inutilisables même en cas de vol ou de perte de disques durs ou de noeuds Isilon. Il s'agit aussi de satisfaire les exigences de certaines réglementations ou standards comme PCI DSS.

Enfin, Isilon a comme promis ajouté à OneFS 7.1 la compatibilité avec des outils d'audit tiers via le support de l'API CEE (Common Event Enabler) déjà supportée par les autres systèmes de stockage maison ainsi que le support d'un modèle de contrôle d'accès à base de rôles et de Kerberos (pour notamment simplifier l'intégration avec Hadoop HDFS)

Pour approfondir sur SAN et NAS