Les challengers du stockage Flash : l'offre de Kaminario

Dans le cadre du dossier spécial Flash du n°7 de STORAGE, LeMagIT vous propose un tour d'horizon des fournisseurs de baies de stockage 100% Flash. Dans cet article, nous faisons le point sur l'offre de Kaminario

Kaminario est avec Texas Memory Systems (racheté par IBM) l’un des plus anciens acteurs du stockage en mémoire et du stockage Flash. La société née en Israël et aujourd’hui basée dans la Silicon Valley est la première à avoir produit une vraie architecture en mode scale-out 100 % Flash. Une architecture qu’elle a patiemment fait évoluer et mûrir. Depuis 2014, Kaminario commercialise la cinquième génération de ses baies de stockage SAN iSCSI et Fibre Channel K2.

Des baies de stockage Flash en mode scale-out

Les baies K2 sont organisées en blocs (baptisés K-Block), chacun composé de deux contrôleurs x86 redondants en mode actif/actif et de tiroirs de disques — il s’agit en fait de serveurs Supermicro de 2 U de haut chacun. Chaque bloc est une baie autonome qui peut évoluer en mode scale-up par ajoute de tiroirs de disques SSD. Il est aussi possible d’assembler plusieurs blocs au sein d’un cluster relié par des interfaces Infiniband pour assembler une baie de stockage Flash en mode scale-out, dont les performances augmentent linéairement avec le nombre de blocs utilisés (chaque bloc ajoute environ 250 000 IOPS en matière de capacités d’entrées/sorties, ainsi que 3,2 Go de bande passante utile). À ce jour le nombre maximal de blocs dans un cluster est de huit (même si le site du constructeur n’affiche pour l’instant qu’une limite à 4 Blocs).

STORAGE n°7

Retrouvez notre dossier complet sur le stockage Flash et l'hyperconvergence en téléchargeant la version PDF de Storage n°7, la dernière édition de notre magazine dédié au stockage d'entreprise.

Les tiroirs de disques sont quant à eux constitués de disques SSD Samsung à base de mémoire Flash 3D TLC. Chaque bloc peut être connecté à un ou deux tiroirs de disques chacun capable d’accueillir un maximum de 24 SSD au format 2,5 pouces. La capacité utile par bloc (après RAID et déduplication) va de 7 To à 360 To, soit une capacité maximale allant de 28 To à 1,44 Po pour un cluster de 4 blocs.

Déduplication et compression en ligne, mais désactivables volume par volume

Comme Pure Storage, Kaminario s’appuie sur une architecture de déduplication en ligne à base de blocs variables. Comme l'explique Dani Golan , le CEO de Kaminario, cela permet à la firme d’optimiser la gestion des entrées/sorties (mais aussi le volume des métadonnées) par rapport à des baies Flash travaillant sur des blocs fixes de 4 K. Ces dernières doivent en effet génèrer en back-end plusieurs opérations d’I/O lorsque les entrées sorties ont une taille supérieure à 4 K (ce qui est loin d'être rare puisque Kaminario note que sur sa base installée, la taille moyenne d’un bloc est de 42 Ko).

Concrètement chacun des blocs ingérés par la baie passe au travers d’un mécanisme associant compression LZ4 et déduplication, afin non seulement de réduire le nombre d’I/O atteignant le back-end de stockage, mais aussi afin d’optimiser la capacité de la baie. Selon Kaminario, la déduplication est globale lorsque plusieurs blocs K2 opèrent en mode cluster. Le constructeur garantit un taux de réduction moyen de 3,3:1 et indique que sur sa base installée, le ratio de réduction de données moyen est de 5,1:1.

Les utilisateurs de baies K2 ont aussi la possibilité de désactiver la déduplication volume par volume. Il s'agit d'une option intéressante, en particulier avec des applications pour lesquelles la technologie n’offre que de faibles perspectives de réduction de données. Cela permet alors de limiter la charge CPU des contrôleurs du système.

Dani Golan, CEO de Kaminario

Un mécanisme de protection de données sophistiqué

Les baies K2 implémentent un algorithme à base d’erasure coding qui fournit un niveau de protection supérieur au Raid6 et qui ne consomme que 12,5 % de la capacité brute des baies. Cet algorithme protège contre la panne simultanée de 3 SSD par tiroir de disque (et d’un SSD additionnel pendant la reconstruction de données), le tout en garantissant que les opérations de reconstruction des pools RAID se font sans impact sur la performance de la baie. Les baies K2 proposent également un mécanisme de snapshot efficace (la taille du snapshot est strictement égale à celle des deltas de données dédupliquées) et intégré avec les API de VMware, Oracle et Microsoft. Ces snapshots sont utilisés comme support à la technologie de réplication asynchrone intégrée aux baies de Kaminario.

Un portail analytique prévu pour début 2017

Au premier trimestre 2017, Kaminario prévoit d'enrichir ses baies K2 avec de nouvelles fonctions analytiques et de gestion de la qualité de service. Ces fonctions seront accessibles via un portail cloud baptisé Kaminario Clarity. L'un des principaux objectifs de Clarity sera de permettre aux administrateurs de mieux comprendre comment est utilisée la performance de leur baie K2 et leur donnera des suggestions pour améliorer l’usage de la capacité et des performances. Kaminario entend aussi à terme ajouter des agents Clarity qui s’intégreront avec certaines applications comme Oracle ou Microsoft SQL Server. Leur mission sera de fournir des métriques plus fines pour ces applications.

Notons, pour terminer, que Kaminario propose déjà un plug-in d’administration pour la console vCenter de VMware et un plug-in Cinder pour OpenStack. Selon Kaminario, l’efficacité de son processus de déduplication permet d’obtenir un coût moyen inférieur à 1 $ par Go. Ce chiffre n’est toutefois valide que lorsque la déduplication est efficace sur les types de données écrits par les applications sur la baie.  Le prix de base d’une configuration K2 avec 22 To de capacité Flash 3D TLC est d'environ 70 000 $.

Pour approfondir sur SAN et NAS