Tour Start-up 2013 : Coho Data dope ses baie Flash aux SDN
Tout juste sortie du mode stealth, Coho Data lance une baie de stockage hybride qui s'appuie sur Ethernet et les SDN pour gérer la distribution de la charge entre ses noeuds.
Quelques semaines après la présentation par CohoData de son architecture DataStream, LeMagIT a pu profiter du récent IT Press Tour 2013 pour rencontrer la société et discuter avec son CTO, Andrew Warfield, de sa toute nouvelle baie de stockage hybride. Warfield est l’ancien directeur technique en charge de la virtualisation du stockage chez Citrix (ou il pilotait le développement des technologies de stockage de XenServer) et il est aussi l’un des consultants techniques de longue date de Teradici (l’inventeur du protocole de déport d’écran PCoIP). cofondateur de Coho Data, il est l’un des pères de l’architecture de stockage distribuée originale développée par la firme.
Une baie de stockage hybride combinant Flash et disques durs
Les baies Coho DataStream sont architecturées autour de nœuds de stockage banalisés composés de micro-châssis SuperMicro au format 2U embarquant 2 serveurs autonomes baptisés MicroArray. Chacun de ces microserveurs est équipé de deux cartes PCI express Flash Intel 910 de 800 Go, de six disques SAS de 3 To et dispose de deux connecteurs 10 Gigabit Ethernet (GbE). La capacité de stockage de chaque MicroArray est virtualisée par l’hyperviseur de stockage maison, qui s’appuie sur système de fichier objet et sur un ensemble de couche d’abstractions afin de rendre la capacité objet consommable par des protocoles traditionnels (le premier et seul supporté pour l'instant étant NFS, ce qui fait pour le moment de la baie une simple baie NAS). L’hyperviseur de stockage prend aussi en charge les tâches de protection des données en veillant à répliquer systématiquement les données de chaque MicroArray sur une autre microarray afin d’assurer une haute disponibilité du système.
Une architecture distribuée qui s'appuie sur Ethernet et sur une approche SDN
L’intérêt de l’offre de Coho Data est la façon originale dont la firme a résolu la question de la scalabilité de son système. Plutôt que de s’appuyer sur une archirecture cluster traditionnelle ou sur Infiniband pour permettre l’agrégation de nœuds, Coho Data s’est appuyé sur Ethernet et sur une couche SDN qui permet au switch de distribuer les sessions entre les nœuds de stockage. Pour cela, la firme a utilisé un commutateur Arista et l'a modifié avec ses propres applications.
Selon Coho Data, l’architecture qui résulte de ce choix permet de garantir un accroissement linéaire des performances avec le nombre de nœuds, une affirmation confirmée par ESG Labs lors de test menés de 1 à 5 noeuds (soit 2 à 10 MicroArray). Selon Coho Data chaque nœud avec 2 microArray offre une capacité utile de 19,5 To et peut délivrer environ 180 000 IOPS (ESG a validé une performance de 173 000 IOPS avec un ratio de lecture écriture de 80/20 sur des blocs de 4K). Avec cinq nœuds de 2U et un commutateur 10 Gigabit 1U, ESG Labs affirme qu’un « cluster » DataStream est capable de délivrer 900 000 IOPS NFS sous VMware ESX et un total de près de 100 To de capacité le tout avec une latence moyenne de 12,5 ms. Selon Coho Data, les résultats sont encore meilleurs avec un client NFS Linux, les performances approchant alors 1,4M d’IOPS.
L’une des caractéristiques rendue possible par l’architecture SDN de la baie est de passer outre les limitations de NFS v3. Le commutateur Arista modifié avec le logiciel de Coho Data, présente ainsi les différents nœuds serveurs comme ayant une adresse unique, mais distribue ensuite les sessions entre les nœuds, ce qui permet dans la pratique à l’implémentation NFS de Coho Data de voir ses performances progresser avec le nombre de nœuds. Comme l’explique Andrew Warfield, les prochains protocoles sur la liste du constructeur sont SMB 3.0 et iSCSI. Selon lui les caractéristiques de l’hyperviseur de stockage maison devraient produire des résultats intéressants avec SMB 3.0.
Mais Coho Data voit aussi plus loin. La firme a par exemple produit une version spécialement modifiée de MySQL dont le moteur de stockage s’interface directement avec l’hyperviseur de stockage maison et elle estime que des intégrations similaires sont possibles avec des bases NoSQL comme Riak ou MongoDB ainsi qu’avec des technologies comme Hadoop. Warfield indique aussi que des intégrations natives pourraient aussi être réalisées pour certaines applications internes d’entreprises (la firme travaille à la publication d’une API).
L’administration d’un système Coho DataStream s’effectue via une interface graphique plutôt riche qui permet de suivre en temps réel les différents paramètres de fonctionnement de la baie mais aussi de provisionner les volumes de stockage pour les applications.
Selon Warfield, le coût moyen au Go d’une baie Coho Data est d’environ 2,50 $ et il devrait continuer à diminuer avec la baisse des composants et avec l’arrivée de la déduplication dans les baies une fonction attendue pour 2014. Une baie 5U Coho DataStream avec une capacité de 190 To et son Switch Ethernet modifié est ainsi proposée au prix public de 530 000 $.