WavebreakmediaMicro - Fotolia
Les entreprises françaises mettent Ceph en production
En marge des solutions de SDS qui consistent à simuler des baies SAN au plus près des machines virtuelles, Ceph servirait déjà aux entreprises françaises pour stocker leurs données froides à prix réduit.
Le SDS Open source Ceph connaîtrait un succès très rapide parmi les grands comptes français. C’est en tout cas Suse, l’un de ses principaux éditeurs, qui le dit : « en contrepied d’OpenStack qui est longtemps évalué par les DSI, Ceph a été immédiatement adopté par les entreprises. Elles l’ont mis en production dès la version 2 de notre implémentation Suse Enterprise Storage (SES 2, sortie en novembre 2015) et utilisent déjà la fonction de réplication sur plusieurs sites de la version 3 que nous avons lancée en juin dernier », se félicite Julien Niedergang, ingénieur système chez Suse en France. Il précise qu’il n’a contractuellement pas le droit de citer les entreprises en question.
Entre 30 et 40% moins cher qu’une baie SAN
Dans la catégorie des logiciels qui transforment un serveur et ses disques internes en une baie de stockage bien moins chère qu’une véritable SAN d’EMC ou NetApp (les SDS, ou Software Defined Storage), Ceph est conçu pour déployer des tiers de stockage externes sur des serveurs dédiés, avec une capacité pouvant aller théoriquement jusqu’à 16 Exaoctets (16384 Po, ou environ 17 millions de To). Il se différencie des SDS ScaleIO d’EMC, StoreVirtual de HPE ou encore VSAN de VMware qui, eux, fonctionnent sur les serveurs qui exécutent des machines virtuelles, de sorte à rapprocher le plus possible les VM de leurs données afin de réduire les temps d’accès. « Le but de Ceph n’est pas de d’apporter de la rapidité d’accès aux données mais de la capacité. Cela constitue entre 70 et 85% des besoins en entreprise, ce qui explique selon moi l’engouement pour cette solution », indique Julien Niedergang. Il précise que les déploiements actuels en entreprise concernent le stockage des données froides et, souvent, des sauvegardes.
En terme de prix, à capacité égale, un serveur Xeon avec une dizaine de cœurs, avec une carte réseau 10 Gbits/s et fonctionnant sous SES 3, coûte à l’achat entre 30 et 40% moins cher qu’une baie SAN. « Mais le véritable avantage financier de cette solution apparaît lors de la migration : il suffit d’installer des nouveaux serveurs dans le cluster pour étendre la capacité à volonté, le logiciel s’occupant tout seul d’utiliser les nouveaux disques. Avec une baie SAN traditionnelle, on est limité à un plafond. Quand on l’atteint, il faut changer toute la baie, en racheter une bien plus capacitive que la première et perdre plusieurs jours de production le temps de migrer les données de l’une à l’autre », argumente l’ingénieur système.
En revanche, Julien Niedergang avoue qu’il a dû ravaler l’argument du recyclage, pourtant très à la mode chez tous les fournisseurs de SDS. « Lorsque nous avons présenté notre solution aux entreprises françaises, nous leur avons expliqué qu’elle avait l’avantage supplémentaire de s’installer sur des serveurs devenus trop peu puissants pour exécuter des machines virtuelles, si bien qu’il n’était même pas nécessaire d’en acheter d’autres. Mais autant les entreprises trouvent cela pratique pour tester la solution avant de la déployer, autant elles se refusent à remettre en service des matériels arrivés au bout de leur contrat de maintenance. Surtout quand il s’agit de stocker des données », relate-t-il.
Les fonctions des vraies baies, mais pas toutes
Comme sur les vraies baies SAN, Crush, l’algorithme qui se charge de répartir les données sur tous les disques du cluster, supporte la déconnexion sauvage de nœuds, par accident ou pour remplacement. « Mais ce n’est pas le RAID des baies SAN, où chaque disque remplacé est indisponible pendant plusieurs heures le temps de reconstruire ses blocs ! Dans Ceph, les données sont dispersées en triple exemplaire sur toute la capacité de stockage. Si bien que le cluster continue de donner accès à toutes les informations même lorsque l’on enlève d’un coup le tiers, voire la moitié de ses nœuds », dit Julien Niedergang.
Dans la nouvelle version SES 3, Crush apporte un fonctionnement asynchrone pour dupliquer les données entre plusieurs parties d’un cluster situées chacunes sur un site distant. Cette fonction, dite de métrocluster et utile pour bâtir des plans de continuité d’activité (PCA), ne nécessite même pas l’achat sur chaque site d’un équipement dédié à la synchronisation, alors qu’EMC, par exemple, demande d’installer des Vplex.
En revanche, SES 3 ne sert encore officiellement qu’à simuler des baies en mode bloc. Le tout nouveau système de fichiers CephFS, qui apporte la fonction de NAS au cluster avec des partages en CIFS et NFS, est bien livré dans sa version communautaire « Technology Preview », tout juste finalisée. Mais Suse ne fournira ni maintenance, ni support avant la sortie de la version SES 4, prévue pour novembre. Dans le même ordre d’idées, le chiffrement des données à la volée ne sera aussi supporté qu’en novembre. Pour l’heure, le chiffrement passe par une réécriture sur les disques, ce qui n’est généralement pas indiqué pour des disques SSD car cela raccourcit d’autant leur durée de vie.
En bundle avec HPE
Enfin, il est probable qu’il faille attendre la version suivante, la 5 en avril 2017, pour que la SES soit officiellement compatible avec des serveurs encore moins chers, basés sur des processeurs ARM. Des bundles avec des fabricants avaient pourtant été annoncés en novembre dernier, lorsque Suse Entreprise Storage a basculé de son système de stockage maison à Ceph. A date, Suse vient plutôt de nouer un accord avec HPE qui propose désormais des châssis super denses Apollo 4500, dotés de 48 disques dans 4U, et qui font office de baie SAN secondaire pour les serveurs HPE Proliant qui exécutent des VM en amont.
Suse n’est pas le seul éditeur à proposer une implémentation de Ceph. Son concurrent Red Hat vient de lancer RH Ceph Storage 2 qui dispose des mêmes logiciels Open source que SES 3 et qui se distingue par l’intégration avec la console d’administration RHSC v2 ainsi qu’avec les annuaires Active Directory. Pour sa part, Suse présente l’avantage de fournir un pilote iSCSI qui permet d’utiliser le cluster Ceph depuis VMware et Hyper-V.