Pure Storage poursuit sa croissance et acquiert StorReduce
Le spécialiste des baies de stockage Flash a dépassé les attentes des analystes lors de son second trimestre fiscal avec une croissance de 37 % de son chiffre d'affaires. Il a profité de la présentation de ses résultats pour annoncer le rachat de StorReduce, une startup qui a développé une technologie séduisante de déduplication pour les stockages objet S3.
Pure Storage a terminé son second trimestre fiscal sur un chiffre d’affaires de 309 M$, en hausse de 37 % par rapport aux 224,7 millions de dollars réalisés durant la même période l’an dernier. La perte nette de la société s’est quant à elle légèrement creusée, à 60,1 M$ (contre 58,4 M$ il y a un an), largement du fait de généreuses distributions d’actions et de stock-options (53,6 M$). Pure dispose toutefois de réserves considérables pour financer son activité. La firme est assise sur un matelas de près de 386 M$ de trésorerie et dispose de plus de 400 M$ de placements à moyen et long terme.
Le fournisseur de baies de stockage de Mountain View, en Californie, a déclaré que ses ventes de systèmes avaient passé la barre des 241 M$, en hausse de 34 % par rapport à l’année dernière, et que le solde de ses revenus provenait de ses contrats de maintenance et de support (env 68 M$), un montant en hausse de 51 %.
Selon Charles Giancarlo, le PDG de Pure Storage, les baies FlashArray //X, à base de stockage NVMe, ont généré plus de la moitié des ventes du dernier trimestre.
Pure compte désormais plus de 5150 clients dans le monde, dont plus de 350 nouveaux obtenus durant le trimestre (dont Zeiss Vision Care en France). L’annonce des résultats a été l’occasion de mettre le doigt sur l’un des points faibles de la firme, sa faible internationalisation. Malgré de lourds investissements pour se développer à l’international, Pure réalise encore 74 % de son activité avec des entreprises américaines.
Rachat de la technologie de déduplication de StorReducce
L’annonce des résultats du second trimestre a aussi été l’occasion pour la firme d’annoncer sa première acquisition depuis son introduction en bourse en 2015. Pure a mis la main sur StorReduce, une start-up connue pour son logiciel éponyme de déduplication pour le stockage objet.
L’une des premières intégrations de StorReduce devrait être réalisée avec la baie de stockage distribuée FlashBlade qui supporte à la fois les protocoles NAS et objet (S3). Pure Storage a récemment mis en avant l’usage de FlashBlade comme cible de sauvegarde à hautes performances. Le rachat de StorReduce a été l’occasion pour la firme d’admettre que FlashBlade ne supportait pas pour l’instant la déduplication de données, une déclaration qui lève un flou habilement entretenu par la firme qui parlait du support par FlashBlade de « techniques de réduction de données ». En fait FlashBlade ne supportait que la compression de données.
En mariant FlashBlade et StorReduce (qui fonctionne pour l’essentiel comme un proxy distribué et transparent de déduplication pour le stockage S3), Pure Storage pourrait séduire plus d’entreprises désireuses de trouver une alternative à des stockages de sauvegarde dédupliqués comme Dell EMC Data Domain. La firme pourrait aussi simplifier la migration massive de données vers le cloud pour les entreprises.
Selon David Hatfield, le président de Pure Storage, la société n’a pas « de déduplication dans FlashBlade aujourd'hui et c'est un ajustement naturel. Mais nous rencontrons plus largement des clients qui ont des centaines de pétaoctets de données. Migrer des dizaines de pétaoctets sur de la flash n'est probablement pas réaliste. Nous entamons des discussions sur la façon de déplacer des dizaines de pétaoctets sur la flash et placer le reste de ces données dans le nuage ».
HatField a également indiqué que Pure Storage entendait honorer et étendre les partenariats signés dans le cloud par StorReduce. Le président de Pure Storage n'a toutefois pas précisé si cette intention s'étendait aux partenariats existants avec des constructeurs comme Western Digital (qui utilise StorReduce en frontal de ses baies de stockage objet ActiveScale)
Une technologie de déduplication séduisante pour le stockage S3
La technologie de StorReduce est séduisante. Le logiciel de la firme peut être déployé sur un serveur physique ou sous forme de VM dans un datacenter d’entreprise ou dans un cloud public. Chaque appliance agit comme une passerelle de déduplication transparente intercalée entre les serveurs hôtes et le stockage objet cible (comme Amazon AWS S3 ou une baie FlashBlade) . Les appliances sont stateless, ce qui permet de les déployer en cluster, avec une limite actuelle de 31 appliances par cluster.
L’ensemble des communications entre serveurs de sauvegarde et appliances de déduplication s’effectue via le protocole S3, qui est également le protocole privilégié pour accéder au back-end de stockage (les APIs Microsoft Azure Blob Storage et Google Cloud Storage sont aussi supportées). Selon StorReduce, le back-end de stockage peut être une baie de stockage objet, un service de stockage en cloud ou une combinaison des deux. Dans ce dernier cas, il est possible pour une entreprise de sauvegarder ses données en local, puis de répliquer ou de cloner ses sauvegardes vers le cloud.
L’ensemble des données ingérées par les appliances est tout d’abord traité par un algorithme de déduplication inline en mode variable, puis compressé afin d’obtenir le taux de réduction de données le plus élevé possible. Selon StorReduce, ce traitement ajoute un maximum 50 ms de latence entre le serveur et le stockage.
Pour fonctionner, chaque appliance requiert un espace tampon sur SSD utilisé pour le stockage des index et des métadonnées de déduplication. Lorsque plusieurs appliances sont réunies au sein d’un cluster, ces informations sont distribuées et redondées à l’échelle du cluster afin de se protéger contre la défaillance éventuelle d’un nœud.
Un log complet des transactions est également stocké au fil de l’eau sur le stockage objet pour permettre de reconstruire l’index en cas de sinistre affectant l’ensemble des nœuds. Le processus de reconstruction de l’index étant consommateur en temps, l’index de déduplication est aussi périodiquement snapshoté et répliqué sur le stockage objet afin d’accélérer la reconstruction. Cette « astuce » permet de n’avoir à reconstruire que la partie postérieure au snapshot le plus récent.
Des performances qui évolue linéairement avec le nombre de noeuds
Au sein d’un cluster, la performance d’ingestion et d’accès des appliances évolue quasi linéairement avec le nombre de nœuds. Un cluster d’appliances StorReduce est vu comme un namespace global dédupliqué unique et peut gérer un back-end de plusieurs centaines de pétaoctets de données (chaque appliance gère au maximum 80 Po de données dédupliquées).
Selon StorReduce, chaque appliance offre un débit de déduplication de l’ordre de 2 Go/s (env. 7, 2 To/h), aussi bien en ingestion qu’en restitution, soit un débit maximum d’un peu plus de 60 Go/s et de 216 To/h pour un cluster. Bien sûr, pour que ces débits soient soutenus, il est nécessaire que le back-end de stockage et le réseau soient dimensionnés en conséquence.
Par comparaison, le plus performant des systèmes DataDomain peut gérer un maximum de 50 Po de données de sauvegarde et affiche une performance en ingestion de 68 To/s lorsque l’on met en œuvre la déduplication à la source (DDBoost) et de 31 To/s.