Getty Images

Sur site ou en cloud ? 4 questions pour savoir où stocker ses données

Dans un contexte de cloud hybride, où le stockage est réparti entre un datacenter sur site et un service de données en cloud, comment décider où placer les données ? Cet article fait le point.

Presque tous les projets informatiques des entreprises impliquent de décider où stocker les données. Le cloud public contient a priori aujourd’hui plus de la moitié de toutes les données des entreprises. Ce volume-là de données n’a cessé de croître au cours des dernières années, principalement chez les hyperscalers.

Le gros problème du cloud est que le trafic n’est pas facturé de la même manière, qu’on lise (payant) ou qu’on écrive (gratuit) les données. De plus en plus, les entreprises se tournent donc vers un stockage en cloud hybride, où certaines données sont stockées sur site et d’autres dans le cloud. Selon différentes études, ce sont près de 80 % des entreprises qui utilisent un cloud hybride à présent pour stocker leurs données.

Derrière ces statistiques, il y a un processus de décision complexe qui implique l’évaluation des charges de travail, des performances, de la réglementation et de la sécurité, ainsi que des coûts. Nous examinons ici quatre interrogations clés pour déterminer quelles données doivent être stockées sur site, dans le cloud, ou à cheval entre les deux. 

Les données sont-elles principalement traitées sur site ou dans le cloud ?

Pour obtenir les meilleures performances, les architectes système doivent minimiser la latence entre les applications et le stockage. L’accès au stockage en cloud via l’internet public augmente inévitablement la latence. Les connexions internet sont également plus sujettes à des performances variables et à des problèmes de fiabilité générale.

Cela suggère que, pour une meilleure performance, les données doivent être stockées à côté des applications. Pour les applications les plus critiques, c’est généralement le cas. Mais la décision n’est pas toujours évidente.

Nous savons que si vous commencez à exécuter des calculs sur une unité de stockage en multipliant les câbles, vous aurez un impact sur les performances », prévient Paul Mackay, patron de la région EMEA chez Cloudera, une société spécialisée dans les données en cloud.

Des architectures différentes peuvent également être nécessaires, selon que les données sont consommées par une application ou par un analyste humain.

« Dans le premier cas, ce sont les applications qui consomment les données ; dans le second, ce sont les utilisateurs qui accèdent aux partages de fichiers sur des NAS », explique Adrian Bradley, responsable de la transformation en cloud chez KPMG. « Dans le premier cas, la meilleure pratique consiste à conserver les applications et les données connectées dans le même environnement. Pour les partages de fichiers, la décision de stocker les données est principalement motivée par l’analyse des coûts opérationnels et par les exigences du cycle de vie des données. »

Quelle est la fréquence d’accès aux données ?

Pour certains cas d’utilisation, tels que l’archivage et le stockage froid, le cloud est très utile. Lorsque les données ne sont pas consultées fréquemment, les performances sont moins importantes. Les applications d’archivage et de sauvegarde basées sur le cloud sont conçues pour fonctionner en arrière-plan, de sorte que les problèmes de performances ne devraient pas affecter les utilisateurs.

« La gestion d’ensembles de données volumineux et fréquemment consultés est plus avantageuse d’un point de vue économique et en termes de performances avec des solutions de stockage sur site. »
Rahul GuptaExpert en données, PA Consulting

Les problèmes surviennent lorsque les entreprises n’ont pas une bonne compréhension de leurs données et de la manière dont elles sont utilisées. Le stockage des données au mauvais niveau augmente les coûts. Il peut également y avoir des problèmes de performance.

« La gestion d’ensembles de données volumineux et fréquemment consultés est plus avantageuse d’un point de vue économique et en matière de performances avec des solutions de stockage sur site », dit Rahul Gupta, expert en données chez PA Consulting.

Là encore, tout dépend de la manière dont les applications sont optimisées pour le cloud. Les entreprises qui transfèrent des charges de travail existantes vers le cloud peuvent se heurter à des problèmes de performances et de coûts, tandis que celles qui utilisent des applications natives du cloud s’en sortent mieux.

Quelles sont les considérations en matière de coûts ?

Le cloud est souvent considéré comme une mesure d’économie, et cela vaut également pour le stockage. Dans les faits, le passage en cloud est davantage lié au passage d’un investissement en capital (achat) à des dépenses opérationnelles (souscriptions). Au fil du temps, le cloud peut facilement coûter plus cher que la solution sur site ou en colocation.

Ce coût supplémentaire peut en valoir la peine. Parfois, les entreprises sont prêtes à payer pour la flexibilité, afin de profiter de l’innovation des fournisseurs de cloud, ou parce qu’elles ont besoin de préserver leur capital. Il se peut aussi qu’elles soient passées à des applications basées sur le cloud.

Même dans ce cas, un stockage optimisé sur site peut rester l’option la plus économique. Comme le souligne Rahul Gupta, tout dépend de l’ancienneté de l’infrastructure sur site du client et de sa durée de vie restante.

Le stockage en cloud comporte également des coûts cachés. L’export des données est souvent cité comme une raison pour laquelle les factures sont plus élevées que prévu. Mais les entreprises peuvent aussi se rendre compte qu’elles paient plus que prévu parce qu’elles stockent des données pendant de longues périodes à des niveaux de performances plus chers, plutôt que dans les zones du cloud dédiées aux archives.

Là encore, une conception minutieuse des applications et une vision claire de l’utilisation des données permettront de minimiser ce problème.

Quelles sont les exigences en matière de sécurité et de conformité ?

« Dans les premiers temps du cloud, on n’y plaçait pas les systèmes critiques, tout ce qui avait trait à la finance ou tout ce qui avait un impact réglementaire. »
Patrick SmithDirecteur technique, Pure Storage

La bonne nouvelle, c’est que la plupart des exigences en matière de sécurité et de conformité peuvent désormais être satisfaites en cloud. « Dans les premiers temps du cloud, on n’y plaçait pas les systèmes critiques ni tout ce qui avait trait à la finance ou tout ce qui avait un impact réglementaire », se souvient Patrick Smith, directeur technique de Pure Storage. « Mais les régulateurs ont depuis lâché la bride sur ces questions. »

Même les niveaux de sécurité les plus élevés sont possibles avec la bonne infrastructure en cloud. La clé pour les DSI est de faire correspondre les exigences de sécurité et de conformité à la sensibilité des données.

Dans certains secteurs, tels que les services financiers ou la santé, des exigences de conformité supplémentaires s’appliquent à l’endroit où les données sont stockées. Cela est susceptible de restreindre les services en cloud qui peuvent être utilisés.

Il reste essentiel d’avoir une vision claire des données de l’entreprise avant de décider où les stocker. « Du point de vue de la sécurité ou de la conformité, vous devez être en mesure de comprendre où se trouvent vos données, qui les a touchées et ce qu’il est advenu de cet ensemble de données », explique Paul Mackay de Cloudera. « Nous constatons que les entreprises se débattent beaucoup dans ce domaine. Elles ont une posture de sécurité sur site, mais ont besoin d’un tout nouvel ensemble d’outils pour le faire dans le cloud. »

Pour approfondir sur Administration du stockage