ninog - Fotolia
Stockage Edge : usages et technologies
Le stockage migre du datacenter au lieu de production. Cet article explique ce qu'est le stockage de proximité, dit Edge, et décrit les technologies sur lesquelles il s'appuie.
Les grands datacenters monolithiques, au cœur des entreprises, pourraient céder la place à des centaines, voire des milliers, de datastores ou d’équipements plus petits dotés chacun de leur propre capacité de stockage.
Pourquoi ? Parce que les entreprises déplacent leurs processus vers l’Edge, c’est-à-dire vers le lieu de production. L’informatique de proximité, ou Edge computing, ne consiste plus à envisager un stockage local dans des bureaux distants. Elle trouve désormais sa raison d’être dans les objets connectés à Internet, les équipements et les capteurs intelligents et d’autres technologies comme les voitures autonomes. Toutes ces technologies imposent le stockage des données là où elles sont collectées.
Les analystes de Gartner confirment que les données métier passent du datacenter vers le cloud ou vers le lieu de production. Le cabinet identifie quatre cas d’utilisation pour le stockage Edge : les clouds et datacenters distribués, le traitement des données à la source, la collaboration et l’accès au contenu, et l’ingestion et le streaming numériques.
Cette liste est loin d’être exhaustive : des applications telles que les véhicules autonomes, qui ne relèvent pas de l’informatique d’entreprise, justifient aussi l’informatique de proximité. En parallèle, les processus industriels, les capteurs et les objets connectés à Internet sont autant de raisons de traiter les données là où elles sont collectées.
Le marché du stockage Edge dépend de l’évolution des technologies de stockage et des applications de l’informatique en edge. De plus en plus, les appareils de proximité imposent un stockage persistant, robuste et fiable, de même que les applications exigent des performances que les cartes SD ou micro-SD des premières générations d’appareils connectés et des ordinateurs monocartes ne sont pas en mesure d’offrir.
Où se situe l’Edge ?
L’Edge computing était initialement lié au déploiement des bureaux distants, où les données pouvaient être sauvegardées ou répliquées, pour leur sécurité, et mises en cache avant de remonter vers le datacenter pour y être traitées. Cette approche par lots fonctionnait assez bien dans les environnements où les flux de données étaient relativement prévisibles, comme le commerce et la distribution.
Mais compter sur un PC en réseau, un petit serveur ou un équipement NAS pour étendre le stockage n’est vraiment possible que dans les environnements de bureau ou de back-office qui sont statiques, stables au niveau environnemental et généralement sécurisés.
Aujourd’hui, l’informatique en Edge est beaucoup plus vaste et couvre des environnements opérationnels beaucoup plus hostiles : de l’usine, avec des équipements de proximité reliés à des machines-outils, aux caméras ou autres capteurs disséminés sur site, en passant par les kits de télécommunication et même les véhicules.
Pour qualifier ces environnements, Enrico Signoretti, analyste chez GigaOM, utilise les termes edge industriel, edge distant ou edge lointain. Le stockage doit être fiable, facile à gérer et surtout économique, compte tenu du nombre d’équipements déployés.
Quelles sont les caractéristiques d’un système de stockage Edge ?
Pour les applications de proximité, le stockage doit être physiquement robuste, sécurisé aussi bien physiquement que virtuellement (souvent par chiffrement) et capable de résister aux fluctuations de température comme aux vibrations. Il doit être persistant, mais consommer peu d’énergie. Dans certains cas, il doit aussi être rapide, surtout lorsque les entreprises souhaitent exécuter des moteurs d’intelligence artificielle directement sur les sites de production.
Alex McDonald, président EMEA (Europe, Moyen-Orient et Afrique) de la Storage Networking Industry Association (SNIA), explique que le stockage Edge regroupe « les produits et technologies de stockage et de mémoire qui hébergent les données générées sur le lieu de production, dont les disques et baies SSD, la DRAM intégrée, la mémoire flash et la mémoire persistante. »
Dans certains cas, les systèmes de stockage et de calcul doivent être adaptés pour fonctionner dans des environnements plus variés que l’informatique conventionnelle. Cela requiert à la fois une robustesse physique et des mécanismes de sécurité. Les ordinateurs monocartes (Rapsberry Pi, par exemple) s’appuient souvent sur des cartes mémoire amovibles. Si le chiffrement évite la perte des données, il n’empêche pas une personne mal intentionnée de retirer physiquement le module mémoire.
« Les équipements renforcés et améliorés trouveront naturellement leur place dans les environnements qui exigent une protection supplémentaire dans les applications embarquées, de l’automobile à l’industrie », constate Alex McDonald.
Les entreprises qui font appel à l’informatique de proximité s’intéressent aussi à d’autres technologies : SCM (Storage Class Memory), NVMe-over-fabrics, et HCI (infrastructure hyperconvergée).
L’infrastructure hyperconvergée, avec son stockage intégré, est peut-être la solution la mieux adaptée aux applications promises à une évolution future. Il est assez facile pour les équipes informatiques d’ajouter des nœuds HCI, même sur des sites distants, sans alourdir les tâches ou les coûts de gestion.
Dans la plupart des cas, les besoins en stockage en Edge computing restent néanmoins relativement faibles. Il ne s’agit pas de trouver des systèmes de stockage à plusieurs téraoctets, mais des systèmes capables de gérer des données chronosensibles, « périssables », qui sont analysées localement puis transmises à un système central, le Cloud en principe. Peut-être faudra-t-il combiner les deux ?
Par conséquent, les systèmes doivent pouvoir analyser immédiatement les données avant de les transmettre à un magasin ou à un processus central. Ce tri doit se faire rapidement et au plus proche des ressources informatiques. C’est ce point qui suscite l’intérêt dans les technologies NVMe-over-fibre channel et Storage Class Memory.
En intégrant un stockage local dans le périphérique, les concepteurs de systèmes parviennent à compenser l’un des plus gros défauts de l’Edge computing : la consommation de bande passante.
Edge computing et données : quelles relations ?
Si les entreprises cherchent à intégrer le stockage des données à leurs systèmes de proximité, c’est, du moins en partie, pour réduire la charge qui pèse sur leurs réseaux et datacenters centralisés, ou pour diminuer la latence lors du traitement.
Certaines entreprises disposent aujourd’hui d’un si grand nombre d’équipements de proximité que ces derniers risquent de submerger les réseaux locaux. Aussi plaisante soit l’idée d’une informatique décentralisée connectée au Cloud, dans la pratique, la latence, le risque de perturbation du réseau et les coûts de stockage en Cloud ont fini par convaincre les fabricants de matériel de proposer au minimum la prise en charge d’un stockage local.
Nombreux sont dorénavant les fournisseurs à fabriquer des appliances Edge qui fonctionnent aux côtés des appareils connectés à Internet (ou plus précisément, juste derrière) pour en récupérer les données. Certains de ces outils transfèrent les données, comme l’Edge Appliance de Google, d’autres en assurent eux-mêmes le traitement IA pour soulager le réseau.
Ainsi, les architectes système renforcent l’Edge computing : on traite davantage de données à proximité du capteur ou du périphérique, on prend des décisions plus rapidement grâce à l’analytique et à l’IA, et on réduit considérablement le volume de données transmises vers le réseau local de l’entreprise ou le service cloud.
Ajouter du stockage de proximité, directement ou par le biais d’appliances, permet aussi la réplication ou l’archivage par lots et facilite le fonctionnement en cas de connexions intermittentes ou peu fiables, notamment pour les applications mobiles. Selon Jimmy Tam, PDG de Peer Software, certains fournisseurs intègrent à la fois des disques durs et des disques SSD pour que les appareils puissent stocker à moindre coût des volumes plus importants de données.
« Lorsque le stockage Edge agit principalement comme une plateforme d’ingestion qui réplique ou transmet ensuite les données vers le Cloud, une large partie du stockage peut être constituée de disques durs plutôt que de disques SSD pour accroître la densité des données », explique-t-il.
Quelles technologies de stockage émergentes en Edge ?
Il y a peu de chances qu’une seule technologie de stockage prédomine sur les lieux de production. Comme l’observe Gartner dans une récente étude : « bien que les solutions de stockage Edge partagent des principes fondamentaux, il n’existe pas de technologie unique, car chaque cas d’utilisation demande une personnalisation particulière ».
Pour autant, Gartner s’attend à voir davantage de technologies de stockage de données « edge-ready », y compris des technologies de datacenter plus efficaces face aux besoins locaux.
Les fournisseurs de solutions IoT et d’autres technologies de proximité s’efforceront d’améliorer les performances du stockage, en délaissant les technologies USB, comme les cartes SD ou micro-SD, au profit de solutions de type serveur et poste de travail, telles que Flash, NVMe et NVMe-over-fabrics, ou encore SCM.
Mais, reste une question : comment gérer un nombre toujours croissant de dispositifs de stockage ? Les développements comme la 5G ne feront qu’augmenter le nombre d’applications en Edge. Les entreprises chercheront donc des systèmes de stockage non seulement robustes, mais aussi autoréparables et capables de se gérer seuls, du moins dans le cours normal des opérations.