WavebreakmediaMicro - Fotolia
Les 4 clés du stockage en Edge
Le stockage de proximité, ou stockage Edge, se développe grâce à l’essor de la collecte des données à la source. Cet article explique l’intérêt de stocker les données sur le lieu de production et passe en revue les principaux défis à relever.
La demande pour de l’informatique de proximité – appelée Edge computing – ne cesse de croître. Le cabinet Deloitte, par exemple, annonce que le marché de la technologie edge atteindra les 12 milliards de dollars cette année. D’autres études anticipent même une envolée jusqu’à 60 milliards de dollars d’ici à 2028.
Cette croissance est principalement due aux objets connectés, à la connectivité 5G et aux systèmes distribués que l’on trouve dans des secteurs aussi divers que l’industrie, la santé, la R&D, pour des cas d’usage comme la surveillance à distance ou les véhicules autonomes.
Dans l’un de ses rapports, The Four Edges of Edge Computing, Forrester décrit quatre types d’infrastructure. Chacun sert des besoins particuliers : engagement (les consommateurs ou l’environnement interagissent avec l’équipement), opérations, entreprises et fournisseurs. Nous sommes bien loin de la définition du Edge computing apparue il y a à peine dix ans et où il s’agissait d’évoquer le service informatique d’une petite entreprise ou d’une agence qui avait affaire à un nombre infime d’appareils mobiles.
Les systèmes de proximité, de Edge, aident aujourd’hui les entreprises à faire face au volume croissant des données qu’il faut traiter et analyser, en évitant la latence induite par un transfert des flux d’informations vers le cœur du datacenter.
En revanche, qui dit systèmes de proximité, dit aussi stockage de proximité. Et ce stockage doit être adapté à la charge de travail, à la localisation et à l’environnement.
Où déployer le stockage Edge ?
L’infrastructure et le stockage de proximité n’ont rien de nouveau. Les bureaux distants ou agences peuplés de PC de bureau ont adopté depuis des années des dispositifs de stockage en réseau (NAS…) permettant d’assurer localement le partage et la sauvegarde des fichiers. Les entreprises techniquement plus matures recouraient dans un second temps au transfert de ces sauvegardes soit vers le datacenter du siège, soit sur bandes.
Les équipements portables des utilisateurs peuvent également être considérés comme de l’informatique Edge. À certains égards, leur nature de plus en plus mobile pose même plus de difficultés que le scénario précédent : même s’il existe des solutions en cloud qui automatisent les sauvegardes depuis les équipements personnels, les entreprises se doivent toujours de gérer le stockage sur des équipements locaux pour des raisons de sécurité.
De la même manière, le stockage des données issues de l’informatique de proximité doit se faire sur des équipements éloignés du siège, des équipements autonomes. Les capteurs, les dispositifs de surveillance, les véhicules, les systèmes de gestion de la circulation se pilotent via des relais 4G ou 5G mais exigent un stockage au plus proche des utilisateurs.
Pourquoi utiliser le stockage Edge ?
Les services informatiques des entreprises se polarisent, à juste titre d’ailleurs, sur les datacenters ou l’infrastructure cloud pour tout ce qui a trait au stockage. Ils disposent de systèmes de grande capacité, gérés de façon centralisée et évolutifs.
Pour autant, le transfert des données du lieu de production vers le siège n’est pas toujours possible ni souhaitable. Les énormes volumes de données issus des capteurs connectés, de la vidéosurveillance et de tout équipement connecté pourraient très vite saturer la bande passante du réseau.
Toby AlcockDirecteur technique, Logicalis
Même si ce n’était pas le cas, la latence, la qualité de service et la fiabilité risqueraient d’en souffrir : autant d’arguments à l’encontre de la centralisation de toutes les données. Mieux vaut traiter les données à la source et n’envoyer que les informations particulièrement significatives (résultats, exceptions ou défaillances, échantillons de données temporelles, par exemple) afin de moins solliciter la bande passante. Mais le stockage de proximité doit être efficace.
« Au cours des dernières années, nous avons assisté à l’explosion des appareils connectés à Internet et ils sont principalement à l’origine des systèmes dits d’informatique en edge », explique Toby Alcock, directeur technique chez Logicalis, un intégrateur de solutions informatiques. « Les appareils connectés à Internet pour remonter leurs données nécessitent aussi une puissance de traitement en temps réel à l’endroit où ces données sont collectées, et c’est pourquoi ils doivent disposer d’un stockage local. »
Variante du stockage Edge, la mise en cache de proximité est l’objet de toutes les attentions du secteur des télécommunications. Dans ce cas, les données sont temporairement stockées avant d’être transférées vers d’autres systèmes centralisés, ou vers des services cloud, où elles sont traitées.
La mise en cache Edge permet de compresser les données, de les chiffrer, d’effectuer de l’équilibrage de charge. Cette technique est déjà utilisée dans les réseaux de diffusion de contenu (CDN, Content Delivery Network) dans le monde des médias. Contrairement à d’autres applications de stockage de proximité, la mise en cache fonctionne dans les deux sens : elle stocke en aval les données livrées au consommateur et en amont celles qui remontent à l’entreprise.
Stockage Edge : quelle technologie ?
D’un point de vue purement technique, le stockage Edge sera très vraisemblablement basé sur du stockage Flash. On pense à des SSD NVMe sous la forme de cartes électroniques à un format suffisamment petit pour être embarqué dans les équipements les plus complexes sur site. Mais aussi à des cartes SD ou MicroSD pour d’autres équipements comme les caméras de vidéosurveillance.
Les fabricants produisent à présent des cartes SD et microSD de qualité professionnelle, qui supportent une écriture constante de données. Ces cartes sont plus robustes que les modèles grand public, mais coûtent bien plus cher.
Le stockage Edge doit aussi afficher une certaine robustesse sur le plan physique, car les appareils connectés risquent d’être exposés à des conditions environnementales critiques, dont l’humidité, les chocs, les fluctuations de température. Ils peuvent être la cible de vandalisme ou de vol. Dans l’automobile et les transports, les supports doivent aussi résister aux vibrations et aux mouvements.
« La technologie Edge doit se fondre dans le décor tant sur le plan de la forme que sur celui de la fonction », explique Naveen Chhabra, analyste chez Forrester. « Prenez l’exemple des voitures autonomes. Il est impossible de placer un rack complet de serveurs dans une voiture, par manque d’espace et de capacité de refroidissement. Un kiosque interactif en boutique a aussi ses propres contraintes de conception. »
Avantages et inconvénients du stockage Edge
S’il est vrai que l’installation du stockage augmente le coût des équipements sur site, il faut aussi noter que le stockage (et le traitement) à la source s’avère moins cher et plus efficace que le transfert des données vers le data center ou le cloud.
Le coût de bande passante est l’un des principaux éléments jouant en faveur d’un stockage de proximité. Selon les experts du secteur qui se basent sur les tarifs d’AWS, les coûts de bande passante sont quatre fois supérieurs par gigaoctet à ceux du stockage. De plus, en éliminant les données redondantes avant tout transfert, vous réduisez encore les coûts.
Citons d’autres points d’achoppement : la difficulté à atteindre la périphérie à l’aide des technologies réseau conventionnelles, le manque de fiabilité et les temps de latence susceptibles d’affecter les réseaux à distance.
« Parmi les préoccupations majeures de la technologie Edge – mais ne devrais-je pas plutôt parler de fortes motivations en sa faveur – figurent la latence et la bande passante. Autrement dit, la vitesse et la capacité de la connexion reliant le cœur », précise Bryan Betts, analyste chez Freeform Dynamics. « Si vous souhaitez réduire le volume de données à transférer et réagir plus vite, ce qui doit normalement être votre cas, vous devez travailler davantage en périphérie. »
Seul hic, la gestion et la maintenance du stockage sur le site de production s’avèrent plus difficiles en raison même de la localisation. Pour accroître la capacité, vous devez renouveler le matériel et pour télécharger les données, vous dépendez des connexions à bande passante limitée des sites distants.
Malgré cela, les fournisseurs et clients cherchent les moyens d’améliorer la capacité de stockage Edge, en transférant les données via le réseau pendant les périodes creuses, voire physiquement.
« Le stockage Edge ne s’adapte pas aussi vite que le cloud » affirme Ivaylo Vrabchev, responsable des services professionnels et de l’architecture de solutions AWS chez HeleCloud. Et de poursuivre : « Il faut prévoir une gestion très précise de la capacité pour éviter au système une pénurie de ressources. »