Getty Images/iStockphoto

Les nouvelles tendances de la production IT pour optimiser le contrôle et l’agilité des actifs

Automatisation, Machine Learning, GenAI, AIOps, FinOps. Cet avis d’expert remet en perspective les petites révolutions qui touchent l’observabilité et la production IT.

La mission de la production IT est de proposer des solutions méthodologiques et techniques robustes pour améliorer et maintenir constants les processus de production, tout en assurant la surveillance infra-applicative.

Impactée par les évolutions technologiques du marché, elle est aujourd’hui en mutation.

En effet, la transformation digitale et le volume en croissance des données, la migration accélérée des charges de travail dans le cloud, les changements induits par les nouvelles architectures sur containers (et Kubernetes), le edge computing, le manque généralisé de ressources qualifiées, mais aussi la pression plus forte sur les coûts sont autant d’impératifs avec lesquels les entreprises doivent composer.

De nouvelles voies doivent donc être explorées pour renforcer la qualité de service IT : une automatisation encore plus poussée, maintenir le service informatique en condition opérationnelle constante, planifier au plus juste et garantir une maîtrise des coûts.

Le tout en maintenant une infrastructure à jour via une veille continue des technologies et de meilleures pratiques.

Une automatisation plus que nécessaire

Le cloud public continuera à connaître une forte adoption. Le marché est estimé à presque 3 milliards d’euros en France sur les 4 prochaines années, selon une étude réalisée par Markess.

De son côté, le volume des données poursuit sa croissance phénoménale alimentée notamment par l’Internet des objets (IoT), les médias sociaux, les technologies mobiles et l’adoption croissante du cloud. Ce volume est évalué en 2023 à plus de 50 zettaoctets.

Les entreprises de tous les secteurs sont confrontées au défi de gérer et d’analyser ces vastes ensembles de données pour en tirer des informations précieuses.

De plus, les entreprises migrent leurs workloads sur site vers les machines virtuelles (VM) dans le cloud, mais aussi transfèrent les workloads des serveurs et VM vers Kubernetes et les conteneurs, réorganisent leurs architectures applicatives monolithiques vers les microservices et adoptent des fonctions Serverless. Le volume de données télémétriques augmente donc lui aussi de manière drastique.

Les coûts élevés d’ingestion des données peuvent obliger les organisations à les échantillonner.

Pour traiter l’ensemble de ces informations, l’automatisation des processus de production est un prérequis. Les technologies comme le Machine Learning et la RPA (Robot Process Automation) allègent considérablement les tâches des équipes, tout en améliorant l’efficacité et la disponibilité des systèmes.

Avec l’IA et des algorithmes prédictifs, elles ont les moyens d’anticiper les indisponibilités dues à des pannes ou à des erreurs pour fiabiliser encore plus l’infrastructure.

Palliant en partie le manque de spécialistes, l’intelligence artificielle générative va simplifier le support en apportant la possibilité de gérer la production, par de simples requêtes en langage naturel pour proposer des réponses adéquates aux problèmes posés.

Il est important de noter que l’IA et l’automatisation ne vont pas remplacer l’humain. Ces technologies vont, au contraire, renforcer l’efficacité du pilote d’exploitation au quotidien. Elles vont lui permettre de ne plus traiter les tâches répétitives à faible valeur ajoutée. Elles vont aussi lui donner à comprendre les alertes et autres événements, afin de pouvoir les traduire en enjeux métiers tangibles (indisponibilité, retard, insatisfaction, etc.).

Le « pilote augmenté », ainsi doté de cette nouvelle couche de compréhension, va parler le même langage que les métiers et donner plus de sens à sa profession.

De la surveillance… à la prédictibilité avec l’AIOps

Au sein de ce processus d’automatisation, il est important de s’assurer que l’on possède bien les bonnes données. Mais aussi qu’il est possible de les analyser, tout en les délivrant aux bonnes personnes, à travers les bons outils, ce qui va permettre d’évaluer l’utilisation des ressources, la disponibilité système, ou encore les temps de réponse applicatifs. Et assurer ainsi la continuité et la qualité de l’activité IT.

Parce qu’elle améliore la supervision – en mettant à disposition toutes les informations utiles pour régler les incidents –, l’observabilité repose sur la capacité à mesurer les états internes d’un système en examinant ce qu’il produit.

Un système est considéré comme « observable » si son état actuel peut être estimé uniquement en utilisant les informations de sortie, à savoir les données des capteurs (logs, métriques, etc.). Mais ici, il est nécessaire d’être le plus transverse possible pour éviter le cloisonnement entre les informations.

Il est également nécessaire de pouvoir, via API, se connecter à d’autres outils et d’autres systèmes IT en consolidant les données provenant de différentes sources et de se doter ainsi d’un système d’observabilité unique.

Cependant, selon une étude réalisée pour NewRelic (2022 d’Observability Forecast), seuls 2 % des entreprises déploient 15 capacités d’observabilité différentes (indicateur d’une approche d’observabilité mature). 57 % déployaient du monitoring réseau et seulement 34 % du monitoring Kubernetes.

L’AIOps (ou intelligence artificielle adaptée aux opérations IT) constitue une révolution pour l’observabilité.

Elle lui apporte plus d’assistance, de prédictibilité et de hiérarchisation des urgences à traiter. Elle se base sur une plateforme pour regrouper les données, les équipes et les outils informatiques silotés. Elle active des techniques d’analyse avancée et du Machine Learning pour détecter les anomalies et prédire les incidents, ce qui facilite de facto la maintenance prédictive et la gestion des risques.

La capacité à traiter de grandes quantités de données en temps réel va permettre une identification rapide de schémas et des tendances, qui sont des indicateurs potentiels de problèmes. Par exemple, un système de surveillance basé sur l’IA dans un datacenter va détecter des tendances de surcharge sur un serveur pour déployer automatiquement des ressources supplémentaires.

Quand le FinOps s’en mêle pour adapter l’impact financier

Si actuellement la stratégie FinOps assure le suivi des coûts dans le cloud, elle peut aussi être utile pour une analyse étendue de ce qui se passe économiquement sur la production IT en général.

Cette approche permet aux équipes opérationnelles, en liaison avec les analyses d’observabilité, de gérer au plus juste les coûts de la production IT et ainsi de prévoir les besoins et les capacités nécessaires pour assurer la continuité des opérations le plus efficacement possible.

Au-delà des sources d’économies, le FinOps soutient également la stratégie de durabilité des organisations, en mesurant de manière continue l’impact environnemental des datacenters on premise, de l’infrastructure cloud et des services logiciels.

Conclusion

Une production IT moderne, à la fois au niveau opérationnel et économique, allie automatisation, observabilité avec l’IA, et stratégie FinOps. Elle répond à la complexité des nouveaux environnements.

En offrant, en plus, une meilleure visibilité sur l’utilisation des applications et une approche proactive de la résolution des pannes, elle va générer une meilleure sobriété digitale.

À l’instar du cloud considéré il y a quelques années comme une technologie révolutionnaire, mais que beaucoup d’entreprises temporisent aujourd’hui en s’orientant davantage vers un mode hybride, l’IA doit être utilisée convenablement.

Les rythmes de diffusion et d’adoption de la technologie sont inégaux en fonction des marchés et des entreprises. Il convient de s’assurer en amont du niveau de maturité de l’organisation, afin de trouver le bon équilibre pour in fine livrer un niveau de service de qualité, mais aussi adapter ses promesses aux réalités terrain.

Sans oublier la sensibilisation des collaborateurs pour favoriser une adoption complète.

Pour approfondir sur Administration et supervision du Cloud