Le monitoring réseau, une réponse au cloud défaillant
Le monitoring de services cloud permet de collecter de nombreuses données liées à la performance, mais une pièce centrale du puzzle, le réseau, est souvent aux abonnés absents. Un outil tiers de surveillance pour cette partie est donc essentiel afin de maintenir votre cloud dans un état fonctionnel.
Les services de monitoring de services cloud collectent de nombreuses données liées aux performances des serveurs, des systèmes de stockage, ou encore d’autres services, analysant l’écosystème global d’un fournisseur. Malheureusement, les outils de monitoring du réseau y sont souvent limités ; en résulte une vision partielle et une dissimulation de problèmes clés affectant les performances de votre environnement cloud. Pour surveiller de près votre réseau et identifier d’éventuels problèmes, utilisez un outil de monitoring pour suivre et tracer le moindre dysfonctionnement et dresser une rapport clair sur l’état des performances.
Les outils de monitoring de réseau sont classés en trois catégories : les outils basiques, les outils de visualisation et de reporting, les outils de détection d’anomalies avancés.
Les outils les plus avancés disposent de fonctions qui les positionnent bien au-delà d’une des trois catégories ci-dessus. Mais, si vous vous intéressez à la visualisation et à la détection d’anomalies ainsi qu’à la sécurité, arrêtez-vous sur ces seules fonctions, mais contenues dans un unique produit.
Les outils basiques, mais efficaces
Nagios est un outil de monitoring du réseau Open Source qui a la réputation d’être difficile à utiliser mais qui reste complet. Il écoute les protocoles réseaux, surveille les services et génère des alertes via SMS, email ou des scripts d’exécution personnalisés. Un module de reporting permet de documenter et de journaliser les défaillances ainsi que les réponses qui leur ont alors été apportées.
Pour ceux qui souhaitent disposer des capacités de monitoring de Nagios mais sans la courbe d’apprentissage, des outils tiers pour cette plate-forme sont peut-être la bonne option. Avec des services comme ceux d’Opsview, vous avez à disposition des fonctions ainsi que des services avancés et plusieurs niveaux commerciaux : une option gratuite et Open Source et une autre de type entreprise. Cette dernière comprend des tableaux de bord unifiés, l’agrégation des rapports et de données issues de plusieurs serveurs distribuées.
Zabbix ISA peut également être considéré comme une option Open Source pour la gestion d’infrastructure, avec des outils de monitoring réseau. Avec ces outils de Zabbix, les administrateurs collectent des indicateurs détaillés sur les serveurs ainsi que sur les réseaux. Ils proposent des fonctions de visualisation capables de formater de grands volumes de données dans des formats plus faciles à analyser.
Le monitoring distribué via proxy et le monitoring avec ou sans agent sont également des options disponibles.
Les outils de visualisation pour digérer les grands volumes de données
L’une des plus grosses difficultés avec un service de monitoring réseau est justement qu’il est capable de générer de grandes quantités de données. Les outils de reporting peuvent filtrer et agréger les données. Ceux de visualisation peuvent consolider cette avalanche de données et leur donner un rendu spécifique qui mette en avant les connexions les plus pertinentes entre les informations.
Côté visualisations, les administrateurs cloud sont généralement attirés par l’utilisation d’un outil de monitoring Open Source comme PRTG, bâti sur RRDtool, utilisé notamment pour l’enregistrement de données ou les applications à base de graphes. La société Paessler propose un support commercial pour PRTG. Cacti, un autre outil reposant sur RRDtool, est quant à lui proposé par un partenaire AWS Jumpbox. Cacti comprend une interface qui supporte le templating de graphes ainsi que de nombreuses méthodes d’acquisition de données.
La détection d’anomalies pour un monitoring réseau plus avancé
Seules, les techniques de visualisation ne suffisent pas. Certains patterns du trafic réseau sont plus subtils. Par exemple, les variations de ces patterns peuvent être révélatrices d’un problème, mais il se peut qu’elles n’apparaissent pas dans les outils classiques de gestion de rapports et de visualisations. Cela nécessite une méthode de détection d’anomalies. Pour le monitoring avancé, doué de fonctions de prévention, les applications de détection d’anomalies ont la capacité d’identifier les comportements du réseau, hors des plages attendues.
La détection d’anomalies est clé pour les services qui nécessitent des applications cohérentes ainsi que des performances optimisées côté réseau. Une campagne marketing peut par exemple provoquer un pic de trafic sur un site. Même avec des outils de load balancing, il existe un risque en matière de latence côté expérience utilisateur. Des solutions comme Grok (de la société Numenta) peuvent identifier ces hausses ainsi que d’autres anomalies.
Idéalement, si l’auto-scaling est en place, votre application doit ajouter automatiquement des nœuds au cluster pour absorber la charge. Grok identifie les problèmes potentiels en matière de performances, permettant aux administrateurs d’ajouter manuellement de serveurs ou de s’assurer que l’auto-scaling répond bien à ce pic de trafic.
Traduit par la rédaction