L'association Goodwill décongestionne son réseau avec un analyseur de trafic NetFlow
Afin de régler ses problèmes de congestion réseau, l'association de réinsertion GoodWill a mis en place un analyseur de trafic exploitant les informations remontées par les sondes Netflow et sFlow embarquées dans ses commutateurs et routeurs Cisco. L'outil, combiné à son outil de supervision libre Zenoss, a permis à la firme d'accélérer la résolution de ses problèmes réseau.
Tenter de régler un problème de congestion réseau en ajoutant systématiquement plus de capacité n’est pas la solution magique à tous les problèmes de ce type remontés par les outils de supervision du réseau, mais c’est une solution facile pour ceux qui n’ont pas le temps de diagnostiquer en profondeur leur réseau. Pour les autres, trouver la source d'une congestion revient souvent à partir à la chasse les yeux bandés. Pour une association à but non lucratif de Chicago, l’utilisation d’un outil d’analyse de trafic Netflow a toutefois mis un terme à ce jeu des devinettes.
Le réseau de Goodwill, association américaine de réinsertion à but non lucratif qui aide des personnes handicapées à se former et à retrouver un travail, s’appuie sur des routeurs et des commutateurs Cisco qui relient le siège aux bureaux locaux de l’organisation ainsi qu’aux sites des services de manutention, de logistique, d'emballage des produits, de blanchisserie, de services de restauration et de services de nettoyage d’uniformes. Parmi les 30.000 « clients » de Goodwill figurent notamment les marins et leurs familles sur la base navale des États-Unis des Grands Lacs, au nord de Chicago.
"Ils commandent quotidiennement les repas à préparer et ces commandes transitent par le biais du réseau, explique Bob Branski, administrateur système chez Goodwill. Nous ne pouvons pas aller voir la Marine et leur dire que nous n'avons pas reçu leur commande de nourriture aujourd'hui et ne pouvons pas les servir. Ce n'est tout simplement pas envisageable".
Pas un problème réseau, une erreur de configuration des systèmes
"Auparavant, le diagnostic d’un problème de congestion relevait largement de la méthode des essais et des erreurs, reprend Bob Branski. Maintenant, je peux simplement affirmer par exemple que 80 % de mes données proviennent de tel serveur, et je peux concentrer mon énergie sur [la résolution] de ce problème, plutôt que me lancer dans une chasse à l'aveuglette."
Pour Branski, le problème était avant tout une question d’échelle. Les utilisateurs de Goowill sont en effet répartis sur 56 sites reliés par un réseau MPLS et sur 13 autres bureaux distants connectés par VPN IPSec ou par liaisons Numéris. Cette infrastructure permet aux salariés de l’entreprise de se connecter aux services fournis par plus de 120 serveurs physiques et virtuels, basés au siège social à Milwaukee.
En utilisant un outil d'analyse de trafic NetFlow, Branski a découvert que les mises à jour automatiques de logiciels antivirus et de Windows - censées en principe se dérouler en tâche de fond et avec une faible priorité - n’avaient pas été configurées correctement. "Avec 60 sites, quelle que soit la quantité de bande passante que vous ajoutez pour régler le problème, cela ne suffira pas. En utilisant Netflow, j’ai découvert que mon problème ne provenait pas du réseau, mais de la configuration des systèmes."
L’outil d’analyse de trafic basé sur NetFlow réduit le temps de diagnostic
Au cours des deux dernières années, Bob Branski a utilisé Zenoss, un outil de supervision Open Source pour surveiller l’usage de la bande passante. Le problème ? Le simple constat d’une saturation de la bande passante disponible ne permet pas d’avoir des informations pertinentes quant à la source de l’obstruction. "Je pouvais visualiser les files d’attente et voir le nombre de paquets perdus augmenter... sans toutefois avoir d’indications sur la nature du problème. J’avais sous les yeux un constat de sur-utilisation de la bande passante, mais pas d’indications sur les causes", reconnaît-il.
L'éditeur Zenoss a alors mis Branski en relation avec Plixer International, l’éditeur de Scrutinizer, un outil spécialisé dans l’analyse des informations sFlow et NetFlow collectées par les sondes embarquées des commutateurs et routeurs Cisco. Le logiciel s’intégre directement dans Zenoss, ce qui évite d’avoir plusieurs consoles à surveiller.
Plixer offre une version démo gratuite de ses outils d'analyse de trafic NetFlow et sFlow et propose une version commerciale plus riche. Scrutinizer a permis à Branski de résoudre ses problèmes de congestion réseau en remontant en quelques minutes à la source du problème. "Pour nous, la principale amélioration réside dans la réduction du délai entre la détection d’un problème et sa résolution. Je peux facilement passer dans Scrutinizer et déterminer quels postes ou quels systèmes sont à la source de la congestion", explique l'administrateur.
Eviter l'ajout systématique de bande passante
"L’un des intérêts de l’outil est d’éviter d’avoir recours à des analyseurs de paquets pour tenter de détecter la source d’un problème. Nous effectuons automatiquement ce diagnostic et permettons à l’administrateur d’analyser en profondeur la source de la défaillance", ajoute Mike Patterson, le patron de Plixer. Bien sûr, parfois, le problème vient effectivement d’un mauvais dimensionnement du lien réseau et il faut alors accroître la bande passante. Mais dans bien des cas, l’outil permet d’isoler les problèmes de configuration, les comportements erratiques de certains postes ou serveurs qu’autrefois l’entreprise aurait tenté de résoudre en augmentant sa bande passante... alors que le problème était tout autre.