La lingerie fine RougeGorge se pare de capteurs contre les pannes
La marque a équipé ses 241 magasins, son siège et ses deux datacenters de plus de 4800 capteurs et d’une console PRTG pour réagir au moindre incident informatique.
La marque de lingerie RougeGorge utilise le logiciel PRTG Network Monitor pour surveiller tous les incidents qui pourraient survenir dans ses deux datacenters, dans les bureaux de son siège ou dans l’un de ses 241 magasins en France métropolitaine, à la Réunion et en Belgique.
« Vérifier qu’un équipement numérique est bien allumé dans nos points de vente est primordial, car notre image de marque repose notamment sur l’utilisation des nouvelles technologies », explique au MagIT Thomas Clauw, en charge de la gestion du système d’information de RougeGorge.
S’assurer que chaque magasin a une connexion Internet active est bien évidemment le plus important. Outre la validation des paiements par carte bancaire, cette connexion sert à synchroniser le point de vente avec les commandes passées sur le web de l’enseigne ; les clientes sont en effet invitées à venir chercher sur place les produits que les vendeurs auront mis de côté à leur intention. En cas de rupture de stock, le système prévoit même de prévenir un autre magasin pour qu’il envoie par coursier le produit manquant.
« Dès que nous détectons une panne, nous prévenons nous-mêmes le SAV pour qu’ils interviennent. Et s’ils ne peuvent le faire dans les plus brefs délais, nous livrons au magasin un routeur 3G/4G », dit Thomas Clauw.
L’enjeu d’être réactif pour servir une image de marque à la pointe
Les magasins ont aussi une borne Wifi, qui permet aux vendeurs outillés d’un Zebra – une sorte de Smartphone durci - de mieux renseigner les clientes dans les rayons et de préparer leur facture pour leur éviter de faire la queue en caisse. L’entrée est munie d’un compteur de passage, qui permet aux commerciaux de la marque d’établir des statistiques sur la fréquentation, de les comparer aux ventes effectives et d’optimiser en permanence la mise en avant des produits.
Chaque magasin est d’ailleurs équipé de plusieurs écrans qui font office de vitrine en allant télécharger eux-mêmes sur une plateforme SaaS les vidéos promotionnelles du moment. Ils sont synchronisés avec un boîtier NUC d’Intel qui s’assure que toutes les vidéos démarrent en même temps. Enfin, un boîtier multimédia assure un fond sonore, pour le confort des visiteurs.
« Nous avons 5 à 10 capteurs par magasins qui nous indiquent la bonne marche de chaque équipement, soit un total de 1237 capteurs. A cela s’ajoutent 3600 autres capteurs qui monitorent aussi bien les imprimantes et les caméras de notre siège que les serveurs de nos deux datacenters. Cela fait énormément d’informations à surveiller en temps réel pour réparer un incident dans les plus brefs délais. »
« Mais le problème est que, lorsque j’ai pris mes fonctions chez RougeGorge en 2013, tout ce système de surveillance reposait sur le logiciel Open source Nagios », se désole Thomas Clauw.
Le responsable du SI rêve alors d’un système qui affiche sur de grands écrans des cartes des activités, d’interfaces avec une arborescence taillée sur mesure pour naviguer parmi les flottes d’appareils, voire de dispositifs qui s’enclenchent tous seuls en cas d’incident. Nagios n’offrait rien de tout ça.
« Nagios envoyait des e-mails en cas d’alerte. Son interface web – illisible - était excessivement compliquée à manipuler. A chaque fois que nous devions configurer les capteurs d’un nouveau magasin ou d’un nouveau serveur, c’était un enfer », lance-t-il ! L’inertie était telle qu’elle remettait en question toute la réactivité dont le service informatique voulait faire preuve.
Des indicateurs en temps réel sur des cartes et des arborescences personnalisées
Thomas Clauw n’a pas eu à chercher bien loin pour trouver une alternative bien plus efficace à Nagios : dans ses précédentes fonctions, il utilisait déjà le logiciel commercial PRTG Network Monitor de Paessler. « La validation du budget pour ce projet n’a pas été très compliquée : nous avons calculé que le coût de cette solution serait largement amorti par tous les appels à des prestataires que nous n’aurions plus à faire à chaque fois que nous avions besoin d’aide sur Nagios », assure-t-il.
« Ce qui me plaît dans PRTG est toute la partie administration, qui me permet de configurer exactement les environnements de visualisation et les processus automatiques que je souhaite. Je peux représenter les magasins par pays, par région, sur une carte géographique où je place les icônes de mes points de vente, qui changent de couleur en cas de problème et sur lesquels je peux cliquer pour consulter les détails. »
« Je fais la même chose pour les équipements de notre siège, à partir d’un plan des locaux que j’ai dessiné sous Painter. Quant aux datacenters, j’ai pour l’instant rangé les différents éléments dans une arborescence par type d’infrastructures. C’est le moyen que je trouve le plus efficace », détaille-t-il.
Il n’y a pas d’agent à installer. Tous les indicateurs correspondent juste à de simples ‘pings’ qu’envoient les routeurs réseau aux appareils qui leur sont connectés. Un serveur PRTG, un dans chaque datacenter pour des questions de redondance, passe juste son temps à interroger tous les routeurs. Pour configurer ces requêtes, RougeGorge est passé par l’ESN By The way.
« Outre le côté pratique des indicateurs – que j’affiche sur deux écrans 55 pouces accrochés au mur de mon bureau – il y a l’information en temps réel. Avec Nagios, nous étions alertés en cas d’incident, mais nous ne savions pas quand il était résolu. Avec PRTG, nous voyons un indicateur redevenir vert. Il n’y a plus de vérification à aller refaire. »
Automatiser pour soulager les métiers d’interventions répétitives
Au-delà des indicateurs, l’exécution de processus automatiques est un autre grand avantage de PRTG Network Monitor.
« Nous avons traité le passage de Nagios à PRTG comme un projet de transformation classique : nous avons discuté en amont avec les métiers pour connaître les fonctionnalités dont ils avaient besoin. Et tous ont exprimé des attentes. A la comptabilité, par exemple, nous avons un serveur de base de données qui atteint régulièrement les limites de ses ressources. Il suffit juste de lui en allouer ponctuellement, mais Nagios demandait que quelqu’un intervienne », raconte Thomas Clauw.
« Il en va de même sur le serveur d’impression des étiquettes qui, manifestement, souffre d’un bug : il ne ferme pas toujours ses tâches d’impression après les avoir exécutées et se trouve, certains jours, saturé alors qu’il n’a plus rien à imprimer. Là aussi, Nagios envoyait un e-mail pour que quelqu’un aille fermer des centaines de fenêtres. Cela devenait insupportable. »
Ces interventions sont désormais scriptables depuis PRTG, lequel déclenche, là, une allocation des ressources, là, une fermeture de processus. « Et tout se fait depuis l’interface, de manière très intuitive. Nous n’avons même pas eu besoin d’écrire des scripts .bat ou PowerShell », se réjouit le responsable.
Surtout, PRTG a contribué à apporter une certaine autonomie aux métiers. « Dans chaque division se trouve des informaticiens auxquels nous avons donné un accès restreint à la console de supervision. Cet accès leur permet de voir en temps réel si leur activité ne souffre pas d’un problème, car ils sont souvent les mieux placés pour savoir comment les résoudre ou quelles actions ils doivent entreprendre. Ils peuvent également régler le niveau des alertes, pour éviter de se mobiliser sur des problèmes ponctuels ou qui n’ont pas de caractère d’urgence. »
« En somme, je dirais que, plus qu’améliorer notre réactivité, PRTG nous a surtout rendus plus proactifs », conclut Thomas Clauw.