Dans l’Est, l’Établissement Français du Sang monitore sa fiabilité avec 3 900 sondes
Culture de la rigueur et prévention des risques ont incité l’EFS Grand Est à s’équiper du logiciel de surveillance PRTG, lequel affiche l’état des équipements jusque sur la montre des équipes de maintenance.
La région Grand Est de l’Établissement Français du Sang (EFS) a choisi de s’équiper du logiciel de monitoring PRTG de Paessler pour éviter des pannes informatiques susceptibles d’entraîner des problèmes dans la gestion des échantillons sanguins.
« Nous collectons du sang, nous le préparons, nous le filtrons, nous le qualifions, nous le stockons dans des frigos et nous le distribuons à 1 500 hôpitaux et cliniques en France. Toutes ces étapes sont appuyées par des ordinateurs. Si ceux-ci ne répondent plus, nous courrons le risque qu’il y ait des erreurs de manipulation, de référencement du sang, ou encore que nous ne recevions plus d’alerte quand un frigo tombe en panne. Le rôle de notre informatique est d’éviter les risques métier. Le rôle d’un logiciel comme PRTG est d’éviter le risque de ne pas pouvoir dépanner à temps l’informatique », résume Jean-Christophe Gehmert, responsable adjoint du SI de l’EFS pour la région Grand Est.
Jean-Christophe GehmertResponsable adjoint du SI de L'EFS, Région Grand Est
Créé dans les années 2000 à la suite de l’Agence Française du Sang, et présent sur 120 sites en métropole comme dans les DOM, l’EFS a pour mission principale d’assurer l’autosuffisance nationale en produits sanguins. La région Grand Est compte pour sa part 14 sites, 900 collaborateurs et son informatique est constituée de 130 serveurs virtuels. Les fonctions de ceux-ci vont de l’inventaire des produits sanguins à leur analyse, en passant par le système de call-center, de badges d’accès et de sécurité des infrastructures. On y trouve des applications, des ETL, des bases de données SQL, du stockage, de la sauvegarde et de nombreux services réseau.
« La qualité de service, la rigueur, être toujours dans la prévention des risques, tout cela est solidement ancré dans la culture de l’EFS », ajoute Jean-Christophe Gehmert pour illustrer qu’un outil de monitoring fait nécessairement partie ici des moyens mis en œuvre pour assurer la bonne marche des activités.
Un très grand nombre de sondes prêtes à l’emploi
Lorsque Jean-Christophe Gehmert a pris ses fonctions en 2013 sur le site alsacien d’EFS, PRTG est déjà déployé. « Le produit avait été choisi par mon prédécesseur et les équipes étaient convaincues de son efficacité, car il est excessivement simple d’utilisation. Nous supervisons l’infrastructure – à savoir la charge processeur, l’espace disponible, les temps de réponse sur le réseau – mais aussi les applications elles-mêmes », dit-il.
« Notamment, nous pouvons vérifier que des processus automatiques, que nous avons mis au point à base de requêtes SQL, sont fonctionnels. Nous nous servons aussi de PRTG pour vérifier l’âge de nos certificats SSL, par exemple. » Et de préciser qu’il coulait de source de conserver PRTG pour superviser toute l’informatique Grand Est quand les antennes situées dans cette partie de la métropole se sont regroupées, en 2016.
En tout, l’EFS Grand Est a déployé 3 900 capteurs pour superviser 534 entités informatiques. Outre les serveurs, les virtuels comme les machines physiques qui les hébergent, PRTG monitore les équipements réseau (bornes Wifi, routeurs, mais aussi caméras IP…), des processus applicatifs ou encore des écrans. Ces « capteurs » sont en pratique des sondes regroupées dans une batterie de machines virtuelles, lesquelles envoient à intervalle régulier des requêtes aux entités qu’elles surveillent. Il n’y a pas d’agent à installer sur l’appareil qui est monitoré, toutes les informations passent par des requêtes réseau SNMP, NetFlow ou encore WMI.
L’éditeur Paessler fournit un très grand nombre de modèles prêts à l’emploi pour les équipements et les applications du commerce. L’EFS Grand Est revendique avoir personnalisé plus d’une centaine de sondes pour des besoins plus précis au regard de ses métiers. Selon Jean-Christophe Gehmert, les incidents qui surviennent sont la plupart du temps des pannes matérielles.
« Souvent c’est une borne Wifi qui tombe en panne, ou alors une caméra. PRTG peut nous indiquer si l’équipement est hors service, s’il a des difficultés à communiquer sur le réseau, ou encore si sa carte mémoire est pleine. Le grand intérêt de cet outil est qu’il sait nous prévenir suffisamment en amont pour que nous ayons le temps d’intervenir avant même que les utilisateurs constatent une dégradation du service. »
Réagir avant que les utilisateurs ne souffrent d’un incident
Un serveur virtuel agrège les relevés de toutes les sondes et les présente sous la forme de tableaux de bord, avec des indicateurs de couleurs selon l’état de l’unité observée. L’équipe en charge de la surveillance – quatorze personnes – n’a pas installé de mur d’écrans pour avoir une vue d’ensemble, quoiqu’elle y pense. Les indicateurs sont affichés par défaut sur les écrans des PC, mais dix membres de l’équipe ont aussi installé l’app cliente de PRTG sur leur smartphone et même sur leur Apple Watch afin de pouvoir réagir où qu’ils se trouvent.
Jean-Christophe GehmertResponsable adjoint du SI de L'EFS, Région Grand Est
« PRTG nous fait gagner énormément de temps sur la maintenance, y compris sur les sites distants, car il nous donne assez de détails sur un incident pour pouvoir faire un diagnostic assez juste avant même de nous déplacer, ou d’envoyer un technicien sur place », indique Jean-Christophe Gehmert. Il donne l’exemple d’un switch dont le dysfonctionnement était dû à une température anormale et qui a permis de diagnostiquer que la climatisation du local alentour était en cause.
« Cette très grande réactivité donne du crédit à notre équipe vis-vis du reste de nos collaborateurs ; nous sommes pleinement dans la culture de la rigueur qui est chère à l’EFS. »
Dans son planning, Jean-Christophe Gehmert doit bientôt superviser la migration de plusieurs serveurs vers des versions plus récentes de leur système d’exploitation. « À cette occasion, nous allons revoir les sondes qui les supervisent. Le fond restera le même, mais nous allons opter pour une nouvelle convention de nommage, pour des intervalles de sondage plus courts sur certains éléments plus prioritaires. L’ensemble ne devrait pas prendre plus d’une semaine à une personne, migration des serveurs comprise », conclut-il.