Gestion de crise : ces erreurs qu’il est trop naturel de commettre
Ravi Bindra est un vétéran de la gestion de crises informatiques. Fort de son expérience, il présente une liste non exhaustive des erreurs de base qui sont trop aisément commises.
Ravi Bindra est aujourd’hui responsable conception et ingénierie de l’architecture de sécurité chez Novartis. Avant, il était responsable de la gestion du risque chez Roche. Un poste auquel il est arrivé après avoir été confronté à une crise réseau : « c’était l’époque de Blaster, de Slammer, etc. Ils nous ont tous affectés ». Et Ravi Bindra s’est avéré doué pour la gestion de crise : « la direction a apprécié la méthode et m’a chargé de mettre en place une organisation dédiée à la gestion des crises ».
Et cela commence par une entité chargée pilotage global de la gestion d’incidents, dont dépendent des organisations distinctes dédiés par exemple aux incidents de sécurité, ou aux incidents impliquant les applications critiques SAP. Des organisations virtuelles dont chaque membre dispose parallèlement d’une activité à temps plein, à l’exception du patron de l’entité de pilotage global, chargé de faire vivre les processus de gestion des incidents.
Ravi Bindra semble effectivement apprécier la gestion de crises. Rencontré à l’occasion de l’édition 2016 de l’EIC, qui se déroulait début mai à Munich, il évoquer une activité très excitante, source de « beaucoup d’adrénaline », à la redescente parfois délicate. Et il connaît les risques associés.
Pour lui, la première erreur à faire est… de ne pas déclarer un sinistre, même si l’incident répond aux critères correspondants. Et c’est pourtant important, car une fois le sinistre déclaré, « on arrête de chercher à rafistoler et l’on enclenche les procédures de repli sur les systèmes de secours ». Las, naturellement, l’humain est tenté d’attendre « 20 minutes, et 20 minutes de plus… », espérant que les choses rentrent dans l’ordre. « C’est une erreur que l’on observe fréquemment ».
La seconde consiste à prendre des décisions sur la base d’analyse partielles, où la source réellement de l’incident passe inaperçue et le remède préconisé s’avère donc totalement inefficace, voire contreproductif.
Et puis la tentation peut être grande de commencer à distribuer les blâmes alors que tout n’est pas réglé : « et lorsqu’ils sont adressés aux ingénieurs par le manager de service, vous imaginez ce qui se passe… il perd tout le soutien de ses équipes ». Au risque de pénaliser la remédiation.
Mais l’un des risques majeurs de la gestion de crise est peut-être tout simplement la fatigue : « réfléchir et décider sous l’emprise de la fatigue. Je n’ai pas connu beaucoup de crises survenant au début de ma journée. C’est toujours plus tard, voire en toute fin de journée, à alors après que vous soyez rentré chez vous. Typiquement, vous vous retrouvez éveillé pour 24h d’affilée. Votre cerveau a cessé de fonctionné ; le niveau de sucre dans votre sang est au plus bas ; vous prenez des décisions qui ne sont probablement pas les meilleures à prendre ».
Quid alors des systèmes expert d’aide à la décision, ou même de l’automatisation de la réponse ? Pour Ravi Bindra, l’intelligence artificielle a déjà fait ses preuves dans la détection d’anomalies – « c’est là que je vois les machines appelées à jouer un rôle très important ». Mais le potentiel va bien au-delà : « se reposer sur l’intelligence artificielle ? Il y a dix ou quinze ans, je vous aurais dit non, mais plus aujourd’hui. Je pense qu’elle en est arrivée à un stade où elle surpasse un humain bien entraîné ».
Au-delà se pose bien sûr la question de la garantie du fonctionnement du système d’assistance en cas d’incident, mais également celle de la définition des protocoles d’intervention : « je ne peux pas me rappeler d’un incident collant parfaitement à nos protocoles. Peut-être parce qu’ils n’étaient pas assez matures. Mais il y a toujours des aspects nécessitant une dérogation ».
Et puis se pose la question de la confiance que l’humain est prêt à accorder à la machine… et là, Ravi Bindra ne cache pas une défiance toute naturelle, renvoyant par là-même au constat formulé par Balazs Scheidler, de Balabit, à l'automne dernier, lors d'un entretien avec la rédaction.