Panne d’Azure : des DSI déçus de la réaction de Microsoft
La lenteur de l’éditeur à réagir à la récente panne d’Azure a conduit certains utilisateurs à s’interroger : peuvent-ils faire confiance au Cloud pour des données métiers critiques ?
La plupart des DSI touchés par la panne récente d’Azure ont été déçus par le temps qu’il a fallu à Microsoft pour fournir des explications. Au point, pour certains, de remettre en question leur recours aux services Cloud de l’éditeur.
La panne d’Azure, qui a été en partie causée par une mise à jour de performances appliquée à Azure Storage, a rendu indisponibles certains sites Web durant près de 10h dans certaines régions, et a empêché l’accès à plusieurs services de Microsoft, dont Visual Studio, Virtual Machines et la recherche.
Le problème est aujourd’hui résolu et expliqué, mais certains clients estiment que l’éditeur a failli dans sa gestion de crise.
« Notre site Web est tombé, comme tous les autres sur Azure, pendant 4h », explique Ray Suelzer, développeur Web sénior et data guru du syndicat Making Change at WalMart. « Nous avons perdu des quantités considérables de trafic sur notre page, et cela nous est de toute évidence préjudiciable. Mais ce que je trouve pire encore avec cette expérience, c’est à quel point Microsoft a mal géré la crise. »
Pour Suelzer et d’autres, il est inexplicable que la plus grande des entreprises technologiques au monde n’ait pas utilisé son compte Twitter pour informer des milliers de clients entreprises concernés dans le monde entier sur l’avancement des travaux. Et qu’elle n’ait pas même répondu à leurs messages…
Selon Suelzer, Microsoft s’est contenté de renvoyer à une page d’état indiquant en substance que tout allait bien, ou que « nous rencontrons des difficultés, mais nous ne sommes pas sûrs que cela ait un impact sur nos clients. […] Encore plus alarmant : 24h après l’incident, j’attendais encore de recevoir un email de Microsoft expliquant la situation », relève Suelzer.
La panne a conduit un autre utilisateur a suspendre son projet de migration vers Office 365 initialement programmé pour début 2015. « Microsoft a peut-être l’ambition d’héberger les activités d’autres personnes, et dispose des ressources de calcul et de stockage pour cela, mais cette panne me fait hésiter », explique le DSI d’un revendeur New Yorkais de vêtements pour enfants. « Je ne peux pas me permettre d’avoir un site en panne pendant toute une journée sans explication à fournir à mes clients et à mes fournisseurs. »
Les contrats Azure de nombreux clients sont assortis de SLA. Et certains pensent pouvoir recevoir une compensation pour l’impact négatif de la panne sur leurs activités. Mais pour l’heure, dans ses explications sur la panne, Microsoft n’a pas mentionné la moindre compensation. Une source proche de l’éditeur assure toutefois que « certains, en interne, ont plaidé en faveur d’une sorte de crédit de service pour compenser ce type de panne parce que cela a un impact commercial. D’autres estiment que l’entreprise ne devrait pas être mise en cause pour une indisponibilité d’une telle durée. La direction n’a pas encore tranché. »
Microsoft a particulièrement peiné à informer ses utilisateurs sur la situation en raison de l’indisponibilité du Service Health Dashboard et du portail d’administration. Et cela durant les trois premières heures de la panne. Et d’autres outils de support dépendant du Service Health Dashboard ont été affectés, limitant ainsi la capacité des utilisateurs à ouvrir de nouveaux tickets d’incident, ainsi que celle de Microsoft à communiquer.