Panne de Colt : l'opérateur cherche encore d'où vient la balle
De nombreux clients - belges notamment - coupés d'Internet, voire privés de téléphone, pendant plusieurs dizaines d'heures parfois : Colt a été victime d'une importante panne réseau. Plusieurs points de présence européens majeurs ont été touchés. La situation revient à la normale, mais le doute subsiste quant à l'origine d'une panne exceptionnelle, tant dans sa nature que dans son ampleur. Le tout sur fond de communication hésitante. Du moins de l'avis de certains clients de l'opérateur.
Le site Internet de nos confrères belge de La Libre est désormais pleinement accessible. Ce n’était pas le cas en fin de semaine dernière. Sur son site, la rédaction indique en effet avoir subi « pendant deux jours » les « désagréments d’une panne survenue chez l’hébergeur de données du quotidien » - Colt -, se retrouvant privée « de connexion à Internet et même téléphone pendant de longues heures. » D’autres ont été affectés, à commencer par les belges de RTL Info. Dont le directeur technique n’a pas caché une certaines exaspération : « nous n’avons par d’explication de la part de ce fournisseur Colt, qui est un grand fournisseur européen […] On sait que c’est à Londres quelque part. […] Nous avons trouvé des solutions par nos propres moyens […] ce n’est certainement pas grâce à Colt que nous avons pu résoudre [les problèmes] pour l’instant », évoquait-il mardi dernier.
C’est ce jour-là, le 8 septembre dernier, que l’opérateur a mis en place un fil Twitter pour communiquer sur l’avancement du traitement de l’incident. Sans préciser la nature de ce dernier, Colt faisait état, le 8 septembre en fin de matinée, de « problèmes de réseau dans 8 villes », et de ses efforts pour « minimiser l’impact sur les clients. » Moins d’une demie heure plus tard, la situation était – selon l’opérateur – réglée à Dublin. Mais 24 heures plus tard, alors que la situation n’était manifestement pas revenue à la normale sur l’ensemble du réseau de Colt, celui-ci indiquait faire « tout son possible pour résoudre ce problème au plus vite. »
La communication, en panne également
Sur la toile belge, les équipes techniques de RTL ne sont pas les seules à se plaindre de la gestion de crise de Colt. Le mercredi 9, nos confrères de l’Informaticien.be relevait ainsi que « après 24 heures d’indisponibilité, les clients se heurtent à un mur de silence. » Tonalité comparable chez BelgoIT : « si avoir des temps de réponse de 9 secondes et une inaccessibilité de quasi 48 heures n’est rien, on se demande tout de même ce qu’il faut pour qu’une panne soit considérée comme grave. » Les commentaires, sur les sites Web ou les forums en ligne, n’ont guère été plus tendres.
Alors que Colt, sur son site Web, se bornait, ce samedi 12 septembre, à annoncer la publication des « détails techniques appropriés » pour ses clients, « dans les prochains jours », François d’Essertaux, porte-parole de l’opérateur en France, est un peu plus précis. Joint par téléphone, il précise ainsi que 9 villes desservies par Colt ont été affectées, « sur certains services IP, pas tous », sans détailler. Et de souligner « qu’aucune ville française » n’a été concernée par la panne. Au final, selon lui, seule « une petite portion » des clients européens de l’opérateur auraient été touchés ; « une infime partie » en France.
Erreur de configuration ou malveillance ?
Sur le plan technique, François d’Essertaux indique de le réseau de Colt a été victime d’un Broadcast Storm, ce qui a entrainé des « volumes significatifs de trafic sur le réseau ; certaines parties ont été saturées. » Un Broadcast Storm est une panne dans le cadre de laquelle les trames transmises en diffusion point-multipoint (broadcast) sont relayées de manière exponentielle par chaque port de commutateurs déployés en redondance : une sorte d’effet Larsen version réseau ; l’ensemble s’enferme dans une boucle jusqu’à saturation avec, à la clé, une situation comparable à celle d’un déni de service.
Le porte-parole de Colt indique que « toutes les ressources à [sa] disposition ont été mises en place pour résoudre le problème. Certains ingénieurs ont travaillé jour et nuit. » Mais, si le problème semble aujourd’hui largement réglé – sinon totalement –, François d’Essertaux assure que ses équipes « travaillent toujours à trouver la cause », sans écarter un acte de malveillance.
Quant à la gestion commerciale de l’incident, elle se règlera au cas par cas, « selon la nature des contrats » et, en particulier en fonction des accords sur les niveaux de service.