Pannes à répétition pour Gmail : le dur apprentissage du Saas pour Google
Seconde panne en quelques jours pour Gmail, la messagerie de Google. Un dysfonctionnement qui a affecté également les utilisateurs payants du service. Si la société prend peu de risques dans ses contrats – en n'offrant que des extensions de service -, ces épisodes affectent l'image des Apps, ces services hébergés clefs dans la diversification du moteur de recherche.
Quoi de plus désagréable que d'être bloqué entre deux stations de métro sans information rapide sur la nature et la durée de la panne ? C'est cette leçon que les dirigeants de Google sont en train d'apprendre dans leur gestion des pannes à répétition qui affectent leur service de messagerie Gmail. Hier, en fin de soirée heure française (soit en début d'après-midi en Californie), Gmail a connu une panne d'environ 2 heures, pendant laquelle de nombreux utilisateurs, dont certains abonnés payants de Google Apps Premier Edition, n'ont pas pu accéder à leur compte. Le système affichant des erreurs 502 (mauvaise passerelle d'accès) ou 796 (probablement une erreur de la base de données).
Selon les explications données par le géant de l'Internet, « le problème a été causé par une panne temporaire dans le système de contacts utilisé par Gmail, qui empêche la messagerie de se charger proprement ». Des utilisateurs américains, canadiens, indiens, néo-zélandais ou encore sud-africains – mais aussi les employés de Google selon Reuters – ont été touchés.
Des SLA bien timides
Ce dysfonctionnement suit une autre panne, intervenue la semaine dernière. Google avait alors reconnu une interruption de service de 15 heures affectant là encore certains utilisateurs de Gmail (gratuits ou payants). Selon le témoignage d'abonnés à Google Apps s'exprimant sur le forum de Google, d'autres dysfonctionnements ont précédé ces deux pannes spectaculaires.
Au cours de ces deux épisodes, les équipes de Google ont fait l'expérience du haut niveau d'attente des utilisateurs vis-à-vis des services hébergés, notamment pour des applications aussi critiques que la messagerie. Un des utilisateurs lésés affiche ainsi son désappointement : « c'est la deuxième fois en deux semaines et ça s'est déjà passé plusieurs fois dans le passé. La dernière fois, la résolution du problème a pris 18 heures, ce n'est pas acceptable. Nous avons migré vers Gmail Premium (le service payant, ndlr) parce qu'il a été adopté par de grandes organisations localement, mais si ça ne s'améliore pas, nous retournerons vers notre système de messagerie hébergé en interne et demanderons un remboursement. »
IBM et Microsoft se positionnent
Dans ses engagements de qualité de service, Google promet à ses utilisateurs payants une disponibilité de 99,9 % sur n'importe quel mois calendaire. Soit une indisponibilité maximale d'environ 43 minutes. Au-delà, la société offre des extensions de contrat gratuites aux clients lésés : trois jours par exemple si la disponibilité est comprise entre 99 et 99,9 % ou encore 15 jours si celle-ci tombe en-deçà de 95 % (soit 36 heures d'indisponibilité par mois). Au final, Google prend, via ces engagements contractuels, un risque assez faible : toute panne se traduisant au pire par une extension modérée du contrat, sans aucune forme de remboursement.
En vérité, le risque principal pour Google est ailleurs. A l'heure où tous les grands noms de l'industrie tentent de se positionner sur le prometteur marché du cloud computing, apparaître comme peu fiable et peu réactif aux attentes de ses utilisateurs constitue une menace sérieuse pour l'image d'une société qui a misé une partie de sa stratégie de diversification sur les services hébergés. Surtout à l'heure où la concurrence de mastodontes comme Microsoft ou IBM se précise.
A condition bien sûr que ces derniers sachent éviter le piège des pannes lors de la montée en charge de leurs services respectifs. Emblème du Saas, Salesforce, le spécialiste de la GRC hébergée et par ailleurs partenaire de Google, a lui aussi du faire face, au début de l'année 2006 alors qu'il connaissait un afflux de clients, à plusieurs interruptions de service.