Datawarehouse : l’intégration reste souvent douloureuse
Gary Nelson est consultant indépendant en datawarehouse depuis plus de 20 ans. Ce spécialiste des solutions Teradata, basé à Londres, a notamment officié pour des entreprises des secteurs de la finance, de l’assurance, du commerce de détail ou encore des télécommunications. En marge de la conférence partenaires de Teradata, qui vient de s’ouvrir à Washington, il accepte de partager son expérience et son regard sur les perspectives du spécialiste du datawarehouse.
LeMagIT : d’après votre expérience, quelles sont les industries les plus mûres pour réaliser, avec succès, des projets de datawarehouse, et les principales difficultés rencontrées dans ces projets ?
Gary Nelson : au Royaume-Uni, par exemple, le secteur bancaire est clairement mûr. Cela fait plus de 12 à 15 ans que des solutions de datawarehouse y sont déployées. J’ai travaillé pour des grandes banques qui, clairement, réalisent d’importants bénéfices grâce au décisionnel, par exemple en réalisant des ventes croisées de produits selon les profils de leurs clients.
Cela dit, la plupart des entreprises qui se lancent dans un projet de datawarehouse cherchent à construire des solutions adaptées à leurs besoins. C’est donc là que se trouvent les exigences métiers de base. Mais ces exigences doivent être traduites en termes de conception physique et logique. Il y a là un haut niveau de complexité. Une complexité qui touche aussi au support des processus métiers de l’entreprise par la solution. Là, d’un point de vue technologique, il peut y avoir de nombreuses difficultés : avec les solutions modernes de datawarehouse, il faut suivre de nombreux processus pour assurer le déploiement des systèmes conformes aux pratiques de référence de l’industrie concernée. Et puis il y a aussi, parfois, le problème de l’intégration de systèmes existants, mal documentés et pour lesquels les compétences requises ne sont plus dans l’entreprise : quand vous regardez les données qui en sortent, il peut être très difficile de comprendre ce à quoi elles correspondent puisque vous ne savez pas comment elles ont été construites. Sans compter l’absence, parfois, de garantie sur la fiabilité des données, notamment lorsqu’elles ont été saisies manuellement, avec les questions que cela soulève en termes de gestion des données erronées : que dois-je faire de ces données ? les rejeter ? les intégrer ? Et il arrive que l’on rencontre des difficultés avec la hiérarchie des données et plus généralement avec le master data management (MDM), par exemple lorsqu'un des produits d’une entreprise passe d’une entité à une autre et que chaque entité cherche à obtenir une vue différente sur les données relatives à ce produit. A tout cela, il faut encore ajouter les questions de connectivité aux sources des données.
LeMagIT : dans ce contexte, les fournisseurs ont-ils tendance à enjoliver leurs solutions ?
G.N. : un fournisseur cherche bien sûr à pousser ses solutions, en les présentant comme capables de régler tous les problèmes. Mais l’on sait bien que ce n’est pas le cas. Surtout parce que la réussite d’un déploiement ne dépend pas exclusivement des outils qui sont déployés. Cela dépend des serveurs sur lesquels est déployée la solution de décisionnel, du type de connectivité entre le datawarehouse et le serveur de BI, etc. Cela dépend aussi des compétences des intégrateurs. Ce qui nous conduit à l’un des défis du décisionnel temps réel. Le ministère de la Défense britannique cherche à aller vers ce type de système. Mais cela intéresse aussi le commerce de détail : si je positionne mal un produit dans plusieurs centaines de supermarchés, ça peut coûter très cher ; avec un système décisionnel temps réel, je peux tester une mise en avant sur un petit échantillon de magasins avant de la généraliser ou de la corriger très rapidement.
LeMagIT : justement, en matière de connaissance client, la BI commence à s’intéresser à des sources de données telles que les réseaux sociaux ou les blogs. Retiennent-elles l’attention des entreprises ?
G.N. : C’est une étape de sophistication supplémentaire. Plus on en sait sur son client, plus on est susceptible d’améliorer sa rentabilité. Récupérer des données venues d’Internet et des réseaux sociaux permet effectivement d’améliorer la connaissance de clientèle. On n’en est juste au début. Et les applications du décisionnel peuvent aller au-delà, en direction des campagnes politiques par exemple. Les Etats-Unis sont plus avancés que l’Europe pour l’utilisation du décisionnel et plus généralement de l’IT dans le cadre politique. Mais cela soulève d’autres questions telles que le respect de vie privée, de l’éthique…
LeMagIT : plus spécifiquement, pensez-vous que Teradata puisse rester indépendant ?
G.N. : Si la question est de savoir si Teradata restera une entreprise indépendante, ma réponse est non. Ne serait-ce que parce que, selon moi, Teradata a probablement le meilleur socle disponible pour le datawarehouse d’entreprise, pour le traitement massivement parallèle de données brutes. Cette position suscite naturellement un certain intérêt. Je verrais bien un constructeur l'absorber.