Le pôle Colis de la Poste accélère sa BI avec SAP HANA
Face à la baisse du courrier, la branche Services-Courrier-Colis de La Poste doit optimiser son efficacité. Le pôle colis, havre de croissance de la branche, mise sur HANA pour améliorer encore son efficacité.
Avec un chiffre d’affaires de 1,6 milliard d’euros en 2014, le pôle Colis de La Poste reste en croissance alors que l’activité courrier ne cesse de baisser. Ce sont un million de colis qui sont livrés chaque jour, notamment pour les grands noms du e-Commerce. Le pôle compte 50 000 clients entreprise. Comme dans toutes les grandes entreprises, le pôle Colis s’est doté d’une informatique décisionnelle au grès des besoins de ses métiers, créant, projet après projet, des data warehouses indépendants, avec diverses bases de données qu’il est toujours couteux de faire communiquer. « Nous avions un reporting en silos », reconnait David Bizien alors directeur des systèmes d’information Finance et Décisionnel du Pôle Colis, « avec des outils décisionnels dédiés à la production, principalement basés sur BusinessObjects, un reporting pour l’activité commerce basé sur Oracle OBIEE et une partie financière sur SAP BW. »
Le responsable du SI décisionnel, aujourd’hui consultant, décide alors de lancer un grand projet de consolidation de ce système d’information : « l’idée initiale était de migrer toutes ces structures dans un seul système décisionnel afin de pouvoir faire du reporting croisé, puis évoluer vers du reporting temps réel. » Ce croisement entre données de production et d’indicateurs financiers est nécessaire pour des indicateurs tels que le CUP (Coût Unitaire de Pilotage) qui fait le rapport entre les coûts et le nombre de colis délivrés. Pour générer cet indicateur, il faut aller chercher le nombre de colis traités dans les systèmes de production et les données relatives aux charges dans les systèmes financiers.
La mise à disposition de tels indicateurs nécessitait la mise en place de nombreux cubes de données où étaient agrégées les données, consolidées. Ce qui introduisait des dépendances entre systèmes où chaque modification sur un système avait de multiples impacts sur les autres, sur les cubes de données, etc. « A chaque modification, il fallait non seulement intervenir sur la chaine d’alimentation en données mais ce qui nous coutait le plus cher, c’était les chargements de données. La modification d’un indicateur impliquait de vider le cube de données, puis de reconstruire le cube pour que l’indicateur puisse enfin être calculé. S’il ne fallait qu’une demi-heure pour apporter la modification à l’indicateur, une journée en comptant les tests, étant donné les volumes de données en jeu, le temps nécessaire pour vider puis reconstruire le cube pouvait atteindre 5 jours. » Face aux métiers qui demandent de la réactivité, même si la DSI est en capacité de répondre rapidement car elle avait bien les informations nécessaires, ces temps de maintenance se révélaient un vrai handicap pour toute l’entreprise.
Objectif n°1 : mettre fin à cette approche « spaghettis »
Pour en finir avec cette approche « Spaghetti » et gagner en performance, le pôle Colis décide de basculer ses systèmes décisionnels sur la plateforme SAP HANA, la base de données In-memory. Le projet était planifié sur plusieurs phases. La première phase consistait à mettre HANA en production en migrant la base SAP BW. Une seconde, plus longue, est toujours en cours. Elle consiste à redévelopper les cubes de données et profiter à plein des capacités de la base de données.
« La première phase a consisté à mettre à jour BW puis le basculer sur HANA, sans revoir les modélisations et les cubes », se souvient David Bizien. « Ce seul basculement nous a apportés des gains importants, de l’ordre de +70% sur des chargements de tables, par exemple », précise David Bizien qui ajoute : « Mais pour tirer la quintessence du modèle HANA, vous êtes obligés de revoir toute votre modélisation, toute votre architecture de cubes. En basculant sur des vues, vous allez éviter toute cette problématique de chargement de données. »
Le choix de David Bizien a été de mener le projet en s’appuyant au maximum sur ses ressources internes, pour faire monter en compétence son équipe sur SAP HANA. Il a fait appel à Censio, société de conseil, pour assister son équipe dans une migration qui est alors menée en moins de 2 mois. Ce prestataire était déjà intervenu auprès du pôle Colis sur la mise en place de ses processus budgétaires. Thomas Becquet, président de Censio positionne l’action de ses consultants dans ce projet : « Le pôle Colis souhaitait en faire un maximum en interne. Nous leur avons apporté un accompagnement d’expertise. En nombre de jours, c’est peu impressionnant, mais nous sommes intervenus sur les phases clé du projet comme la préparation de la migration, la résolution des problèmes qui se présentent immanquablement lors de ce type de projets. » Une migration qui ne présente plus guère de difficultés aujourd’hui : « Migrer BW vers HANA n’est pas aussi complexe qu’il n’y parait », ajoute Thomas Becquet. « Une première étape de data cleaning (nettoyage de données, NDLR) s’impose afin d’alléger la base en supprimant toutes les données temporaires, l’idée étant de réduire le plus possible la taille de la base. Ensuite, on fait un dump de database comme on le ferait d’une base Oracle, par exemple, et après vient une phase des tests de non régression pour vérifier que tout fonctionne correctement. Tous les jours prévus n’ont pas été consommés par le projet, signe que cela s’est bien déroulé », souligne le président de Censio.
Le plus long à réaliser : démonter les cubes de données
Si le pôle Colis a connu un bel accroissement de performances en migrant BW vers HANA, il reste encore à la DSI à « démonter » tous les cubes de données et à profiter de la nouvelle architecture de la base de données. David Bizien explique son approche : « L’idée est de mener cette tâche processus par processus, en commençant par ceux qui ont le plus de valeur ajoutée. Les processus les plus lourds, ceux qui nécessitent le plus de réactivité et ceux qui évoluent le plus rapidement seront prioritaires pour basculer vers les vues HANA. Comme ce sont des cubes qui sont déjà modifiés régulièrement, le coût de la re-modélisation est minime et le ROI immédiat. » Thomas Becquet ajoute : « Pour vraiment bénéficier de la puissance de la base, il faut se passer des cubes et faire de l’agrégation à la volée. Cela suppose de retravailler les flux de données et supprimer tout ce qu’on avait créé pour suppléer aux limitations des bases de données relationnelles. »
Le consultant milite pour une approche progressive et se livrer, cube par cube, à une évaluation du coût et des bénéfices attendus, l’idée était de refaire les cubes les plus fréquemment utilisés en priorité. « On a le luxe du temps », souligne-t-il. « Il faut optimiser les processus critiques en priorité, puis mettre en place un plan sur 1 à 2 ans pour optimiser l’ensemble des indicateurs. Par exemple, dès qu’une évolution est demandée sur un indicateur, un rapport, on en profite pour remettre au propre les indicateurs concernés. »
Faire face au déluge de données à venir
HANA présente d’énormes gains en termes de performance et de compacité dans le stockage de données mais elle reste physiquement limitée par la RAM des serveurs. « HANA, c’est une appliance, avec un volume de mémoire fixe, or les volumes de données ne cessent de grossir », résume David Bizien. « Quand le marketing vous demande de passer de 60 jours de données historisées à 3 ans, et peut-être plus encore par la suite, le volume de donnée ne peut qu’exploser. En tant que DSI finance et décisionnel, je devais pouvoir prévoir cette capacité à gérer de très gros volumes de données dans le futur. »
Le pôle Colis a ainsi fait le choix de coupler HANA avec Sybase IQ, l’autre base de données en colonnes au catalogue SAP. La solution reste plus efficace qu’une base relationnelle classique et le pôle Colis ne stockant pour l’instant que des données structurées, IQ s’est imposé face à Hadoop ou Couchbase pour le stockage des données « froides ». Toutes les données accédées plus fréquemment, les données « chaudes » sont stockées sur HANA en priorité pour bénéficier des performances inégalées du « in-memory ».
L’exemple du pôle Colis de La Poste le montre : la migration BW vers HANA est désormais un projet informatique qui présente peu de risque si le datawarehouse SAP a été créé proprement et respecte les bonnes pratiques prônées par l’éditeur.