Une bonne stratégie analytique peut très bien se passer de Data Scientist
Si les data-scientists peuvent apporter de la valeur à une équipe en charge d'une analyse Big Data, toutes les entreprises n'en ont pas besoin. Pour éviter d'avoir recours à ces spécialistes, certaines utilisent un savant mélange de technologie et de culture.
Lorsqu'en 2013, les responsables d'eviCore Healthcare, société de gestion de prestations médicales, ont commencé à réfléchir aux moyens de tirer le meilleur parti des solutions analytiques en temps réel et prédictives, ils n'ont pas souhaité créer une équipe séparée de leurs divisions opérationnelles.
En particulier, Matt Cunningham, vice-président directeur chargé des initiatives d'amélioration des opérations, savait par son expérience passée comme directeur informatique que la création d'une infrastructure analytique centrée sur le service informatique présente souvent l'inconvénient de compartimenter les données, ce qui complique le partage d'informations pertinentes. Son objectif était donc de « remettre l'opérationnel entre les mains des opérationnels » en intensifiant les efforts en matière d'analytique. D'après lui, « on doit pouvoir favoriser les solutions analytiques et la prise de décisions au niveau le plus bas possible ».
C'est dans cette optique qu'eviCore a soigneusement évité les excès souvent associés aux programmes d'analytique. Ainsi, Matt Cunningham a recruté une équipe composée de quatre analystes, tous titulaires de masters plutôt que de doctorats. Leurs principaux domaines d'expertise sont l'économie et des branches particulières des affaires, comme la finance. Un seul possède un bagage mathématique.
La société a également ignoré les principaux outils existant sur le marché, comme ceux de SAS ou SPSS d'IBM, préférant opter pour un logiciel de la startup Alpine Data Labs. Selon Matt Cunningham, le choix des outils était important pour éviter une trop grande dépendance vis-à-vis de la science des données.
Arrêter la chasse aux « licornes » de l'analytique
Aujourd'hui, d'autres entreprises adoptent la même stratégie. Le coût des data-scientists est sans cesse croissant et leur nombre est insuffisant pour satisfaire la demande. Les entreprises comme eviCore cherchent donc à tirer parti de leurs données et à constituer une grande équipe dédiée au Big Data sans avoir à payer le prix fort pour ceux que leur rareté ont fait surnommer des « licornes ».
Pour Matt Cunningham, il s'agit en même temps de rester réaliste quant aux bénéfices que les données peuvent apporter. Il se dit toujours sceptique quand un éditeur de logiciels lui vante les formidables mérites des solutions analytiques Big Data. Si les promesses sont belles en matière d'analyse des flux et des données non structurées, Matt Cunningham soulève la question du lien avec l'activité de l'entreprise. « En réalité, l'intégration au niveau opérationnel de la modélisation de données complexes s'avère rarement efficace », observe-t-il.
C'est pourquoi il préfère se consacrer à structurer son équipe analytique de telle sorte qu'elle tire une valeur tangible de projets spécifiques d'analyse des données. Actuellement, dit-il, l'équipe travaille à élaborer de meilleurs modèles analytiques afin de prévoir de quels remboursements des dépenses médicales les assureurs devront s'acquitter. L'objectif est de raccourcir le délai de réponse sur la prise en charge lorsqu'un professionnel de santé soumet une demande de remboursement pour le compte d'un patient.
Cette procédure implique d'analyser les données à l'aide d'un modèle qui examine des facteurs tels que le code du diagnostic médical, la spécialité du médecin qui soumet la demande et d'autres informations cliniques.
Des outils et une culture appropriés pour démocratiser les analyses
Pour Infectious Media Ltd., agence londonienne de publicité numérique spécialisée dans les enchères en temps réel, éviter le recours à des data-scientists hautement spécialisés est revenu à choisir des technologies back-end appropriées pour prendre en charge un environnement analytique faisant la part belle au libre-service.
Daniel de Sybel, directeur informatique, indique qu'auparavant la société entrait toutes ses données dans une base de données analytique Infobright. Mais, ajoute-t-il, en raison des possibilités d'évolution restreintes, lui et son équipe ont commencé il y a un an à envisager d'autres solutions.
Ils ont d'abord considéré Amazon Redshift avant de décider que cette application exigeait trop de connaissances et une estimation précise de la puissance de traitement nécessaire pour chaque tâche. De même, Hadoop pose des problèmes techniques qui nécessitaient des compétences spécialisées dépassant celles d'Infectious Media, poursuit Daniel de Sybel.
Finalement, la société a opté pour la plateforme analytique Cloud BigQuery de Google. D'après Daniel de Sybel, cette solution allie l'évolutivité d'Hadoop à la simplicité des bases de données relationnelles SQL classiques. L'équipe de développement s'est rendu compte qu'elle pouvait aisément renforcer BigQuery par un système analytique frontal de Looker Data Sciences sans que cela exige une gestion intensive du back-end.
Ainsi, Infectious Media a pu confier ses besoins en matière d'analytique « avancée » à une équipe de deux personnes, tout en permettant au personnel en première ligne, notamment aux gestionnaires de campagne, de créer leurs propres rapports et de mener leur propre exploration des données. La société utilise l'outil Looker pour suivre les performances de campagnes spécifiques et repérer les éventuelles améliorations nécessaires. Par le passé, ce travail incombait à des analystes.
« Nous avons toujours mis l'accent sur les données, mais nos ambitions étaient limitées », indique Daniel de Sybel, affirmant que la nouvelle infrastructure contribue à généraliser la culture de l'analytique.
Et d'ajouter que l'un des objectifs principaux de l'équipe analytique consistait à éviter la complexité tout en prenant en charge des fonctionnalités d'analytique avancée. « Les solutions ne donnent toute leur mesure que si leurs résultats sont à la portée de tous, remarque-t-il. Tant qu'elles resteront l'apanage de quelques privilégiés, elles n'auront pas l'impact économique recherché ».
« Pour ma part, je considère la technologie comme un simple moteur », conclut Daniel de Sybel. « Elle ne doit pas être source de confusion, mais apporter un plus à votre activité ».