Avec CorpoRadar, Data Publica se lance dans la prédiction des ventes

La start-up parisienne spécialisée dans l'open data lance son site Corporadar dont l’objectif est d'aider les entreprises à identifier des prospects en s'appuyant sur de puissants algorithmes statistiques.

Donner une utilité métier à l’exploitation et à l’analyse des données : c’est l'objectif poursuivi par Data Publica, une jeune pousse spécialiste de la donnée et de l'Open Data, née en France  en 2011, avec son site CorpoRadar. Un service qui marie le savoir-faire historique de la société en matière de collecte de données et de visualisation, à des algorithmes d’analyses et de statistiques dont l’objectif est d’analyser finement les données et les informations pour les mettre à disposition des entreprises. Data Publica est l'un des premiers à appliquer ce concept sur l’information B2B, même si le grand public a déjà fortement connaissance de ces puissants mécanismes, par le biais de Google et d’Amazon notamment.

Le lancement de CorpoRadar vient confirmer le positionnement de Data Publica sur le marché du B2B. La société, initialement bâtie sur l’Open Data et sur la collecte de données, avait déjà pris un virage en ce sens, début 2013, avec le lancement d’une offre de tableaux de bord personnalisés issus de flux de données structurés, et d’une autre, basée sur la création de jeux de données sur mesure pour le secteur B2B.

Cela constitue aujourd’hui le socle du service CorpoRadar.  « Cette idée provient des travaux de Data Publica depuis la naissance de la société, indique Christian Frisch, co-fondateur et CTO de la société. Initialement présenté comme la première place de marché de la donnée en France, Data Publica a ainsi collecté beaucoup de données, que ce soit des données publiques (Open Data) et institutionnelles, mais également glanées sur le Web, en fonction des cas clients.

« Jusque là on essayait de récolter [la donnée], de l’enrichir et de la visualiser, mais assez peu de l’interpréter et de la décortiquer », raconte-t-il encore. Des  clients ont commencé à s’intéresser à la donnée d’entreprise pour pouvoir identifier des contacts. « Un secteur assez pauvre finalement », poursuit-il. Le constat de Data Publica est le suivant : les informations précises sur les entreprises ne sont pas seulement rares, elles sont surtout pauvres d’une point de vue informatif. On dispose par exemple des données (payantes et très chères) proposées par l’Insee - elles donnent un code d’identification (NAF), une adresse, le nom des dirigeants, etc. Des informations financières sont également disponibles, «  mais cela concerne très peu d’entreprises ».

C’est là que CorpoRadar entre en scène. A ces données classiques, le service allie des données marketing et communication des entreprises, « exprimées par une série de voix, comme le site Web (les services et les produits commercialisés), blogs, Twitter, Facebook et la presse par exemple ». En clair des canaux pas du tout, ou peu captés par les sources d’informations traditionnelles en matière d’entreprise. « A travers son site Web et ses différents canaux, l’entreprise exprime son intention. »

Parmi les informations ainsi captées, raconte-t-il, on peut connaître de façon beaucoup plus précise son activité, les catégorisations de produits, mais aussi ce que Data Publica qualifie de « signaux faibles », comme la présence d’une entreprise sur un salon, son management, et ses ambitions en termes de recrutement. Quels sont ses partenaires, ses réseaux, ses certifications, son modèle économique, quel type de technologie motorise le site Web, s’agit d’un site de e-commerce, le site est-il optimisé pour la mobilité ? Bref, « des milliers d’attributs », qui se retrouvent aujourd’hui injectés dans une base de données.

Détecter les bons profils et les bons prospects

CorpoRadar s’appuie ainsi sur une base de données augmentée mise à jour en temps réel, sur laquelle sont appliqués des algorithmes complexes, notamment de ressemblances, de classification, de Machine Learning, de statistiques - afin d’établir des profils d’entreprise à partir d’informations qui jusqu’alors étaient inexploitées. Ces algorithmes sont mis à jour en permanence et affinés en fonction des résultats produits. Un apprentissage continu des technologies sous-jacentes qui permet d’affiner les résultats dans le temps.

Dans le détail, il s’agit d’observer les caractéristiques de l’entreprise, de ses clients afin de déterminer un profil et une typologie de clients. Puis de confronter ces données aux entreprises dans la base afin d’isoler des clients qui s'approchent de ce profil - et sont donc de potentiels prospects. Des ventes prédictives basées sur la détection de profils et de prospects, en somme. A la clé, il s’agit de proposer la mise en place des flux de prospects automatiques.

Si le marketing B2B est naturellement un segment d’activité ciblé, Data Publica indique également viser avec CorpoRadar ce qu’il baptise la segmentation dynamique, qui permet de déterminer des groupes d’entreprises sur un segment donné et « de détecter encore d’autres signaux ». En résulte un segment de marché. Les cabinets d’analystes et de conseil sont ainsi visés par ce service.

Autre service, « une perspective à long terme » : « à travers ces algorithmes de similitudes, on devrait être capables de mettre en avant l’approche stratégique des PME », souligne encore Christian Frisch. De quoi fournir un outil de veille concurrentielle pour les PME, en somme. « Une petite PME peut également trouver des partenaires, ou encore analyser ses concurrents ».

CorpoRadar a été testé auprès de plusieurs entreprises, affirme Data Publica. Par exemple, l’éditeur lyonnais Cegid, spécialisé dans les ERP verticaux, est l'un des clients de CorpoRadar.  Il s’agissait d’identifier parmi 20 000 entreprises les sous-traitants du secteur de l’automobile. « Un problème pas évident à résoudre avec les seuls codes NAF. On a obtenu une fiabilité de 90%. Dans ce cas, le modèle se base sur l’abonnement, car Cegid a décidé de généraliser et d’automatiser cette étude », commente enfin Christian Frisch.

Pour approfondir sur Big Data et Data lake

Close