ELT : l’essentiel sur Rivery
Rivery entend bien se faire une place sur le marché de l’ELT/ETL en mettant avant son modèle économique, ses kits d’intégration précâblés ainsi que la modularité de sa plateforme SaaS.
Malgré sa mascotte venue du Nord – un Viking –, Rivery.io est née en Israël en 2017. Dès 2018, la startup a mis les voiles vers New York afin d’y installer son bureau américain. En Europe, elle développe ses activités depuis Londres, et bientôt s’établira en France. La jeune pousse compte 75 collaborateurs.
Rivery doit cette croissance relativement rapide à l’édition d’une solution ELT SaaS, à l’instar de Stitch (rachetée par Talend) et de Fivetran.
« J’en discutais avec des clients : aujourd’hui, les entreprises se concentrent sur la modernisation de l’architecture de traitement de données », affirme Thibaut Ceyrolle, membre du conseil d’administration de Rivery. « La première étape a été d’adopter des data warehouses et des data lake clouds. Maintenant que beaucoup de projets ont migré vers le cloud, ils veulent des solutions agiles pour l’extraction, le chargement et la transformation des données ».
Thibaut Ceyrolle connaît bien ce sujet. Jusqu’en septembre 2021, il était à la tête du développement des activités de Snowflake dans la région EMEA.
Thibault CeyrolleMembre du conseil d’administration de Rivery
« Quand j’étais chez Snowflake, j’observais de loin le marché de l’ETL/ELT. Beaucoup d’acteurs avaient à cœur de changer leur message avec la croissance du cloud, mais peu d’entre eux avaient adopté une architecture cloud native », déclare-t-il. « Rivery n’arrive pas sur le marché avec un nouveau concept, mais apporte un produit “pur cloud”, c’est-à-dire scalable, évolutif, facile à intégrer ».
Ce sont là des arguments maintes fois entendus chez les porte-parole des concurrents. Avec leurs offres SaaS, des éditeurs comme Talend, Fivetran, ou encore Hevo s’adressent, eux aussi, aux lignes de métiers commerciales et marketing chargées de récolter les fruits des données clients. Pourtant, Rivery prétend qu’il peut se distinguer des autres acteurs présents sur le marché.
En ce sens, Thibaut Ceyrolle fait valoir le modèle économique de Rivery. Au lieu de facturer ses usagers au nombre de lignes ingérées dans une table, Rivery établit sa tarification suivant le volume de données extraites, puis transformées depuis un data store. Si le point d’entrée est une API, alors c’est la fréquence de synchronisation qui sert de référence à la monétisation (au besoin, Rivery peut rafraîchir les données toutes les cinq minutes). Un simulateur permet de prévoir les coûts selon les charges de travail et la formule choisie (Starter, Professional et Enterprise).
« Plus il effectue de traitements, plus le client peut prétendre à des remises, mais la tarification demeure transparente », assure le membre du conseil d’administration.
Des kits d’intégration pour les data analysts
Techniquement, Rivery a aussi quelques cordes à son arc. Outre ses 190 connecteurs natifs (JDBC/ODBC, API, webhooks, FTP, etc.), l’éditeur mise sur une orchestration simplifiée des workflows. Ici, les flux des sources aux cibles sont appelés « rivières ».
L’outil permet d’administrer ces pipelines ELT/ETL tout en proposant des kits, c’est-à-dire des templates de flux pour les intégrations et les transformations les plus communes. Ces modèles réutilisables sont accessibles depuis une place de marché. Ils sont développés et certifiés par Rivery et ses partenaires.
« Vous n’êtes pas enfermé avec la solution », avance Taylor McGrath, responsable des solutions clients chez Rivery. « Nous pouvons nous adapter à la plupart des architectures de données ».
En cas de besoin, les kits peuvent être édités à façon, avec des scripts SQL et Python, tandis que les worfklows peuvent être complétés avec d’autres outils de transformation de données. Pour rappel, la notion d’ELT (Extract, Load, Transform) renvoie au fait que le traitement est effectué à la fin du processus, en s’appuyant sur le moteur du magasin de données cible.
« Depuis peu, nous avons une machine virtuelle pour exécuter du code Python. Nous offrons un support intégré pour DataFrame, de sorte qu’il est possible de produire un cadre de données à partir d’un script actuel et insérer directement ce dataframe dans une table d’un entrepôt », précise Taylor McGrath.
De l’ELT façon infrastructure as code pour les ingénieurs
Rivery dispose également d’une fonction d’ETL inversé afin de transformer des données depuis une base de données, les extraire et les charger à travers un point de terminaison API.
« Beaucoup d’usagers poussent des données de BigQuery, Databricks ou encore Snowflake vers des outils opérationnels comme Salesforce, ThoughSpot, Monday.com, etc. dans le but de réaliser leurs opérations quotidiennes », renseigne la responsable.
En outre, l’éditeur assure qu’il peut maintenir le data lineage de tous les flux passés par la plateforme à des fins de contrôle, de supervision et de gouvernance.
Pour les utilisateurs les plus avancés (et les partenaires), Rivery propose un CLI. L’outil en ligne de commande permet de déployer les pipelines depuis des fichiers YAML. Le versionning des transformations se fait via GitHub. En clair, l’éditeur entend « traiter les pipelines de données comme de l’infrastructure as code ».
En ce sens, les développeurs peuvent éprouver ces flux à travers des environnements de développement et de test avant de les pousser en production.
Cette adaptabilité est nécessaire pour l’éditeur. Ses clients ne cherchent pas seulement à ingérer des données depuis un CRM ou un CDP vers un data warehouse à des fins analytiques, et inversement.
« La migration de donnée vers le cloud est aussi un des gros cas d’usage chez nos clients, tout comme l’utilisation de flux de change data capture », confirme Taylor McGrath.
Rivery débarque en France
Toutefois, c’est sans doute pour des usages moins complexes et son modèle self-service que les départements des entreprises emploient en premier lieu la solution. C’est le cas en France, selon Thibaut Ceyrolle.
« Sans vraiment de présence sur le territoire, nous avons une vingtaine de clients en France », indique-t-il. « Dans la continuité du paiement à l’usage, nous avons lancé cette année un mode self-service. Au mois de mai, en nombre d’utilisateurs, la France était le deuxième pays derrière les États-Unis », ajoute-t-il.
Thibaut CeyrolleMembre du conseil d’administration de Rivery
Au total, Rivery revendique près de 300 clients. En France, Blablacar et Webedia ont déjà adopté la solution. Une équipe commerciale française sera recrutée dès juillet avec le soutien du membre du conseil d’administration. Même s’il commence petit, Rivery espère bien voguer au côté des très grands comptes.
« En France, il y a deux problématiques », liste Thibaut Ceyrolle. « Premièrement, il y a un manque de ressources techniques. Deuxièmement, les entreprises ont un gros parc de solutions ETL existantes qui ne sont pas adaptées aux services cloud tels que Snowflake, BigQuery, Databricks, Redshift ou autres ».
Rivery mise donc sur cette simplicité. « Il faut avoir des compétences SQL, mais globalement c’est un produit simple d’utilisation », souligne Thibaut Ceyrolle.
Pour accompagner les clients, Rivery compte sur Synergy, Eulidia et Keyrus. Ces partenaires, le membre du conseil d’administration les connaît bien. Il les a côtoyés à de nombreuses reprises quand il œuvrait pour Snowflake. À noter également que la startup a été fondée par d’anciens dirigeants de l’ESN Keyrus. Quant à Snowflake, tout comme Databricks, Google Cloud, Microsoft Azure et AWS, est un partenaire technologique de la jeune pousse.
En mai 2022, Rivery a levé 30 millions de dollars auprès de Tiger Global Management, Entrée Capital et State of Mind Ventures. En quatre tours de table, l’entreprise d’origine israélienne a récolté 52,5 millions de dollars.