Indexima 2.0, l’infrastructure qui accélère Snowflake
Avec sa nouvelle implémentation spécifique, Indexima accélère les temps de traitement sur les entrepôts Snowflake tout en réduisant les coûts d’infrastructure en cloud. Sept ans après sa création, il s’agit pour l’éditeur français d’une nouvelle étape stratégique.
Indexima, le système qui accélère l’analyse des lacs de données (Hadoop, S3...), arrive dans une version 2.0 qui prend désormais en charge les entrepôts de données Snowflake.
Indexima est le produit édité par une société éponyme créée en 2017 par les Français Sébastien Farges, Emmanuel Dubois et Nicolas Korchia. Ce dernier, actuel PDG, a conçu le projet Indexima en 2015 alors qu’il travaillait chez Mappy et qu’il était confronté à des problèmes de performance dans l’exploitation des données de 13 millions d’utilisateurs. Deux années plus tard, grâce à un financement de 1,3 million d’euros de la part de Natixis, les trois compères créent leur société et lancent en 2018 Indexima 1.0 pour Hadoop. Deux années plus tard, l’entreprise compte 15 clients et affiche un revenu récurrent de 1,2 million d’euros.
Nicolas Korchia explique qu’Indexma est un logiciel qui se positionne à la croisée des bases de données, d’un côté, et des outils d’analyse tels que Qlik, Tableau, PowerBI et consorts, de l’autre :
« Indexima est un système de données unique qui découpe les bases en plus petites portions pour régler les problèmes de performance, de coût et d’agilité dans l’analyse de ces données. Le principe de fonctionnement est de générer des tables dynamiques optimisées à partir des structures de bases de données, afin d’accélérer l’affichage des tableaux de bord analytiques dans un facteur 1000, puisqu’on réduit la quantité de données scannées. »
Résoudre le problème du tri des données
L’idée d’Indexima repose sur un constat : la gestion et l’analyse des données sont extrêmement consommatrices de temps. AWS affirme par exemple que 90% des données sont finalement jetées, car il est impossible de les exploiter. Une étude menée par Deloitte auprès de 600 entreprises constate quant à elle que les analystes des données passent 48% de leur temps à créer et mettre à jour leurs rapports, contre 18% pour en communiquer les résultats.
Bref, le plus chronophage dans l’analyse de données est de trier en amont, trier en aval et, surtout, de devoir le faire à la main. Dans sa première version, Indexima répondait déjà en partie à ces questions en s’installant à côté des serveurs de bases de données Hadoop. En 2021, l’entreprise lançait une version full SaaS sur les trois principaux clouds publics – AWS, Azure, GCP – afin de pouvoir s’interfacer avec des consoles d’analytique en ligne, d’une part, et aussi étendre les sources de données aux services de stockage objet.
Aujourd’hui, Indexima lance une version 2.0 dédiée à Snowflake et prévoit une version dédiée à Databricks pour l’année prochaine. Plusieurs clients ont d’ores et déjà adopté la nouvelle solution qui offre des performances assez exceptionnelles en matière d’agrégation de données par rapport à une configuration Snowflake de base.
Par ailleurs, Indexima s’appuie de plus en plus sur le Machine Learning et l’Intelligence artificielle, afin d’avoir une compréhension continue de l’usage des données. Selon l’éditeur, cela permet à son logiciel de créer et d’adapter les tables dynamiques de la manière la plus précise possible.
Des performances assez étonnantes
Rencontré à l’occasion d’un événement IT Press Tour consacré aux éditeurs européens qui innovent dans la gestion et le stockage de données, Nicolas Korchia a effectué une démonstration en temps réel de la plateforme dans un scénario de mise à disposition de vélos dans différents points de la ville de New York. Côté Snowflake, il s’agit de centaines de milliers de lignes, car l’analyse est effectuée toutes les minutes depuis près de sept ans.
Dans le cas d’une plateforme Snowflake standard, le temps de réponse est en moyenne de 20 secondes. Après implémentation d’Indexima et création automatique des tables dynamiques, ce délai passe à moins d’une seconde. L’autre intérêt de ces tableaux dynamiques, outre la vitesse, est qu’il n’est plus nécessaire de solliciter les données présentes sous forme de lignes.
D’autres exemples ont été fournis dans le domaine de la distribution, de la finance, du transport ou encore de l’e-commerce. Dans le cas de la distribution, le logiciel de BI est Tableau et le jeu de données est constitué d’un milliard de lignes exposées par infrastructure AWS. Avec l’ajout d’Indexima, les performances sont multipliées par 100 et le coût horaire lié à l’utilisation de l’infrastructure est divisé par 4, voire par 8 selon les configurations. Il en va globalement de même pour les autres exemples.
Enfin, et ce n’est pas le moindre des avantages, la plateforme est d’une simplicité confondante. En effet, il suffit d’indiquer l’URL du serveur Snowflake que l’on souhaite optimiser et le tour est joué.
À la conquête du marché
Pour attirer ses clients, l’entreprise vise deux cibles : premièrement, les équipes analytiques côté métiers qui sont à la recherche de performances, d’indépendance vis-à-vis de l’IT et de facilité d’adoption. La deuxième catégorie est constituée des équipes d’ingénieurs de données qui, eux, sont à la recherche d’une réduction des coûts liés au cloud, d’une optimisation automatique et d’une facilité de déploiement.
Le modèle économique repose sur le nombre de requêtes et de tables dynamiques créées. La solution est gratuite pour 10 000 requêtes et 10 tables. Le tarif passe à 490 € par mois pour 40 000 requêtes et 40 tables, 1490 € pour 150 000 requêtes et 150 tables. Il existe aussi un modèle personnalisé sur demande pour les offres plus importantes.
Interrogé sur des prix plutôt attractifs eu égard aux performances et aux gains économiques potentiels, Nicolas Korchia explique qu’il s’agit d’une stratégie délibérée visant à conquérir le plus rapidement possible d’importantes parts de marché. En parallèle, il ne nie pas être à la recherche de fonds supplémentaires afin de développer l’entreprise à l’international et tout particulièrement aux États-Unis. En effet, une hypothèse demeure : celle d’un rachat pur et simple par Snowflake.
Enfin l’entreprise va continuer à développer de nouvelles fonctionnalités dans les domaines de l’analyse, le routage des requêtes, ou encore le portage sur de nouvelles plateformes. On le voit, le cahier des charges est loin de s’alléger.