alphaspirit - stock.adobe.com
Enterprise Search : Sinequa optimise sa plateforme pour Microsoft Azure
Sinequa a annoncé la disponibilité prochaine de son logiciel de recherche d’entreprise sur Microsoft Azure. Déjà accessible en préversion privée, la solution doit compléter les outils du géant du cloud, mais surtout proposer un moyen de réduire les coûts d’exécution de la plateforme.
L’éditeur d’origine française qui propose une plateforme logicielle de cognitive search (Sinequa Enterprise Search) a d’abord développé son activité auprès de clients en provenance d’industries hautement réglementées dont Airbus, EDF, Framatome ou encore la NASA. Ceux-ci souhaitaient bénéficier de ce moteur de recherche « intelligent » à partir d’infrastructure sur site, là où leurs données résident.
Mais depuis l’année dernière, Sinequa a inscrit sur sa feuille de route le portage de sa plateforme sur le cloud. Après avoir présenté Sinequa sur la marketplace d’AWS en mars 2020, l’éditeur offrira sa solution sur Microsoft Azure en juillet prochain, sous l’appellation Sinequa for Azure.
Mais alors pourquoi Microsoft Azure ? « Il y a plusieurs raisons à cela », déclare Adrien Gabeur, Vice-Président Cloud & SaaS chez Sinequa. « Tout d’abord, avec la pandémie, nous avons observé une accélération de la migration de nos clients vers le cloud et en particulier vers Azure. Beaucoup d’entre eux ont choisi AWS, mais l’adoption d’Azure connaît la croissance la plus rapide », affirme-t-il.
Ensuite, le dirigeant évoque des « motifs stratégiques » pour travailler avec Microsoft. « Notre solution se déploie sur des serveurs Windows et est développée à l’aide du framework .NET. Nous proposons des intégrations avec leurs produits, par exemple Microsoft Teams et Viva quand la plateforme d’e-learning sera disponible. Enfin, nous ciblons les mêmes clients, c’est-à-dire les grands comptes », énumère-t-il. « De plus, 90 % des projets demandent l’indexation de données Microsoft en provenance de OneDrive, Exchange, SharePoint, Office 365 ».
Est-ce à dire que Sinequa for Azure sera différent du logiciel déployé ailleurs ? Non, répond Adrien Gabeur. « Les fonctionnalités de Sinequa For Azure sont similaires à celles de notre plateforme, la distribution est identique. Par exemple, vous pouvez toujours bâtir des Search Based Applications (SBA) et bénéficiez de nos nombreux connecteurs. Simplement, Sinequa For Azure utilise des services de Microsoft et apporte son lot d’optimisations ».
Faciliter le déploiement et réduire les coûts d’exécution
L’une des optimisations promises dans Sinequa for Azure n’est autre que l’indexation dynamique. « Nous voulons disposer d’une architecture élastique pour l’ingestion des documents », annonce le VP Cloud.
Selon lui, la première ingestion de toutes les sources de données dans l’index est l’un des grands défis du Search Enterprise. « Par le passé, nous avions des architectures statiques. Dans Azure, l’on trouve les VM Scale Sets, des groupes élastiques de machines virtuelles. À partir de ces VM, la plateforme Sinequa va utiliser des algorithmes afin d’augmenter ou diminuer automatiquement les ressources allouées à l’indexation en fonction de l’activité des connecteurs », explique Adrien Gabeur.
Le bénéfice de cette méthode ? « Si nous sommes dimanche après-midi et qu’il n’y a pas de nouveaux documents à réindexer ou à rafraîchir, la plateforme éteint les indexeurs. Si le lundi matin, l’on souhaite ajouter une source ou mettre à jour des données, les indexeurs vont monter en charge en fonction des VM qui leur sont alloués. Le job sera effectué beaucoup plus rapidement et sans faire augmenter les dépenses : avoir 5 indexeurs pendant 10 jours ou en avoir 50 pendant un jour revient au même prix », illustre le VP cloud.
Il faut comprendre qu’aux indexeurs se greffent divers traitements de données, d’analytique, de règles métiers, de machine ou de deep learning, suivant s’il faut extraire des entités nommées, par exemple.
Selon le VP Cloud, l’indexation dynamique doit accélérer les projets. « Avec certains projets, l’on a 100, 200, 500 millions de documents. Quand les métiers demandent un nouveau cas d’usage réclamant l’exécution d’un modèle d’extraction d’entités nommées ou de deep learning sur tous les documents, il n’y a pas le choix, il faut relancer l’indexation. Auparavant c’était une barrière, ce ne sera plus le cas avec les VM Scale Sets », promet-il.
Pour autant, l’utilisation ou non des VM Scale Sets – et donc de l’autoscaling associée à l’indexation – est fonction du choix du client. « Si le client souhaite conserver une architecture statique, il le peut : l’indexation dynamique est une option supplémentaire », assure Adrien Gabeur.
En outre, Sinequa for Azure promet la compatibilité avec le service de gestion de clés de chiffrement Azure Key Vault. En outre, l’éditeur fournit des scripts Terraform, PowerShell, des templates pour faciliter le déploiement et les mises à jour de la plateforme. « Nous envisageons d’adopter d’autres services Azure pour ajouter des fonctionnalités à nos clients », s’engage le vice-président. « Nous souhaitons également améliorer le TCO notre plateforme sur cet environnement cloud spécifique ».
L’éditeur prévoit aussi des intégrations de Sinequa dans des produits comme Teams afin d’en faire « le nouveau navigateur de l’entreprise ». « Cette intégration est attendue par nos clients », déclare Adrien Gabeur.
Malgré les apparences, Sinequa entend se différencier des offres Azure
La pertinence de Sinequa for Azure dans l’écosystème de services Microsoft pourrait poser question. Le géant du cloud dispose de plusieurs services de recherche de documents, dont Azure Cognitive Search et Microsoft Search.
« Azure Cognitive Search est un service de Search. Sinequa est une plateforme d’Enterprise Search », catégorise le VP Cloud chez Sinequa. « La grande différence entre Cognitive Search et Sinequa, c’est Build versus Buy. Si quelqu’un veut bâtir des solutions basées sur de la recherche avec une équipe de développeurs, il peut utiliser Cognitive Search. Si quelqu’un veut acheter un logiciel d’Enterprise Search qui permet de concevoir des applications avec le framework SBA, il peut l’acheter. Cognitive Search n’a pas les connecteurs, n’a pas de NLP, n’a pas de modèles de deep learning, ou encore de sécurité », tranche Adrien Gabeur.
Adrien GabeurVice-Président Cloud & SaaS, Sinequa
Pour autant, si le VP Cloud vante une approche « Buy », la plateforme Sinequa sur Azure dépend d’une offre « self-managed ». « Ce n’est pas une offre managée, c’est à l’équipe DevOps du client de gérer la plateforme et les mises à jour de Sinequa dans son tenant Azure. C’est important de le préciser, car la diversité des services cloud peut provoquer une forme de confusion », indique Adrien Gabeur.
« Les clients ou les partenaires intégrateurs emploient Sinequa for Azure à leur guise. La licence reste la même : nous assurons la portabilité des licences et un mode de souscription annuel », ajoute-t-il.
Reste à savoir si la plateforme Sinequa sera un jour disponible comme un service managé. Ce n’est pas d’actualité, selon notre interlocuteur.
« Notre produit demeure extrêmement personnalisable, tant sur l’administration de l’architecture que sur la conception de spécifiques applicatifs, et nous n’envisageons pas encore de le faire ». Ce serait d’ailleurs cette approche hautement paramétrable qui le différencierait de Microsoft Search.
« Il y a de grandes différences entre notre plateforme et Microsoft Search », considère Adrien Gabeur. « Microsoft Search est un outil de recherche générique sur les données Office 365, des produits Microsoft et sur quelques logiciels tiers (165 connecteurs listés au total, mais la majorité sont disponibles en triple exemplaire, soit une soixante de plug-ins uniques N.D.R.). Sinequa s’intéresse à tous les types de données grâce à nos 200 connecteurs pour analyser les données des métiers : les dossiers médicaux, les documents PLM, les bases de données, etc. Nous pouvons aider à bâtir des applications de recherche spécialisées par métier pour construire une vue à 360 degrés des clients, d’un produit ou encore analyser des essais cliniques », vante le responsable.
Microsoft et l’éditeur ne sont donc pas des compétiteurs. D’ailleurs, Sinequa for Azure s’inscrit dans un partenariat avec le géant du cloud. « Nous travaillons avec Microsoft pour développer la plateforme sur leur architecture et proposer des capacités de partenariats commerciaux auprès des clients finaux. Nous commençons déjà à le faire auprès de certains comptes », assure Adrien Gabeur.
Quant à savoir si Sinequa se connectera avec les solutions de Nuance incorporées dans Azure, il est trop tôt pour le dire, mais comme l’éditeur français s’intègre avec les services cognitifs de Microsoft pour le speech to text ou le NLP, il évaluera cette possibilité au moment voulu, « quand cela fait sens pour les clients ».
Un programme pilote a permis de tester Sinequa for Azure auprès d’un fonds d’investissement et des manufacturiers. Reconnu une nouvelle fois comme un des leaders de sa catégorie dans un Magic Quadrant publié en mars 2021 par Gartner, le cabinet de recherche note toutefois un manque de visibilité du produit, un problème récurrent chez les éditeurs de ce marché. Les autres points d’attention portent sur la sécurité, un critère que Sinequa a pris en compte dans son offre hébergée sur le cloud de Microsoft (d’où l’utilisation d’Azure Key Vault pour le chiffrement des données ainsi que la protection des certificats), et l’absence de solutions prépackagées.
Pour approfondir sur Intelligence Artificielle et Data Science
-
Enterprise Search : le Français ChapsVision s’empare de Sinequa
-
Google Cloud redouble d’efforts pour promouvoir AlloyDB et AlloyDB Omni
-
Search AI Lake : Elastic renomme son architecture « stateless » pour mieux surfer sur la genAI
-
Comment Saint-Gobain motorise la recherche de matériaux dans ses enseignes