Getty Images/iStockphoto
OpenText World 2021 : double dose de « Smart OCR » et d’intégrations pour Salesforce et Office 365
OpenText a l’intention de connecter Core Content à Office 365 pour mieux contrer OneDrive de Microsoft. Et comme Box et Adobe, il a investi dans l’IA et la capture intelligente pour numériser les documents papier, rendre leurs contenus indexables, et surfer sur la tendance du « smart OCR ».
La capture intelligente, qui consiste à numériser les documents papier pour les rendre indexables, est une technologie née il y a plusieurs décennies. Mais elle a de nouveau le vent en poupe avec les progrès de l’Intelligence artificielle (IA). Tous les éditeurs de gestion documentaire, au sens large (factures comme Esker, notes de frais comme Expensya, etc.), sortent de nouveaux outils dans ce domaine. OpenText ne fait pas exception avec sa nouvelle édition de Content Cloud (la 21.4 sortie fin octobre 2021).
Le Smart OCR, une tendance de fond
Microsoft propose Lens et l’extraction de textes contenus dans des PDF et des photos dans OneDrive. Oracle a sorti Intelligent Document Recognition. Box et Adobe ont récemment sorti des fonctionnalités similaires. Et même Salesforce dans le CRM prévoit d’en lancer un l’année prochaine (pour la gestion des contrats).
Cheryl McKinnonAnalyste, Forrester Research
Pour Cheryl McKinnon, analyste chez Forrester Research, ce foisonnement ne doit rien au hasard. L’IA et le machine learning (ML) ont en effet prouvé qu’ils étaient très efficaces pour améliorer le traditionnel OCR. Avec ces algorithmes, la reconnaissance optique de caractères sait désormais analyser un document dans son ensemble et mieux traiter son contenu en isolant automatiquement certaines zones et certaines informations (numéro de facture, montants en euros, etc.).
« Nous avions toutes ces données utiles enfermées dans ce que j’aime appeler en plaisantant “des fichiers dans des formats débiles”… et le papier est le plus débile de tous », rigole-t-elle. « Et le ML et l’IA sont arrivés. Vous n’avez plus à vous soucier de savoir où trouver le numéro de facture sur le document. Les systèmes sont suffisamment entraînés pour reconnaître eux-mêmes ces informations, que ce soit grâce à la computer vision ou à un autre type d’analyse textuelle ».
OpenText Intelligent Capture et le défi du smartphone
Dans son Content Cloud, OpenText a donc infusé une nouvelle l’IA dans Intelligent Capture. Pour son EVP et directeur produit, Muhi Majzoub, les clients demanderaient aujourd’hui des applications pour mobiles et des algorithmes capables de fonctionner avec les caméras des smartphones, plutôt qu’avec des scanners. Ce qui n’est pas sans poser quelques défis.
« Nous avons beaucoup travaillé sur le mobile, mais nous n’avons pas complètement terminé », admet-il. « C’est un domaine qui continue de s’améliorer, et nous innovons. Surtout lorsqu’il s’agit des frais de voyages, des reçus et des dépenses. Personne n’a accès à un scanner [dans ces moments-là] et c’est le genre de tâche que nous faisons tous à la maison ».
OpenText applique exactement la même logique avec Intelligent Viewing, une nouvelle fonctionnalité qui fait appel à l’IA pour extraire des informations et créer des métadonnées depuis des fichiers scannés, notamment pour s’assurer que les politiques et les règles de l’entreprise sont bien respectées dans la gestion documentaire (en plus de l’indexation pour les rendre plus facilement trouvables par le moteur de recherche interne).
Intégration avec Salesforce
Une autre nouveauté majeure d’OpenText Content Cloud Editions 21.4 est l’intégration de Documentum avec Sales Cloud (CRM) et Marketing Cloud de Salesforce.
Cette intégration permet de partager des documents dans ces applications tout en maintenant les règles de sécurité, de gouvernance et de suivi des versions définies dans OpenText.
« Du point de vue des métadonnées, c’est également assez intéressant », estime Cheryl McKinnon de Forrester. « Si vous souhaitez utiliser Salesforce comme système d’enregistrement pour les numéros de clients ou de projets, ces informations peuvent être transférées dans les métadonnées de l’ECM. Vous disposez ainsi d’un identifiant commun unique, quels que soient le système dans lequel se trouvent les données ou les documents relatifs au client ».
Une connexion à Office 365 pour mieux contrer OneDrive
Une autre intégration – entre Office 365 et Core Content (son concurrent maison de Box, Dropbox et autres Google Drive) – montre la volonté d’OpenText de ne pas se laisser prendre des parts de marché par OneDrive.
Muhi MajzoubEVP et directeur produit, OpenText
Pour l’analyste Alan Pelz-Sharpe, de Deep Analysis, Microsoft tente de pousser son OneDrive auprès des clients d’Office 365 pour qu’ils y stockent leurs fichiers. Mais, continue-t-il, la grande majorité des organisations qui ont construit leurs ECM sur OpenText (ou sur un de ses concurrents) n’abandonneront pas leurs plateformes documentaires pour la remplacer par OneDrive. Microsoft doit donc donner à ses clients ce dont ils ont besoin, conclut-il, à savoir : la flexibilité de sauvegarder leurs contenus là où ils le veulent, et là où ils ont mis en place leurs workflows documentaires, et leurs politiques de conformité et de sécurité.
« Si je me fie aux retours que me font [nos] clients, ils disent à Microsoft qu’ils ne veulent pas que tous leurs contenus soient toujours stockés dans un de ses systèmes », confirme Muhi Majzoub d’OpenText. « Leur stratégie consiste au contraire à stocker leurs contenus dans Documentum et Core Content [d’OpenText]. Ils veulent poursuivre cette stratégie, globalement pour l’ensemble de l’entreprise, et ils ne veulent pas être obligés de stocker le contenu dans OneDrive ou dans SharePoint ».