Prostock-studio - stock.adobe.co
Comment l’IA révolutionne vos traductions (et le métier de traducteur)
L’Intelligence Artificielle ne va pas mettre les traducteurs au chômage. Mais elle rebat les cartes en fonction des cas d’usages et recentre la traduction humaine sur la traduction hybride et la « transcréation ».
L’Intelligence Artificielle (IA) est-elle en train de faire disparaître les métiers de traducteurs et d’interprètes ? La question semble provocatrice – elle l’est –, mais avec les avancées du Deep Learning et la multiplication des outils qui proposent la traduction en fonctionnalité, indépendante ou intégrée, elle mérite d’être posée.
« C’est une vraie question », confirme en tout cas Theo Hoffenberg, fondateur de Reverso, qui considère que la révolution de l’IA dans la traduction a véritablement débuté il y a deux ans et demi.
Parmi ces outils qui intègrent la traduction, des éditeurs de visio ont des extensions qui permettent à présent de sous-titrer les échanges en direct dans différentes langues. Dans la bureautique, Office 365 propose de traduire les fichiers. Dans le grand public, YouTube automatise depuis plusieurs années la traduction des sous-titres.
Côté services indépendants, l’Allemand DeepL a rejoint Google Traduction. Les éditeurs spécialisés dans la traduction B2B comme les Français Reverso et Systran offrent désormais eux aussi des traducteurs en ligne.
Ces fonctionnalités et ces services sont autant de preuves de la démocratisation de l’IA dans le domaine. De là à dire que le métier de traducteur va disparaître, il y a un pas que ne franchissent ni Theo Hoffenberg ni Peggy Santerre, experte en stratégie de traduction et co-fondatrice de Six Continents, une agence qui propose plusieurs types de traductions, dont certains, à base d’IA.
Theo Hoffenberg Reverso
« Quand on dit que c’est la fin du traducteur humain, non. Évidemment, non », répond celle qui enseigne également à l’Université d’Aix-en-Provence. « L’IA n’est pas du tout une menace [pour les traducteurs]. C’est juste le métier qui a complètement évolué ».
Pour elle, il faut distinguer trois grandes familles de traduction pour bien comprendre l’influence de l’IA : la traduction purement automatisée, la traduction augmentée (hybride) et la « transcréation ».
Theo Hoffenberg fait cette même distinction. Il en fait découler trois types de cas d’usages. « Il y a des cas où [l’IA] peut remplacer les traducteurs. Il y a des cas dans lesquels elle peut faciliter le travail des traducteurs. Et il y a des applications dans lesquelles les traducteurs sont toujours mieux que l’IA ».
Traduction automatique : de la pure Intelligence Artificielle
« Si on parle de traduction automatique, il reste des défis à relever. Déjà, sa qualité est assez surévaluée et variable d’une langue à l’autre », constate Peggy Santerre. « Il y a des langues qui sont catastrophiques parce qu’il n’y a pas d’enjeu. Il manque pas mal de données d’entraînement sur beaucoup de domaines ».
Reste que sur l’anglais français, « ce n’est pas trop mal » concède-t-elle.
Pas trop mal, si on différencie bien les cas d’usages. « Il y a des contenus sur lesquels la Machine Translation (NDR : traduction entièrement automatisée) est tout à fait suffisante. Une traduction purement automatique d’un avis client qui permet de comprendre que “l’hôtel est très bien, mais la nourriture pas géniale”, ça fait le boulot », illustre-t-elle.
Peggy SanterreSix Continents
Pour le fondateur de Reverso, les applications typiques dans lesquelles on peut remplacer les traducteurs par de l’IA sont celles à usage interne, pour la compréhension d’un document de travail par exemple. « Si vous avez besoin voir si un appel d’offres d’une entreprise allemande vous concerne et que vous ne parlez pas allemand, ou si vous voulez savoir ce qu’on dit sur votre entreprise en Russie, ou faire de la veille sectorielle pour savoir si une entreprise concurrente fait quelque chose de mieux que vous sur ce marché, et que vous ne comprenez pas bien le russe, vous n’avez plus besoin de faire appel à un traducteur », renchérit Theo Hoffenberg. « C’est déjà un énorme pan d’utilisation. »
Pour l’experte en stratégie de traduction de Six Continents, un des dangers pour le métier de traducteur viendrait d’ailleurs plus d’une baisse d’exigence du lecteur final que de l’IA elle-même.
« La qualité de la Machine Translation (MT) a augmenté, mais ce qui est plus inquiétant c’est que le lecteur a pris l’habitude du snacking (des tweets, etc.). Il est beaucoup dans le “Good Enough” : si c’est suffisamment qualitatif pour comprendre, ça lui va », constate-t-elle. « Ces deux courbes – celle qui monte de la qualité et celle qui descend du “Good Enough” – se rejoindraient en 2030 ».
Traduction hybride (ou augmentée) : l’humain dans la postproduction
Mais, prévient-elle, la traduction automatique n’est pas pertinente sur tous les contenus. Elle peut même être néfaste. « Pour tout ce qui concerne les industries réglementées – le médical, la pharmaceutique, le financier –, l’IA pure sans intervention humaine est fortement déconseillée, voire dangereuse […] Pour certains secteurs [réglementés], sans intervention humaine, l’entreprise prend d’énormes risques juridiques, pour son image et peut même mettre en danger la vie humaine ou l’environnement », insiste-t-elle.
Dans ces cas, l’IA n’est pas discréditée. Mais elle doit venir au soutien de l’intervention humaine. On parle alors de « traduction hybride » – ou de traduction augmentée (par distinction à la traduction automatisée).
« La traduction hybride est un mix “traduction par IA – révision par un humain” » définit Peggy Santerre. « On estime que [l’aide à la traduction] fait gagner entre 30 % à 50 % du temps par rapport à une traduction classique », chiffre Theo Hoffenberg dont la société propose une offre de ce type baptisée Reverso Documents.
Peggy SanterreSix Continents
La traduction hybride a du sens dans de nombreux cas. « Un exemple l’illustre bien. Un prospect avec un site marchand m’a appelée récemment », raconte Peggy Santerre. « Il avait 1 500 références sur son site. Va-t-il traduire les 1 500 pages produits en traduction humaine ? Non, cela lui coûtera trop cher. Ou tout en traduction automatique ? Non plus. Ce serait quasiment gratuit, mais la qualité ne sera pas là. Entre les deux il y a la traduction hybride ».
Dans ce cas précis, Peggy Santerre préconise d’identifier les « best sellers » et de les faire traduire par deux humains (un premier traducteur et une relecture par un second traducteur).
Cette traduction de haute qualité – la plus chère – commencera à alimenter des mémoires de traduction (des fichiers TMX) qui serviront ensuite à prétraduire automatiquement, mais sans IA, les segments que ces fiches ont en commun avec celles de « best sellers ».
Il restera alors des « trous » que l’IA pourra traduire (en MT). Puis un traducteur humain reprendra la main sur cette prétraduction – mixte et brute – pour « donner un coup de pinceau » (sic) et faire de l’hybride humain – machine.
« C’est à la fois mieux que du Google Traduction et cela évite le prix d’une traduction complètement humaine », résume Peggy Santerre. Pour l’experte, une traduction hybride varierait entre 30 à 70 % du prix d’une traduction humaine, « selon le niveau d’aboutissement [N.D.R. : de relecture] qu’on veut mettre derrière » (cf. ci-après).
Dans un deuxième temps, une fois récoltés les ROI des « best sellers », le marchand pourra passer d’autres fiches en traduction purement humaine pour améliorer son site.
Autre exemple : l’aide en ligne d’un logiciel. Un éditeur doit-il payer aussi cher la traduction des pages les moins lues que celles des plus lues ? « Sur la base des statistiques de consultation, il peut être intéressant d’avoir recours à une traduction purement automatique, puis de faire améliorer les pages identifiées comme utiles par des traducteurs », illustre Peggy Santerre pour qui, une des bonnes pratiques, est donc d’analyser et de différencier ses contenus à traduire et d’établir une stratégie globale.
Transcréation : l’IA n’a pas d’émotion
À côté de ces deux formes de traduction – automatiques et augmentées –, la traduction purement humaine (épaulée par des outils classiques comme les mémoires de traduction) existe encore. Mais elle s’est recentrée sur ce que le secteur appelle la « transcréation ».
« La post-édition, c’est quand on relit de l’IA. La transcréation, c’est quand il faut complètement se décoller de la source et adapter complètement un texte à une langue et une culture », synthétise Peggy Santerre.
On pense évidemment à la littérature. « Si vous traduisez un livre, [l’IA] va vous donner quelque chose que l’on peut lire. Mais ça ne va pas vous donner quelque chose avec la patte d’un écrivain » resitue Theo Hoffenberg.
La transcréation a de nombreux cas d’usages aussi dans le B2B. Ceux où « vous allez attendre que la personne réécrive le texte en s’inspirant de l’original », continue Theo Hoffenberg qui cite la publicité, le marketing ou le journalisme (de presse ou d’entreprise).
Nelson Mandela
« Par exemple un article [ou un billet de blog] est très rarement traduit en l’état », constate le fondateur de Reverso. « Vous allez l’adapter au style du média et aux attentes des lecteurs. S’il s’agit d’un dossier technique, oui [l’IA peut le faire]. Mais sinon vous allez ajouter un chapeau différent. Vous allez expliciter les choses de façon différente. Et là, peut-être que vous n’allez même pas recourir à un traducteur, mais à un journaliste spécialisé ».
« La grosse différence c’est l’émotion : l’IA ne crée pas d’émotions », approfondit Peggy Santerre. « Nelson Mandela disait : “si tu parles une langue que ton interlocuteur comprend, tu parles à sa tête. Si tu veux toucher son cœur, il faut lui parler dans sa langue maternelle”. L’IA peut suffire pour comprendre. Mais si on veut donner une émotion – pour susciter un achat par exemple –, il faut qu’il y ait une intervention humaine à un moment donné. C’est évident ».
« Si l’objectif est d’avoir quelque chose d’informatif, [l’IA] c’est suffisant. Mais si l’objectif est d’avoir quelque chose qui va vous émouvoir, vous convaincre (un discours politique ou commercial), ce sera plus difficile », acquiesce Theo Hoffenberg.
Le marketing, la publicité, la communication se marieraient donc mal (ou peu) avec l’IA. Et quand ces disciplines y ont recours de manière pertinente, c’est toujours dans une stratégie hybride, avec un fort degré d’intervention humaine qui peut aller jusqu’à la ré-écriture et à l’adaptation culturelle en fonction des pays et des marchés ciblés.
« En fait, dans l’hybride il y a aussi différents types d’interventions : révision complète, révision de points précis, ou révision légère. Il faut que ce soit clair pour le client. Ne serait-ce que parce que ce n’est pas le même prix », avertit Peggy Santerre.
Apprentissage d’un moteur de traduction : un défi (quasi) impossible ?
À côté des outils clefs en main comme DeepL ou Google Translate, la promesse de certains éditeurs est de fournir des algorithmes que les clients peuvent entraîner eux-mêmes.
Peggy SanterreSix Continents
Est-ce une menace pour les agences et pour les spécialistes de services de bout en bout (collecte des documents, extraction des textes, traduction, prise en charge des nouveaux documents, etc.) comme Systran ou Reverso ? Non, répondent Theo Hoffenberg et Peggy Santerre qui, elle aussi, propose des services clefs en main pour les entreprises.
« Le défi majeur pour la personnalisation d’un moteur de traducteur – le nerf de la guerre – c’est la quantité de traductions humaines de grande qualité qu’il faut fournir comme exemples… et il faut le faire pour chaque type de contenu et dans toutes les langues dont vous avez besoin ! Il faut arrêter de croire au père Noël », tranche Peggy Santerre. Sur ce point, Theo Hoffenberg estime qu’il faut au minimum 20 000 phrases pour entraîner un algorithme de traduction ; l’idéal est néanmoins d’en avoir dix fois plus.
Le fondateur de Reverso fait un autre constat : les entreprises n’ont pas envie « de mettre les mains dans le cambouis » (sic).
Theo HoffenbergReverso
« Elles n’ont pas envie de préparer les données d’apprentissage, de regarder quel est le meilleur modèle, de faire le tuning, de voir si cela fonctionne mieux en en mettant plus comme ci ou plus comme ça, de faire tourner la machine 37 fois. Ce que les entreprises veulent pouvoir dire c’est “voilà mes données, faites-nous un modèle personnalisé” ». Un acteur comme Google avec AutoML ne répondrait pas à ce besoin. « Google, son focus, c’est de mettre des technos à disposition. Et à vous de vous débrouiller avec », répond Theo Hoffenberg au MagIT.
Enfin, pour Peggy Santerre de Six Continents, les clients omettraient un point essentiel : « pour fonctionner, la traduction automatique nécessite des textes de départ impeccables, ce que l’on voit rarement. Le moindre écart dans le choix d’un terme et c’est la porte ouverte aux erreurs dans la traduction ».
Conclusion : le rôle du traducteur-interprète se transforme radicalement
L’avènement de l’IA n’est donc pas en train de faire disparaître le métier de traducteur. Mais il le transforme un peu plus chaque jour. « À nous de nous adapter », en conclut Peggy Santerre. « Nous, nous positionnons clairement comme fournisseur de traduction humaine et de traduction hybride […] Pour nous, ce sont des produits et des services différents qui répondent à des besoins différents ».
Reste que pour beaucoup de professionnels du secteur, le sujet de l’IA semble encore honteux. « Il faut dire que le discours ambiant a longtemps été de dire que passer par un cabinet de traduction était la garantie d’avoir une traduction purement humaine ; donc meilleure que ces outils en ligne [ou IT] », confirme la responsable de Six Continents. « Mais finalement, nous ne sommes pas les uns contre les autres. On peut coupler les deux de façon intelligente pour certains projets, dans l’intérêt du client ».
Peggy SanterreSix Continents
Plus largement, l’experte témoigne d’un saut générationnel. Également professeur à l’Université d’Aix Marseille, elle constate que les étudiants prétraduisent déjà leurs textes avec une IA avant de les améliorer eux-mêmes, dans un processus instinctif pour la nouvelle génération.
« Pour eux, c’était normal. Je venais notamment pour leur expliquer les processus de post-édition et l’évolution de leur métier… alors qu’ils avaient déjà ce réflexe naturel de prétraduire leurs textes ! », en rigole Peggy Santerre.
La teneur de ses cours a donc évolué en conséquence. « Je leur explique qu’ils ne peuvent pas tout prétraduire en amont, car selon le type de contenu et le service acheté par le client, leur approche doit être différente et adaptée. […] Je leur dis aussi de faire attention aux données qu’ils collent dans ces outils. Quid de la confidentialité et de la sécurité ? Quand on signe un accord de confidentialité, on prend d’énormes risques en interrogeant Google Traduction, par exemple. »
Un conseil qui s’applique aussi bien aux professionnels en entreprise.