IA : où en est-on avec la traduction automatique ?
La traduction automatique a reçu un coup de pouce des technologies comme le deep learning, mais elle se heurte encore aux complexités et aux nuances des langues humaines.
L’intelligence artificielle est de plus en plus apte à relever l’un des grands défis du NLP : la traduction automatique. L’objectif ultime de cette technique est de pouvoir traduire de manière fluide et précise une langue parlée ou écrite vers une autre sans intervention humaine.
Si les concepts qui sous-tendent la traduction automatique sont faciles à comprendre, les processus d’automatisation de l’adaptation d’une langue à une autre s’avèrent extraordinairement complexes. Les langues humaines comportent une grande variété de nuances et d’argot. Elles incluent même des mots aux significations multiples. Un algorithme doit être capable de traiter et comprendre toutes ces subtilités afin de fournir une traduction précise.
Pour y parvenir, il faut réunir diverses technologies telles que le deep learning, l’intelligence artificielle, le big data, et l’analyse linguistique. Certaines d’entre elles comme le cloud computing, le stockage cloud et les API Web existent depuis plus longtemps. Toutes se révèlent utiles pour alimenter un moteur de traduction automatique.
Les dernières évolutions de la traduction automatique
Il existe aujourd’hui trois grands types de traduction automatique : la traduction automatique à base de règles (RBMT), celle qui s’appuie sur un modèle statistique, et des systèmes hybrides qui combinent les deux approches.
Le système RBMT implique un ensemble de règles qui régissent la manière de traduire un texte ou un enregistrement vocal. Généralement, ce modèle repose sur la combinaison de deux dictionnaires pour produire une traduction. Au cours de ces deux dernières décennies, la plupart des déploiements de la traduction alimentée par l’IA dépendaient du RBMT, car cette technique a été la première à donner des résultats pertinents. Elle est idéale pour les documents techniques. Elle fournit des traductions littérales et répond à des standards bien établis.
Cependant, les dictionnaires ont leurs limites, car il y a beaucoup de mots qui sont difficilement traduisibles d’une langue à une autre. Pour aider l’IA à améliorer son efficacité, une nouvelle méthode a vu le jour : la traduction automatique statistique (SMT). Au lieu d’utiliser des dictionnaires, ces algorithmes apprennent à traduire en examinant des textes bilingues.
Avec les évolutions de l’IA, le RBMT n’est plus le modèle dominant. Davantage de déploiements ont évolué vers la traduction automatique statistique ou hybride. En effet, ces deux techniques s’appuient sur des documents réels au lieu de puiser des informations dans des dictionnaires pré-installés. Le système hybride mêle les deux approches. Les bases de données de vocabulaires permettent d’effectuer une première traduction et l’entraînement sur les textes bilingues apporte les nuances nécessaires à la bonne compréhension du langage humain.
Comme la traduction basée sur le machine learning est alimentée par des volumes de données importants, il n'est pas surprenant que les grands fournisseurs de cloud ouvrent la voie dans ce domaine.
Amazon, Google, Microsoft, Facebook et d’autres ont mis au point des technologies de pointe. Elles s’appuient sur les innombrables conversations entre les utilisateurs de leurs plateformes dans un grand nombre de langues. Google translate est largement utilisé, mais n’est généralement pas assez précis. Facebook a dévoilé un modèle d’apprentissage non supervisé qui a montré une efficacité supérieure. AWS a également lancé un service de traduction automatique.
Les géants du cloud ne sont pas seuls sur ce marché. Il existe au moins 45 entreprises spécialisées dans la traduction automatique dans le monde. Certains éditeurs se concentrent sur la conception de services dédiés à la traduction de documents professionnels et techniques. D’autres sociétés introduisent l’humain dans la boucle pour accentuer la précision du travail d’adaptation dans le cas où la qualité n’atteint pas le seuil attendu.
Les services de traduction automatique destinés aux entreprises et aux professionnels sont de plus en plus populaires. Ces services entièrement automatisés permettent aux organisations d'économiser beaucoup d'argent et de temps lorsqu'il s'agit d’adapter des contenus. La traduction réalisée par l’IA peut gérer plus de trois fois la quantité de travail qu'un humain est capable d’effectuer.
Cela inclut même le travail d'un rédacteur humain qui passe en revue l’œuvre de la machine.
Les limites de la traduction automatique
La plupart des algorithmes ne sont pas capables de comprendre les nuances du langage courant et encore moins celles des langages spécialisés utilisés, par exemple, dans les documents médicaux ou légaux. Une traduction incorrecte dans ce type d’activité peut causer de sérieux problèmes. Par exemple, un concept qui décrit une maladie mentale n’a souvent pas son équivalent exact dans plusieurs autres langues.
De même, les outils de traduction automatique gèrent très mal les adaptations littéraires et comprennent difficilement les œuvres de fiction. Les auteurs utilisent davantage d’images et d’effets de style que dans d’autres manuscrits. Un algorithme n’est pas forcément entraîné à identifier l’humour ou le sarcasme et aura donc des difficultés à retranscrire ces concepts. L'argot et les dialectes spécifiques à une culture peuvent également poser des problèmes pour un modèle de machine learning. Parfois, il n'y a même pas moyen de traduire l'argot, car il est dépendant d’un contexte culturel. Traiter quelqu’un de pieuvre en japonais est offensant, mais aux États-Unis, la personne qui tente de vous dénigrer avec ce mot passera pour quelqu’un d’étrange.
Les nouvelles technologies et méthodes d'apprentissage permettront d'améliorer la traduction automatique au fil du temps. Comme nous l'avons déjà mentionné, la traduction est un problème difficile, mais les machines sont de plus en plus performantes.