Il nous est tous déjà arrivé d’utiliser des outils tels que Google Translate, Reverso ou encore Deepl. Vous savez, ces traducteurs disponibles sur internet permettant de passer d’une langue à une autre ! C’est ce que l’on appelle la traduction automatique, ou machine translation (MT) en anglais : le passage d’un texte – d’une langue à une autre – effectué par ordinateur, sans intervention humaine.
Certains de ces outils laissent encore à désirer et des questions se posent toujours. Est-ce qu’un moteur de traduction automatique générique répond bien à mes attentes business spécifiques ? Est-ce que la machine translation permet d’assurer la confidentialité de mes données ? Qu’est-ce que la Neural Machine Translation et comment puis-je l’intégrer à mon workflow spécifique ?
Traduction automatique : origines, fonctionnement et évolution
Les débuts de la traduction automatique remontent aux années 50. Trois types de systèmes se sont succédé :
Les systèmes basés sur des règles (années 1980)
Le programme de traduction automatique va associer des dictionnaires de mots courants ainsi que des règles linguistiques et grammaticales. Il est également recommandé d’ajouter des dictionnaires utilisateurs afin d’améliorer la qualité de traduction, bien que celle-ci ne sera pas forcément à la hauteur de nos attentes. Cependant, grâce à l’alimentation des dictionnaires spécialisés, les systèmes basés sur des règles permettent généralement des traductions cohérentes et logiques.
Les systèmes basés sur des statistiques (1980-90)
Ces systèmes n’utilisent aucune règle linguistique pour effectuer la traduction. Ils traduisent en se servant de modèles statistiques auto construits à partir de corpus. Le programme de traduction automatique analyse des banques de données importantes pour chaque langue, ce qui permet des traductions assez fluides mais qui ne sont parfois pas très logiques.
Les systèmes basés sur des algorithmes neuronaux (2015)
Ces systèmes permettent de traduire en temps réel et de prédire la probabilité d’une séquence de mots. C’est une approche qui permet aux moteurs d’apprendre à traduire par le biais de réseaux neuronaux dont les liaisons sont similaires à celles d’un cerveau. Ce système de traduction automatique neuronale permet des traductions de plus grande qualité : la traduction neuronale contient en effet 50% moins d’erreurs d’ordre des mots, 17% moins d’erreurs lexicales et 19% moins d’erreurs grammaticales. Les réseaux neuronaux ont même appris à harmoniser le genre et le cas dans différentes langues (et personne ne leur a appris à le faire !). Voici un exemple de phrase en anglais traduite en français par un moteur de traduction automatique générique ne prenant pas en compte le contexte de la phrase et un moteur de traduction automatique neuronale entraîné dans le domaine :
Découvrez comment vous développer à l’international grâce aux technologies
La NMT, un atout majeur de la traduction automatique
Radicalement différente des autres approches telles que la traduction statistique et la traduction automatique à base de règles, la Neural Machine Translation utilise un grand réseau neuronal qui fonctionne sur le modèle du cerveau humain au travers de l’intelligence artificielle.
Elle est la plus avancée en matière de traduction générée par ordinateur et a fait d’énormes progrès ces dernières années grâce à l’auto-apprentissage basée sur l’Intelligence Artificielle, le Big Data et le Deep Learning. Aujourd’hui les moteurs neuronaux de traduction automatique peuvent être utilisés comme base pour des traductions professionnelles.
La machine est capable de reproduire une traduction fiable mais aussi d’apprendre une langue. Cela lui permet d’améliorer continuellement la qualité des données traduites. Pour qu’elle soit opérationnelle, celle-ci doit forcément être entraînée par un humain. Ce qui signifie que le programme doit être alimenté avec un volume important de données dans le but d’améliorer la fiabilité des résultats finaux.
L’humain est également capable d’entraîner le programme pour répondre aux besoins spécifiques d’un secteur qu’il soit juridique, financier ou encore médical avec un vocabulaire métier propre.
Deux entreprises des GAFAM sont déjà adeptes de ce type de traduction automatique vérifiée :
- Google avec le Google Neural Machine Translation (GNMT) : réseau neuronal disponible en 8 langues
- Microsoft avec l’application mobile Microsoft Translator permettant de traduire des documents dans une soixantaine de langues différentes
Skype a également son Skype Translator, efficace pour faciliter les conversations de groupes allant jusqu’à 100 interlocuteurs.
En clair, la NMT est utile dans divers secteurs, notamment celui du e-commerce à condition de valider quelques critères pour faciliter la traduction tels qu’un nombre de répétitions suffisant, un volume de data spécifiques disponible pour entraîner le moteur système ou encore un assez grand volume de texte à traduire.
Cependant, il y a des points à ne pas négliger…
Les limites de la Traduction Automatique Neuronale
L’inconvénient de la NMT, comme les autres types de traduction automatique, est que les phrases dans le texte source doivent être très explicites pour obtenir une traduction de qualité. La moindre ambiguïté doit être intégrée dans le programme auparavant au risque de se retrouver avec une traduction n’ayant plus aucun sens. En effet, la Neural Machine Translation rencontre des difficultés face à un langage très technique ou à l’utilisation de mots rares et de noms propres. Il y a divers sujets à traiter avant de se lancer dans une traduction automatique neuronale :
- L’explicité du texte à traduire afin d’éviter les soucis d’ambiguïté
- L’entraînement et le regard humain sur les secteurs particuliers (juridiques, médicaux…)
- La gestion de la confidentialité des données : il faut savoir que les moteurs publiquement disponibles enregistrent toutes les données sur leurs serveurs. De ce fait, il est difficile voire impossible de garantir la confidentialité des données des clients
- Le sujet de créativité : un moteur s’entraîne avec ce qu’il considère être la norme et proposera alors, toujours une traduction qui, pour lui, sera la plus appropriée par rapport à ce qu’il aura appris. Or, un langage de marque (notamment dans le secteur du e-commerce) requiert de se différencier (un « top » chez Topshop sera peut-être appelé « t-shirt » chez Zara bien que ces deux produits fassent référence au même type de vêtement).
C’est pour gérer tous ces obstacles que l’interaction humaine est indispensable.
L’impératif de l’humain
La traduction automatique, même neuronale, présente donc encore quelques lacunes notamment en matière de contexte. C’est pour cela que la vérification humaine est nécessaire, car certaines subtilités restent encore hors de portée de la traduction automatique. L’expertise humaine en gestion de projet, le conseil et les connaissances techniques des spécialistes de la Neural Machine Translation sont autant d’éléments indispensables à la réussite d’un projet de traduction automatique vérifiée.
Tout ceci nous amène donc à la traduction automatique vérifiée, ou traduction automatique relue. On parle de Post-Edited Machine Translation ou PEMT. Cette activité, gérée par des traducteurs professionnels et sensibilisés aux enjeux de la traduction automatique neuronale, consiste à corriger la traduction générée par la machine pour obtenir un texte final cohérent et fluide. Il existe deux types de post-édition :
- La post-édition légère qui consiste à corriger la traduction automatique sans approfondir
- La post-édition complète qui requiert une correction approfondie de la part du traducteur humain
Une PEMT légère sera utilisée pour les erreurs suivantes : fautes d’orthographe ou de grammaire, contresens, contenu offensant ou inapproprié, mots manquants… Tandis que la PEMT complète sera plutôt utile pour tout ce que touchera à la terminologie, la structure de certaines phrases, la ponctuation ou encore le style d’écriture afin de rendre le texte plus naturel et fluide.
La PEMT légère (light post-editing en anglais) est donc utilisée pour faciliter la compréhension globale d’une langue que l’on ne maîtrise pas alors que la PEMT complète (Full post-editing en anglais) est utilisée pour rendre parfaites les phrases produites par le moteur de traduction automatique… d’où le terme de traduction automatique relue ou vérifiée.
La Neural Machine Translation représente donc une avancée considérable dans l’efficacité et la pertinence des moteurs de traduction automatique. Ces moteurs, s’ils sont enrichis et entraînés par secteur d’activité, sont une base très qualitative pour les traducteurs chargés de relire et vérifier les textes traduits. Concrètement, la NMT possède des bénéfices indéniables pour les entreprises :
- D’abord, des économies importantes générées par la traduction automatique ;
- Ensuite, un gain de temps non négligeable : un traducteur humain professionnel peut traduire en moyenne 2000 à 3000 mots par jour, alors qu’il ne faut à une machine que quelques instants pour traduire des volumes conséquents ;
- Enfin, l’assurance d’une qualité irréprochable grâce à l’expertise humaine de l’équipe en charge du projet et au travail indispensable des traducteurs professionnels en charge de la post-édition.
Le travail des moteurs de traduction automatique neuronale doit donc impérativement être couplé d’un accompagnement humain par des professionnels de la traduction : chefs de projets, linguistes, développeurs et traducteurs/relecteurs. La traduction automatique vérifiée vous permettra ainsi d’assurer des traductions rapides, cohérentes et moins coûteuses, adaptées à votre domaine d’expertise, à votre langage de marque et à votre cible.