Traduction automatique

Un article de Wikipédia, l'encyclopédie libre.
Sauter à la navigation Sauter à la recherche

La traduction automatique désigne la traduction d'un texte (ou d'une conversation audio, en direct ou en différé) entièrement réalisée par un ou plusieurs programmes informatiques, sans qu'un traducteur humain n'ait à intervenir. On la distingue de la traduction assistée par ordinateur où la traduction est en partie manuelle, éventuellement de façon interactive avec la machine.

Malgré ses faiblesses, elle peut rendre des services dans des domaines tels que la veille internationale (y compris la veille technologique)[1], où elle permet de prendre connaissance de façon superficielle, mais rapide, de grandes quantités de textes.

Depuis quelques années, elle connaît un essor considérable sur le Web, avec plusieurs systèmes en ligne pouvant traduire automatiquement et en quelques secondes des pages Web ou des textes de plus en plus longs. C'est une aide très appréciée du grand public car elle permet de déchiffrer — de façon certes encore grossière — le thème d'une page Web dans une langue totalement inconnue et les principaux faits ou éléments d'information qu'elle contient. Pour simplifier la navigation, plusieurs moteurs de recherche comme Google, Altavista ou Yahoo! permettent de l'utiliser systématiquement.

Le processus de traduction[modifier | modifier le code]

Triangle de Vauquois, modèle pour les fondements de la traduction automatique

Le processus de traduction (au sens humain) peut être découpé en trois phases successives :

  1. compréhension : assimilation du sens véhiculé par un texte, du vouloir dire d'un auteur… ;
  2. déverbalisation : oubli des mots et conservation du sens ; « Opération par laquelle un sujet prend conscience du sens d'un message en perdant conscience des mots et des phrases qui lui ont donné corps »[2] ;
  3. réexpression : reformulation du vouloir dire en langue cible.

En termes informatiques, la compréhension devient l'analyse, la déverbalisation devient le transfert et la réexpression devient la génération. Ces étapes du processus sont modélisées dans le triangle de Vauquois[3]. Ce modèle est utile car pour passer de la source à la cible, il existe plusieurs chemins possibles qui constituent les différentes approches envisagées à ce jour. Plus le degré de conceptualisation est élevé, plus court est le chemin du transfert. Il existe quatre possibilités principales :

  • Le transfert direct : pas de conceptualisation, toute la traduction repose sur le transfert. La traduction par l'exemple et la traduction statistique[4] travaillent à ce niveau. La traduction est vue comme un processus de décodage.
  • Le transfert syntaxique : le niveau du transfert est syntaxique. Généralement, sa représentation est l'arbre syntaxique. L'analyse produit une représentation syntaxique pour la langue source. Le transfert consiste à produire une représentation syntaxique pour la langue cible à partir de ce dernier. Finalement la génération produit la phrase en langue cible. La traduction automatique à base de règles est représentative de cette catégorie. Les règles permettent les différentes transformations.
  • Le transfert sémantique : le niveau du transfert est sémantique. Cette voie est celle qu'empruntent les humains. Les modèles de représentation de la sémantique du langage sont décrits par la pragmatique. La sémantique peut être décrite par une ontologie. Il n'y a que peu d'approches de la traduction automatique représentatives du transfert sémantique[5].
  • L'interlangue : Ce niveau supprime la nécessité de transfert. L'interlangue devient universelle. Et seuls restent les processus d'analyse et de génération. l'interlangue est aussi désignée sous le terme de langue pivot. DLT (voir l'article Traduction de langues distribuée) est une tentative inachevée de cette approche. Le langage UNL est aussi un exemple de langage formel informatique permettant de représenter le sens d'un énoncé. L'approche est séduisante car l'effort consiste, pour une langue donnée, à produire un analyseur et un générateur pour l'interlangue. On bénéficie alors de toutes les traductions de ou vers les langues possédant aussi l'analyseur et le générateur. Cette approche reste difficile et n'a pas connu de succès à large échelle.

Actuellement, les moteurs de traduction sont principalement par règles ou statistiques. Une voie dite hybride émerge[6]. Systran, Google Translate, Reverso et Microsoft Traduction utilisent des approches hybrides.

Prérequis[modifier | modifier le code]

Les pré-requis dépendent de l'approche envisagée : traduction à base de règles (mot-à-mot, transfert, pivot), traduction par l'exemple, traduction statistique.

La traduction automatique à base de règles nécessite :

  • des entrées de dictionnaires,
  • des règles linguistiques.

La traduction par l'exemple et la traduction statistique nécessitent :

On peut, en plus, avoir besoin d'outils d'analyse linguistique tels que :

Approches[7][modifier | modifier le code]

  • Approche directe :
  1. traduction mot à mot du texte source vers le texte cible
  2. reformulation de l'ordre des mots traduits dans le texte cible
  • Approche Interlangue :
  1. construction de la représentation interlangue du texte source
  2. construction du texte cible par la représentation
  • Approche par transfert :
  1. analyse lexicale et syntaxique du texte source
  2. transfert des lemmes traduits et structures en langue cible
  • Proposition : Approche séquentielle (ou progressive) :
  1. D'abord : Correction automatique du texte source (1 → 2)
  2. Ensuite : Détecter les expressions idiomatiques en LangueSource dans TexteSource > les interpréter en LCible > les retraduire mot-à-mot en LSource > les remplacer dans le TSource (2 → 3)
  3. Ensuite : Détection pour Interprétation (LSource → LCible + Trad-Mot-à-Mot → LSource) et remplacement des seuls noms propres dans le texte source (3 → 4)
  4. Ensuite : Réorganisation syntaxique dans le texte source (4 → 5)
  5. Enfin : Traduction mot à mot du texte source (5 → texte cible)

Évolutions[modifier | modifier le code]

Fin octobre 2005, la presse annonce de notables améliorations[8]. Le Centre international pour les technologies avancées des communications, dirigé conjointement par l’université Carnegie-Mellon de Pittsburgh et l'université de Karlsruhe en Allemagne, dévoile alors un système informatique de traduction instantanée. Un étudiant chinois, affublé de onze électrodes sur le visage et sur la gorge, prononce dans sa langue un discours qui est simultanément traduit en anglais et en espagnol. Les chercheurs indiquent en conclusion que « Les résultats ne sont pas parfaits » et qu'« il peut y avoir des difficultés quelquefois ». En fait, aucun article n'indique que les journalistes allemands et américains ont pu discuter avec l'étudiant. Les journalistes omettent d’ailleurs généralement de préciser que, quand le docteur Waibel annonce qu’il va prendre des questions de journalistes allemands et américains, l’ordinateur entend quelque chose comme : « Ainsi nous glycogène il alternant des questions entre l’Allemagne et l’Amérique. »[9] Ce type de traduction instantanée manque encore d'améliorations logicielles concernant la reconnaissance vocale, notamment brouillée par le bruit ambiant et la mauvaise prononciation.

En 2018, un outil informatique basé sur l'intelligence artificielle réussit à traduire en douze heures un livre de 800 pages de texte, de graphiques et de formules mathématiques, écrit avec LaTeX[10]. Cet outil développé par Quantmetry, une jeune entreprise de conseil en intelligence artificielle pour les entreprises, associée à quatre chercheurs français spécialistes de l'apprentissage profond et issus de l'ENSAI, de l'INRIA et de l'Université de Caen, est basé sur le service de traduction automatique DeepL.

Applications[modifier | modifier le code]

Les appareils de traduction actuels sont utiles pour des situations limitées, par exemple pour réserver une chambre dans un hôtel. « Si je vais à Pékin, je peux descendre au Hilton sans aucun problème », disait Stephan Vogel, un chercheur de Carnegie Mellon.

Services en ligne[modifier | modifier le code]

Traducteurs en ligne gratuits :

Ils permettent de traduire des mots ou des textes de taille limitée. Il s'agit par exemple de :

Logiciels libres :

Environnements de développement :

Prospective[modifier | modifier le code]

Divers projets cherchent à améliorer les performances et la rapidité des moteurs de traduction (dont celui de Google), espérant un jour pouvoir surmonter la « barrière de la langue » et traduire en temps réel (comme cela a été imaginé par de nombreux auteurs de science-fiction) une langue étrangère, voire pouvoir « communiquer » avec certains animaux via un logiciel de traitement vocal.

  • Un projet en cours au Japon consiste à équiper un téléphone portable d'un traducteur multilingue automatique. Ce projet vise dans un premier temps à afficher sur l'écran du téléphone la traduction de phrases et mots simples prononcées en Japonais ou en d'autres langues, en quelques secondes et de manière autonome, c'est-à-dire sans dépendre d'un serveur[11].

Notes et références[modifier | modifier le code]

  1. Laurence Danlos. Professeur de Linguistique Informatique à l'Université Paris 7, écrit dans Linguistique informatique, Traduction automatique : « Ils produisent souvent des traductions erronées mais qui peuvent au moins servir à déterminer de quoi parle le texte (ce qui est important en veille technologique, par exemple). »
  2. La traduction: mode d'emploi, Glossaire analytique, J. DEMANUELLI & C. DEMANUELLI, page 51
  3. À la suite des travaux de Vauquois et Boitet (Bernard Vauquois, Christian Boitet: Automated Translation at Grenoble University. Computational Linguistics 11(1): 28-36 (1985))
  4. Philipp Koehn: Statistical Machine Translation. Cambridge University Press, 2010.
  5. (en) Eugene Seo, Il-Sun Song, Su-Kyung Kim, et Ho-Jin Choi. 2009. Syntactic and semantic English-Korean machine translation using ontology. In Proceedings of the 11th international conference on Advanced Communication Technology - Volume 3 (ICACT'09), Vol. 3. IEEE Press, Piscataway, NJ, USA, 2129-2132.
  6. Roland Raoul KOUASSI, Université de Cocody, La problématique de la traduction automatique, , 30 p. (lire en ligne)
  7. M. Constant, Cours de Traduction automatique, Université Paris-Est Marne-la-Vallée, , 32 p.
  8. « De nouveaux systèmes de traduction pour surmonter la barrière de la langue », sur www.rtflash.fr, (consulté le 14 octobre 2018)
  9. Ange-Gabriel C., « Une machine de traduction simultanée », sur generation-nt.com, (consulté le 14 octobre 2018)
  10. Laure Beaudonnet, « «Deep learning»: L'homme prend sa première grosse raclée par la machine en matière de traduction », sur www.20minutes.fr, (consulté le 14 octobre 2018)
  11. description d'un essai au C&C iEXPO 09, article de akihabaranews.

Voir aussi[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Bibliographie[modifier | modifier le code]

  • Doug Arnold, Balkan, L., Meijer, S., Humphreys, R.L. Sadler, L. 1993. Machine Translation: An Introductory Guide.
  • Paul Bennett. 1994. Translation Units in Human and Machine. Babel 40:12-20.
  • Bert Esselink. 1998. A practical guide to software localization. John Benjamins.
  • Ethnologue. 2001. Languages of the World.
  • W. John Hutchins & Harold L. Somers. 1992.An Introduction to Machine Translation. Academic Press.
  • W.John Hutchins. 2001. Machine translation over fifty years. Histoire, Epistemologie, Langage XXII-1:7-31.
  • Martin Kay. 1997. The Proper Place of Men and Machines in Language Translation. Machine Translation 13:3-23.
  • Alan K. Melby. 1995. The Possibility of Language. A discussion of the nature of language with implications for human and machine translation. John Benjamins.
  • Sergei Nirenburg. 1987. Machine Translation: Theoretical and Methodological Issues. Cambridge University Press.
  • Jörg Porsiel (éd.): Machine Translation. What Language Professionals Need to Know. Bundesverband der Dolmetscher und Übersetzer Weiterbildungs- und Fachverlagsgesellschaft mbH, Berlin 2017, ISBN 978-3-93843-094-1.
  • Johnatan Slocum. 1988. Machine Translation Systems. Cambridge University Press.

Liens externes[modifier | modifier le code]