Moteur de traduction automatique Google

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Le moteur de traduction automatique Google est le programme utilisé par le service de traduction automatique Google Translate.

En 2007, le moteur de traduction automatique Google a apporté des nouveautés dans le domaine de la traduction automatique. Le système Systran qu'il utilisait jusqu'alors était conçu pour des ordinateurs individuels et était soumis à leurs limitations  : il gérait des centaines de milliers de mots et d'expressions, avec des traductions possibles en appliquant des règles de grammaire qu'on lui avait inculquées.

Une autre différence notoire est qu'avec Google traduction l'anglais se retrouve désormais au cœur du système[1]. Chez ses concurrents, l'espagnol par exemple étant directement traduit en français et réciproquement, Google traduit la langue source en anglais, puis retraduit de l'anglais vers la langue cible. C'est un système qui possède des similitudes avec le projet de traduction de langues distribuée, avec pour différence le fait que la langue-pont n'est plus une langue artificielle élaborée pour présenter le moins d'équivoques possibles, mais une langue réelle contenant des imprécisions.L'exemple d' une phrase espagnole comme « Mi hermano podía venir » est correctement rendue en français par « Mon frère pouvait venir », par Promt, Reverso ou par Systran ; mais Google quant à lui traduit la phrase par « Mon frère pourrait venir ». Cette dernière a fait un tour par la langue source anglaise où elle est devenue « My brother could come », « could » voulant dire à la fois « pouvait » et « pourrait », Google opte pour le sens le plus fréquent qui de fait ne convient pas.

Google, Systran et Promt[modifier | modifier le code]

Le système Google, qui travaille à partir d'un centre serveur, est capable de jongler avec des milliards de mots et d'expressions, « provenant de textes monolingues dans la langue cible et de textes mettant en parallèle les deux langues »[2]. La grammaire est délaisée au profit des équivalences les plus rapprochées. Si Google ne trouve pas une expression dans sa base de données, il l'omet. Christian Boitet, Directeur du GETA (Groupe d'étude pour la traduction automatique) à Grenoble déclare à ce propos  : « Tout le monde peut constater que GoogleTranslate fournit des traductions apparemment « fluides », mais, au moins à 30 %, incompréhensibles, ou fausses, et surtout où des parties d'information ont disparu. »[3]

L'accroissement des dictionnaires personnels ralentit le travail et le nombre des mots qu'il est possible d'y mettre n'est parfois pas illimité.

Étendue du vocabulaire[modifier | modifier le code]

Du fait de la diversité de son vocabulaire, Google est avantagé dans le cas de sujets modérément techniques. Pour traduire, par exemple, « Erbkrankheit » Promt et Systran décomposeront le mot en ses deux éléments et donneront « maladie héréditaire », en face de « maladie génétique », plus précis et plus professionnel de Google. En revanche, si nous proposons « erbliche Belastung » (tare héréditaire), aucun des trois ne connaît « Belastung » dans ce sens et ils rendront le mot par son sens habituel de charge  : « charge héréditaire » pour Google et « erbliche charge » pour Promt et Systran qui ignorent même l'adjectif. Avec ces deux derniers cependant, un médecin qui aura entré l'expression dans un dictionnaire utilisateur obtiendra désormais toujours « tare héréditaire », tandis qu'il n'a aucun pouvoir pour imposer cette traduction à Google[4].

Google en vient même à ne pas traduire ce qu'il ne comprend pas, ne le laissant même pas dans la langue originale. Avons-nous  : « Many Jews now made a living by providing lodging and food for the masses of Hasidim who visited the Admor »[5] et la traduction sera  : « Beaucoup de Juifs vivant aujourd'hui en offrant un hébergement et de nourriture pour les masses de Hasidim qui ont visité le Admor », « made a » est mis de côté comme s'il n'existait pas. On peut le vérifier en soumettant la même phrase débarrassée de ces deux mots  : le résultat est le même[6].

Le cas des termes techniques[modifier | modifier le code]

Dans le cas de textes techniques, l'étendue du vocabulaire dont dispose Google connait ses limites. Si nous lisons dans un article en allemand sur une espèce d'araignées la Brachypelma smithi :

« Oft richtet das Weibchen den Vorderkörper auf, um dem Männchen das Einhaken seiner Schienbeinhaken in ihre Beißklauen zu ermöglichen[7] », Google nous donne  : « Souvent, la chienne vise les Vorderkörper, pour le mâle, le Einhaken son tibia Beißklauen crochet dans leur permettre », c'est-à-dire qu'elle traduit « Weibchen » par « chienne » et, devant des mots inconnus, n'essaie pas de les analyser comme Systran le fait dans les deux cas (« Souvent, la femelle redresse le corps d'avant, pour permettre accrocher de ses crochets de jambe sembler dans ses griffes mordre au mâle ») et Promt dans un seul (« La femelle dresse souvent le corps avant pour permettre le fait d'accrocher ses crochets de tibia dans ses Beißklauen au mâle »).

Les progrès de Google translate[modifier | modifier le code]

Le système du moteur de traduction automatique connait des progrès. Au 26 octobre 2007, la phrase  : « Preußen (lat.: Borussia, Prussia oder Prutenia; poln. Prusy; russ.: Prussija) war ursprünglich das Gebiet des baltischen Volksstamms der Pruzzen, später eines der Länder des Deutschen Ordens und seit dem 16. Jahrhundert ein Herzogtum der Hohenzollern unter polnisch-litauischer Lehenshoheit, das seit 1618 in Personalunion mit der Mark Brandenburg verbunden war[8] » était traduite par « Prusse (en latin: Borussia, Prussia ou Prutenia; Polonais ancienne; Russe: Prussija) était à l'origine le territoire du pays baltes Chinoise de l'exilé, plus tard, l'un des pays de l'ordre et les Allemands depuis le 16 Un siècle, le duché de Hohenzollern sous polnisch-litauischer fief de la souveraineté, qui, depuis 1618 en union personnelle avec le Mark Brandenburg connecté » mais la traduction était devenue au début de 2008  : « Prusse (en latin: Borussia, Prussia ou Prutenia; polonais Prusy; russe: Prussija) était à l'origine le territoire du pays baltes Volksstamms la Pruzzen, plus tard, l'un des pays de l'ordre et les Allemands depuis le 16 Un siècle de la Duché de Hohenzollern sous polnisch-litauischer fief de la souveraineté, qui, depuis 1618 en union personnelle avec le Mark Brandebourg était associé », plus proche de la réalité. Le 13 juillet 2009  : « La Prusse (en latin: Borussia, Prussia ou Prutenia; poln. Prusy; russe: Prussija) était à l'origine le territoire du peuple baltes Pruzzen de la racine, plus tard, l'un des pays de l'Ordre teutonique et depuis le 16 Siècle, un duché des Hohenzollern polono-lituanien de fief de souveraineté, qui, depuis 1618 en union personnelle avec la Marche de Brandebourg a été connecté ». Encore un peu plus étoffé, même si le texte initial est encore perfectible.

Lorsque le cas est simple, les traductions fautives peuvent être corrigées avec le temps. C'est ainsi qu'au 13 juillet 2009 les phrases  : « Looking for a new home? », « Looking for a husband? » et « I had a very intelligent ape » sont rendues en français dans une tournure conforme.

Notes et références[modifier | modifier le code]

  1. Barbara Cassin, Directrice de recherches au CNRS, nous dit en passant dans Intraduisible et mondialisation que « L'offre multilingue tout comme l'offre de traduction, omniprésentes sur Google, pivotent effectivement toutes deux autour d'une seule et même langue, l'anglais, ou plus exactement, le globish. »
  2. Foire aux questions de Google Traduction
  3. Traduction automatique : ça marche ou non ?
  4. Au 18 mars 2010, cependant, la traduction est devenue correcte
  5. « Beaucoup de Juifs alors gagnaient leur vie en offrant hébergement et restauration aux foules hassidiques qui venaient rendre visite à l'Admor »
  6. Au 13 juillet 2009 la traduction ne s'était guère améliorée.
  7. La femelle redresse souvent le céphalothorax pour permettre au mâle de fixer les crochets de ses tibias dans ses chélicères''
  8. À l'origine la Prusse (latin: Borussia, Prussia ou Prutenia; polonais: Prusy; russe: Prussija) était un territoire habité par une population balte: les Vieux-Prussiens. Par la suite elle devint une des possessions des Chevaliers Teutoniques ; au XVIe siècle elle forma un duché vassal de l'État polono-lituanien et appartenant aux Hohenzollern, avant d'être liée en 1618 à la Marche de Brandebourg par une union personnelle.

Voir aussi[modifier | modifier le code]

Articles connexes[modifier | modifier le code]