Générateur automatique de phrases

Un article de Wikipédia, l'encyclopédie libre.
Ceci est une version archivée de cette page, en date du 25 octobre 2019 à 06:51 et modifiée en dernier par Warp3 (discuter | contributions). Elle peut contenir des erreurs, des inexactitudes ou des contenus vandalisés non présents dans la version actuelle.

Un générateur automatique de phrases est un programme qui crée des phrases à partir d'un corpus bien défini.

Ce programme est destiné au divertissement, en créant un texte pouvant passer pour authentique, mais qui sonne souvent faux ou drôle. Quelqu'un qui utilise une telle matrice sera étonné de la cohérence du propos pourtant composé de toutes pièces par assemblage au hasard de morceaux de phrases.

En réalité, un générateur de phrases ne donne que l'illusion de créer du sens. Une analyse des isotopies du texte créé montre qu'il n'a en fait quasiment aucun sens, et que le locuteur (le générateur de phrase) génère aléatoirement un texte sur un thème donné sans jamais entrer dans le vif du sujet, par supercherie, à la manière d'un locuteur qui parle la « langue de bois ».

C'est le thème du roman de Robert Escarpit, Le Littératron (1964).

Technique

Comment se passe la production des phrases ? Il suffit de demander au programme de faire des phrases sur un thème (linguistique) précis. Le programme sélectionne le champ lexical correspondant à ce thème, puis il assemble au hasard les termes du champ lexical de façon à former des phrases.

  • Le champ lexical en question doit être assez vaste pour que les mêmes termes ne reviennent pas trop souvent, de façon à donner l'illusion d'une variété dans le propos.
  • Chaque terme du champ lexical, placé au hasard dans la phrase produite doit pouvoir faire partie de toute autre phrase produite sans qu'il y ait d'incohérence grammaticale. Certains termes sont donc exclus de la base de donnée lexicale, car ils sont, dans les phrases naturelles, placés dans un endroit précis de la phrase. On peut cependant conserver ces termes dans la base lexicale en obligeant le générateur à les placer dans une phrase ou dans un texte à l'endroit où ils sont d'habitude : le terme premièrement, par exemple, sera placé quelques phrases avant le terme deuxièmement. Le texte produit gagne ainsi en complexité donc en vraisemblance.
  • La base lexicale ne doit pas comporter trop de termes, sous peine d'un plus grand risque d'incongruité.
  • Les thèmes abordés par le générateur automatiques de phrases doivent être des thèmes où l'on croise ordinairement des termes techniques et inhabituels : par exemple, la philosophie kantienne ou la théorie de la superfluidité.

De cette façon, d'une part, les termes inconnus par le lecteur renforcent l'impression d'un discours réfléchi donc naturel, et d'autre part ils peuvent plus facilement faire partie d'un champ lexical plus serré donc présentant moins de risque d'incongruité.

Un générateur automatique de phrase est parfois très étonnant et peut servir de test ludique pour savoir si un professionnel d'un domaine précis (par exemple la philosophie) peut détecter ou non la supercherie. Mais surtout, il est un objet de réflexion pour l'étude de la sémantique et des langages artificiels.

Exemples

Un exemple de phrase produite n'ayant aucun sens mais qui, pour le non-spécialiste, peut passer pour vraisemblable :

« L'organisation rousseauiste de la continuité découle d'une représentation universelle de l'objectivisme. Le paradoxe de l'antipodisme rationnel illustre, par là même, l'idée selon laquelle l'objectivisme n'est ni plus ni moins qu'une immutabilité morale. Il est alors évident que Kierkegaard interprète l'analyse synthétique de la continuité. »

On remarquera l'outil « par là même », servant à relier d'une manière faussement savante deux idées sans aucun rapport l'une avec l'autre. Mais le lecteur essaie de construire un rapport, comme il en a l'habitude ; tous les mots de la philosophie ayant au moins entre eux un point commun, qui est d'appartenir au champ de la philosophie, le lecteur croit comprendre au moins une chose, c'est qu'il s'agit, dans ce texte, de philosophie, ou du moins de sciences humaines. Cela peut parfois suffire à la vraisemblance du propos, surtout si un contexte ou un cotexte bien choisi vient la renforcer, tel un discours censé être officiel.[réf. nécessaire]

Un exemple simple de productions de phrases
Sujet Verbe Complément d'objet direct
Mon voisin mange de la choucroute
Le président annonce des réformes
L'hirondelle ne fait pas le printemps
Le président ne fait pas de la choucroute

Jusqu'où peut-on aller sur cette voie ?

À partir du même principe de construction et d'assemblage, mais en y ajoutant quelques règles d'accord et de conjugaison, on peut rapidement augmenter la combinatoire des phrases possibles, notamment si le « dictionnaire » est lui aussi étendu assez loin.

Notes et références

Articles connexes