Théorie linguistique du vivant

Un article de Wikipédia, l'encyclopédie libre.

La théorie linguistique du vivant est une théorie proposée par Cédric Gaucherel, chercheur français à INRAE en écologie théorique [1].

En s'inspirant des langages humains, il fait l'hypothèse que le domaine du vivant possède de nombreux langages. Cette hypothèse incite à identifier puis à décoder ces langages dans le but de comprendre et, potentiellement, de gérer ces systèmes vivants (par exemple les cellules ou les écosystèmes.

Cédric Gaucherel suggère également que ces différents langages puissent être liés dans le temps par des mécanismes qui leur sont propres[1].

Langages humains et systèmes d'écriture[modifier | modifier le code]

Décomposition topologique des lettres “b” et “d”. Ces deux lettres peuvent être divisées en une barre (point rouge) et une demi-boucle (point bleu). Seul l’ordre d’assemblage de ces deux parties permet de différencier ces deux lettres. Le sens de lecture des lettres est spécifié par les flèches en dessous de la figure.

Les nombreux langages humains s'appuient sur l'utilisation de symboles reliés à une signification, la sémiosis. Depuis les origines de l'écriture, les nombres et les lettres en sont des exemples archétypaux.

La première hypothèse émise pour la compréhension des langages de différents systèmes vivants affirme le rôle central de la topologie de tout symbole, puis de la structure du langage qui les manipule[2]. Cette topologie est continuellement changeante et la théorie linguistique du vivant a pour but de formaliser les mécanismes de tels changements[3].

Concept d'information, en biologie[modifier | modifier le code]

Dans cette théorie, l'information peut être redéfinie comme toute structure qui émerge du bruit (aléatoire) ambiant. Une telle information est déjà présente dès les origines de l'univers, au moment du rayonnement fossile, ensuite partiellement figée en une structure au cours de la phase d'inflation. Une telle information peut aussi se retrouver dans le domaine du vivant, depuis la molécule d'ADN et sa structure complexe une fois repliée, en passant par un organisme et les interactions entre ses organes, et jusqu'à la structure des écosystèmes (leurs réseaux trophiques entre autres) et des paysages.

Cette figure a été composée par Noam Chomsky dans son livre Syntactic Structures (1957) pour servir d’exemple à une phrase qui est grammaticalement correcte, mais sémantiquement incorrecte. Cet exemple souligne la différence entre la syntaxe et la sémantique. Les adjectifs (A), noms (N), verbes (V) et adverbes (Adv) se combinent successivement en un syntagme nominal (NP) et un syntagme verbal (VP) pour  former la phrase (S). La structure de la phrase est ainsi visible grâce à l’arborescence (en haut), et peut également être formalisée sous une forme linéaire emboitant les syntagmes (en bas).

L'ubiquité des langages et leurs grammaires[modifier | modifier le code]

La manipulation de cette information nécessite des langages s'appuyant sur des syntaxes (la grammaire) et des sémantiques (les significations des vocabulaires et de leurs assemblages[4]). En linguistique, ces deux propriétés permettent de construire des phrases compréhensibles entre locuteurs.

En étendant la définition des langages à celle des informaticiens, on peut par exemple trouver des langages au sein de la cellule (ce langage nommé ambigénétique par Cédric Gaucherel, combine les mécanismes génétiques et épigénétiques), comme au sein des écosystèmes (le « langage écosystémique »)[2].

« Faire appel à la chimie ? La méthode des essais et des erreurs ? Vous ne comprenez donc pas qu'on peut concevoir une multitude de façons dont les protéines se combinent entre elles pour coder l'information ? Elles sont plus nombreuses que le total des atomes de votre planète. La seule façon de comprendre les lois qui régissent la réalité est d'empiler l'un sur l'autre le plus grand nombre possible de langages issus de mondes différents. C'est par là seulement que se trouve l'unique accès à la Cette-réalité, et par là seulement qu'on en sort. »

— I. Watson, L'Enchâssement, 1973.

La chronologie des langages et l'origine de la vie[modifier | modifier le code]

Illustration d’un texte écrit en boustrophédon, dont la lecture se fait de gauche à droite puis de droite à gauche (i.e., le sens de lecture change d’une ligne à l’autre). Cette inscription du Ve siècle av. J.-C. écrite en grec ancien, le code de Gortyne, vient de Crète.

Les études des langages et symboles humains ont montré qu'ils « évoluent » au cours du temps, selon différentes modalités. Cette évolution n'est pas soumise à la sélection naturelle comme en biologie, mais à un autre type d'« évolution »[5].

Les langages et leurs symboles ont des propriétés variées : ils peuvent être arbitraires ou non, référentiels ou non, compositionnels ou non (voir par exemple : les signes linguistiques).

En étendant l'analyse des propriétés linguistiques à l'ensemble du vivant et des systèmes « presque vivants » (semi-living systems) tels que les écosystèmes ou les virus, on observe une « complexification » des langages qui doit encore être démontrée et formalisée. Cette complexification, qui n'est pas systématique ni inéluctable, est la seconde hypothèse de la Théorie linguistique du vivant. Par exemple, il s'agit de comprendre si les langages actuels des systèmes biologiques ont émergé de langages plus simples, ceux présents dès les systèmes prébiotiques à l'origine de la vie.

Justifications philosophiques[modifier | modifier le code]

Si l'on admet que l'information est basée sur la topologie des réseaux d'interactions du monde vivant, on doit encore en comprendre les règles grammaticales qui modifient continuellement cette topologie. C'est l'objectif de modèles rigoureux comme les modèles à événements discrets, qui encodent et décodent (comme un système de réécriture informatique) les graphes représentant ces réseaux d'interaction. C'est par exemple le cas des réseaux écosystémiques que Cédric Gaucherel et son équipe formalisent grâce notamment à des réseaux de Petri[2].

Ainsi, l'historicité des systèmes vivants dont les structures changent continuellement, peut en théorie être reconstruite et comprise. La troisième et dernière hypothèse de travail de la théorie linguistique du vivant stipule que la vie peut être (re)définie comme des systèmes maintenus par des langages possédant certaines propriétés spécifiques (à identifier)[1].

Le concept de langage qui, selon les linguistes et philosophes[6], fait un lien triptyque entre les choses (monde réel), les mots (symboles) et les idées (des humains), est décliné dans cette théorie en une version tronquée liant uniquement les choses et les mots.

« pour générer langages à états non-finis comme l'Anglais, nous avons fondamentalement besoin de méthodes différentes, et d'un concept plus général de « niveau linguistique » »

— N. Chomsky, Syntactic Structures, 1957.

Notes et références[modifier | modifier le code]

  1. a b et c (en) Cédric Gaucherel, Languages of nature : when nature writes to itself., LULU COM, (ISBN 0-244-21498-0, lire en ligne), p. 65
  2. a b et c Cédric Gaucherel et Franck Pommereau, « Using discrete systems to exhaustively characterize the dynamics of an integrated ecosystem », Methods in Ecology and Evolution, vol. 10, no 9,‎ , p. 1615–1627 (ISSN 2041-210X et 2041-210X, DOI 10.1111/2041-210x.13242, lire en ligne, consulté le )
  3. Jean-Louis Giavitto et Olivier Michel, « Topologie combinatoire et programmation », Rencontre toulousaine graphes et topologi,‎
  4. Rémi Tournebize et Cédric Gaucherel, « Language: A fresh concept to integrate syntactic and semantic information in life sciences », Biosystems, vol. 160,‎ , p. 1–9 (ISSN 0303-2647, DOI 10.1016/j.biosystems.2017.07.005, lire en ligne, consulté le )
  5. (en) Szathmáry Eörs, Smith, John Maynard, Les Origines de la vie : de la naissance de la vie à l'origine du langage, Dunod. Paris, (ISBN 2-10-004860-0)
  6. Pascal Ludwig, Le langage, Flammarion, , 255 p. (ISBN 978-2-08-126539-4)