Aller au contenu

« Équation entre mots » : différence entre les versions

Un article de Wikipédia, l'encyclopédie libre.
Contenu supprimé Contenu ajouté
ManiacParisien (discuter | contributions)
m →‎Formulation : Un exemple supplémentaire et des exemples
ManiacParisien (discuter | contributions)
+ Exemples
Ligne 8 : Ligne 8 :
Un célèbre théorème de Makanin<ref name="Mak77">{{harvsp|Makanin|1977|id=M77}}.</ref>{{,}}<ref name= "Die02">{{harvsp|Diekert|2002|p=}}.</ref> établit que ce problème est [[Décidabilité|décidable]]. En cela, les équations de mots se distinguent des équations diophantiennes pour lesquels l'existence de solutions est indécidable par le théorème de [[Iouri Matiassevitch | Matiassevitch]] résolvant le [[dixième problème de Hilbert]].
Un célèbre théorème de Makanin<ref name="Mak77">{{harvsp|Makanin|1977|id=M77}}.</ref>{{,}}<ref name= "Die02">{{harvsp|Diekert|2002|p=}}.</ref> établit que ce problème est [[Décidabilité|décidable]]. En cela, les équations de mots se distinguent des équations diophantiennes pour lesquels l'existence de solutions est indécidable par le théorème de [[Iouri Matiassevitch | Matiassevitch]] résolvant le [[dixième problème de Hilbert]].


Un problème lié est la description de toutes les solutions d'une équation donnée, sous forme paramétrée en général. La première étude systématique dans cette direction est faite par Hmelevskii<ref>{{harvsp|Hmelevskii|1976|p=}}.</ref>.
Un problème lié est la description de toutes les solutions d'une équation donnée, sous forme paramétrée en général. La première étude systématique dans cette direction est faite par Hmelevskii<ref name="Hme">{{harvsp|Hmelevskii|1976|p=}}.</ref>.


== Formulation ==
== Formulation ==
Ligne 23 : Ligne 23 :
sont toutes cycliques.
sont toutes cycliques.


Une équation est dite ''quadratique'' si toute variable apparaît au plus deux fois. Voici un exemple d’une équation quadratique en 4 variables <math>X,Y,Z, T</math> :
Une équation est dite ''quadratique'' si toute variable apparaît au plus deux fois. Voici un exemple<ref name= "Die02" /> d’une équation quadratique en 4 variables <math>X,Y,Z, T</math> :
:<math>XaTZaT=YZbXaabY</math>
:<math>XaTZaT=YZbXaabY</math>
Une solution est donnée par :
Une solution est donnée par :
Ligne 29 : Ligne 29 :
et en effet on a :
et en effet on a :
:<math>(abb)a(bab)(ba)a(bab)=abbababbaabab=(ab)(ba)b(abb)aab(ab)</math>.
:<math>(abb)a(bab)(ba)a(bab)=abbababbaabab=(ab)(ba)b(abb)aab(ab)</math>.

== Équations entre mots et équations diophantiennes ==
Les équation être mots sont liées aux [[équation diophantienne|équations diophantiennes]]. On peut coder simplement une équation entre mots en équation diophantienne, en se basant sur le fait que les matrices
:<math>\begin{pmatrix}1 & 0\\ 1 & 1\end{pmatrix}</math> et <math>\begin{pmatrix}1 & 1\\ 0 & 1\end{pmatrix}</math>
engendrent une [[monoïde]] libre, et de plus ce sont exactement les matrices d’ordre 2 du groupe spécial linéaire <math>|operatorname{SL}(2,\Z)</math> à coefficients entiers naturels.

Ainsi, l’équation
:<math>abX=Yba</math>
possède une solution si et seulement si le système suivant d’équations diophantiennes à 8 inconnues <math>X_1,\ldots,Y_4</math> a une solution en nombres entiers :
:<math>\begin{align}
\begin{pmatrix}1 & 0\\ 1 & 1\end{pmatrix}\cdot\begin{pmatrix}1 & 1\\ 0 & 1\end{pmatrix} \cdot \begin{pmatrix}X_1 & X_2\\ X_3 & X_4\end{pmatrix} &=
\begin{pmatrix}Y_1 & Y_2\\ Y_3 & Y_4\end{pmatrix} \begin{pmatrix}1 & 1\\ 0 & 1\end{pmatrix} \cdot \begin{pmatrix}1 & 0\\ 1 & 1\end{pmatrix}\\
X_1X_4-X_2X_3&=1\\
Y_1Y_4-Y_2Y_3&=1\\
X_i\ge0, Y_i\ge0&\quad(1\le i\le4)
\end{align}</math>

Mais alors que le [[dixième problème de Hilbert]], à savoir déterminer si une équation diophantienne a une solution, est indécidable, trouver une solution d’une équation entre mots est décidable par le théorème de Makanin.


== Complexité ==
== Complexité ==


Le théorème de Makanin{{refm|"Mak77"|"Die02"}} dit que savoir si une équation a une solution est un problème décidable. La complexité de l'algorithme de décision a fait l'objet de nombreuses recherches<ref name="Die15">{{harvsp|Diekert 2015|id=Die15|p=}}.</ref> ; en 1999, Plandowski<ref>{{harvsp|Plandowski|2004|p=}}.</ref> a montré que le problème est dans la [[classe de complexité]] nommée [[PSPACE]].
Le théorème de Makanin{{refm|"Mak77"|"Die02"}} dit que le problème de déterminer si une équation a une solution décidable. La complexité de l'algorithme de décision a fait l'objet de nombreuses recherches<ref name="Die15">{{harvsp|Diekert 2015|id=Die15|p=}}.</ref> ; en 1999, Plandowski<ref>{{harvsp|Plandowski|2004|p=}}.</ref> a montré que le problème est dans la [[classe de complexité]] nommée [[PSPACE]].


Une nouvelle approche du problème est présentée par Artur Jeż en 2013<ref>{{harvsp|Jeż|2013|p=}}.</ref>. Il utilise une méthode de modification locale de variables qui consiste d'une part à remplacer une variable <math>X</math> par <math>aX</math> ou <math>Xa</math> selon le cas, et d'autre part à remplacer une paire de lettres apparaissant dans l'équation par une nouvelle lettre. Avec cette technique, il obtient un algorithme non déterministe en espace <math>O(n \log n)</math> et en temps polynomial en <math>N</math> et <math>n</math>, où <math>n</math> est la longueur de l'équation et <math>N</math> est la taille de la solution la plus courte de l'équation. Cette taille <math>N</math> est elle-même [[Fonction exponentielle double|doublement exponentielle]] en <math>n</math>.
Une nouvelle approche du problème est présentée par Artur Jeż en 2013<ref>{{harvsp|Jeż|2013|p=}}.</ref>. Il utilise une méthode de modification locale de variables qui consiste d'une part à remplacer une variable <math>X</math> par <math>aX</math> ou <math>Xa</math> selon le cas, et d'autre part à remplacer une paire de lettres apparaissant dans l'équation par une nouvelle lettre. Avec cette technique, il obtient un algorithme non déterministe en espace <math>O(n \log n)</math> et en temps polynomial en <math>N</math> et <math>n</math>, où <math>n</math> est la longueur de l'équation et <math>N</math> est la taille de la solution la plus courte de l'équation. Cette taille <math>N</math> est elle-même [[Fonction exponentielle double|doublement exponentielle]] en <math>n</math>.

== Exemples d'équations sans constantes ==
Dans ces exemples, on ne considère que des solutions composées de mots non vides.
Les équations les plus simples et sans constantes ont souvent des solutions assez facile à décrire.
=== Équations en deux variables ===
Pour deux variables, on a le résultat général :
:''Les solutions d'une équation sans constantes en deux variables sont toutes cycliques''
On peut être plus précis : Pour une équation sans constantes
:<math>U=V</math>
où <math>U</math> contient <math>n</math> occurrences de <math>X</math> et <math>m</math> occurrences de <math>Y</math> et où <math>V</math> contient <math>p</math> occurrences de <math>X</math> et <math>q</math> occurrences de <math>Y</math>, les solutions sont toutes de la forme <math>X=t^i, Y=t^j</math>, pour un mot <math>t</math> et des entiers <math>i, j</math> avec <math>ni+mj=pi+qj</math>.
=== Équations en trois variables ===
Le cas des équations en trois variables est plus complexe. Un premier exemple est l'équation
:<math>XZ=ZY</math>
Les solutions de cette équation sont de la forme <math>X=pq, Y=qp Z=(pq)^np</math> pour des mots <math>p, q</math> et un entier <math>n\ge 0</math>. Les mots solutions pour <math>X</math> et <math>Y</math> sont donc des [[mot (mathématiques) | mots conjugués]].

Les solutions de l'équation
:<math>XYZ=ZYX</math>
sont de la forme
<math>X=(pq)^ip, Y=(q(pq)^j, Z=(pq)^kp</math>.

Les solutions de l'équatio
<math>XYZ=ZXY</math>
sont de la forme
<math>X=(pq)^i, Y=q(pq)^j, Z=(pq)^k</math>.

Un théorème général, démontré par Hmelevskii<ref name="Hme" />, est le suivant :
:''Les solutions d’une équation sans constantes en trois variables sont finiment paramétrisables, c’est-à- dire peuvent être exprimées par une collection finie de formules contenant des mots et des paramètres numériques entiers. ''

Les expressions pour les équations ci-dessus en sont des exemples. La démonstration originale du théorème a été considérablement simplifiée depuis<ref name="Saarela">{{chapitre | auteur = Aleksi Saarela | titre chapitre = On the Complexity of Hmelevskii’s Theorem and Satisfiability of Three Unknown Equations
| titre ouvrage = Developments in Language Theory (Proceedings de DLT 2009, Stuttgart)
| auteurs ouvrage = Volker Diekert et Dirk Nowotka (éditeurs)
| passage = 443-453
| année = 2009
| doi = 10.1007/978-3-642-02737-6_36
| collection = Lecture Notes in Computer Science
| isbn = 978-3-642-02736-9
| numéro dans collection = 5583
| éditeur = Springer Verlag}}.</ref>.

La taille de la représentation est bornée par une fonction qui est exponentielle en la taille de l’équation. De plus, la taille de la plus petite solution non triviale de l’équation, si elle existe, est elle-même exponentielle, et le problème de l'existence peut être résolu en temps non déterministe exponentiel<ref name="Saarela" />.


== Notes et références ==
== Notes et références ==

Version du 21 novembre 2015 à 09:45

En mathématiques et en informatique théorique, une équation de mots ou une équation entre mots (en anglais word equation) est un couple de mots, usuellement écrit sous la forme d'une équation

.

Ici, et sont des mots composés de lettres qui sont des constantes ou des variables. Les constantes sont écrites en minuscules et les variables en majuscules. Par exemple, l'équation

contient quatre occurrences de la variable , et des constantes et . Une solution d'une équation est un ensemble de mots sans variables, un pour chaque variable, tel que la substitution des mots aux variables rend les deux composantes de l’équation identiques. Par exemple, pour (et plus généralement pour avec , les deux côtés de l'équation précédentes deviennent égaux, à (et plus généralement à ).

On considère le problème qui consiste à trouver une solution à équation de mots, ou plus généralement un ensemble d'équations de mots. Un célèbre théorème de Makanin[1],[2] établit que ce problème est décidable. En cela, les équations de mots se distinguent des équations diophantiennes pour lesquels l'existence de solutions est indécidable par le théorème de Matiassevitch résolvant le dixième problème de Hilbert.

Un problème lié est la description de toutes les solutions d'une équation donnée, sous forme paramétrée en général. La première étude systématique dans cette direction est faite par Hmelevskii[3].

Formulation

Une équation est un couple de mots sur un alphabet composé de constantes et de variables. Une solution est un morphisme de monoïde qui associe à chaque variable X un mot f(X), et qui laisse inchangé les constantes, et qui vérifie

.

Ainsi, pour l'exemple de l'équation donné dans l'introduction, le morphisme défini par est une solution. On écrit aussi parfois pour ce morphisme, la lettre choisie devant rappeler le mot « solution », ou plus simplement .

Une équation sans constante est une équation où ne figurent que des variables, comme l'équation .

Il est plus naturel d'écrire au lieu de .

Une solution d'une équation est dite cyclique (ou périodique) si tous ses mots sont puissances d'un même mot. Par exemple, les solutions de l'équation

sont toutes cycliques.

Une équation est dite quadratique si toute variable apparaît au plus deux fois. Voici un exemple[2] d’une équation quadratique en 4 variables  :

Une solution est donnée par :

et en effet on a :

.

Équations entre mots et équations diophantiennes

Les équation être mots sont liées aux équations diophantiennes. On peut coder simplement une équation entre mots en équation diophantienne, en se basant sur le fait que les matrices

et

engendrent une monoïde libre, et de plus ce sont exactement les matrices d’ordre 2 du groupe spécial linéaire à coefficients entiers naturels.

Ainsi, l’équation

possède une solution si et seulement si le système suivant d’équations diophantiennes à 8 inconnues a une solution en nombres entiers :

Mais alors que le dixième problème de Hilbert, à savoir déterminer si une équation diophantienne a une solution, est indécidable, trouver une solution d’une équation entre mots est décidable par le théorème de Makanin.

Complexité

Le théorème de Makanin[1],[2] dit que le problème de déterminer si une équation a une solution décidable. La complexité de l'algorithme de décision a fait l'objet de nombreuses recherches[4] ; en 1999, Plandowski[5] a montré que le problème est dans la classe de complexité nommée PSPACE.

Une nouvelle approche du problème est présentée par Artur Jeż en 2013[6]. Il utilise une méthode de modification locale de variables qui consiste d'une part à remplacer une variable par ou selon le cas, et d'autre part à remplacer une paire de lettres apparaissant dans l'équation par une nouvelle lettre. Avec cette technique, il obtient un algorithme non déterministe en espace et en temps polynomial en et , où est la longueur de l'équation et est la taille de la solution la plus courte de l'équation. Cette taille est elle-même doublement exponentielle en .

Exemples d'équations sans constantes

Dans ces exemples, on ne considère que des solutions composées de mots non vides. Les équations les plus simples et sans constantes ont souvent des solutions assez facile à décrire.

Équations en deux variables

Pour deux variables, on a le résultat général :

Les solutions d'une équation sans constantes en deux variables sont toutes cycliques

On peut être plus précis : Pour une équation sans constantes

contient occurrences de et occurrences de et où contient occurrences de et occurrences de , les solutions sont toutes de la forme , pour un mot et des entiers avec .

Équations en trois variables

Le cas des équations en trois variables est plus complexe. Un premier exemple est l'équation

Les solutions de cette équation sont de la forme pour des mots et un entier . Les mots solutions pour et sont donc des mots conjugués.

Les solutions de l'équation

sont de la forme .

Les solutions de l'équatio sont de la forme .

Un théorème général, démontré par Hmelevskii[3], est le suivant :

Les solutions d’une équation sans constantes en trois variables sont finiment paramétrisables, c’est-à- dire peuvent être exprimées par une collection finie de formules contenant des mots et des paramètres numériques entiers.

Les expressions pour les équations ci-dessus en sont des exemples. La démonstration originale du théorème a été considérablement simplifiée depuis[7].

La taille de la représentation est bornée par une fonction qui est exponentielle en la taille de l’équation. De plus, la taille de la plus petite solution non triviale de l’équation, si elle existe, est elle-même exponentielle, et le problème de l'existence peut être résolu en temps non déterministe exponentiel[7].

Notes et références

  1. a et b Makanin 1977.
  2. a b et c Diekert 2002.
  3. a et b Hmelevskii 1976.
  4. Diekert 2015.
  5. Plandowski 2004.
  6. Jeż 2013.
  7. a et b Aleksi Saarela, « On the Complexity of Hmelevskii’s Theorem and Satisfiability of Three Unknown Equations », dans Volker Diekert et Dirk Nowotka (éditeurs), Developments in Language Theory (Proceedings de DLT 2009, Stuttgart), Springer Verlag, coll. « Lecture Notes in Computer Science » (no 5583), (ISBN 978-3-642-02736-9, DOI 10.1007/978-3-642-02737-6_36), p. 443-453.

Bibliographie

  • Volker Diekert, « More than 1700 years of word equations », dans Conference on Algebraic Informatics, Springer, coll. « Lecture Notes in Computer Science » (no 9270), (ISBN 978-3-319-23020-7, DOI 10.1007/978-3-319-23021-4_2, arXiv 1507.03215), p. 22-28
  • Volker Diekert, chap. 12 « Makanin's Algorithm », dans M. Lothaire, Algebraic Combinatorics on Words, Cambridge University Press, coll. « Encyclopedia of Mathematics and its Applications » (no 90), , p. 387–442.
  • Ju. I. Hmelevskii, Equations in free semigroups, American Mathematical Society, Proceedings of the Steklov Institute of Mathematics 107 (1971), (ISBN 978-0-8218-3007-9, MR 0393284, zbMATH 0326.02032, présentation en ligne) — Traduit de l’original russe, paru en 1971, par G. A. Kandall.
  • Artur Jeż, « Recompression: a simple and powerful technique for word equations », dans Natacha Portier et Thomas Wilke (éditeurs), 30th International Symposium on Theoretical Aspects of Computer Science (STACS 2013), coll. « Leibniz International Proceedings in Informatics (LIPIcs) », (ISBN 978-3-939897-50-7, DOI 10.4230/LIPIcs.STACS.2013.233, lire en ligne), p. 233-244
  • G. S. Makanin, « The problem of solvability of equations in a free semigroup », Soviet Math. Dokl., vol. 18, no 2,‎ , p. 330-334 — Traduction anglaise de l’annonce du résultat. En russe : Dokl. Akad. Nauk SSSR 233 (1977), no. 2, 287–290.
  • G. S. Makanin, « The problem of solvability of equations in a free semigroup », Math. Sbornik (N.S.), vol. 103, no 2,‎ , p. 147-236, 319 (MR 0470107) — Article complet, en russe. Traduction anglaise : Math. USSR Sbornik 32 (1977)
  • (en) Youri Matiassevitch, Hilbert’s Tenth Problem, Cambridge, Mass., MIT Press, , 288 p. (ISBN 9780262132954)
  • Youri Matiassevitch, Le dixième problème de Hilbert : son indécidabilite, Paris, Masson, (ISBN 2225848351) — Traduction française
  • W. Plandowski, « Satisfiability of word equations with constants is in PSPACE. », Journal of the Association for Computing Machinery, vol. 51,‎ , p. 483–496 — Version « journal » de la communication de 1999.

Articles connexes