Utilisateur:Vers75/Brouillon1

Une page de Wikipédia, l'encyclopédie libre.

En combinatoire, et particulièrement en combinatoire des mots un mot fermé est un mot qui commence et fini par un mot sans contenir d'autres occurrences de . Un mot de fermé est aussi appelé un mot de retour complet.

Ces mots permettent de séparer deux occurrences consécutives d'un facteur dans un mot infini, et ainsi de découper des mots infinis en un produit de facteurs finis, et leur nombre et leurs occurrences permettent de caractériser des familles de mots infinis comme les mots sturmiens.

Définition et exemples[modifier | modifier le code]

Un mot est fermé s'il est constitué d'au plus une lettre, ou s'il possède un bord (un préfixe et suffixe tous deux non vides) qui apparaît exactement deux fois dans [1],[2] , formellement s'il appartient à l'ensemble , pour un mot et où est l'alphabet. Les premiers mots fermés sur un alphabet binaire sont

.

Le plus long bord d'un mot fermé est appelé sa frontière. Par exemple, le mot est fermé, sa frontière est le mot . Un mot est ouvert s'il n'est pas fermé. Le mot est ouvert, car il est sans bord. Le mot aussi est ouvert : sa frontière est , mais elle apparaît trois fois dans ce mot.

Un mot est un mot de retour complet pour un mot s'il commence par , se termine par et ne contient pas en facteur interne, formellement s'il appartient à l'ensemble , où est l'alphabet. Ainsi, est un mot de retour complet pour un mot si est fermé et sa frontière est . Un mot réduit à une lettre est un mot de retour complet. Un mot de retour (sans la spécification « complet ») pour un mot est un mot tel que est un mot de retour complet pour . Par exemple, est un mot de retour pour puisque est un mot de retour complet. Un mot de retour pour est donc en préfixe ou est un préfixe de .

Soit un mot infini et soit un préfixe de . On considère l'ensemble des débuts d'occurrence de dans . Si sont deux éléments consécutifs de , alors le facteur de qui commence en position et se termine en position est un mot de retour.

Exemple 1 : mot de Champernowne

Soit le mot de Champernowne binaire formé de la concaténation des développements binaires des entiers naturels. Les débuts d'occurrences du facteur sont en position , et le mot de Champernowne est le produit des mots de retour commençant en ces positions, soit . Comme le mot est récurrent (tout facteur du mot apparaît une infinité de fois dans le mot), cette factorisation du mot de Champernowne en un produit infini de facteurs fini est possible.

Exemple 2 : Mot de Fibonacci

Le mot de Fibonacci est uniformément récurrent. Par exemple, les occurrences du chiffre dans ce mot infini sont les éléments de la suite A001950 de l'OEIS, soit 1, 4, 6, 9, 12, 14, 17,... en commençant la numérotation à 0. La distance entre deux consécutifs est donc au plus 3.

Le préfixe 010 apparaît aux positions 0, 3, 5, 8,..., et le mot se factorise en . Les mots de retour pour dans le mot de Fibonacci sont au nombre de deux : ce sont et .

Les mots de retour pour un préfixe d'un mot infini sont en nombre fini seulement si ce préfixe apparaît à distance bornée, ce qui est le cas lorsque le mot infini est uniformément récurrent. Les mots de retour sont des mots finis seulement si ce préfixe apparaît une infinité de fois, ce qui est le cas lorsque le mot est récurrent.

Mots de retour des mots sturmiens[modifier | modifier le code]

Les mots sturmiens sont caractérisés comme suit par leurs mots de retour[3] :

  • Dans tout mot sturmien, tout préfixe possède exactement deux mots de retour. Il est équivalent de dire que la distance entre deux occurrences consécutives d'un préfixe d'un mot sturmien prend exactement deux valeurs.
  • Réciproquement, si tout préfixe d'un mot infini possède exactement deux mots de retour, alors ce mot est sturmien.

On peut aussi voir cette propriété comme suit : un mot sturmien s'écrit comme un produit infini de deux facteurs fini. En renommant ces facteurs, le produit de ces symboles est un mot infini qui est à nouveau sturmien, sur ce nouvel alphabet.

On peut caractériser les mots points fixes de morphismes par leurs mots de retour[4].

Complexité ouverte et fermée[modifier | modifier le code]

La complexité fermée d'un mot (fini ou infini) est la fonction qui, à chaque entier , associe le nombre de facteurs fermés de longueur dans . De même, la complexité ouverte associe à chaque entier , associe le nombre de facteurs ouverts de longueur dans .

Par exemple, le mot a deux facteurs fermés de longueur 2, à savoir et , et donc pour ce mot. Aucun de ses facteurs de longueur 3 n'est fermé, donc . Tout facteur est soit ouvert soit fermé, donc on a

est le nombre de facteurs de longueur . On a le résultat suivant[5] :

Théorème (Parshina, Postic) — Pour un mot infini , les trois conditions sont équivalentes :

  1. est apériodique
  2. .

Chacune des conditions 2 ou 3 implique que le mot est apériodique, car un mot périodique n'a qu'un nombre fini de facteurs (et donc de facteurs fermés ou ouverts) de chaque longueur.

La table des plus long facteurs fermés[modifier | modifier le code]

Le table des plus long facteurs fermés (the longest closed factor array) d'un mot de longueur est le vecteur tel que, pour , est la longueur du plus long facteur fermé de commençant en position .

Par exemple, pour , on a .

La table des plus long facteurs fermés d'un mot de longueur peut être calculée en tembs [6].

Graphe de Rauzy[modifier | modifier le code]

En combinatoire, et particulièrement en combinatoire des mots, le graphe de Rauzy est un graphe qui décrit l'évolution du cheminement dans un mot fini ou infoni. Il a été introduit par Gérard Rauzy. le graphe de Rauzy d'ordre d'un mot est le graphe orienté dont les sommets sont les facteurs de longueur n du mot et dont les arcs sont étiquetés par les facteurs de longueur  ; il y a un arc étiqueté du sommet vers le sommet si est préfixe et est suffixe de . En d'autres termes, le mot s'écrit pour deux lettres et . Le graphe de de Bruijn est le graphe de Rauzy particulier correspondant à un mot de de Bruijn.

Notes et références[modifier | modifier le code]

Bibliographie[modifier | modifier le code]

  • Golnaz Badkobeh, Alessandro De Luca, Gabriele Fici et Simon J. Puglisi, « Maximal Closed Substrings », Lecture Notes in Computer Science, Springer « String Processing and Information Retrieval (SPIRE) »,‎ , p. 16–23 (ISBN 978-3-031-20643-6, DOI 10.1007/978-3-031-20643-6_2, lire en ligne, consulté le )
  • Hideo Bannai, Shunsuke Inenaga, Tomasz Kociumaka, Arnaud Lefebvre, Jakub Radoszewski, Wojciech Rytter, Shiho Sugimoto et Tomasz Walen, « Efficient Algorithms for Longest Closed Factor Array », Lecture Notes in Computer Science, Springer, vol. 9309 « String Processing and Information Retrieval »,‎ , p. 95–102 (ISBN 978-3-319-23826-5, DOI 10.1007/978-3-319-23826-5_10, lire en ligne, consulté le )
  • Olga Parshina et Svetlana Puzynina, « Finite and infinite closed-rich words », Theoretical Computer Science, vol. 984,‎ , article no 114315, 12 p. (DOI 10.1016/j.tcs.2023.114315, arXiv 2111.00863)
  • Fabien Durand, « A characterization of substitutive sequences using return words », Discrete Math., vol. 179,‎ , p. 89-101.
  • Gabriele Fici, « Open and closed words », Bulletin of the European Association for Theoretical Computer Science, no 123,‎ , p. 140-149 (lire en ligne, consulté le ).
  • Olga Parshina et Mickaël Postic, « Open and closed complexity of infinite words », submitted,‎ (arXiv 2005.06254).