Théorème de Cobham

Un article de Wikipédia, l'encyclopédie libre.

Le théorème de Cobham est un théorème de combinatoire des mots qui a des connexions importantes avec la théorie des nombres, et notamment des nombres transcendants, et avec la théorie des automates. Le théorème stipule que si les écritures, en deux bases multiplicativement indépendantes, d'un ensemble d'entiers naturels S sont des langages rationnels, alors l'ensemble S est une union finie de progressions arithmétiques. Le théorème a été prouvé par Alan Cobham en 1969. Depuis, il a donné lieu à de nombreuses extensions et généralisations[1].

Définitions[modifier | modifier le code]

Soit un entier. L'écriture en base d'un entier naturel est la suite de chiffres tels que

avec et . La suite est souvent noté ou plus simplement .

Un ensemble d'entiers naturels S est reconnaissable en base ou plus simplement -reconnaissable si l'ensemble des écritures en base b de ses éléments est un langage reconnu par un automate fini, sur l'alphabet .

Deux entiers positifs et sont multiplicativement indépendants s'il n'existe pas d'entiers non nuls et tels que . Par exemple, 2 et 3 sont multiplicativement indépendants, alors que 8 et 16 ne le sont pas puisque . Deux entiers sont multiplicativement dépendants si et seulement s'ils sont puissances d'un même troisième entier.

Énoncés[modifier | modifier le code]

Énoncé original[modifier | modifier le code]

Plusieurs énoncés équivalents du théorème ont été donnés. La version originale de Cobham est la suivante :

Théorème (Cobham 1969) — Soit S un ensemble d'entiers naturels, et soient et deux entiers positifs multiplicativement indépendants. Alors S est reconnaissable par automate fini en base et en base si et seulement si S est ultimement périodique.

Une autre façon d'énoncer le théorème le relie aux suites automatiques. Cobham lui-même les appelle « uniform tag sequences »[2]. Il se trouve sous la forme suivante dans le livre d'Allouche et Shallit[3] :

Théorème — Soient et deux entiers multiplicativement indépendants. Une suite est à la fois -automatique et -automatique seulement si elle est -automatique[4].

On peut en effet montrer que la suite caractéristique d'un ensemble entiers naturels S reconnaissable par automate fini en base k est une suite k-automatique et que réciproquement, pour toute suite k-automatique et tout entier , l'ensemble des entiers tels que est reconnaissable en base .

Formulation en logique[modifier | modifier le code]

Le théorème de Cobham peut se formuler dans une logique du premier ordre, en utilisant un théorème démontré par Büchi en 1960. Cette formulation logique a donné lieu à des extensions et généralisations. L'expression logique fait appel à la théorie[5]

des entiers naturels équipés de l'addition et de plus de la fonction définie par V_r(0)=1 et pour un entier positif , prend la valeur si est la plus haute puissance de qui divise . Par exemple, , et . Un ensemble

Un ensemble d’entiers est définissable en logique du premier ordre dans s’il peut être décrit par un formule du premier ordre avec égalité, addition et .

Exemples :

  • L’ensemble des nombres impairs est définissable (sans ) par la formule
  • L’ensemble des puissances de 2 est définissable par la formule toute simple .

Théorème de Cobham reformulé — Soit S un ensemble d'entiers naturels, et soient et deux entiers positifs multiplicativement indépendants. Alors S définissable au premier ordre dans et dans si et seulement si S est ultimement périodique.

On peut pousser plus loin l’analogie avec la logique en notant que S est définissable au premier ordre dans l’arithmétique de Presburger si et seulement s’il est ultimement périodique. Ainsi, un ensemble S est définissable dans les logiques et si et seulement s'il est définissable dans l'arithmétique de Presburger.

Généralisations[modifier | modifier le code]

Approche par morphisme[modifier | modifier le code]

Une suite automatique est un mot morphique particulier, dont le morphisme générateur est uniforme. Un ensemble d'entiers est donc k-reconnaissable si et seulement si sa suite caractéristique est engendrée par un morphisme uniforme suivie d'un morphisme de codage. Par exemple, la suite caractéristique des puissances de 2 est produite par le morphisme 2-uniforme sur l'alphabet défini par

qui engendre le mot infini

,

suivi du morphisme de codage (c'est-à-dire lettre à lettre) qui envoie sur et laisse et inchangés, ce qui donne .

La notion a été étendue comme suit : Un mot morphique est -substitutif pour un certain nombre s'il s'écrit sous la forme

où le morphisme , prolongeable en , a les propriétés suivantes :

  • toutes les lettres de ont des occurrences dans , et
  • est la valeur propre dominante de la matrice du morphisme .

Un ensemble S d'entiers naturels est -reconnaissable si sa suite caractéristique est -substitutive.

Une dernière définition : Un nombre de Perron est un nombre algébrique tel que tous ses conjugués appartiennent au disque . Ce sont exactement les valeurs propres dominantes des matrices entières positives primitives.

On a alors l'énoncé suivant[6] :

Théorème de Cobham pour les substitutions — Soient α et β deux nombres de Perron multiplicativement indépendants. Alors une suite x à élément dans un ensemble fini et à la fois α-substitutive et β-substitutive si et seulement si x est ultimement périodique.

Approche logique[modifier | modifier le code]

L'équivalence logique a permis de considérer des situations plus générales : les suites automatiques sur les entiers naturels ou ensembles reconnaissables ont été étendues aux entiers relatifs , aux produits cartésiens , aux nombres réels et aux produits cartésiens [5].

Extension à

On code les entiers base en faisant précéder l’écriture d'un entier positif par le chiffre 0, et d’un entier négatif par suivi du complément à . Par exemple, en base 2, l’entier -6=-8+2 s’écrit 1010. Les puissances de 2 s’écrivent 010^* , et leurs opposés 110^* (car 11000 = -16+8=-8)

Extension à

Une partie de est reconnaissable en base si les éléments de , écrits comme vecteurs à composantes sont reconnaissables sur l’alphabet produit.

Par exemple

En base 2, on a et ; le vecteur est écrit comme .

Théorème de Semenov (1997) — Soient et deux entiers positifs multiplicativement indépendants. Une partie de est -reconnaissable et -reconnaissable si et seulement si est une union finie de parties semi-linéaires.

Une preuve élégante de ce théorème est de Muchnik en 2003, par récurrence sur .

D'autres extensions ont été données aux nombres réels et aux vecteurs de nombres réels[5].

Démonstrations[modifier | modifier le code]

Samuel Eilenberg énonce le théorème sans preuve dans son livre[7] ; il dit « The proof is correct, long, and hard. It is a challenge to find a more reasonable proof of this fine theorem ». Georges Hansel a proposé une preuve plus simple, publiée dans des actes difficilement accessibles d'un colloque[8]. La preuve de Dominique Perrin[9] et celle du livre d'Allouche et Shallit[3] contiennent la même erreur dans un des lemmes, mentionnée dans la liste d'erratas du livre[10]. Cette erreur a été relevée dans une note de Tomi Kärki[11], et corrigée par Michel Rigo et Laurent Waxweiler[12]. Cette partie de la démonstration a fait l'objet d'une rédaction récente[13].

En janvier 2018, Thijmen J. P. Krebs annonce, sur Arxiv, une preuve simplifiée du théorème original, basée sur un critère d'aproximation de Dirichlet plutôt que de Kronecker ; l’article est paru en 2021[14]. La méthode employée est raffinée et utilisée par Mol, Rampersad, Shallit et Stipulanti[15].

Notes et références[modifier | modifier le code]

  1. Une synthèse des résultats récents est présentée dans Durand et Rigo 2010 et dans Adamczewski et Bell 2010.
  2. Cobham 1972.
  3. a et b Allouche et Shallit 2003, p. 345-350.
  4. Une suite « 1-automatique » est une suite ultimement périodique.
  5. a b et c Bruyère 2010.
  6. Durand 2011.
  7. (en) Samuel Eilenberg, Automata, Languages and Machines, Vol. A, New York, Academic Press, coll. « Pure and Applied Mathematics » (no 58), , xvi+451 (ISBN 978-0-12-234001-7).
  8. Georges Hansel, « À propos d’un théorème de Cobham », dans D. Perrin (éditeur), Actes de la Fête des mots, Rouen, Greco de programmation, CNRS, , p. 55–59.
  9. Dominique Perrin, « Finite Automata », dans Jan van Leeuwen (éditeur), Handbook of Theoretical Computer Science, vol. B : : Formal Models and Semantics, Elsevier, (ISBN 978-0444880741), p. 1-57.
  10. Errata for Automatic Sequences: Theory, Applications, Generalizations
  11. Tomi Kärki, « A Note on the Proof of Cobham’s Theorem », Rapport Technique n° 713, Université de Turku, (consulté le ).
  12. Michel Rigo et Laurent Waxweiler, « A Note on Syndeticity, Recognizable Sets and Cobham's Theorem. », Bulletin of the EATCS, vol. 88,‎ , p. 169-173 (MR 2222340, zbMATH 1169.68490, arXiv 0907.0624, lire en ligne).
  13. Paul Fermé, Willy Quach et Yassine Hamoudi, « Le théorème de Cobham », (consulté le ).
  14. Krebs 2021.
  15. Mol et al. 2019.

Bibliographie[modifier | modifier le code]

  • [1969] (en) Alan Cobham, « On the base-dependence of sets of numbers recognizable by finite automata », Mathematical Systems Theory, vol. 3, no 2,‎ , p. 186–192 (DOI 10.1007/BF01746527, MR 0250789).
  • [1972] (en) Alan Cobham, « Uniform tag sequences », Mathematical Systems Theory, vol. 6, nos 1-2,‎ , p. 164–192 (DOI 10.1007/BF01706087, MR 0457011).
  • Véronique Bruyère, « Around Cobham's theorem and some of its extensions », Dynamical Aspects of Automata and Semigroup Theories, Satellite Workshop of Highlights of AutoMathA, (consulté le )
  • (ru) Alexei Lvovich Semenov, « Predicates regular in two number systems are Presburger », Sib. Mat. Zh., vol. 18,‎ , p. 403-418 (MR 0450050, zbMATH 0369.02023).
  • Andrej A. Muchnik, « The definable criterion for definability in Presburger arithmetic and its applications », Theoret. Comput. Sci., vol. 290, no 3,‎ , p. 1433–1444 (MR 1937730, zbMATH 1052.68079).
  • Fabien Durand et Michel Rigo, « On Cobham’s Theorem », dans J.-É. Pin (éditeur), Automata: from Mathematics to Applications, European Mathematical Society, 2010 (en préparation) (lire en ligne).
  • Boris Adamczewski et Jason Bell, « Automata in number theory », dans J.-É. Pin (éditeur), Automata: from Mathematics to Applications, European Mathematical Society, 2010 (en préparation).