Grand ordinal dénombrable

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Article principal : Nombre ordinal.

En mathématiques, et plus particulièrement en théorie des ensembles, il existe de nombreuses méthodes de description des ordinaux dénombrables. Les plus petits (jusqu'à \varepsilon_0) peuvent être exprimés (de façon utile et non circulaire) à l'aide de leur forme normale de Cantor. Au-delà, on parle de grands ordinaux dénombrables ; de nombreux grands ordinaux (le plus souvent en rapport avec la théorie de la démonstration) possèdent des notations ordinales calculables. Cependant, il n'est pas possible en général de décider si une notation ordinale potentielle en est effectivement une, pour des raisons analogues à celles rendant insoluble le problème de l'arrêt.

Comme il ne peut exister qu'un nombre dénombrable de notations, l'ensemble des ordinaux qui en admettent une se termine bien avant le premier ordinal non dénombrable ω1 ; la borne supérieure de cet ensemble s'appelle l'ordinal ω1 de Church–Kleene, noté ω1CK (cet ordinal est dénombrable, et ne doit pas être confondu avec ω1). Les ordinaux inférieurs à ω1CK sont les ordinaux récursifs. Il est possible de définir des ordinaux supérieurs, mais ils ne possèderont pas de notations.

L'étude des ordinaux dénombrables non récursifs est délicate, la difficulté principale venant de ce qu'on ne sait pas, en général, comparer deux grands ordinaux définis par des méthodes différentes, et parfois même, qu'on ne sait pas démontrer qu'un ordre donné est un bon ordre.

Généralités sur les ordinaux récursifs[modifier | modifier le code]

Les ordinaux récursifs (ou calculables) sont les ordinaux dénombrables qu'on peut représenter par une fonction calculable. On peut en donner plusieurs définitions rigoureuses équivalentes ; la plus simple consiste à dire qu'un ordinal est récursif s'il est le type d'ordre d'un bon ordre calculable sur les entiers, c'est-à-dire qu'il existe une machine de Turing qui, ayant pour entrée deux entiers, décide lequel est le plus petit pour cet ordre.

Notations ordinales[modifier | modifier le code]

Une autre définition des ordinaux récursifs utilise les notations ordinales de Kleene. Schématiquement, une notation ordinale est soit le nom zéro (représentant l'ordinal 0), soit le successeur d'une notation ordinale (représentant le successeur de l'ordinal que cette notation décrit), soit une fonction calculable (ou la machine de Turing correspondante) qui produit en sortie une suite croissante de notations ordinales, l'ordinal décrit par cette suite étant la limite des ordinaux décrits par chaque notation. On définit un ordre (partiel) sur les notations tel que le successeur de o soit plus grand que o et que la limite soit plus grande que chaque terme de la suite. Cet ordre est calculable, mais l'ensemble O des notations ordinales n'est pas récursif, car il est impossible de décider si une machine de Turing donnée produit effectivement une suite infinie de notations (c'est une variante du problème de l'arrêt). Un ordinal récursif est alors un ordinal décrit par une notation ordinale.

Tout ordinal plus petit qu'un ordinal récursif est lui-même récursif, aussi l'ensemble des ordinaux récursifs est un ordinal dénombrable, l'ordinal de Church-Kleene. Bien qu'il soit tentant de négliger les notations ordinales, et de ne parler que des ordinaux récursifs eux-mêmes, cela peut créer de graves difficultés : même le plus petit ordinal infini, ω, possède de nombreuses notations, et il n'est pas toujours possible de montrer qu'elles sont équivalentes à la plus simple d'entre elles (la limite du programme énumérant les entiers dans l'ordre usuel).

Relations avec des théories arithmétiques[modifier | modifier le code]

Il existe une importante relation entre les ordinaux récursifs et certains systèmes formels (contenant l'arithmétique, c'est-à-dire un sous-ensemble suffisant des axiomes de Peano).

En effet, certains ordinaux récursifs sont si grands que bien qu'ils correspondent à une certaine notation ordinale o, un système formel donné peut ne pas être assez puissant pour démontrer que o est effectivement une notation ordinale : le système ne permet pas la récurrence transfinie jusqu'à o.

Ainsi, les axiomes de Peano (ou, pour être plus précis, la théorie du premier ordre qui leur est associée) ne permet pas la récurrence transfinie jusqu'à ε0 : bien que l'ordinal ε0 puisse être aisément décrit dans l'arithmétique du premier ordre, les axiomes de Peano ne sont pas assez puissants pour montrer que c'est effectivement un ordinal ; en fait, la récurrence transfinie jusqu'à ε0 permet de démontrer la cohérence des axiomes de Peano (c'est le théorème de cohérence de l'arithmétique de Gentzen (en)), ce qui montre que ce raisonnement ne saurait être formalisé dans l'arithmétique du premier ordre, d'après le théorème d'incomplétude de Gödel (ce résultat est à la base des théorèmes d'indécidabilité, dus à Kirby et Paris, concernant les suites de Goodstein). On dit que ε0 mesure la force démonstrative (en) des axiomes de Peano.

On peut mesurer ainsi des systèmes bien plus puissants. Ainsi, la force démonstrative de la théorie des ensembles de Kripke-Platek est l'ordinal de Bachmann-Howard (en), et en fait, ajouter simplement aux axiomes de Peano des axiomes affirmant que tous les ordinaux inférieurs à l'ordinal de Bachmann-Howard sont effectivement bien ordonnés est suffisant pour obtenir toutes les conséquences arithmétiques de la théorie des ensembles de Kripke-Platek.

Ordinaux récursifs particuliers[modifier | modifier le code]

Définitions prédicatives et hiérarchie de Veblen[modifier | modifier le code]

Article détaillé : fonction de Veblen.

L'ordinal ε0 est le plus petit ordinal satisfaisant l'équation \omega^\alpha = \alpha ; c'est la limite de la suite 0, 1, \omega, \omega^\omega, \omega^{\omega^\omega}, etc. L'ordinal suivant satisfaisant cette équation est appelé ε1 : c'est la limite de la suite \varepsilon_0+1,    \omega^{\varepsilon_0+1}=\varepsilon_0\cdot\omega,    \omega^{\omega^{\varepsilon_0+1}}=(\varepsilon_0)^\omega,    etc.

Plus généralement, le \iota-ème ordinal tel que \omega^\alpha = \alpha est appelé \varepsilon_\iota. On pourrait définir \zeta_0 comme le plus petit ordinal tel que \varepsilon_\alpha=\alpha (c'est-à-dire la limite de la suite 0, \varepsilon_0, \varepsilon_{\varepsilon_0}, etc.), mais comme l'alphabet grec n'a pas un nombre infini de lettres, une notation plus robuste s'impose : on définit les ordinaux \varphi_\gamma(\beta) par récurrence transfinie en posant \varphi_0(\beta) = \omega^\beta et \varphi_{\gamma+1}(\beta) est alors le \beta-ème point fixe de \varphi_\gamma (c'est-à-dire le \beta-ème ordinal tel que \varphi_\gamma(\alpha)=\alpha ; ainsi, par exemple, \varphi_1(\beta) = \varepsilon_\beta), et si \delta est un ordinal limite, on appelle \varphi_\delta(\alpha) le \alpha-ème point fixe commun de tous les \varphi_\gamma pour tous les \gamma<\delta. Cette famille de fonctions est connue sous le nom de hiérarchie de Veblen ; \varphi_\gamma est appelée la \gamma-ème fonction de Veblen.

On a le bon ordre : \varphi_\alpha(\beta) < \varphi_\gamma(\delta) si et seulement si (\alpha = \gamma et \beta < \delta) ou (\alpha < \gamma et \beta < \varphi_\gamma(\delta)) ou (\alpha > \gamma et \varphi_\alpha(\beta) < \delta).

L'ordinal de Feferman–Schütte et les ordinaux supérieurs[modifier | modifier le code]

Le plus petit ordinal tel que \varphi_\alpha(0) = \alpha s'appelle l'ordinal de Feferman-Schütte, et se note généralement \Gamma_0. On peut le décrire comme l'ensemble de tous les ordinaux qui peuvent s'écrire à l'aide d'expressions finies, utilisant uniquement 0, la hiérarchie de Veblen, et l'addition. L'ordinal de Feferman-Schütte est important parce que, en un sens assez difficile à rendre précis, c'est le plus petit ordinal qui ne peut être décrit prédicativement à l'aide des ordinaux plus petits. Il mesure la force de systèmes tels que celui de la récurrence transfinie arithmétique (en). Plus généralement, Γα est le α-ème ordinal qui ne peut être obtenu à partir des ordinaux précédents et de la hiérarchie de Veblen.

Il est bien sûr possible de décrire des ordinaux au-delà de l'ordinal de Feferman-Schütte. Ainsi, on peut continuer à énumérer des points fixes par des schémas de plus en plus complexes : ceux de \alpha\mapsto\Gamma_\alpha (le premier de ceux-ci est l'ordinal d'Ackermann (en)), puis les points fixes de cette fonction-là, et ainsi de suite, puis le premier ordinal α tel que α est obtenu après α étapes de ce procédé, puis continuer à « diagonaliser » par des méthodes analogues. Ceci amène finalement à la définition des ordinaux de Veblen (en)[1].

Ordinaux imprédicatifs[modifier | modifier le code]

Pour aller bien au-delà de l'ordinal de Feferman-Schütte, et même des ordinaux de Veblen, il est nécessaire d'introduire de nouvelles méthodes. Il n'existe malheureusement encore aucune standardisation de ces méthodes : chaque auteur s'étant intéressé à cette question semble avoir inventé son propre système de notation, et il est souvent difficile d'établir une correspondance entre ces différents systèmes. La première de ces notations fut introduite par Bachmann en 1950 (d'une manière assez artificielle), et diverses extensions et variations en furent décrites par Buchholz, Takeuti (les diagrammes ordinaux), Feferman (les systèmes θ), Aczel, Bridge, Schütte et Pohlers. Cependant, la plupart de ces systèmes de notations utilisent la même idée fondamentale consistant à construire de nouveaux ordinaux dénombrables à l'aide de certains ordinaux non dénombrables. Voici l'une de ces constructions (décrite avec beaucoup plus de détails dans l'article fonction d'effondrement ordinale (en)) :

  • ψ(α) est défini comme le plus petit ordinal ne pouvant être construit à l'aide de 0, 1, ω et Ω (où Ω = ω1 est le premier ordinal non dénombrable), de l'addition, de la multiplication et de l'exponentiation, et de ψ appliqué à des ordinaux déjà construits, et inférieurs à α[2].

Le rôle de Ω est d'empêcher la fonction ψ de rester « bloquée » au plus petit ordinal σ tel que εσ = σ : de fait, ψ(α) = σ pour tous les ordinaux α tels que σ ≤ α ≤ Ω (ce n'est pas tout à fait clair au vu de la définition ci-dessus, mais, bien que ψ(σ) = σ, on ne peut utiliser σ dans le calcul de ψ(σ+1), car il n'est pas encore « construit »). Mais inclure Ω permet de dépasser ce point: ψ(Ω+1) est supérieur à σ. Dans ce contexte, la propriété essentielle de Ω est d'être plus grand que tout ordinal construit par ψ. Cette définition est imprédicative, parce qu'elle utilise l'ordinal non dénombrable Ω, ce qui, en un certain sens, revient déjà à utiliser tous les ordinaux dénombrables qu'on est en train de construire. De même, l'opérateur « plus petit point fixe » utilisé dans la hiérarchie de Veblen peut être considéré comme non prédicatif[3].

La construction précédente finit, à son tour, par rester définitivement bloquée : on ne peut dépasser l'ordinal limite de la suite \psi(\Omega), \psi(\Omega^\Omega), \psi(\Omega^{\Omega^\Omega}), etc., qui est donc \psi(\varepsilon_{\Omega+1}) ; c'est l'ordinal de Bachmann-Howard (en). Pour construire des ordinaux plus grands, il est possible, et de plusieurs manières, d'adjoindre à la définition de la fonction ψ de nouveaux ordinaux non dénombrables, ou de nouvelles méthodes de construction d'ordinaux ; certaines de ces constructions sont détaillées dans l'article fonction d'effondrement ordinale (en).

L'ordinal de Bachmann-Howard, ψ(εΩ+1), joue un rôle important, parce qu'il décrit la force démonstrative de la théorie des ensembles de Kripke-Platek. De fait, l'importance de ces grands ordinaux, et l'intérêt de les décrire précisément, vient de leur relation avec certains systèmes formels ; cependant, des systèmes aussi puissants que l'arithmétique du second ordre, sans même parler de la théorie des ensembles de Zermelo-Fraenkel, semblent hors de portée pour le moment.

Ordinaux récursifs dont on ne peut prouver la récursivité[modifier | modifier le code]

Si l'on ne réclame pas de description véritablement explicite, il est possible de définir des ordinaux récursifs encore beaucoup plus grands, en les caractérisant comme les ordinaux mesurant la force démonstrative de diverses théories puissantes ; on peut en gros voir ces ordinaux comme les plus petits que ces théories ne peuvent démontrer être bien ordonnés. En prenant des théories de plus en plus fortes, comme l'arithmétique du second ordre, la théorie des ensembles de Zermelo (en), ou ZFC augmentée d'un des axiomes de grand cardinal, on peut atteindre des ordinaux extrêmement grands. Mais, à proprement parler, il n'est pas clair qu'on ait encore affaire à des ordinaux : par construction, ceci n'est démontrable qu'à l'aide d'une théorie encore plus puissante ; dans le dernier cas mentionné, il n'est nullement évident qu'on puisse en construire une qui soit admise [4]par la majorité des mathématiciens.

Au-delà des ordinaux récursifs[modifier | modifier le code]

L'ordinal de Church-Kleene[modifier | modifier le code]

L'ensemble des ordinaux récursifs est lui-même un ordinal, le plus petit qui ne puisse être décrit de manière récursive (autrement dit, ce n'est le type d'ordre d'aucun bon ordre sur les entiers reconnaissable par machine de Turing). Cet ordinal est dénombrable ; on l'appelle l’ordinal de Church–Kleene, et on le note \omega_1^{\mathrm{CK}}. Ainsi, aucun ordinal à partir de \omega_1^{\mathrm{CK}} ne peut être réellement « décrit », mais seulement, dans le meilleur des cas, défini comme ayant telle ou telle propriété caractéristique. \omega_1^{\mathrm{CK}} étant dénombrable, il est évidemment bien plus petit que le premier ordinal non dénombrable, \omega_1. Cependant, comme la notation le suggère, il se comporte à certains égards comme \omega_1 (ainsi, par exemple, toute suite récursive croissante d'ordinaux inférieurs à \omega_1^{\mathrm{CK}} est stationnaire).

Ordinaux admissibles[modifier | modifier le code]

L'ordinal de Church-Kleene est lui aussi lié à KP, la théorie des ensembles de Kripke-Platek, mais en un sens différent : là où l'ordinal de Bachmann-Howard (décrit précédemment) était le plus petit ordinal pour lequel KP ne démontre pas la validité de la récurrence transfinie, l'ordinal de Church-Kleene est le plus petit α tel que la construction de l'univers de Gödel, L, jusqu'à l'étape α, fournit un modèle L_\alpha de KP. Les ordinaux ayant cette propriété sont dits admissibles ; ainsi \omega_1^{\mathrm{CK}} est le plus petit ordinal admissible.

Un théorème de Gerald Sacks (en) montre que les ordinaux admissibles dénombrables sont exactement ceux correspondants à la construction de l'ordinal de Church-Kleene, mais en autorisant des machines de Turing avec oracles. On note parfois \omega_\alpha^{\mathrm{CK}} le \alpha-ème ordinal qui soit admissible ou limite d'ordinaux admissibles.

Au-delà des ordinaux admissibles[modifier | modifier le code]

Un ordinal \alpha qui est à la fois admissible et limite d'ordinaux admissibles, ce qui revient à dire que \alpha est le \alpha-ème ordinal admissible[réf. souhaitée], est dit récursivement inaccessible. Il existe une théorie des grands ordinaux de ce type qui est tout à fait analogue à celle des premiers grands cardinaux. Ainsi, on peut définir des ordinaux récursivement Mahlo (voir cardinal Mahlo (en)) : ce sont les \alpha tel que tout sous-ensemble non borné de \alpha, \alpha-récursivement fermé contienne un ordinal admissible. Mais les ordinaux définis de cette manière peuvent encore parfaitement être dénombrables, et, alors que l'existence de cardinaux inaccessibles ne peut être démontrée dans ZFC, celle d'ordinaux dénombrables récursivement inaccessibles ou récursivement Mahlo est un théorème de ZFC ; en revanche, ils sont hors de portée de la théorie de Kripke-Platek.

Un ordinal admissible \alpha est dit non-projectif s'il n'y a pas d'application injective et \alpha-récursive envoyant \alpha sur un ordinal plus petit (cette définition est automatiquement vérifiée pour les cardinaux réguliers[5], mais nous nous intéressons ici essentiellement au cas des ordinaux dénombrables). La non-projectivité est une condition bien plus forte que les précédentes ; elle est équivalente à dire que l'univers de Gödel construit jusqu'à l'étape α, donne un modèle L_\alpha de KP + l'axiome de séparation pour les propositions de type \Sigma_1.

Ordinaux non-démontrables[modifier | modifier le code]

On peut imaginer des ordinaux encore plus grands, et toujours dénombrables. Ainsi, si ZFC possède un modèle transitif (en) (hypothèse un peu plus forte que la seule hypothèse de cohérence, et impliquée par l'existence d'un cardinal inaccessible), il existe un \alpha dénombrable tel que L_\alpha est un modèle de ZFC. De tels ordinaux sont « au-delà » de ZFC, au sens où ZFC ne peut (par construction) prouver leur existence.

Un pseudo bon ordre[modifier | modifier le code]

L'ensemble des notations de Kleene (en) (noté généralement \mathcal O dans ce contexte) donne une représentation (non unique) de tous les ordinaux récursifs, mais on ne peut en général décider si une notation donnée représente ou non un ordinal (ni, d'ailleurs, si deux notations représentent le même ordinal). Il est cependant possible de définir un ordre total récursif sur un sous-ensemble \mathcal S de \mathcal O, lequel admet un segment initial bien ordonné de type d'ordre \omega_1^{\mathrm{CK}}. Tous les sous-ensembles (non vides) récursivement énumérables de \mathcal S ont un plus petit élément pour cet ordre total, ce qui en fait un analogue d'un ensemble bien ordonné, et permet d'y définir des opérations ayant les mêmes propriétés que celles de l'arithmétique des ordinaux ; mais il n'est pas possible de déterminer effectivement où se termine le segment bien ordonné, et où commence la partie de \mathcal S (non récursivement énumérable) sans plus petit élément.

Notes[modifier | modifier le code]

  1. On trouvera une description constructive du petit ordinal de Veblen, sous forme d'un bon ordre explicite entre arbres finis, dans cet article de H. R. Jervell (en), et une illustration plus complète de cette correspondance entre arbres et ordinaux dans ce document dû à David Madore.
  2. Plus rigoureusement, on définit par récurrence transfinie sur α ordinal et n entier des ensembles C(\alpha), union des C(\alpha)_n pour tous les n entiers, et ψ(α) le plus petit ordinal non dans C(\alpha), en posant C(\alpha)_0 = \{0,1,\omega,\Omega\} et \scriptstyle C(\alpha)_{n+1} = C(\alpha)_n \cup \{\beta_1+\beta_2,\beta_1\beta_2,{\beta_1}^{\beta_2}: \beta_1,\beta_2\in C(\alpha)_n\} \cup \{\psi(\beta): \beta\in C(\alpha)_n \land \beta<\alpha\}.
  3. (en) Predicativity beyond Gamma 0
  4. L'acceptation ou non de nouveaux axiomes et de nouvelles théories au-delà de la théorie des ensembles usuelle est relative à des considérations de cohérences relatives ou d'incompatibilité entre théories et aussi à des intuitions personnelles ; intuitions qui ne font sens que dans le cadre de l'adhésion au réalisme mathématique qui est une position philosophique parmi d'autres mais très répandue.
  5. Voir Cardinal inaccessible#Définitions

Références[modifier | modifier le code]

La plupart des ouvrages décrivant de grands ordinaux dénombrables s'intéressent surtout à la théorie de la démonstration, et n'ont malheureusement souvent pas été réédités.

Sur les ordinaux récursifs[modifier | modifier le code]

Ordinaux non-récursifs[modifier | modifier le code]

Une étude générale[modifier | modifier le code]

  • (en) Michael Rathjen, "The realm of ordinal analysis." dans S. Cooper et J. Truss (éds.): Sets and Proofs. (Cambridge University Press, 1999) 219-279. En ligne : (fichier Postscript).