Combinatoire analytique

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

En mathématiques, et plus précisément en combinatoire, la combinatoire analytique (en anglais : analytic combinatorics) est un ensemble de techniques décrivant des problèmes combinatoires dans le langage des séries génératrices, et s'appuyant en particulier sur l'analyse complexe pour obtenir des résultats asymptotiques sur les objets combinatoires initiaux.

Les résultats de combinatoire analytique permettent notamment une analyse fine de la complexité de certains algorithmes.

Introduction[modifier | modifier le code]

La combinatoire analytique s'organise autour de plusieurs thèmes : des méthodes symboliques sont employées pour décrire des relations entre des objets mathématiques discrets et des opérations algébriques sur des fonctions génératrices d'énumération ; des méthodes d'analyse complexe sont développées en vue d'extraire des fonctions génératrices des informations sur le comportement asymptotique du nombre d'objets énumérés ; c'est la nature des singularités qui est la clé de l'étude du comportement asymptotique. Enfin, une application importante est l'étude de propriétés probabilistes de grandes structures aléatoires.

Cette théorie a été largement développée notamment par Philippe Flajolet et son école. Elle est détaillée dans son livre avec Robert Sedgewick, Analytic Combinatorics[1]. Des contributions antérieures à cette approche peuvent être trouvées dans des travaux de Leonhard Euler, Arthur Cayley, Srinivasa Ramanujan, George Pólya et Donald Knuth notamment.

Classes combinatoire[modifier | modifier le code]

Les méthodes symboliques s'appuient sur le concept de classe combinatoire, c'est-à-dire d'ensembles d'objets dont chacun a une taille. Les méthodes consistent en une association entre opérations ensemblistes ou algébriques sur les classes opératoires d'une part, et des opérations algébriques sur des séries génératrices d'autre part. Le but est d'obtenir un processus de traduction purement formel. On constate que deux types de fonctions génératrices sont appropriées, les fonctions génératrices ordinaires pour des structures non étiquetées, et des fonctions génératrices exponentielles pour des structures étiquetées.

Définitions[modifier | modifier le code]

Une classe combinatoire est par définition un ensemble muni d'une application appelée taille qui, à chaque élément de l'ensemble associe un entier naturel . On demande de plus que, pour chaque , le nombre d'éléments de taille est fini.

Comme la définition le suggère, un même ensemble peut être doté de plusieurs tailles différentes. Ainsi, la taille des arbres binaires peut être leur nombre de sommet; une autre taille est leur hauteur. Mais le nombre de feuilles n'est pas une taille valide, parce qu'il existe une infinité d'arbres binaires « filiformes » (où chaque nœud n'a qu'il seul enfant) qui n'ont qu'une feuille unique. En général, un objet d'une certaine taille est formé de composants élémentaires que l’on appelle parfois des atomes (comme les sommets d'un graphe par exemple).

Soit maintenant un ensemble combinatoire, et soit le nombre d'éléments de taille de . La série génératrice ordinaire associée à est par définition la série définie par

.

Il est parfois commode de considérer une autre expression équivalente pour la série, à savoir :

.

On considère aussi, dans le cas de structures étiquetées, des séries génératrices exponentielles dont il sera question plus bas.

En général, les séries génératrices associées au dénombrement d'objets combinatoires sont des séries formelles, que l'on manipule sans considération de convergence. Dans le cadre de la combinatoire analytique, on étudie leur comportement dans le cadre de l’analyse complexe. L'observation fondamentale utilisée - qui est explicitée plus loin - est que la nature de la singularité sur l'axe réel positif donne des informations précises sur la croissance des nombres d'objets de taille .

Une notation utile pour l'extraction de coefficients d'une série génératrice est la suivante : on désigne par le coefficient de la variable , de sorte que, pour

,

on a :

.

Exemples[modifier | modifier le code]

Quelques exemples usuels sont les suivants :

  • Classe des mots sur un alphabet binaire, la taille est la longueur du mot. Il y a mots de longueur . La série génératrice est :
  • Compositions d'entiers (une composition d'un entier positif est une suite d'entiers positifs tels que ). Chaque entier positif possède compositions. La série génératrice est :
  • Arbres binaires complets. Le nombre d'arbres binaires complets à nœuds internes est
,
et la série génératrice est :
.

La méthode symbolique[modifier | modifier le code]

La méthode symbolique est un procédé qui permet de traduire directement des relations entre classes combinatoires dans les séries génératrices correspondantes. L'algorithme consiste à commencer avec des classes combinatoires très simples, et à les composer à l'aide d'opérateurs au comportement connu. Ces opérateurs ensemblistes comprennent diverses opérations simples, comme la réunion disjointe, le produit cartésien; d'autres opérations, comme l'ensemble des parties, la formation de suites, de multiensembles sont un peu plus complexes. Enfin des définitions récursives sont possibles. L'attrait de la méthode est que la définition ensembliste, ou symbolique, se traduit directement en de relations algébriques sur les fonctions génératrices.

Deux types de séries génératrices sont utilisées usuellement en combinatoire, les séries génératrices ordinaires, pour des classes combinatoires d'objets non étiquetés, et des séries génératrices exponentielles, pour des classes combinatoires d'objets étiquetés,

Il est d'usage, dans cette théorie, de noter les classe combinatoires par des lettres cursives, et leurs séries génératrices par les même lettres, droites. Ainsi, les séries associées à des classes combinatoires ou sont notées respectivement et .

Constructions élémentaires[modifier | modifier le code]

Les briques de base sont des classes formées d'un seul objet. Deux types de classes sont utiles : celles où le singleton est de taille nulle, et celles dont le singleton est de taille un. Une classe du premier type a donc un élément de taille nulle, et sa série génératrice est la fonction constante . Une classe du deuxième type au un seul élément, de taille un, et sa série génératrice est . Les opérations élémentaires sont l'union disjointe, le produit cartésien, la formation de suites.

Union disjointe[modifier | modifier le code]

On écrit si la classe est l’union disjointe des classes et . Cette relation se traduit en séries génératrices par

puisqu'en effet

.

Produit cartésien[modifier | modifier le code]

On écrit si la classe est l'ensemble des couples , avec et . La fonction taille est définie par . On a alors, pour les séries génératrices, la relation

.

Séquences[modifier | modifier le code]

On écrit lorsque est l'ensemble des suites finies d éléments de . En d'autres termes,

, ou encore .

La taille d'une suite est la somme des tailles de ses composants. Pour que l’opération soit bien définie, la classe ne doit pas contenir d'élément de taille 0 car sinon la classe contiendrait une infinité d'éléments d'une taille donnée. La traduction en séries génératrices est

.

La série est appelée parfois la quasi-inverse de la série .

Définition récursive[modifier | modifier le code]

Lorsque certaines conditions assez techniques sont remplies[2], on peut définir une classe combinatoire de façon récursive. Voici des exemples.

Arbres binaires[modifier | modifier le code]

Le premier exemple est celui des arbres binaires. Un arbre binaire est soit l’arbre binaire vide, soit formé d'une racine et de deux sous-arbres qui sont des arbres binaires. L'équation de la classe combinatoire des arbres binaires est donc :

,

est réduite à un élément de taille 0 et est composé d'un élément de taille 1. Cette équation se traduit en l’équation

.

Arbres unaires-binaires[modifier | modifier le code]

Un arbre unaire-binaire est un arbre où chaque nœud interne a un ou deux enfants. L'équation symbolique s'écrit

d'où l'on déduit l'équation fonctionnelle

.

Exemples[modifier | modifier le code]

On peut employer la méthode symbolique même dans des cas très élémentaires :

Mots binaires[modifier | modifier le code]

Un mot binaire est une suite de symboles 0 et 1. On a deux classes combinatoires et dont la série génératrice est . Les mots binaires sont donnés par la construction

,

leur série génératrice est

et .

C'est utiliser une grosse artillerie pour un exemple tout simple.

Composition restreinte d'entiers[modifier | modifier le code]

Le problème est de couvrir le segment avec des briques de taille 1 et 2, en d'autre termes d'écrire l'entier comme une somme dont les termes sont 1 ou 2, et de compter le nombre de façons de le faire. Par exemple, l'entier 4 possède les cinq écritures :

4=1+1+1+1=1+1+2=1+2+1=2+1+1=2+2 .

Il est facile de voir directement que le nombre de ces compositions de est , le e nombre de Fibonacci. Pour utiliser la méthode symbolique, on considère deux classes et composées d'un élément unique de taille 1 et de taille 2 respectivement. Alors la classe de couvertures est

et la série génératrice est :

.

Autres constructions symboliques[modifier | modifier le code]

D'autre constructions syboliques importantes sont : Cycles. Les cycles sont comme des séquences, sauf que deux objets qui s'obtiennent l'un de l'autre par une rotation circulaire ne sont pas considérés comme distincts. La série génératrice est nettement plus compliquée; dans le cas étiqueté, elle est plus simple. Ici, elle s'écrit

est l'indicatrice d'Euler. Classe pointée. La classe est formée d'objets de qui sont « pointés » : dans chaque objet, un atome est distingué. Par exemple, les arbres enracinés sont des arbres libres pointés. Formellement, chaque objet est augmenté d'un élément de taille zéro sur un de ses atomes. La série génératrice est

.

Substitution. La classe est obtenue en substituant, à chaque atome d'un élément de , un élément de la classe . La série génératrice est simplement .

Analyse[modifier | modifier le code]

Les méthodes d'analyse complexe se concentrent autour du processus d'extraction d'informations asymptotiques à partir de fonctions génératrices. Il existe un ensemble de résultats qui fournissent une traduction systématique entre fonctions génératrices et la forme asymptotique des coefficients.

Dans la plupart des situations qui se présentent en combinatoire, une série formelle

de dénombrement peut être vue comme le développement, autour de 0, d'une fonction analytique . Le rayon de convergence de la série est donné par exemple par

.

Ceci signifie que

)

est une fonction sous-exponentielle de . Il y a donc une singularité sur le rayon de convergence, et un théorème classique de Pringsheim (ne pas confondre avec un théorème de Pringsheim de même nom) dit que si les coefficients sont non négatifs, ce qui est bien le cas dans des séries énumératrices, alors il existe une singularité réelle positive au point .

Cas des séries rationnelles[modifier | modifier le code]

Avec les constructeurs autres que la récursivité, c'est-à-dire avec et les opérateurs , on obtient que des séries rationnelles. Dans ce cas, le terme est asymptotiquement équivalent à une somme de termes de la forme . Plus précisément, si la singularité dominante est de multiplicité , alors

.

Exemple.- On considère la série rationnelle

.

Ses singularités sont ( est le nombre d'or). La singularité dominante est 1/2, et sa multiplicité est 5. On a donc

.

Un cas plus général[modifier | modifier le code]

Le cas général est plus délicat. La démarche adoptée est la suivante : on considère une famille générale mais bien précise de fonctions (combinaisons de puissance (complexes) de et de ) pour lesquelles on sait obtenir des estimations asymptotiques à l'aide d'outils d'analyse complexe plus ou moins complexe. Ensuite, on emploie un autre principe de base, appelé le théorème de transfert, qui dit que si deux fonctions sont « voisines » autour de leur singularité réelle, il en est de même de leurs coefficients. Le résultat sur la famille de fonctions est le suivant[3], exprimé ici dans le cas où la singularité est 1; on peut toujours s'y ramener par un changement de variable.

Soient et . On a
,
est la fonction Gamma usuelle.

De nombreux exemples sont donnés dans le livre de Flajolet et Sedgewick[4]. En voici quelques-uns :

Fonction Coefficients

Le théorème de transfert[modifier | modifier le code]

Le théorème de transfert[5] énonce qu'il suffit de connaître le comportement de deux fonctions autour de leur plus petite singularité pour pouvoir comparer le comportement asymptotique de leurs coefficients. L'énoncé est le suivant.

Soient et ) deux fonctions dont la plus petite singularité est 1. Alors — Si , alors .
— Si , alors .
— Si , alors .

Un exemple[modifier | modifier le code]

On retrouve comme suit l'évaluation asymptotique du nombre d'arbres binaires. On part de l'équation symbolique

,

est réduite à un élément de taille 0 et est composé d'un élément de taille 1. Cette équation se traduit en l’équation

.

On résout l'équation et on trouve

.

La fonction a une singularité en , et son ordre est . Autour de , on peut écrire

et par le théorème général on obtient

parce que .

Classes combinatoires étiquetées[modifier | modifier le code]

Une classe combinatoire est étiquetée si ses éléments sont étiquetés. Par définition, un tel objet combinatoire, de taille , est de plus doté d'une permutation de . Les exemples les plus pertinents d'objets étiquetés sont les graphes.

Pour énumérer les objets d'une classe étiquetée, on emploie des séries génératrices exponentielles, où les coefficients sont normalisées par une factorielle.

Définition[modifier | modifier le code]

Plus formellement, soit une classe combinatoire étiquetée, et soit , pour , le nombre d'objets de taille dans cette classe. La série génératrice exponentielle associée à est

.

Il est équivalent d'écrire

.

L'extraction d'un coefficient de cette série donne

, donc .

Exemples[modifier | modifier le code]

Permutations. Soit la classe des permutations. Sa série génératrice exponentielle est

.

Graphes sans arête. Il existe, pour chaque entier n, un seul graphe sans arête. La série génératrice correspondante est

La même série compte les graphes complets.

Graphes cycliques. Le nombre de graphes étiquetés de n sommets formés d'un seul cycle est (n-1)!. Leur série génératrice exponentielle est donc

.

Constructions[modifier | modifier le code]

Produit[modifier | modifier le code]

La construction d'une somme disjointe de classes combinatoires se transpose sans modifications aux classes étiquetées. Pour le produit, il faut être plus attentif. Soient et deux classes combinatoires étiquetées. Le produit cartésien est formé de couples d'objets étiquetées, mais un tel couple n’est pas correctement étiqueté puisque ses éléments n'ont pas des étiquettes distinctes. On définit une structure associée, dont les éléments ont exactement les étiquettes , et où l'ordre relatif des étiquettes de chaque élément est respecté. On définit

comme l'ensemble des couples ainsi ré-étiquetés. La famille contient exactement éléments. Le produite étiqueté des classes et est par définition

.

Pour les séries génératrices exponentielles, on a

.

En effet, pour et , on a

,

et donc

.

Séquence[modifier | modifier le code]

À partir de la somme disjointe et du produit, on construit l'opérateur de séquence comme dans le cas ordinaire : On écrit lorsque est l'ensemble des suites finies d'éléments de ; ici n'a pas d'élément de taille nulle. En d'autres termes,

,

ou encore , où les suites son ré-étiquetées. La série génératrices exponentielle est

.

Ensemble des parties[modifier | modifier le code]

Les définitions d'ensemble et de cycle donnée ici s'appliquent aussi bien aux structures non étiquetées. On définit la classe

comme la classe des parties de la classe contenant éléments. On peut voir cette classe comme la classe quotient de

,

est l’ensemble des suites à éléments de , et où met en équivalence deux suites qui sont les mêmes à une permutation de ses éléments près. On a

.

La classe des parties de la classe est par définition

,

et la série génératrice exponentielle correspondante est

.

Cycle[modifier | modifier le code]

On définit la classe

comme la classe des cycles de éléments de la classe . On peut la voir comme le quotient de la classe des suites de longueur d'éléments de par l'ensemble des permutations circulaires de ses éléments. On a

.

La classe des cycles de la classe est par définition

,

et la série génératrice exponentielle correspondante est

.

Deux cas particuliers sont l'opérateur de construction des cycles de longueur paire, et celui de longueur impaire, qui sont respectivement

et .

Leurs séries génératrices sont respectivement

et .

Exemples[modifier | modifier le code]

Permutations. Une permutation peut être vue comme un ensemble de cycles de supports disjoints. Ceci conduit à l'équation symbolique

,

est la classe formée d'un seul élément de taille 1. La série génératrice exponentielle est

.

Involutions. Une involution est une permutation telle que . On peut voir une involution comme un ensemble de cycles de longueur 1 ou 2 à supports disjoints. L'équation symbolique est donc

,

et a série génératrice exponentielle est . Un calcul élémentaire permet d'obtenir l'expression close

Dérangements. Un dérangement est une permutation sans point fix. La définition symbolique est

,

et la fonction génératrice exponentielle est

.

Pour évaluer le nombre d_n de dérangements de taille , on observe que la singularité de est en . Autour de ce point, le développement de est

, de sorte .

Arbres. Un arbre enraciné est formé d'un sommet et d'un ensemble de sous-arbres. Ce sont des structures étiquetées ou non. Pour les arbres étiquetés, l'équation symbolique est

,

et la série exponentielle correspondante est :

.

Pour un arbre plane enraciné et non étiqueté, formé d'un sommet et d'une suite de sous-arbres, l'équation symbolique est

,

et la série génératrice ordinaire est :

.

Multi-ensemble[modifier | modifier le code]

La construction de la classe des multi-ensembles ou parties avec multiplicité est semblable à celle des parties. Dans la classe

,

chaque élément de peut figurer un nombre arbitraire de fois dans une partie. On obtient :

Ceci conduit à la relation (ici est le nombre d'éléments de taille de ) :

Un exemple d'application est constitué des partitions d'entiers. On définit d'abord la classe des entiers positifs, notée ici , où la taille de chaque entier est sa valeur

.

La série génératrice de iest alors

L'ensemble des partitions d'entiers est la classe des multi-ensembles d'entiers positifs. Si on la note , on obtient donc la formule

La série génératrice de est

Il n'y a pas de formule close connue pour cette série, mais on peut calculer la valeur asymptotique de ses coefficients.

Notes et références[modifier | modifier le code]

  1. Flajolet et Sedgewick 2008.
  2. Flajolet et Sedgewick 2008, Chap I, §2.3..
  3. Flajolet et Sedgewick 2008, Theorem VI.2, p. 385.
  4. Flajolet et Sedgewick 2008, Figure VI.5, p. 388.
  5. Flajolet et Sedgewick 2009, Transfert Lemma, Th. VI.3, p. 390.

(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Analytic Combinatorics » (voir la liste des auteurs).

Bibliographie[modifier | modifier le code]

  • (en) Herbert Wilf, Generatingfunctionology, Academic Press, 1990, ISBN 0-12-751955-6. (lire en ligne)
  • Jérémie Lumbroso et Basile Morcrette, « A Gentle Introduction to Analytic Combinatorics », dans CIMPA Summer School Analysis of Random Structures, An Najah University, Naplouse, Palestine, 18-27 août 2014 (lire en ligne) Document utilisé pour la rédaction de l’article
  • François Bergeron, Gilbert Labelle et Pierre Leroux, Combinatorial Species and Tree-like Structures, Cambridge University Press, coll. « Encyclopedia of Mathematics and its Applications » (no 67), , 457 p. (ISBN 9780521573238) — Version française : Théorie des espèces et combinatoire des structures arborescentes, LaCIM, Montréal (1994).
  • (en) Philippe Flajolet et Robert Sedgewick, Analytic Combinatorics, Cambridge University Press, (ISBN 0-521-89806-4, lire en ligne)
  • Micha Hofri, Analysis of Algorithms: Computational Methods and Mathematical Tools, Oxford University Press (1995).
  • Robin Pemantle et Mark C. Wilson, Analytic Combinatorics in Several Variables, Cambridge University Press, coll. « Cambridge Studies in Advanced Mathematics » (no 140), , 392 p. (ISBN 978-1107031579).