Marche aléatoire

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Trois marches aléatoires (indépendantes) isotropes sur le réseau ℤ2 ; 10 000 pas.

En mathématiques, en économie, et en physique théorique, une marche au hasard est un modèle mathématique d'un système possédant une dynamique discrète composée d'une succession de pas aléatoires, ou effectués « au hasard ». On emploie également fréquemment les expressions marche aléatoire, promenade aléatoire ou random walk en anglais. Ces pas aléatoires sont de plus totalement décorrélés les uns des autres ; cette dernière propriété, fondamentale, est appelée caractère markovien du processus, du nom du mathématicien Markov. Elle signifie intuitivement qu'à chaque instant, le futur du système dépend de son état présent, mais pas de son passé, même le plus proche. Autrement dit, le système « perd la mémoire » à mesure qu'il évolue dans le temps. Pour cette raison, une marche aléatoire est parfois aussi appelée « marche de l'ivrogne ».

Cette modélisation mathématique permet de rendre compte de certains phénomènes naturels, dont l'exemple le plus fameux est le mouvement brownien, correspondant par exemple aux mouvements en apparence aléatoires des particules présentes dans le fluide intérieur d'un grain de pollen.

En mathématiques ou en informatique, on étudie souvent des marches au hasard sur des réseaux réguliers ou sur des graphes plus complexes. C'est par exemple la méthode utilisée par le moteur de recherche Google pour parcourir, identifier et classer les pages du réseau internet.

Techniquement, les marches aléatoires sont du domaine de la théorie des probabilités. Une marche aléatoire est en effet un processus stochastique du type chaîne de Markov. Elle se décompose en unités élémentaires appelées pas, dont la longueur peut être elle-même constante, aléatoire ou fixée par le réseau ou le graphe sur lequel on circule. À chaque pas, on a donc un éventail de possibilités pour choisir au hasard la direction et la grandeur du pas. Cet éventail de possibilités peut être discret (choix parmi un nombre fini de valeurs), ou continu.

Historique[modifier | modifier le code]

L'idée de marche aléatoire a été introduite (sans le nom) en 1905 par le biostatisticien Karl Pearson pour rendre compte des migrations d'une population de moustiques dans une forêt. Pearson y pose la question suivante[1] :

« Un homme part d'un point O et parcourt l yards (0,914 m) en ligne droite ; il tourne d'un angle quelconque, et marche de nouveau l yards en ligne droite. Il répète ce processus n fois. Je demande la probabilité qu'après n de ces trajets, il soit à une distance située entre r et r + dr de son point de départ. »

La réponse à cette question est fournie une semaine plus tard par Lord Rayleigh dans la livraison suivante de Nature : lorsque n est suffisamment grand, cette probabilité vaut :

dP(r) \ \sim \ \frac{2}{n \, l^2} \quad \mathrm{e}^{- \ \frac{\displaystyle r^2}{n \, l^2}} \quad r \ dr

Si Rayleigh fournit si rapidement la réponse[2], c'est qu'il a lui-même étudié en 1880 un problème connexe : le comportement d'une superposition d'ondes acoustiques toutes de même amplitude, mais de phases aléatoires. Pearson répond à Rayleigh le 10 août[3] :

« J'aurais dû le savoir, mais mes lectures ces dernières années se sont déplacées vers d'autres centres d'intérêt, et on ne s'attend pas à trouver la première étape d'un problème de biométrie dans un mémoire sur l'acoustique. »

Pearson poursuit ensuite :

« La leçon de la solution de Lord Rayleigh est que, dans un pays ouvert, l'endroit le plus probable pour trouver un ivrogne encore capable de tenir sur ses pieds se trouve quelque part dans le voisinage de son point de départ. »

L'expression « marche aléatoire » n'a été introduite que vers 1919-1921 par le mathématicien hongrois George Pólya, qui utilisait le mot allemand « Irrfahrt ».

Marche aléatoire discrète à une dimension[modifier | modifier le code]

Définition[modifier | modifier le code]

Le modèle de marche aléatoire le plus simple est celui de la marche aléatoire discrète à une dimension sur le réseau périodique ℤ. Pour en former un exemple concret, on peut imaginer un individu (ou « particule ») sur un escalier, qui tire à pile ou face pour décider si le prochain pas sera vers le haut ou vers le bas. À chaque étape, il n'y a que deux possibilités : sur cet exemple, un pas en avant ou un pas en arrière. Le seul paramètre libre du problème est la probabilité que la particule fasse un saut en avant (plutôt qu'un saut en arrière).

Si on nomme cette probabilité par le nombre réel p tel que : 0 < p < 1, alors q = 1 - p représente la probabilité que la particule fasse un saut en arrière.

Le cas le plus simple, qui correspond par exemple au mouvement brownien, consiste à faire l'hypothèse d' isotropie spatiale. Les directions « avant / arrière » de l'espace physique étant a priori équivalentes, on pose l' équiprobabilité :

p \ = \ q \ = \ \frac{1}{2}

Il est remarquable que les lois mises en évidence dans ce cas s'étendent à des problèmes de marches aléatoires beaucoup plus complexes.

Marche aléatoire isotrope[modifier | modifier le code]

Trois marches aléatoires (indépendantes) isotropes sur le réseau ℤ ; 1000 pas.

Chacun des tirs au hasard pour choisir le mouvement constitue une épreuve de Bernoulli avec issues équiprobables : ici la probabilité de montée ou de descente est 1/2.

La figure ci-contre montre un échantillon de trois simulations numériques indépendantes de marches aléatoires pour une particule : on a tracé les positions successives x(t) de la particule aux instants t = 1, 2, ..., partant de la condition initiale x(0)=0.

Après n pas au total, le nombre X de fois où on a tiré "pile" suit la loi binomiale B(n,1/2), telle que la probabilité vaut :

 P(X=k) \ = \ \frac1{2^n} \ C_n^k

C_n^k est le nombre de combinaisons de k éléments pris parmi n.

On peut déterminer la position Y après n itérations, en prenant la valeur 0 pour la marche initiale, en ajoutant 1 pour chaque pas en avant (pile), en retranchant 1 pour chaque pas en arrière (face). Alors la position Y est donnée par : Y = X - (n-X) = 2X - n. Par rapport à la loi binomiale classique il suffit donc de décaler les résultats de n/2 et de multiplier par 2, ainsi :

Concrètement, si on renouvelle l'expérience avec un grand nombre de participants, et si on les laisse évoluer pendant un nombre de pas assez important (de l'ordre de n = 100 par exemple) on s'attend à ce que le nuage des positions finales soit en gros centré sur la marche initiale. Ceci peut être rendu quantitatif : en se plaçant dans le régime asymptotique  n \gg 1, on démontre en utilisant la formule de Stirling que la loi binomiale se comporte asymptotiquement comme une distribution gaussienne. On obtient notamment un ordre de grandeur de l'étalement du nuage de participants : par exemple on s'attend à ce que 95 % environ des participants soient restés à 20 pas ou moins de la position initiale (20=2\sqrt{100}).

Spécimens[modifier | modifier le code]

La galerie ci-dessous contient quatre spécimens de marches aléatoires isotropes sur le réseau ℤ après 1 000 pas, partant de l'origine. Les lignes en pointillés indiquent respectivement les valeurs maximum et minimum de la position atteintes (après 1000 pas).

Marche aléatoire isotrope sur un réseau à x dimensions[modifier | modifier le code]

Deux dimensions[modifier | modifier le code]

Trois marches aléatoires (indépendantes) isotropes sur le réseau ℤ2 ; 10 000 pas.

On considère une marche aléatoire sur le réseau plan ℤ2. Il y a ici quatre mouvements possibles à chaque site : en avant, en arrière, à droite, à gauche. La figure ci-contre montre un échantillon de trois simulations numériques indépendantes de marches aléatoires pour une particule : on a tracé les trois trajectoires obtenues.

Pour des longues marches, la distribution de la position finale du marcheur se comporte asymptotiquement comme une distribution gaussienne. Cette convergence est illustrée ci-dessous : on trace les répartitions des probabilités de présence sur le réseau après 10 pas, puis après 60 pas :

Après 10 pas
Après 60 pas

Spécimens[modifier | modifier le code]

La galerie ci-dessous contient quatre spécimens de marches aléatoires isotropes sur le réseau ℤ2 après 10 000 pas, partant de l'origine.

Trois dimensions[modifier | modifier le code]

On considère une marche aléatoire sur le réseau cubique ℤ3. Il y a ici six mouvements possibles à chaque site : en avant, en arrière, à droite, à gauche, en haut, en bas.

Trois marches aléatoires (indépendantes) isotropes sur le réseau ℤ3 ; 10 000 pas.

La figure ci-contre montre un échantillon de trois simulations numériques indépendantes de marches aléatoires pour une particule : on a tracé les trois trajectoires obtenues.

Spécimens[modifier | modifier le code]

La galerie ci-dessous contient quatre spécimens de marches aléatoires isotropes sur le réseau ℤ3 après 10 000 pas, partant de l'origine.

Projections bidimensionnelles[modifier | modifier le code]

La trajectoire tridimensionnelle en violet est associée à ses trois projections orthogonales sur les plans (x,y) (courbe bleue), (x,z) (courbe grise) et (y,z) (courbe rouge).

Marche aléatoire isotrope sur un continuum à x dimensions[modifier | modifier le code]

Deux dimensions[modifier | modifier le code]

On considère la marche aléatoire sur le plan ℝ2 définie par le processus suivant :

Trois marches aléatoires (indépendantes) isotropes sur le plan ℝ2 ; 10 000 pas.
  • la particule est initialement à l'origine : x(0) = 0, y(0) = 0 et se déplace sur le plan par des sauts successifs effectués toutes les secondes.
  • à chaque saut, la particule avance d'une longueur unité dans une direction caractérisée par un angle polaire \alpha défini par rapport à l'axe (Ox). On choisit par exemple :  - \pi \leqslant \alpha < + \pi.
  • Cet angle polaire \alpha est une variable aléatoire, caractérisée par une densité de probabilité f(\alpha). Le processus est isotrope lorsque toutes les directions sont équiprobables, ce qui correspond au choix d'une densité uniforme :
f(\alpha) \ = \ \frac{1}{2 \pi}

Chaque direction de saut est totalement indépendante de la direction du saut précédent.

La figure ci-contre montre un échantillon de trois simulations numériques indépendantes de marches aléatoires pour une particule : on a tracé les trois trajectoires obtenues.

Spécimens[modifier | modifier le code]

La galerie ci-dessous contient quatre spécimens de marches aléatoires isotropes sur le plan ℝ2 après 10 000 pas, partant de l'origine.

Récurrence et dimensionnalité[modifier | modifier le code]

Récurrence[modifier | modifier le code]

Considérons une marche aléatoire isotrope sur le réseau ℤd à d dimensions spatiales. On peut toujours choisir de prendre le point de départ de cette marche comme origine O du système de coordonnées cartésiennes. La question de la récurrence consiste alors à se demander si on peut trouver au moins un[4] instant t positif fini pour lequel la particule repasse par l'origine O.

La marche aléatoire sera dite récurrente si et seulement si la probabilité que la particule repasse à l'origine O pour un certain instant t ultérieur fini vaut un.

Théorème de Pólya (1921)[modifier | modifier le code]

Cette propriété de récurrence dépend fortement de la dimensionnalité de l'espace ; on peut en effet démontrer le théorème[5] (Pólya - 1921)[6] :

  • pour d = 1 et d = 2, la marche aléatoire isotrope est récurrente.
  • pour d = 3 et au-delà, la marche aléatoire isotrope n'est pas récurrente ; on dit alors qu'elle est transitoire (en bon « franglais », certains auteurs utilisent parfois le mot anglais transient).

Certains disent parfois en plaisantant que ce théorème est au fondement du proverbe : « Tous les chemins mènent à Rome. » Le lecteur notera que, si l'on inclut les chemins « cosmiques », alors le proverbe est faux[7] !

Probabilité de retour à l'origine en dimension supérieure ou égale à trois 

On sait en fait calculer la probabilité que le marcheur, parti initialement de l'origine, revienne à l'origine, et ce pour toutes les dimensions d > 2. Cette probabilité p(d) admet l'expression suivante (Montroll - 1956)[8] :

p(d) \ = \ 1 \ - \ \frac{1}{u(d)}

u(d) est une intégrale à d dimensions :

u(d) \ = \  \frac{d}{(2\pi)^d} \ \int_{-\pi}^{+\pi} \dots  \int_{-\pi}^{+\pi}\frac{\mathrm{d}x_1 \dots \mathrm{d}x_d}{d \ - \ \cos x_1 \ - \ \dots \ - \ \cos x_d}

Le cas particulier d = 3 avait en fait déjà été obtenu précédemment par Watson[9], Mc Crea et Whipple[10], et Domb[11]. L'expression analytique de l'intégrale n'a été obtenue qu'en 1977 par Glasser et Zucker[12] :

u(3) \ = \  \frac{\sqrt{6}}{32 \, \pi^3} \quad \Gamma \left (\frac{1}{24} \right) \ \Gamma \left (\frac{5}{24} \right) \ \Gamma \left (\frac{7}{24} \right) \ \Gamma \left (\frac{11}{24} \right) \ \approx \ 1{,}5163860592

\Gamma est la fonction Gamma d'Euler. On obtient donc en trois dimensions une probabilité de retour à l'origine : p(3) \approx 0{,}3405373296, voisine de 34 %.

Les expressions analytiques de u(d) ne sont pas connues en dimension d supérieure à 3. On obtient les valeurs numériques suivantes :

  • p(4) \approx 0{,}193206
  • p(5) \approx 0{,}135178
  • p(6) \approx 0{,}104715
  • p(7) \approx 0{,}0858449
  • p(8) \approx 0{,}0729126

Marche aléatoire sur un groupe[modifier | modifier le code]

On considère un groupe (G,\circ) supposé ici multiplicatif, sans que ce soit essentiel à la définition d'une marche aléatoire sur un groupe. On se donne une suite Y\stackrel{\text{def}}{=}(Y_n)_{n \in \N^*} de variables aléatoires indépendantes et de même loi (loi qu'on appelle ici \nu par exemple), variables aléatoires toutes à valeurs dans (G,\circ). On se donne aussi une variable aléatoire X_0 à valeurs dans (G,\circ), de loi quelconque, et indépendante de  Y=(Y_n)_{n\geqslant 0}. On pose alors, pour n \in \N^*

X_n\stackrel{\text{def}}{=}X_{n-1}\circ Y_n.

La suite X\stackrel{ \text{def}}{=}(X_n)_{n\in\N} est alors une chaîne de Markov, et est dite marche aléatoire sur G, de pas \nu. Ce qualificatif s'applique aussi à toute suite aléatoire Z\stackrel{\text{def}}{=}(Z_n)_{n\in\N} de même loi que X. Alternativement, on accepte comme marche aléatoire une suite définie par la relation de récurrence :

X_n\stackrel{ \text{def}}{=}Y_{n}\circ X_{n-1}.

Pour distinguer les deux types de chaines de Markov ainsi définies, on parle parfois de marche aléatoire droite et de marche aléatoire gauche. Le terme général p_{g,h} de la matrice de transition de cette chaine de Markov est défini, pour (g,h)\in G^2, par

p_{g,h} \stackrel{\text{def}}{=} \nu(g^{-1}\circ h)\quad\textrm{ou bien}\quad p_{g,h} \stackrel{ \text{def}}{=}\nu(h\circ g^{-1}),

suivant que la marche aléatoire est droite ou gauche. On vérifie sans peine que

\sum_{g\in G} p_{g,h} = \sum_{g\in G} \nu(g^{-1}\circ h) = \sum_{g\in G} \nu(g^{-1}) = \sum_{g\in G} \nu(g) = 1,

car g\mapsto g\circ h\, et g\mapsto g^{-1} sont des bijections de G dans G. Ainsi, une mesure uniforme sur G est une mesure stationnaire.

Exemple  :

les marches aléatoires mentionnées plus haut sont des marches aléatoires sur les groupes additifs ℤd et ℝ2.

Marche aléatoire sur un graphe[modifier | modifier le code]

Marche aléatoire continue[modifier | modifier le code]

Très utilisée dans la modélisation de séries temporelles continues, une marche aléatoire peut s'écrire:

  • X_{t}=X_{t-1} + \epsilon_{t} \qquad \mbox{avec le bruit blanc} \ \epsilon_{t} \ \sim \mathcal{N} (0,1)

Il s'agit d'un cas particulier d'un processus autorégressif (c'est-à-dire « régressé sur lui-même ») avec \rho=1 . La valeur du paramètre \rho est très importante car elle change fondamentalement la propriété de la série :

  •  X_{t}= \rho X_{t-1} + \epsilon_{t}
 |\rho| \begin{cases} 
<1 & \textrm{Le \ processus \ est \ stationnaire}\\

=1 &  \textrm{Marche \ aleatoire: 
 \ le \ processus \ est \ donc \ non \ stationnaire}\\

>1 & \textrm{Le \ processus \ est \ explosif}\end{cases}

De manière récursive, une marche aléatoire est simplement la somme de bruits blancs. On l'écrit:

 X_{t}= X_{0}+ \sum_{i=1}^{t} \epsilon_{i}

Pour simuler une marche aléatoire, un petit exemple avec le logiciel de statistique R est montré:

a<-rnorm(100)# crée un vecteur "a" de 100 réalisations d'une loi normale (0,1).

b<-cumsum(a) # Crée un vecteur "b" dont chaque élément correspond à la somme cumulée des éléments de a.

plot.ts(b) #Crée un graphe (le ".ts" est utilisé pour "time series")

Marche aléatoire sur une variété riemannienne[modifier | modifier le code]

Notes et références[modifier | modifier le code]

  1. Karl Pearson, Nature (revue), 27 juillet 1905.
  2. Cette densité de probabilité est depuis lors appelée loi de Rayleigh.
  3. Karl Pearson ; Nature (10 août 1905).
  4. S'il en existe un, il en existera en général une infinité. Le plus petit de tous ces instants finis est appelé instant de premier retour à l'origine. Cf. e.g. le chapitre 1 du livre de Daniel W. Stroock.
  5. Cf. p. ex. le chapitre 1 du livre de Daniel W. Stroock
  6. Georg Pólya, Über eine Aufgabe der Wahrscheinlichkeitsrechnung betref-. fend die Irrfahrt im Straßennetz, Mathematische Annalen 83 (1921), 149–160.
  7. Yakov G. Sinaï ; Probability Theory - An Introductory Course, Springer-Verlag (1992), ISBN 3-540-53348-6, p. 71.
  8. E.W. Montroll ; Random Walks in Multidimensional Spaces, Especially on Periodic Lattices, Journal of the SIAM 4 (1956), 241-260.
  9. G.N. Watson ; Three Triple Integrals, Quarterly Journal of Mathematics, Oxford Series 2 10 (1939), 266-276.
  10. W. H. McCrea & F.J.W. Whipple ; Random Paths in Two and Three Dimensions, Proceedings of the Royal Society of Edinburgh 60 (1940), 281-298.
  11. C. Domb ; On Multiple Returns in the Random-Walk Problem, Proceedings of the Cambridge Philosophical Society 50 (1954), 586-591.
  12. M. L. Glasser & I.J. Zucker ; Extended Watson Integrals for the Cubic Lattices, Proceedings of the National Academie of Science U.S.A. 74 (1977),1800-1801.

Voir aussi[modifier | modifier le code]

Bibliographie[modifier | modifier le code]

Ouvrages de références
  • Joseph Rudnick & George Gaspari ; Elements of the Random Walk - An introduction for Advanced Students and Researchers, Cambridge University Press (2004), ISBN 0-521-82891-0.
  • Frank Spitzer, Principles of the Random Walk, Princeton University Press (1964). Réédité par Springer-Verlag (1970), ISBN 0-387-90139-6 ; 2e édition dans la série Graduate Texts in Mathematics 34 (2001), ISBN 0-387-95154-7.
  • Daniel W. Stroock ; An Introduction to Markov Processes, Springer-Verlag (2005), ISBN 3-540-23451-9.
  • William Feller ; An Introduction to Probability Theory and its Applications (Volume 1), John Wiley & Sons(1968), ISBN 0-471-25708-7.
Articles classiques
  • Mark Kac ; Random Walk and the Theory of Brownian Motion, American Mathematical Monthly 54(7) (1947), 369-391. (en) Texte au format [PDF] Cet article est l'un des six contenus dans : Selected Papers on Noise & Stochastic Processes, Charles Proteus Steinmetz & Nelson Wax (eds.), Dover Publishing, Inc. (1954). Réédité dans la collection Phoenix (2003), ASIN 0486495353.
  • Subramaniam Chandrashekhar ; Stochastic Problems in Physics & Astronomy, Review of Modern Physics 15 (1943), 1-89. Cet article est l'un des six contenus dans : Selected Papers on Noise & Stochastic Processes, Charles Proteus Steinmetz & Nelson Wax (eds.), Dover Publishing, Inc. (1954). Réédité dans la collection Phoenix (2003), ASIN 0486495353.
Bibliothèque virtuelle
  • Martin Z. Bazant ; Random Walks and Diffusion ; cours de mathématiques appliquées donné au MIT, avec des applications à la physique et à la finance.
Marche aléatoire sur une variété riemannienne

Articles connexes[modifier | modifier le code]

Liens externes[modifier | modifier le code]