Loi de Yule-Simon

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Loi de Yule–Simon
Image illustrative de l'article Loi de Yule-Simon
Densité de probabilité (ou fonction de masse)
en échelle log-log
(Les fonctions de masse ne sont définies que sur les entiers)

Image illustrative de l'article Loi de Yule-Simon
Fonction de répartition
(Les fonctions de répartition ne sont définies que sur les entiers)

Paramètres \rho>0, paramètre de forme
Support k \in \{1,2,\dots\}\,
Densité de probabilité (fonction de masse) \rho\,\mathrm{B}(k, \rho+1)\,
Fonction de répartition 1 - k\,\mathrm{B}(k, \rho+1)\,
Espérance \frac{\rho}{\rho-1}\, pour \rho>1\,
Mode 1\,
Variance \frac{\rho^2}{(\rho-1)^2\;(\rho-2)}\, pour \rho>2\,
Asymétrie \frac{(\rho+1)^2\;\sqrt{\rho-2}}{(\rho-3)\;\rho}\, pour \rho>3\,
Kurtosis normalisé \rho+3+\frac{11\rho^3-49\rho-22} {(\rho-4)\;(\rho-3)\;\rho}\, pour \rho>4\,
Fonction génératrice des moments \frac{\rho}{\rho+1}\;{}_2F_1(1,1; \rho+2; e^t)\,e^t \,
Fonction caractéristique \frac{\rho}{\rho+1}\;{}_2F_1(1,1; \rho+2; e^{i\,t})\,e^{i\,t} \,

En théorie des probabilités et en statistique, la loi de Yule-Simon est une loi de probabilité discrète dont le nom est issu du statisticien George Udny Yule et de l'économiste et sociologue Herbert Simon. Simon la dénomma initialement loi de Yule[1]. La loi dépend d'un paramètre de forme \scriptstyle \rho, son support est infini.

Définition[modifier | modifier le code]

La fonction de masse de la loi de Yule-Simon de paramètre \scriptstyle \rho>0 est :

f(k;\rho) = \rho\,\mathrm{B}(k, \rho+1), \,

pour tout entier \scriptstyle k \geq 1, où \mathrm{B} est la fonction bêta. La fonction de masse peut également être écrite en utilisant le symbole de Pochhammer décroissant :

 f(k;\rho) = \frac{\rho\,\Gamma(\rho+1)}{(k+\rho)^{\underline{\rho+1}}}

\scriptstyle \Gamma est la fonction gamma. Ainsi, si \scriptstyle \rho est entier,

 f(k;\rho) = \frac{\rho\,\rho!\,(k-1)!}{(k+\rho)!}.

La fonction de masse f possède la propriété suivante, pour k suffisamment grand :

 f(k;\rho) \approx \frac{\rho\,\Gamma(\rho+1)}{k^{\rho+1}} \propto \frac{1}{k^{\rho+1}}.

Ceci signifie que la queue de la loi de Yule-Simon est une réalisation de la loi de Zipf : la fonction f peut être utilisée pour modéliser, par exemple, les fréquences relatives du k-ième mot le plus fréquent dans de grands textes qui, selon la loi de Zipf, est inversement proportionnel à la puissance typique de k.

Le paramètre \scriptstyle \rho peut être estimé en utilisant un algorithme de point fixe[2].

Liens avec d'autres lois[modifier | modifier le code]

La loi de Yule-Simon apparait initialement en tant que loi limite d'un cas particulier de processus stochastique étudié par Yule pour modéliser la répartition de taxa biologiques[3]. Simon baptisa ce processus le processus de Yule, il est cependant plus connu aujourd'hui comme processus d'attachement préférentiel. Ce processus est problème d'urne dans lequel chaque boule est ajoutée à un nombre croissant d'urnes suivant une probabilité dépendant linéairement du nombre de boules déjà dans l'urne.

Cette loi apparait également comme mélange continu de lois géométriques. Plus spécifiquement, Si \scriptstyle W suit une loi exponentielle de paramètre \scriptstyle \rho : \scriptstyle W \sim \mathrm{Exponential}(\rho) avec densité \scriptstyle h(w;\rho) = \rho \, \exp(-\rho\,w)\,, alors la variable aléatoire K de loi géométrique de paramètre \scriptstyle e^{-W} suit la loi de Yule-Simon :

K \sim \mathrm{Geometric}(\exp(-W))\,

La fonction de masse de la loi de Yule–Simon est alors le mélange exponentiel-géométrique suivant :

f(k;\rho) = \int_0^{\infty} \,\,\, g(k;\exp(-w))\,h(w;\rho)\,dw

\scriptstyle g(k; p) = p  \, (1-p)^{k-1} est la fonction de masse de la loi géométrique.

Généralisation[modifier | modifier le code]

Une généralisation possible de la loi de Yule-Simon consiste à introduire un nouveau paramètre en remplaçant fonction bêta par la fonction bêta incomplète. La fonction de masse de la loi de Yule-Simon généralisée de paramètres \scriptstyle \rho>0 et \scriptstyle 0\leq\alpha <1 est donnée par :

 f(k;\rho,\alpha) = \frac{\rho}{1-\alpha^{\rho}} \mathrm{B}_{1-\alpha}(k, \rho+1).

Pour \scriptstyle \alpha=0, on retrouve la loi de Yule-Simon standard.

Références[modifier | modifier le code]

  1. H. A. Simon, « On a class of skew distribution functions », Biometrika, vol. 42, no 3–4,‎ 1955, p. 425-440 (DOI 10.1093/biomet/42.3-4.425)
  2. Juan Manuel Garcia Garcia, « A fixed-point algorithm to estimate the Yule-Simon distribution parameter », Applied Mathematics and Computation, vol. 217, no 21,‎ 2011, p. 8560–8566 (DOI 10.1016/j.amc.2011.03.092)
  3. G. U. Yule, « A Mathematical Theory of Evolution, based on the Conclusions of Dr. J. C. Willis, F.R.S », Philosophical Transactions of the Royal Society of London, Ser. B, vol. 213, no 402–410,‎ 1925, p. 21-87 (DOI 10.1098/rstb.1925.0002)
  • Colin Rose and Murray D. Smith, Mathematical Statistics with Mathematica. New York: Springer, 2002, ISBN 0-387-95234-9. (voir page 107, où il est fait référence de la loi de Yule.)