Loi de Yule-Simon

	Loi de Yule–Simon
	; Fonction de masse; en échelle log-log; (Les fonctions de masse ne sont définies que sur les entiers)
	; Fonction de répartition; (Les fonctions de répartition ne sont définies que sur les entiers)
Paramètres	, paramètre de forme
Support
Fonction de masse
Fonction de répartition
Espérance	pour
Mode
Variance	pour
Asymétrie	pour
Kurtosis normalisé	pour
Fonction génératrice des moments
Fonction caractéristique
	modifier

En théorie des probabilités et en statistique, la loi de Yule-Simon est une loi de probabilité discrète dont le nom est issu du statisticien George Udny Yule et de l'économiste et sociologue Herbert Simon. Simon la dénomma initialement loi de Yule^[1]. La loi dépend d'un paramètre de forme $ρ$ , son support est infini.

Définition[modifier | modifier le code]

La fonction de masse de la loi de Yule-Simon de paramètre $ρ > 0$ est :

f(k;\rho )=\rho \,\mathrm {B} (k,\rho +1),\,

pour tout entier $k \geq 1$ , où $B$ est la fonction bêta. La fonction de masse peut également être écrite en utilisant le symbole de Pochhammer décroissant :

f(k;\rho )={\frac {\rho \,\Gamma (\rho +1)}{(k+\rho )^{\underline {\rho +1}}}}

où $Γ$ est la fonction gamma. Ainsi, si $ρ$ est entier,

f(k;\rho )={\frac {\rho \,\rho !\,(k-1)!}{(k+\rho )!}}.

La fonction de masse $f$ possède la propriété suivante, pour k suffisamment grand :

f(k;\rho )\approx {\frac {\rho \,\Gamma (\rho +1)}{k^{\rho +1}}}\propto {\frac {1}{k^{\rho +1}}}.

Ceci signifie que la queue de la loi de Yule-Simon est une réalisation de la loi de Zipf : la fonction f peut être utilisée pour modéliser, par exemple, les fréquences relatives du k-ième mot le plus fréquent dans de grands textes qui, selon la loi de Zipf, est inversement proportionnel à la puissance typique de k.

Le paramètre $ρ$ peut être estimé en utilisant un algorithme de point fixe^[2].

Liens avec d'autres lois[modifier | modifier le code]

La loi de Yule-Simon apparait initialement en tant que loi limite d'un cas particulier de processus stochastique étudié par Yule pour modéliser la répartition de taxons biologiques^[3]. Simon baptisa ce processus le processus de Yule, il est cependant plus connu aujourd'hui comme processus d'attachement préférentiel. Ce processus est problème d'urne dans lequel chaque boule est ajoutée à un nombre croissant d'urnes suivant une probabilité dépendant linéairement du nombre de boules déjà dans l'urne.

Cette loi apparait également comme mélange continu de lois géométriques. Plus spécifiquement, si $W$ suit une loi exponentielle de paramètre $ρ$ : $W\sim {\mathcal {E}}(\rho )$ avec densité $h(w;\rho )=\rho \,\exp(-\rho \,w)\,$ , alors la variable aléatoire K de loi géométrique de paramètre $e - W$ suit la loi de Yule-Simon :

K\sim {\mathcal {G}}(\exp(-W))\,

La fonction de masse de la loi de Yule–Simon est alors le mélange exponentiel-géométrique suivant :

f(k;\rho )=\int _{0}^{\infty }\,\,\,g(k;\exp(-w))\,h(w;\rho )\,dw

où $g(k;p)=p\,(1-p)^{k-1}$ est la fonction de masse de la loi géométrique.

Généralisation[modifier | modifier le code]

Une généralisation possible de la loi de Yule-Simon consiste à introduire un nouveau paramètre en remplaçant fonction bêta par la fonction bêta incomplète. La fonction de masse de la loi de Yule-Simon généralisée de paramètres $ρ > 0$ et $0 \leq α < 1$ est donnée par :

f(k;\rho ,\alpha )={\frac {\rho }{1-\alpha ^{\rho }}}\mathrm {B} _{1-\alpha }(k,\rho +1).

Pour $α = 0$ , on retrouve la loi de Yule-Simon standard.

Références[modifier | modifier le code]

↑ H. A. Simon, « On a class of skew distribution functions », Biometrika, vol. 42, n^os 3–4,‎ 1955, p. 425-440 (DOI 10.1093/biomet/42.3-4.425)
↑ Juan Manuel Garcia Garcia, « A fixed-point algorithm to estimate the Yule-Simon distribution parameter », Applied Mathematics and Computation, vol. 217, n^o 21,‎ 2011, p. 8560–8566 (DOI 10.1016/j.amc.2011.03.092)
↑ G. U. Yule, « A Mathematical Theory of Evolution, based on the Conclusions of Dr. J. C. Willis, F.R.S », Philosophical Transactions of the Royal Society of London, Ser. B, vol. 213, n^os 402–410,‎ 1925, p. 21-87 (DOI 10.1098/rstb.1925.0002)

(en) Colin Rose et Murray D. Smith, Mathematical Statistics with Mathematica : Mathematical Statistics with Mathematica, New York, Springer, 2002, 107 p. (ISBN 0-387-95234-9)

Portail des probabilités et de la statistique

[SimonBiomet-1] H. A. Simon, « On a class of skew distribution functions », Biometrika, vol. 42, n^os 3–4,‎ 1955, p. 425-440 (DOI 10.1093/biomet/42.3-4.425)

[JMGGarcia-2] Juan Manuel Garcia Garcia, « A fixed-point algorithm to estimate the Yule-Simon distribution parameter », Applied Mathematics and Computation, vol. 217, n^o 21,‎ 2011, p. 8560–8566 (DOI 10.1016/j.amc.2011.03.092)

[YulePhilTrans-3] G. U. Yule, « A Mathematical Theory of Evolution, based on the Conclusions of Dr. J. C. Willis, F.R.S », Philosophical Transactions of the Royal Society of London, Ser. B, vol. 213, n^os 402–410,‎ 1925, p. 21-87 (DOI 10.1098/rstb.1925.0002)

[1]

[2]

[3]

Loi de Yule–Simon

Fonction de masse en échelle log-log (Les fonctions de masse ne sont définies que sur les entiers)
Fonction de répartition (Les fonctions de répartition ne sont définies que sur les entiers)

Paramètres	$\rho >0$ , paramètre de forme
Support	$k\in \{1,2,\dots \}\,$
Fonction de masse	$\rho \,\mathrm {B} (k,\rho +1)\,$
Fonction de répartition	$1-k\,\mathrm {B} (k,\rho +1)\,$
Espérance	${\frac {\rho }{\rho -1}}\,$ pour $\rho >1\,$
Mode	$1\,$
Variance	${\frac {\rho ^{2}}{(\rho -1)^{2}\;(\rho -2)}}\,$ pour $\rho >2\,$
Asymétrie	${\frac {(\rho +1)^{2}\;{\sqrt {\rho -2}}}{(\rho -3)\;\rho }}\,$ pour $\rho >3\,$
Kurtosis normalisé	$\rho +3+{\frac {11\rho ^{3}-49\rho -22}{(\rho -4)\;(\rho -3)\;\rho }}\,$ pour $\rho >4\,$
Fonction génératrice des moments	${\frac {\rho }{\rho +1}}\;{}_{2}F_{1}(1,1;\rho +2;\mathrm {e} ^{t})\,\mathrm {e} ^{t}\,$
Fonction caractéristique	${\frac {\rho }{\rho +1}}\;{}_{2}F_{1}(1,1;\rho +2;\mathrm {e} ^{\mathrm {i} t})\,\mathrm {e} ^{\mathrm {i} t}\,$
modifier