Loi binomiale

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Binomiale
Image illustrative de l'article Loi binomiale
Fonction de masse
Image illustrative de l'article Loi binomiale
Fonction de répartition

Paramètres n \geq 0
0\leq p \leq 1
q=1-p
Support k \in \{0,\dots,n\}\!
Fonction de masse {n\choose k} p^k q^{n-k} \!
Fonction de répartition I_{1-p}(n-[ k ], 1+[ k]) \!
Espérance np\!
Médiane [ np] ou [np]+1
Mode [(n+1)\,p]\!
Variance npq\!
Asymétrie \frac{q-p}{\sqrt{npq} }\!
Kurtosis normalisé 3+\frac{1-6pq}{npq}\!
Entropie  \frac{1}{2} \ln \left( 2 \pi n e p q \right) + O \left( \frac{1}{n} \right)
Fonction génératrice des moments (q + pe^t)^n \!
Fonction caractéristique (q + pe^{it})^n \!

En théorie des probabilités et en statistique, la loi binomiale de paramètres \scriptstyle n et \scriptstyle p est la loi de probabilité discrète qui modélise le nombre de succès dans une répétition indépendante de \scriptstyle n expériences aléatoires identiques où la probabilité de succès de chaque expérience est égale à \scriptstyle p. Une manière visuelle de représenter cette suite d'expériences est d'utiliser un arbre de probabilité : à chaque génération de l'arbre, deux branches partent de chaque nœud, une pour le succès et une pour l'échec.

Plus mathématiquement, pour chaque expérience appelée épreuve de Bernoulli on utilise une variable aléatoire qui prend la valeur 1 lors d'un succès et la valeur 0 sinon. La variable aléatoire, somme de toutes ces variables aléatoires, compte le nombre de succès et est de loi binomiale. Il est alors possible d'obtenir la probabilité de \scriptstyle k succès dans une répétition de \scriptstyle n expériences :

p_k = \mathbb{P}(X = k)= {n \choose k} \, p^k (1-p)^{n-k}

Cette formule fait intervenir le coefficient binomial \scriptstyle {n\choose k} duquel provient le nom de la loi.

L'importance de cette loi est d'abord historique puisqu'elle peut se simuler facilement par une suite de lancers de pile ou face, par exemple. Le calcul de sa fonction de masse devient rapidement fastidieux lorsque \scriptstyle n est grand, il est alors possible d'utiliser des approximation par d'autres lois de probabilité telles que la loi de Poisson ou la loi normale et d'utiliser des tables de valeurs. Lorsque \scriptstyle n tend vers \scriptstyle +\infty, des théorèmes de convergence s'appliquent, c'est le cas du théorème de de Moivre-Laplace, historiquement précurseur. Ces théorèmes sont la base de nombreuses applications, notamment les tests statistiques.

Historique[modifier | modifier le code]

planche de Galton
La planche de Galton : les empilements de billes rouges correspondent à la fonction de masse de la loi binomiale, la courbe bleue correspond à la densité de la loi normale.

La loi binomiale fait partie des plus anciennes lois de probabilités étudiées[1]. Elle a été découverte par Jacques Bernoulli qui y fait référence en 1713 dans son ouvrage Ars Conjectandi. Entre 1708 et 1718, la loi multinomiale (généralisation multi-dimensionnelle de la loi binomiale), la loi binomiale négative ainsi que l'approximation de la loi binomiale par la loi de Poisson, la loi des grands nombres pour la loi binomiale et une approximation de la queue de la loi binomiale sont découvertes[2].

Grâce à l'expression de sa fonction de masse, la loi binomiale a été utilisée par plusieurs scientifiques pour étudier des phénomènes. C'est le cas d'Abraham de Moivre[a 1] qui réussit à trouver une approximation de la loi binomiale par la loi normale, il publie d'abord ses résultats en 1733 en latin[3] : Approximatio ad Summam Terminorum Binomii \scriptstyle(a+b)^n in Seriem expansi, puis les traduit pour les publier en 1756 dans Doctrine of Chances. En 1812, Pierre-Simon de Laplace reprend ces travaux. Francis Galton crée la planche de Galton qui permet d'avoir une représentation physique de cette convergence[a 1]. En 1909, Émile Borel énonce et prouve, dans le cas de la loi binomiale, la première version de la loi forte des grands nombres[4].

Plus récemment, en 1914, McKendrick a démontré que la loi binomiale est la solution d'un processus simple de naissance et d'émigration[5]. D'après les travaux de William Feller en 1957, la loi peut aussi être vue comme la loi stationnaire pour le modèle des urnes d'Ehrenfest. Cette même année, Haight montre que la loi binomiale est liée à un problème de file d'attente[5].

La loi binomiale apparaît dans de nombreuses applications au XXe siècle[6] : en génétique, en biologie animale, en écologie végétale, pour les tests statistiques, dans différents modèles physiques tels que des réseaux téléphoniques[7] ou le modèle des urnes d'Ehrenfest, etc.

Le nom binomiale de cette loi provient[8],[a 1] de l'écriture de sa fonction de masse (voir ci-dessous) qui contient un coefficient binomial issu du développement du binôme : \scriptstyle (p+q)^n.

Définition intuitive[modifier | modifier le code]

La loi de Bernoulli décrit le comportement d'un évènement aléatoire qui possède deux résultats possibles. Ces deux résultats sont traditionnellement appelés succès et échec[9]. Une telle expérience s'appelle une épreuve de Bernoulli. Par exemple, lors d'un lancer de pile ou face, on peut considérer qu'obtenir face est un succès et obtenir pile est un échec. Dans ce modèle, la probabilité de succès est une valeur fixe, c'est-à-dire qui reste constante à chaque renouvellement de l'expérience aléatoire.

On considère la situation où une telle expérience aléatoire (deux résultats possibles et une probabilité fixe) est répétée un nombre de fois de manière indépendante ; notons n ce nombre de fois. Cette répétition indépendante d'épreuves de Bernoulli s'appelle un schéma de Bernoulli ou simplement des épreuves de Bernoulli[10]. La loi binomiale décrit le nombre de fois où le succès apparaît sur les \scriptstyle n expériences effectuées. Le nombre de succès obtenus étant une valeur aléatoire, la loi binomiale est décrite grâce à la donnée des probabilités que le succès apparaisse précisément \scriptstyle k fois sur les \scriptstyle n essais.

En reprenant l'exemple du pile ou face, si on lance cinq fois la pièce, la loi binomiale décrit les probabilités qu'il y ait 0, 1, 2, 3, 4 ou 5 succès. (Ces probabilités sont détaillées dans les sections suivantes de cet article).

Définition mathématique[modifier | modifier le code]

La loi binomiale est une loi de probabilité discrète[1] à deux paramètres : \scriptstyle n\in \mathbb N^* et \scriptstyle p\in[0,1]. Il est fréquent d'utiliser également le paramètre \scriptstyle q=1-p pour avoir des expressions plus concises. Plusieurs définitions équivalentes se trouvent pour la loi binomiale.

fonctions de masse de la loi binomiale
Diagrammes en bâtons de trois fonctions de masse de lois binomiales. Les paramètres sont \scriptstyle n=20 et \scriptstyle p=0,1 (en bleu), \scriptstyle p=0,5 (en vert) et \scriptstyle p=0,8 (en rouge).

Définition 1[11],[9] — La loi binomiale, de paramètres \scriptstyle n et \scriptstyle p, est la loi de probabilité d'une variable aléatoire \scriptstyle X égale au nombre de succès rencontrés au cours d'une répétition de \scriptstyle n épreuves de Bernoulli, \scriptstyle p étant la probabilité de succès d'une épreuve de Bernoulli.

Définition 2[12] — La loi binomiale, de paramètres \scriptstyle n et \scriptstyle p, est la loi de probabilité d'une variable aléatoire \scriptstyle X telle que :

X=Y_1+Y_2+\dots +Y_n,

\scriptstyle Y_1,Y_2,\dots ,Y_n, sont des variables aléatoires indépendantes de loi de Bernoulli de même paramètre \scriptstyle p.

Définition 3[1] — La loi binomiale, de paramètres \scriptstyle n et \scriptstyle p, est la loi de probabilité discrète d'une variable aléatoire \scriptstyle X dont la fonction de masse est donnée par :

p_k=\mathbb P(X=k)={n\choose k}p^kq^{n-k} pour \scriptstyle k=0,1,\dots ,n.

La fonction de masse donnée dans la définition 3 a bien un sens puisque la formule du binôme de Newton donne[13] : \scriptstyle \sum_{k=0}^n p_k=\sum_{k=0}^n{n\choose k}p^kq^{n-k}=(p+1-p)^n=1. La définition 2 est l'écriture mathématique de la définition 1[8].

La définition 3 est équivalente des deux autres : on calcule explicitement la probabilité que \scriptstyle k succès apparaissent dans \scriptstyle n essais. Puisque les \scriptstyle n répétitions sont indépendantes, la probabilité d'obtenir \scriptstyle k succès et donc \scriptstyle n-k échecs est : \scriptstyle p^k(1-p)^{n-k}, dans le cas où on ne tient pas compte de la place des résultats[12],[14]. Il suffit alors de s'intéresser à la place des \scriptstyle k succès et \scriptstyle n-k échecs. C'est-à-dire, combien y a-t-il de manière de placer \scriptstyle k succès parmi \scriptstyle n résultats (sans s'occuper de l'ordre entre les succès) ? C'est le nombre de combinaisons de \scriptstyle k éléments parmi \scriptstyle n éléments[15] donné par le coefficient binomial : \scriptstyle {n\choose k}. On retrouve alors la fonction de masse de la définition 3.

Notation

Un variable aléatoire \scriptstyle X qui suit une loi binomiale de paramètres \scriptstyle n et \scriptstyle p est notée[1],[12] : \scriptstyle X\sim b(n,p) ; \scriptstyle X\sim B(n,p) ou \scriptstyle X\sim Bi(n,p).

Mesure de probabilité

Puisque la loi binomiale \scriptstyle b(n,p) est une loi discrète, il est possible de la définir grâce à sa mesure de probabilité[16] :

\mathbb P = \sum_{k=0}^n {n\choose k}p^kq^{n-k}\delta_k , où \scriptstyle \delta_k est la mesure de Dirac au point \scriptstyle k.

Représentation sous la forme d'un arbre[modifier | modifier le code]

Article détaillé : Arbre de probabilité.
Représentation de la loi binomiale sous forme d'un arbre.

Puisque la loi binomiale est une suite d'épreuves de Bernoulli, il est possible de la représenter grâce à un arbre de probabilité : chaque nœud représente une épreuve de Bernoulli, les succès et échecs sont représentés par une branche gauche et une branche droite. Le graphique est donc un arbre binaire équilibré. Un arbre contenant \scriptstyle n générations correspond à une loi binomiale \scriptstyle b(n,p).

Si on indique les résultats de chaque épreuve de Bernoulli sur les arêtes de l'arbre, il est possible de visualiser les différentes issues de la loi binomiale[17]. Si ce sont les valeurs des probabilités qui sont indiquées sur les arêtes, il est possible de récupérer les probabilités de la loi binomiale[18] (voir le graphique ci-contre).

Le graphique est un arbre de probabilité pour lune loi binomiale de paramètre \scriptstyle n = 3. Sur chaque branche, sont indiquées sont les probabilités des différentes issues. Au bout des branches de l'arbre, apparaissent les probabilités de chaque issue de la loi binomiale \scriptstyle b(3,p). C'est-à-dire pour les valeurs \scriptstyle k=0, 1, 2 ou \scriptstyle 3, on obtient \scriptstyle \mathbb P(X=0)=q^3, \scriptstyle \mathbb P(X=1)=3pq^2, \scriptstyle \mathbb P(X=2)=3qp^2 et \scriptstyle \mathbb P(X=3)=p^3. On retrouve les différents coefficients binomiaux : \scriptstyle {3 \choose 0} = 1 \text{ ; } {3 \choose 1} = 3 \text{ ; } {3 \choose 2} = 3 \text{ ; } {3 \choose 3} = 1 \text{.}

Propriétés[modifier | modifier le code]

Moments[modifier | modifier le code]

Les moments suivants sont les moments d'une variable aléatoire \scriptstyle X de loi binomiale[19],[20] \scriptstyle b(n,p) :

\scriptstyle \mu'_1=\mathbb E(X)= \scriptstyle np (espérance)
\scriptstyle \mu'_2=\mathbb E(X^2)= \scriptstyle np+n(n-1)p^2
\scriptstyle \mu'_3=\mathbb E(X^3)= \scriptstyle np+3n(n-1)p^2+n(n-1)(n-2)p^3
\scriptstyle \mu'_r=\mathbb E(X^r)= \scriptstyle \frac{n!}{(n-r)!}\sum_{k=0}^r p^kS(r,k)

La formule suivante est une formule de récurrence qui permet obtenir les moments : \mu'_{r+1}=pq\left(\frac{n}{q}\mu'_r+\frac{d\mu'_r}{dp}\right).

Les moments inverses, c'est-à-dire \scriptstyle \mathbb E( X^{-r}) avec \scriptstyle r\in \mathbb N^*, sont infinis[21].

Moments centrés

Les moments centrés sont les moments de la différence entre la variable et sa moyenne[20].

\scriptstyle \mu_2 = Var(X) = \mathbb E\left((X-np)^2\right)= \scriptstyle npq \;  ; (variance)
\scriptstyle \mu_3 = \mathbb E\left((X-np)^3\right)= \scriptstyle np(1-p)(1-2p)=npq(q-p)
\scriptstyle \mu_{r}=\mathbb E(X^r)= \scriptstyle npq\sum_{k=0}^{r-2}{r-1\choose k}\mu_k - p\sum_{k=0}^{r-2}{r-1\choose k}\mu_{k+1}

L'expression de variance donne l'écart type[22] : \scriptstyle\sigma_{X} = \sqrt{np(1-p)}.

En 1923, Romanovsky donne une formule de récurrence pour obtenir les moments centrés : \mu_{r+1}=pq\left(nr\mu_{r-1}+\frac{d\mu_r}{dp}\right).

Déviation moyenne

La déviation moyenne est la moyenne de l'écart à la moyenne, elle est donnée par[21] :  \mathbb E(|X-np|)=2n{n-1\choose [np]} p^{[np]+1}q^{n-[np]} , où \scriptstyle [np] est la partie entière de \scriptstyle np. Des ordres plus élevés ont été étudiés en 1960 par Katti.

Fréquence de succès

Grâce aux formules précédentes, on obtient les moments de la fréquence de succès[22] : \scriptstyle \frac{X}{n} :

moment d'ordre 1 (ou espérance) de la fréquence de succès \scriptstyle \mathbb E\left(\frac{X}{n}\right)= \scriptstyle p
moment centré d'ordre 2 (ou variance) de la fréquence de succès \scriptstyle \mathbb E\left((\frac{X}{n}-p)^2\right)= \scriptstyle \frac{p(1-p)}{n}=\frac{pq}{n}
moment centré d'ordre 4 de la fréquence de succès \scriptstyle \mathbb E\left((\frac{X}{n}-p)^4\right)= \scriptstyle \frac{pq(1-6pq)}{n^3}+3\frac{p^2q^2}{n^2}

L'expression de la variance de la fréquence donne l'écart type de la fréquence de succès : \scriptstyle\sigma_{X/n} =\sqrt{\frac{p(1-p)}{n}}=\frac{\sqrt{pq}}{\sqrt{n}},

Covariance

On considère deux variables aléatoires \scriptstyle X_1 et \scriptstyle X_2, pas forcément indépendantes, de lois binomiales respectives \scriptstyle b(n,p_1) et \scriptstyle b(n,p_2). La covariance permet d'évaluer la dépendance entre les deux variables :

 Cov(X_1,X_2)= n\mathbb P(X_1=1 \text{ et }X_2=1) -np_1p_2.

Propriétés et caractérisations[modifier | modifier le code]

Valeurs descriptives de la loi
  • Le coefficient d'asymétrie d'une loi binomiale \scriptstyle b(n,p) est [23] : \scriptstyle\gamma = \frac{q-p}{\sqrt{npq}}. L'asymétrie de la loi binomiale \scriptstyle b(n,p) est positive[24] si \scriptstyle p<1/2 et négative si \scriptstyle p>1/2. La loi est symétrique si et seulement si \scriptstyle p=1/2.
  • La médiane de la loi binomiale est m=\scriptstyle [np] ou m=\scriptstyle [np]+1, \scriptstyle [.] étant la partie entière. Ces valeurs s'obtiennent grâce à la formule[a 2] : \scriptstyle |m-np|<\ln(2) (cette borne étant optimale).
  • Le mode de la loi binomiale \scriptstyle b(n,p) est la valeur \scriptstyle [(n+1)p], elle est la valeur de plus grande probabilité.

A noter que si \scriptstyle np est un entier, alors le mode, la moyenne et la médiane sont égales entre elles à la valeur \scriptstyle np.

Propriétés de stabilité
  • Si \scriptstyle X suit une loi binomiale \scriptstyle b(n,p), alors[12] \scriptstyle  Y=n-X suit une loi \scriptstyle b(n,1-p). Cette symétrie donne les relations suivantes pour la fonction de répartition et pour la fonction de masse[25],[26] : \scriptstyle \mathbb P(X\leq k)=\mathbb P(Y\geq n-k) et \scriptstyle \mathbb P(X = k)=\mathbb P(Y = n-k).
  • Si les variables aléatoires \scriptstyle X_1 et \scriptstyle X_2 sont de lois binomiales respectives \scriptstyle b(n_1,p) et \scriptstyle b(n_2,p), alors la variable aléatoire \scriptstyle X_1+X_2 est de loi binomiale \scriptstyle b(n_1+n_2,p). Cette propriété peut s'obtenir grâce à l'expression des fonctions caractéristiques ou grâce à l'écriture sous forme de somme de variables de Bernoulli[27].
Inégalités
\mathbb P\left( \left| \frac{X}{n}-p  \right|>x \right) \leq \frac{p(1-p)}{nx^2}
  • L'inégalité de Hoeffding pour une variable aléatoire \scriptstyle X de loi \scriptstyle b(n,p) est plus précise que l'inégalité de Bienaymé-Tchebychev lorsque \scriptstyle x est grand, elle s'écrit[28] :
\mathbb P\left( \left| \frac{X}{n}-p  \right|>x \right) \leq 2e^{-2nx^2}.
  • L'inégalité de Kolmogorov s'écrit pour une somme de variables aléatoires indépendantes. Pour des variables aléatoires indépendantes \scriptstyle X_1,X_2,\dots,X_n de loi de Bernoulli, la somme \scriptstyle Y_k=\sum_{i=1}^k X_i-kn suit une loi binomiale \scriptstyle b(k,p) recentrée, l'inegalité s'écrit alors[29] :
\mathbb P\left( \sup\left( \left| Y_k\right|\, ; \, k=1,\dots,n \right)  >\varepsilon \right) \leq \frac{np(1-p)}{\varepsilon^2}
Caractérisations

Fonction de répartition[modifier | modifier le code]

Graphique de 3 fonctions de répartition de lois binomiales avec paramètres : \scriptstyle n=20 et \scriptstyle p=0.1 (en bleu), \scriptstyle p=0.5 (en vert) et \scriptstyle p=0.8 (en rouge).

La fonction de répartition d'une variable aléatoire \scriptstyle X suivant la loi binomiale \scriptstyle b(n,p) est donnée par[19] :

 F(x)=\mathbb P(X\leq x) = \begin{cases} 1 & si\; x\geq n\\ \displaystyle \sum_{k=0}^{[x]}{n\choose k} p^k(1-p)^{n-k}  & si\; 0\leq x < n\\ 0 & si \; x< 0 \end{cases}

\scriptstyle [x] est la partie entière de \scriptstyle x.

Même s'il existe une expression de la fonction de répartition, son calcul n'est pas facile[31] dû aux coefficients binomiaux \scriptstyle {n\choose k}, notamment lorsque \scriptstyle n est grand. Il existe alors des tables de valeurs (voir ci-dessous). Des théorèmes d'approximation ont été développés[31] pour approcher de manière théorique et calculatoire cette fonction de répartition (voir ci-dessous). L'expression suivante provient du lien entre la loi binomiale et la loi bêta[19] (voir ci-dessous) : pour \scriptstyle 0\leq x < n

 F(x)= \frac{1}{B\left( [x]+1,n-[x] \right)} \int_p^1 t^{[x]} (1-t)^{n-[x]-1} dt

\scriptstyle B est la fonction bêta. il est alors possible d'écrire la fonction de répartition grâce à la fonction bêta incomplète[32] :

 F(x)= I_{1-p}(n-[ x ], 1+[ x]).

Fonctions caractéristique et génératrice[modifier | modifier le code]

La fonction caractéristique d'une variable aléatoire \scriptstyle X suivant la loi binomiale \scriptstyle b(n,p) est donnée par[22] :

\phi(t)=\mathbb E\left(e^{itX}\right)=\left(q+pe^{it}\right)^n.

La fonction génératrice des moments d'une variable aléatoire \scriptstyle X suivant la loi binomiale \scriptstyle b(n,p) est donnée par[19] :

M(t)=\mathbb E\left(e^{tX}\right)=\left(q+pe^t\right)^n.

On déduit directement la fonction génératrice des cumulants[5] :

\ln(M(t))=n\ln\left(q+pe^t\right),

et la fonction génératrice des cumulants factoriels[5] :

\ln\left(\mathbb E(t^X)\right)=n\ln\left(q+pt\right).

Lien avec d'autres lois[modifier | modifier le code]

Loi de Bernoulli

Rappelons que la loi binomiale de paramètres \scriptstyle n\in \mathbb N^* et \scriptstyle p\in [0,1] est la loi de la somme de \scriptstyle n variables aléatoires indépendantes de loi de Bernoulli de même paramètre \scriptstyle p.

Ainsi, la loi binomiale \scriptstyle b(1,p) est une loi de Bernoulli de paramètre \scriptstyle p.

C'est par cette représentation de nombre de succès et d'échecs dans une suite d'épreuves que la loi binomiale est source de nombreuses applications.

Lois réciproques

Les lois suivantes ont un lien avec la loi binomiale grâce à leur fonctions de répartition. Lorsque le nombre de succès \scriptstyle k est fixé, elles donnent la loi du nombre d'épreuves nécessaires (loi binomiale négative) ou la loi du paramètre \scriptstyle p (lois bêta ou de Fisher). En ce sens, elles peuvent servir de lois réciproques.

  • La loi binomiale \scriptstyle b(n,p) donne le nombre de succès dans une succession de \scriptstyle n épreuves indépendantes. La loi binomiale négative, ou loi de Pascal, \scriptstyle Pa(k,p) est le nombre d'épreuves nécessaires pour obtenir \scriptstyle k succès[33]. le terme négatif provient de l'écriture de la fonction de masse qui contient un coefficient binomial avec un terme négatif[a 3].
De plus, si \scriptstyle X suit une loi \scriptstyle Pa(k,p) et si \scriptstyle Y suit une loi \scriptstyle b(n+k,p) alors[34],[35], pour \scriptstyle k entre 0 et \scriptstyle n  :
\mathbb P(Y\leq k)= 1-I_p(k,n+1) = \mathbb P(X\geq n) , où \scriptstyle I_p est la fonction bêta incomplète. Autrement dit : la probabilité qu'il faille moins de \scriptstyle n épreuves pour avoir \scriptstyle k succès est égale à la probabilité qu'il y ait au moins \scriptstyle k succès en \scriptstyle n+k épreuves.
\mathbb P(Y\leq k)= 1-I_p(k+1,n-k) = \mathbb P(X \geq p)\scriptstyle X suit une loi bêta de paramètres \scriptstyle k+1,n-k et \scriptstyle Y suit une loi binomiale \scriptstyle b(n,p).
  • La loi binomiale est liée à la loi de Fisher par la propriété suivante[a 3],[36]: si Y suit une loi binomiale \scriptstyle b(n,p) alors, pour \scriptstyle k entre 0 et \scriptstyle n  :
\mathbb P(Y \le k) = \mathbb P(F> \frac{\nu_2}{\nu_1}\cdot\frac{p}{1-p})\scriptstyle F suit une loi de Fischer de paramètres \nu_1=2(k+1)\, , \, \nu_2=2(n-k).
La relation précédente permet de trouver les quantiles de la loi binomiale[36].
Autres lois
  • La loi binomiale(doublement) tronquée de paramètres \scriptstyle n,p,r_1 et \scriptstyle r_2 est la loi binomiale \scriptstyle b(n,p) avec \scriptstyle r_1<n-r_2 telle que les valeurs dans \scriptstyle [0,r_1[ et dans \scriptstyle ]n-r_2,n] sont enlevées[37]. La fonction de masse de cette loi est donnée par l'expression : pour \scriptstyle k=r_1,\dots n-r_2
\mathbb P(X=k)={n\choose k}p^kq^{n-k}/\sum_{i=r_1}^{n-r_2} {n\choose i}p^iq^{n-i}.
De la même manière il est possible de définir la loi binomiale (simplement) tronquée[37] en omettant uniquement les valeurs entre 0 et \scriptstyle r_1 ou entre \scriptstyle n-r_2 et \scriptstyle n.
  • La loi binomiale positive ou loi binomiale tronquée en 0 est la loi binomiale \scriptstyle b(n,p) dont on retire la valeur 0. Sa fonction de masse est : \scriptstyle \mathbb P(X=k)={n\choose k}\frac{p^kq^{n-k}}{1-q^n}. De la même manière il est possible de définir la loi binomiale négative.
  • La loi multinomiale est la généralisation multi-dimensionnelle de la loi binomiale[19] dans le sens où la loi multinomiale modélise une succession d'épreuves dont chacune possède plusieurs issues, pas uniquement succès ou échec. Cette loi multidimensionnelle donne les probabilités du nombre d'apparition des différentes issues dans une succession d'épreuves indépendantes[a 3].
  • La fonction de masse de la loi hypergéométrique de paramètres \scriptstyle A,p=1-q,n est donnée par : p_k=\frac{{k\choose pA}{n-A\choose qA}}{{n\choose A}}. Elle correspond au nombre tirages gagnants dans une expérience de \scriptstyle n tirages simultanés dans une urne contenant \scriptstyle A boules et une proportion de \scriptstyle p boules gagnantes.
Si le nombre de boules augmente, c'est-à-dire \scriptstyle A tend vers l'infini, et si \scriptstyle p/A tend vers une valeur \scriptstyle p'\in [0,1], alors la loi hypergéométrique converge vers une loi binomiale[38] \scriptstyle b(n,p').
Autrement dit, si la taille de la population (\scriptstyle A) est grande par rapport à la taille de l'échantillon (\scriptstyle n), alors les tirages peuvent être convenablement représentés par une loi binomiale de paramètre \scriptstyle p' égal au pourcentage (\scriptstyle p) d'éléments ayant la caractère étudié.
De plus, si \scriptstyle X_1 et \scriptstyle X_2 sont deux variables aléatoires indépendantes de loi binomiale respectives \scriptstyle b(n_1,p) et \scriptstyle b(n_2,p), alors la loi de \scriptstyle X_1 sachant que \scriptstyle X_1+X_2=k est la loi hypergéométrique de paramètres[27] : \scriptstyle k, \frac{n_1}{n_1+n_2} et \scriptstyle n_1+n_2.

Convergences et approximations[modifier | modifier le code]

Pour de grandes valeurs de \scriptstyle n, le calcul des fonctions de masse et de répartition deviennent vite fastidieux. Une méthode est d'approcher ces valeurs grâce aux théorèmes limites. La loi (faible ou forte) des grands nombres permet d'approcher la moyenne de la loi binomiale. Pour obtenir des valeurs approchées de la fonction de répartition, il est possible d'utiliser l'approximation normale ou l'approximation par la loi de Poisson. L'approximation normale est plus performante lorsque le paramètre \scriptstyle p n'est pas trop proche de 0 ou de 1, sinon l'approximation par la loi de Poisson donne de meilleurs résultats[39].

Loi des grands nombres[modifier | modifier le code]

Article détaillé : loi des grands nombres.

La loi des grands nombres, faible ou forte s'applique à la loi binomiale en tant que somme de variables aléatoires indépendantes de loi de Bernoulli. Pour une variable \scriptstyle X_n de loi binomiale \scriptstyle b(n,p) alors[29] :

\lim_{n\rightarrow +\infty} \mathbb P\left( |\frac{X_n}{n}-p|<\varepsilon\right)=1, pour tout \scriptstyle \varepsilon>0.

Ce théorème appliqué à la loi binomiale peut s'utiliser dans le cas particulier du théorème de Bernoulli. Considérons une situation d'une expérience aléatoire dans laquelle on compte le nombre d'issues ayant une propriété. Notons \scriptstyle A l'ensemble de toutes les issues ayant cette propriété et \scriptstyle \#A le nombre de succès dans l'expérience de \scriptstyle n répétitions. Si la probabilité théorique de l'évènement \scriptstyle A est \scriptstyle p(A), alors \scriptstyle \#A suit une loi binomiale \scriptstyle b\left(np(A),np(A)(1-p(A))\right). La loi des grands nombres annonce[29] :

\lim_{n\rightarrow +\infty} \mathbb P\left( |\frac{\#A}{n}-p(A)|<\varepsilon\right)=1, pour tout \scriptstyle \varepsilon>0.

Convergence vers la loi de Poisson[modifier | modifier le code]

Convergence

Considérons une loi binomiale \scriptstyle b(n,p) telle que les paramètres \scriptstyle n et \scriptstyle p sont liés par la formule : \scriptstyle np=\lambda>0\scriptstyle \lambda est fixé. Lorsque \scriptstyle n tend vers l'infini, et donc \scriptstyle p tend vers 0, alors[40] : \scriptstyle \lim_{n\rightarrow +\infty} {n\choose k}p^kq^{n-k} = e^{-\lambda}\frac{\lambda^k}{k!}. Autrement dit la probabilité qu'une variable de loi binomiale prenne la valeur \scriptstyle k converge (lorsque \scriptstyle n devient grand) vers la probabilité qu'une variable de loi de Poisson prenne la valeur \scriptstyle k. Le paramètre \scriptstyle p converge alors vers 0, il correspond donc à un évènement de probabilité très faible, la loi de Poisson est alors appelée loi des évènements rares[40]. Par sommation, on obtient alors le résultat[41] :

\lim_{n\rightarrow +\infty}\mathbb P(X\leq x)=\lim_{n\rightarrow +\infty}\sum_{k=0}^{[x]} {n\choose k}p^kq^{n-k} =  e^{-\lambda}\sum_{k=0}^{[x]}\frac{\lambda^k}{k!}=\mathbb P(Y\leq x)

\scriptstyle [\cdot] est la partie entière, \scriptstyle X est une variable de loi binomiale et \scriptstyle Y de loi de Poisson \scriptstyle \mathcal P(\lambda). Cette limite montre la convergence en loi de la loi binomiale (avec les conditions précédentes) vers la loi de Poisson. Une expression plus détaillée de la convergence peut être donnée par la formule[42],[19] : \scriptstyle \mathbb P(X\leq x) = e^{-\lambda}\sum_{k=0}^{[x]}\frac{\lambda^k}{k!}+\mathcal O(\frac{1}{n^2}) avec \scriptstyle \lambda = \frac{(2n-[x])p}{2-p} lorsque \scriptstyle n tend vers l'infini et \scriptstyle \mathcal O(\cdot) est le comparateur asymptotique.

Fonctions de masse d'une loi binomiale \scriptstyle b(24\,;\,0,5) (en violet), \scriptstyle b(60\,;\,0,2) (en rouge) et d'une loi de poisson \scriptstyle \mathcal P(12) (en bleu).

En 1953, Iouri Prokhorov donne une majoration de l'erreur totale d'approximation entre la fonction de répartition d'une loi binomiale \scriptstyle b(n,p) et une loi de Poisson \scriptstyle \mathcal P(np)[43] : \scriptstyle  \sum_{k=0}^{+\infty}\left|{n\choose k}p^kq^{n-k}-\frac{e^{-np}(np)^k}{k!}\right| \leq \min (2np^2,3p) . Il est également possible de borner le ratio entre les deux fonctions de répartition[43] : \scriptstyle e^{np}\left(1-\frac{k}{n}\right)^k q^n  \leq  \frac{{n\choose k}p^kq^{n-k}}{e^{-np}(np)^k/k!} \leq e^{np} q^{n-k}.

Approximation

Grâce à la convergence ci-dessus, il est possible d'approcher les probabilités de la loi binomiale par la loi de Poisson. En pratique, le cas s'applique lorsque \scriptstyle n est grand et donc \scriptstyle p petit. Différentes valeurs sont proposées[42],[40],[44],[45] :

  • \scriptstyle p<0,4, lorsque \scriptstyle n=3 (ce qui fait \scriptstyle np<1,2),
  • \scriptstyle p<0,3, lorsque \scriptstyle n=30 (ce qui fait \scriptstyle np<9),
  • \scriptstyle p<0,2, lorsque \scriptstyle n=300 (ce qui fait \scriptstyle np<60),
  • \scriptstyle 0<np<10,
  • \scriptstyle p<0,1, lorsque \scriptstyle n\geq 30,
  • \scriptstyle np\leq 10 et \scriptstyle n\geq 1500 p.

L'idée commune de toutes ces propositions est d'avoir la valeur \scriptstyle np stable lorsque \scriptstyle n est grand et \scriptstyle p petit.

Convergence vers la loi normale[modifier | modifier le code]

Article détaillé : Théorème de de Moivre-Laplace.
convergence de la loi binomiale
Illustration de la convergence de la fonction de masse de la loi binomiale vers la loi normale lorsque \scriptstyle n grandit.
Convergence

Le théorème de de Moivre-Laplace, énoncé en 1733, montre qu'une variable aléatoire de loi binomiale, convenablement renormalisée, converge en loi vers une variable aléatoire de loi normale. Ce résultat peut s'énoncer grâce aux fonctions de répartition des deux lois. Considérons variable aléatoire \scriptstyle X de loi binomiale \scriptstyle b(n,p), la variable aléatoire \scriptstyle X renormalisée est la variable aléatoire centrée et réduite, c'est-à-dire : \scriptstyle \frac{X-\mathbb E(X)}{\sigma_X}=\frac{X-np}{\sqrt{npq}}. Si on note \scriptstyle \Phi la fonction de répartition de la loi normale, alors :

Théorème de de Moivre-Laplace : pour tout \scriptstyle x\in \mathbb R , \lim_{n\to+\infty}\mathbb{P} \left( \frac{X- np}{\sqrt{npq}}\leq x \right) =\frac{1}{\sqrt{2\pi}}\int_{-\infty}^x e^{-\frac{t^2}{2}}dt = \Phi(x).

Bien qu'Abraham de Moivre n'ait énoncé ce résultat que dans le cas d'une loi binomiale[46], cette convergence est généralisée dans le cas d'autres lois, c'est le théorème central limite. Dans cette convergence permet d'approcher une loi discrète par une loi continue, il est alors utile d'ajouter un coefficient, dit correction de continuité, afin d'améliorer les approximations futures (voir ci-dessous), la convergence précédente peut alors s'écrire sous forme d'équivalence lorsque \scriptstyle n tend vers l'infini[47] : pour tout \scriptstyle a,b\in \mathbb R

\mathbb P\left( a \leq X \leq b\right) \approx \mathbb P\left( \frac{a-\frac{1}{2}-np}{\sqrt{npq}} \leq \frac{X-np}{\sqrt{npq}}\leq \frac{b+\frac{1}{2}-np}{\sqrt{npq}} \right) \operatorname{\sim}_{n\rightarrow +\infty} \Phi\left(\frac{b+\frac{1}{2}-np}{\sqrt{npq}}\right) - \Phi\left(\frac{a-\frac{1}{2}-np}{\sqrt{npq}}\right).

L'erreur commise par l'approximation est estimée par l'inégalité de Berry-Esseen dont la constante est régulièrement améliorée, elle fournit une borne de la différence entre les deux fonctions de répartition lorsque \scriptstyle n est grand[48],[a 4], pour \scriptstyle X une variable aléatoire de loi binomiale \scriptstyle b(n,p) et \scriptstyle Y de loi normale \scriptstyle \mathcal N(0,1) de fonction de répartition notée \scriptstyle \Phi : \scriptstyle \sup_{x\in \mathbb R}\left| \mathbb P\left( \frac{X-np}{\sqrt{npq}}\leq x \right) - \Phi(x) \right| \leq \frac{0,4748}{\sqrt{npq}}. Une expression plus détaillée de la convergence peut être donnée par la formule avec correction de continuité[19] : \scriptstyle \mathbb P(X\leq x) = \Phi\left( \frac{x-np+1/2}{\sqrt{npq}} \right)+\mathcal O(\frac{1}{\sqrt{n}}) uniformément pour toute variable \scriptstyle x, lorsque \scriptstyle n tend vers l'infini et où \scriptstyle \mathcal O(\cdot) est le comparateur asymptotique. D'autres approximations plus fines ont été étudiées[49], par exemple par Pierre-Simon de Laplace (1820), Iouri Prokhorov (1953) ou Peizer et Pratt (1968).

Approximation

Grâce aux théorèmes de convergence ci-dessus, lorsque \scriptstyle n est grand, les probabilités de la binomiale renormalisée peuvent être approchées par les valeurs des probabilités de la loi normale. il existe plusieurs règles sur les paramètres \scriptstyle n et \scriptstyle p pour que l'approximation soit valable[50],[45] :

  • \scriptstyle npq>9,
  • \scriptstyle np>9 et \scriptstyle p<1/2.

L'influence de ces paramètres sur l'approximation a été finement étudiée dans les années 1990, par exemple[50] : pour \scriptstyle n fixé, l'erreur absolue minimale est atteinte pour \scriptstyle p=1/2 ; l'erreur absolue est inférieure à \scriptstyle 0,0212/\sqrt{npq}.

Tables de la loi binomiale[modifier | modifier le code]

Des tables de la fonction de masse et de la fonction de répartition de la loi binomiale ont été publiée en 1950 par le National Bureau of Standards puis en 1955 dans National of the Computation Laboratory et par Rao et al. en 1985[51].

Grâce aux relations de symétrie (voir ci-dessus), il suffit[25],[26] de donner des tables de valeurs pour \scriptstyle p\leq 0.5.

Valeurs de la fonction de masse[modifier | modifier le code]

Les tables de valeurs suivantes[44] donnent les valeurs de la fonction de masse de la loi binomiale \scriptstyle b(n,p) pour différentes valeurs de \scriptstyle n.

Exemples : Si \scriptstyle X suit une loi \scriptstyle b(10\,;\,0,15), alors \scriptstyle \mathbb P(X=4)\simeq 0,0401. Si \scriptstyle Y suit une loi \scriptstyle b(10\,;\,0,85), alors \scriptstyle \mathbb P(Y=4)=\mathbb P(X=6)\simeq 0,0012.


Valeurs de la fonction de répartition[modifier | modifier le code]

Les tables de valeurs suivantes[52] donnent les valeurs de la fonctions de répartition de la loi binomiale \scriptstyle b(n,p) pour différentes valeurs de \scriptstyle n.

Exemples : Si \scriptstyle X suit une loi \scriptstyle b(10\,;\,0,15), alors \scriptstyle \mathbb P(X\leq 4)\simeq 0,9901. Si \scriptstyle Y suit une loi \scriptstyle b(10\,;\,0,85), alors \scriptstyle \mathbb P(Y\leq 4)=\mathbb P(X\geq 6)=1-\mathbb P(X\leq 5)\simeq 1-0,9986=0,0014.

Tests et applications[modifier | modifier le code]

Tests[modifier | modifier le code]

D'une manière générale, un test statistique permet de rejeter, ou non, une hypothèse dite hypothèse nulle. L'idée principale est de prendre un échantillon et de vérifier si l'hypothèse est vraie pour chaque élément de l'échantillon. Si on considère que les éléments sont indépendants, on compte donc le nombre d'éléments vérifiant une propriété, il y a donc présence de la loi binomiale. On compare si la proportion observée est significativement éloignée de la probabilité théorique de la loi binomiale[53]. Ce test est appelé un test binomial. Il est à noter que l'on peut utiliser aussi la loi normale lorsque la taille de l'échantillon est grand.

Il est possible d'effectuer un test statistique sur la conformité des valeurs des paramètres d'une loi de probabilité, notamment d'une loi binomiale, par rapport aux paramètres théoriques attendus pour la population étudiée[54]. Le test de conformité de l'indice de dispersion s'applique dans ce cas[55]. Cet indice de dispersion est le quotient de la somme des carrés des écarts et de la moyenne. Si \scriptstyle x_k,\,k=1,\dots,n sont les valeurs étudiées de moyenne notée \scriptstyle \bar{x} alors l'indice est : \scriptstyle \frac{1}{\bar{x}} \sum_{k=1}^n(x_k-\bar{x})^2. Grâce à uneLoi du χ² ou une loi normale, le test rejette l'hypothèse de la valeur que prend le paramètre \scriptstyle p de la loi binomiale[55].

Il est également possible de tester l'égalité de deux variables aléatoires de lois binomiales. Soient \scriptstyle X_1 et \scriptstyle X_2 deux variables aléatoires de lois respectives \scriptstyle b(n_1,p_1) et \scriptstyle b(n_2,p_2). On souhaite tester si \scriptstyle p_1=p_2=p, c'est l'hypothèse \scriptstyle H_0 du test. Par le théorème central limite, l'estimateur \scriptstyle \hat{p}_1=X_1/p_1 suit une loi normale \scriptstyle \mathcal N(p_1, p_1(1-p_1)/n_1) lorsque \scriptstyle n_1 est grand. Il en est de même avec \scriptstyle \hat{p}_2. En considérant l'hypothèse \scriptstyle H_0 vraie, on peut montrer que \scriptstyle Z=\frac{\hat{p}_1-\hat{p}_2}{\sqrt{p(1-p)(1/n_1+1/n_2)}} suit une loi normale centrée réduite[56]. On rejette alors l'hypothèse \scriptstyle H_0 au niveau de confiance 0,95 si \scriptstyle |Z|>1,96.

Autres applications[modifier | modifier le code]

Par définition la somme de variables aléatoires indépendantes de loi de Bernoulli suit une loi binomiale. Un exemple typique de phénomène suivant une loi de Bernoulli est le lancer d'une pièce pour un pile ou face[57]. Le nombre de succès, par exemple le nombre de fois où l'on obtient pile, suit donc une loi binomiale. De nombreuses situations peuvent être modélisées par cet exemple ce qui donne son importance à la loi[57].

En génétique, lors de la reproduction, chaque gène est composée de deux allèles qui sont issus des deux parents. Soit les deux allèles proviennent du même parent, soit chaque parent transmet un allèle. Il est alors possible de faire une liste de différents allèles et de noter ces deux cas. Le nombre d'allèles issus du même parent peut être modéliser par une variable aléatoire de loi binomiale[58]. Pour savoir s'il y a égale probabilité d'allèle de même provenance ou de provenance différente, on peut étudier un test statistique[58]. Inversement, pour simuler les allèles d'un individu, il est possible de simuler les fréquences des allèles par des variables aléatoires binomiales[59].

marche aléatoire
Exemple de marche aléatoire (renormalisée). La position de la marche suit une loi binomiale.

En linguistique, la loi binomiale est utilisée pour étudier la richesse du vocabulaire d'un texte[a 5]. C'est un outil quantitatif qui permet de mesurer la fréquence d'un mot dans un texte indépendamment de la longueur du texte. Plus précisément la méthode de Müller permet d'évaluer la richesse théorique du vocabulaire d'un texte grâce au vocabulaire d'un texte plus long, et ainsi comparer avec la richesse du vocabulaire du texte court en question. Techniquement, si \scriptstyle N_a est le nombre de mots d'un texte et \scriptstyle N_b celui d'un autre texte. Alors \scriptstyle p=\frac{N_a}{N_a+N_b} est la probabilité d'apparition d'un mot tiré au hasard dans le premier texte ; de même pour \scriptstyle q=\frac{N_b}{N_a+N_b} dans le deuxième texte[a 6]. Le nombre de mots ayant la même fréquence d'apparition dans le premier texte suit alors une loi binomiale de paramètres \scriptstyle n=N_a+N_b et \scriptstyle p. Il est possible d'effectuer des tests statistiques pour conclure si la richesse du vocabulaire est grande ou non.

En 1908, Émile Borel étudie la fréquence des différents chiffres dans le développement décimal d'un nombre réel. Il considère les \scriptstyle 2n premières valeurs de la décomposition décimale et estime la probabilité d'obtention du nombre de fois où apparaît chaque entier dans cette décomposition grâce à l'approximation par la loi normale. Il démontre ainsi le théorème des nombres normaux[a 7].

Une marche aléatoire sur \scriptstyle \mathbb Z est un processus stochastique \scriptstyle(S_n,n\in \mathbb N^*) à temps entier[60]. C'est-à-dire que la marche part d'une valeur initiale S_0=0 par exemple et à chaque unité de temps, le marcheur se déplace (indépendamment du chemin parcouru avant) d'un pas vers le haut avec une probabilité \scriptstyle p ou d'un pas vers le bas avec une probabilité \scriptstyle 1-p, ainsi \scriptstyle S_1=-1 ou \scriptstyle 1. \scriptstyle S_n donne la position du marcheur au bout d'un temps \scriptstyle n. Si \scriptstyle p=1-p=0,5, la marche est dite symétrique et le marcheur a autant de chance d'aller vers le haut que vers le bas. Dans ce cas, au bout du temps \scriptstyle n, la variable aléatoire \scriptstyle \frac{1}{2}(S_{n}+n) peut prendre comme valeurs \scriptstyle 0,1,\dots,n et elle est de loi binomiale \scriptstyle b(n,0,5). Cette considération ainsi que la convergence vers la loi normale (voir ci-dessus) permet de démontrer qu'une marche aléatoire renormalisée converge vers le mouvement brownien (voir le théorème de Donsker)[61].

Notes et références[modifier | modifier le code]

  1. a, b, c et d Dodge 2007, p. 287
  2. Hald 2005, p. 5
  3. Hald 2005, p. 485
  4. Hazewinkel 1994, p. 438
  5. a, b, c et d Johnson, Kemp et Kotz 2005, p. 109
  6. Johnson, Kemp et Kotz 2005, p. 136
  7. Johnson, Kemp et Kotz 2005, p. 140
  8. a et b Ruegg 1994, p. 39
  9. a et b Gossett 2009, p. 310
  10. Dodge 2007, p. 175
  11. Ruegg 1994, p. 38
  12. a, b, c et d Bogaert 2005, p. 50
  13. Gossett 2009, p. 316
  14. Gossett 2009, p. 311
  15. Bogaert 2005, p. 305
  16. Foata, Fuchs et Ranchi 2012, p. 68
  17. Gossett 2009, p. 274
  18. Ruegg 1994, p. 23
  19. a, b, c, d, e, f et g Hazewinkel 1994, p. 397
  20. a et b Johnson, Kemp et Kotz 2005, p. 110
  21. a et b Johnson, Kemp et Kotz 2005, p. 111
  22. a, b, c et d Courtin 2012, p. 1G17
  23. Bogaert 2005, p. 329
  24. Johnson, Kemp et Kotz 2005, p. 114
  25. a et b Mittag et Rinne 1993, p. 515
  26. a, b et c Mittag et Rinne 1993, p. 105
  27. a et b Johnson, Kemp et Kotz 2005, p. 115
  28. Pfister 2012, p. 104
  29. a, b et c Courtin 2012, p. 1G16
  30. a, b et c Johnson, Kemp et Kotz 2005, p. 135
  31. a et b Johnson, Kemp et Kotz 2005, p. 116
  32. Johnson, Kemp et Kotz 2005, p. 125
  33. Bogaert 2005, p. 54
  34. Johnson, Kemp et Kotz 2005, p. 218
  35. Mittag et Rinne 1993, p. 109
  36. a et b Mittag et Rinne 1993, p. 116
  37. a et b Johnson, Kemp et Kotz 2005, p. 137
  38. Courtin 2012, p. 1G18
  39. Siegmund et Yakir 2007, p. 14
  40. a, b et c Foata, Fuchs et Ranchi 2012, p. 73
  41. Hald 2005, p. 215
  42. a et b Johnson, Kemp et Kotz 2005, p. 121
  43. a et b Johnson, Kemp et Kotz 2005, p. 123
  44. a et b Bogaert 2005, p. 348
  45. a et b Mittag et Rinne 1993, p. 106
  46. Hald 2005, p. 492
  47. Ruegg 1994, p. 93
  48. Hazewinkel 1994, p. 369
  49. Johnson, Kemp et Kotz 2005, p. 118
  50. a et b Johnson, Kemp et Kotz 2005, p. 117
  51. Dodge 2007, p. 288
  52. Bogaert 2005, p. 349
  53. Dagnelie 1998, p. 122
  54. Dagnelie 1998, p. 76
  55. a et b Dagnelie 1998, p. 78
  56. Siegmund et Yakir 2007, p. 17
  57. a et b Lesigne 2005, p. 4ème couv.
  58. a et b Siegmund et Yakir 2007, p. 11
  59. Siegmund et Yakir 2007, p. 240
  60. Pfister 2012, p. 154
  61. Pfister 2012, p. 155
Articles et autres sources
  1. a, b et c Aimé Fuchs, « Plaidoyer pour la loi normale »
  2. (en) Hamza K., « The smallest uniform upper bound on the distance between the mean and the median of the binomial and Poisson distributions », Statist. Probab. Lett., vol. 23,‎ 1995, p. 21-25 (lire en ligne)
  3. a, b, c et d E. Morice, « Quelques modèles mathématiques de durée de vie », Revue de statistique appliquée, t. 14, no 1,‎ 1966 (lire en ligne), p. 68
  4. (en) Korolev Victor et Shevtsova Irina, « An improvement of the Berry–Esseen inequality with applications to Poisson and mixed Poisson random sums », Scandinavian Actuarial Journal, vol. 2,‎ 2012, p. 81-105 (lire en ligne)
  5. Étienne Évrard, « Les mystères des vocables », Revue Informatique et Statistique dans les Sciences humaines XXX - CIPL, vol. XXX, no 1 à 4,‎ 1994, p. 272-274 (lire en ligne)
  6. Étienne Brunet, « Müller le lexicomaître », CIPL,‎ 2009, p. 99-119 (lire en ligne)
  7. Émile Borel, « Les probabilités dénombrables et leurs applications arithmétiques », Rendiconti del Circolo Matematico di Palermo, vol. 27, no 1,‎ décembre 1909, p. 247-271 (ISSN 0009-725X et 1973-4409, DOI 10.1007/BF03019651, lire en ligne)

Voir aussi[modifier | modifier le code]

Bibliographie[modifier | modifier le code]

  • Patrick Bogaert, Probabilités pour scientifiques et ingénieurs : Introduction au calcul des probabilités, De Boeck Supérieur,‎ 2005, 402 p. (ISBN 2-8041-4794-0, lire en ligne)Document utilisé pour la rédaction de l’article
  • Jean-Pierre Courtin, L'homme et les lois de la nature 1, Lulu.com,‎ 2012 (ISBN 978-1-4710-3427-5, lire en ligne)Document utilisé pour la rédaction de l’article
  • Pierre Dagnelie, Statistique théorique et appliquée, vol. 2, De Boeck Supérieur,‎ 1998, 659 p. (ISBN 2-8041-2802-4, lire en ligne)Document utilisé pour la rédaction de l’article
  • Yadolah Dodge, Statistique: Dictionnaire encyclopédique, Springer Science & Business Media,‎ 2007, 662 p. (ISBN 978-2-10-05810-23, lire en ligne)Document utilisé pour la rédaction de l’article
  • Dominique Foata, Aimé Fuchs et Jacques Ranchi, Calcul des probabilités : Cours, exercices et problèmes corrigés, Dunod,‎ 2012, 3e éd., 368 p. (ISBN 978-2-287-72093-2, lire en ligne)Document utilisé pour la rédaction de l’article
  • (en) Eric Gossett, Discrete Mathematics with Proof, John Wiley & Sons,‎ 2009, 904 p. (ISBN 978-0-470-45793-1, lire en ligne)Document utilisé pour la rédaction de l’article
  • (en) Anders Hald, A History of Probability and Statistics and Their Applications before 1750, John Wiley & Sons,‎ 2005, 608 p. (ISBN 0-471-47129-1, lire en ligne)Document utilisé pour la rédaction de l’article
  • (en) Michiel Hazewinkel, Encyclopaedia of Mathematics (set), vol. 2, Springer Science & Business Media,‎ 1994, 963 p. (ISBN 1-55608-010-7, lire en ligne)Document utilisé pour la rédaction de l’article
  • (en) Hans-Joachim Mittag et Horst Rinne, Statistical Methods of Quality Assurance, CRC Press,‎ 1993, 664 p. (ISBN 0-412-55980-3, lire en ligne)Document utilisé pour la rédaction de l’article
  • (en) Norman Johnson, Adrienne Kemp et Samuel Kotz, Univariate Discrete Distributions, John Wiley & Sons,‎ 2005, 646 p. (ISBN 0-471-27246-9, lire en ligne)Document utilisé pour la rédaction de l’article
  • (en) Emmanuel Lesigne, Heads Or Tails: An Introduction to Limit Theorems in Probability, American Mathematical Soc,‎ 2005, 150 p. (ISBN 0-8218-3714-1, lire en ligne)Document utilisé pour la rédaction de l’article
  • Charles-Edouard Pfister, Théorie des probabilités, PPUR presses polytechniques,‎ 2012, 229 p. (ISBN 978-2-88074-981-1, lire en ligne)Document utilisé pour la rédaction de l’article
  • Alan Ruegg, Probabilités et statistique, vol. 3, PPUR presses polytechniques,‎ 1994, 153 p. (ISBN 2-88074-286-2, lire en ligne)Document utilisé pour la rédaction de l’article
  • (en) David Siegmund et Benjamin Yakir, The Statistics of Gene Mapping, Springer Science & Business Media,‎ 2007, 354 p. (lire en ligne)Document utilisé pour la rédaction de l’article

Articles connexes[modifier | modifier le code]