« Loi binomiale » : différence entre les versions

Navigation interactive dans l’historique

← Modification précédente Modification suivante →

Contenu supprimé Contenu ajouté

Intégrés

Version du 26 février 2011 à 11:55

En mathématiques, une loi binomiale de paramètres n et p est une loi de probabilité qui correspond à l'expérience suivante :

On renouvelle n fois de manière indépendante une épreuve de Bernoulli de paramètre p (expérience aléatoire à deux issues possibles, généralement dénommées respectivement « succès » et « échec », la probabilité d'un succès étant p, celle d'un échec étant $q=(1-p)$ ). On compte alors le nombre de succès obtenus à l'issue des n épreuves et on appelle X la variable aléatoire correspondant à ce nombre de succès.

L'univers $X(\Omega )~$ désigne l'ensemble des entiers naturels de 0 à n.

La variable aléatoire suit une loi de probabilité définie par :

p(k)=P(X=k)={n \choose k}\,p^{k}q^{n-k}

Cette formule fait intervenir le nombre des combinaisons de $k$ éléments parmi $n$ , généralement notée ${n \choose k}$ ou $\mathrm {C} _{n}^{k}$ , la première notation étant préconisée en France pour l'enseignement des mathématiques en terminale scientifique^[1]. Notons que ce nombre de combinaisons se distingue du nombre des arrangements de $k$ éléments parmi $n$ $\,,A_{n}^{k}={\dfrac {n!}{(n-k)!}}\,,$ du fait que dans une combinaison l'ordre des éléments n'importe pas. Et comme il y a $k!$ (prononcer factorielle k) façons d'ordonner $k$ éléments, le nombre des combinaisons se déduit du nombre des arrangements par la simple division ${\dfrac {A_{n}^{k}}{k!}}\,$ et on obtient :

{n \choose k}={\frac {n!}{k!(n-k)!}}

Cette loi de probabilité s'appelle la loi binomiale de paramètre (n ; p) et se note B(n ; p).

Calcul de p(k)

Une épreuve de Bernoulli conduit à la création d'un univers Ω = {S ; E}, (S pour Succès et E pour Echec).

n épreuves de Bernoulli indépendantes conduisent à la création d'un univers Ωⁿ constitué de n-uplets d'éléments de Ω, sur lequel peut se définir une probabilité produit. La probabilité de l'éventualité (S, S, ..., S, E, E, ..., E) avec k succès et n - k échecs a donc pour valeur p^kq^n-k.

Plus généralement, tout n-uplet formé de k succès et de n-k échecs aura pour probabilité p^kq^n-k quel que soit l'ordre d'apparition des S et des E.

L'évènement « X = k » est formé de tous les n-uplets comportant k succès et n - k échecs. La combinatoire permet de déterminer le nombre de n-uplets de ce type : il y en a autant que de parties à k éléments d'un ensemble à n éléments ; or chaque partie correspond à une façon de placer les k succès parmi les n places du n-uplet. Il y a donc ${n \choose k}$ n-uplets, chacun ayant une probabilité égale à p^kq^n-k.

Donc $P(X=k)={n \choose k}\,p^{k}(1-p)^{n-k}={n \choose k}\,p^{k}q^{n-k}$ .

Lien avec la loi de Bernoulli

Du fait de son interprétation comme loi du nombre de succès lors d'une série de n épreuves de Bernoulli indépendantes et identiques, la loi binomiale est en particulier la loi de la somme de n variables aléatoires indépendantes suivant toutes la (même) loi de Bernoulli de paramètre p, prenant la valeur 1 en cas de succès (probabilité p) et 0 en cas d'échec (probabilité (1-p)). Des exemples importants où la loi binomiale apparaît comme loi de la somme de variables de Bernoulli sont les suivants :

l'étude des sondages,
la fonction de répartition empirique,
la fonction de répartition d'une statistique d'ordre, comme par exemple la médiane d'un échantillon, ou un quartile,
l'étude, par Émile Borel, de la fréquence des différents chiffres dans le développement décimal d'un nombre réel, et sa démonstration du Théorème des nombres normaux^[2].

Par ailleurs, cette interprétation en terme de sommes de variables de Bernoulli permet un calcul rapide de l'espérance et de la variance.

Espérance, variance, écart type

Ainsi X a la même loi que la somme S de n variables aléatoires indépendantes suivant toutes la (même) loi de Bernoulli de paramètre p. Comme l'espérance et la variance d'une variable aléatoire ne dépendent que de sa loi de probabilité, on en déduit que

E[X] est donc la somme des espérances de ces variables de Bernoulli, or elles ont pour espérance p et pour variance p(1-p), soit E[X]=np
de même, V(X) est la somme des variances de n variables de Bernoulli, soit V(X)=np(1-p)
$\sigma _{X}={\sqrt {np(1-p)}}$

Convergence

Pour de grandes valeurs de n, le calcul de ${n \choose k}\,p^{k}q^{n-k}$ devient vite pratiquement impossible, sauf si l'on cherche à calculer le logarithme de cette expression au lieu de l'expression elle-même (et à condition d'utiliser l'approximation des factorielles par la formule de Stirling). On distingue deux cas :

Lorsque n tend vers l'infini et que p tend vers 0 avec np = a, la loi binomiale converge vers une loi de Poisson de paramètre a. En pratique, on remplace la loi binomiale par une loi de Poisson dès que n > 30 et np < 5 ou dès que n > 50 et p < 0.1.

Démonstration de la convergence vers la loi Poisson

Décomposons ${n \choose k}\,p^{k}q^{n-k}={n \choose k}\,p^{k}(1-p)^{n-k}$

${n \choose k}\,p^{k}(1-p)^{n-k}={\frac {n(n-1)...(n-k+1)}{k!}}p^{k}(1-p)^{n-k}={\frac {(pn)^{k}}{k!}}(1-{\frac {1}{n}})(1-{\frac {2}{n}})...(1-{\frac {k-1}{n}})(1-p)^{n-k}$

On se place dans la situation où np reste constant et où n tend vers l'infini (par conséquent p tend vers 0).

Lorsque n tend vers l'infini, les termes $(1-{\frac {1}{n}})(1-{\frac {2}{n}})...(1-{\frac {k-1}{n}})$ tendent vers 1. Le produit des termes tend également vers 1 puisqu'ils sont en nombre fini.
On a $(1-p)^{n-k}=(1-p)^{n}(1-p)^{-k}$ $(1-p)^{n-k}=(1-p)^{n}(1-p)^{-k}$
- Or $\lim _{p\to 0}(1-p)^{-k}=1$
- De plus, $(1-p)^{n}=(1-{\frac {np}{n}})^{n}$ et ce terme tend vers $e^{-np}$ quand n tend vers l'infini.

On trouve donc ${n \choose k}\,p^{k}(1-p)^{n-k}\rightarrow {\frac {(np)^{k}}{k!}}e^{-np}$ .

Il s'agit de la loi de probabilité d'une loi de Poisson de paramètre

\lambda =np

.

Lorsque n tend vers l'infini et que p et q sont de même ordre de grandeur, la loi binomiale converge vers une loi normale d'espérance np et de variance npq. En pratique, on remplace une loi binomiale par une loi normale dès que n > 30, np > 5 et nq > 5

Démonstration de la convergence vers la loi normale

Supposons que $p(k)$ admette un extremum pour $k={\tilde {k}}$ . Alors, $\ln p(k)$ admet un extremum $\ln p({\tilde {k}})$ , car la fonction logarithme est monotone croissante. On calcule $\ln p(k)$ à l'aide de la formule de Stirling :

$\ln(k!)\ \sim \ k\ \ln k\ -\ k\ +\ {\frac {1}{2}}\ \ln(2\pi k)$

Il vient :

$\ln p(k)\ \sim \ n\ \ln n\ -\ n\ +\ {\frac {1}{2}}\ \ln(2\pi n)\ -\ \left[\ k\ \ln k\ -\ k\ +\ {\frac {1}{2}}\ \ln(2\pi k)\ \right]$

$\ -\ \left[\ (n-k)\ \ln(n-k)\ -\ (n-k)\ +\ {\frac {1}{2}}\ \ln(2\pi (n-k)\,)\,\right]\ +\ k\ln p\ -\ (n-k)\ln(1-p)$

La dérivée par rapport à k donne :

${\frac {d~}{dk}}\ln p(k)\ \sim \ \ln \left[\,{\frac {(n-k)\ p}{k\ (1-p)}}\,\right]\ +\ O\left({\frac {1}{k}}\right)$

Pour annuler cette dérivée, il faut que l'argument du logarithme soit égal à un. On obtient alors la valeur de k qui rend le logarithme extremum :

${\tilde {k}}\ =\ n\,p\ =\ \langle \ k\ \rangle$

La valeur la plus probable est donc la valeur moyenne. La dérivée seconde vaut par ailleurs :

${\frac {d^{2}~}{dk^{2}}}\ln p(k)\ \sim \ -\ \left[\,{\frac {1}{n-k}}\ +\ {\frac {1}{k}}\,\right]\ +\ O\left({\frac {1}{k^{2}}}\right)$

Calculée en $k={\tilde {k}}$ , elle vaut :

${\frac {d^{2}~}{dk^{2}}}\ln p({\tilde {k}})\ \sim \ -\ \left[\,{\frac {1}{np(1-p)}}\,\right]\ =\ -\ {\frac {1}{\sigma ^{2}}}$

On peut donc écrire le développement limité au second ordre suivant :

$\ln p(k)\ \sim \ \ln p({\tilde {k}})\ +\ {\frac {\left(k-{\tilde {k}}\right)^{2}}{2}}\ {\frac {d^{2}~}{dk^{2}}}\ln p({\tilde {k}})\ +\ o\left(\ \left(k-{\tilde {k}}\right)^{2}\ \right)$

qui s'écrit compte-tenu de ce qui précède :

$\ln p(k)\ \sim \ \ln p({\tilde {k}})\ -\ {\frac {\left(k-{\tilde {k}}\right)^{2}}{2\,\sigma ^{2}}}$

soit en prenant l'exponentielle :

$p(k)\ \sim \ p({\tilde {k}})\ \exp \ \left[-\ {\frac {\left(k-{\tilde {k}}\right)^{2}}{2\,\sigma ^{2}}}\ \right]$

On détermine la constante $p({\tilde {k}})$ avec la condition de normalisation des probabilités totales :

$\int _{-\infty }^{+\infty }p(k)\ dk\ =\ 1\quad \Longrightarrow \quad p({\tilde {k}})\ =\ {\frac {1}{\sqrt {2\pi \sigma ^{2}\ }}}$

d'où la distribution gaussienne :

$p(k)\ =\ {\frac {1}{\sqrt {2\pi \sigma ^{2}\ }}}\ \exp \ \left[-\ {\frac {\left(k-\langle \ k\ \rangle \,\right)^{2}}{2\,\sigma ^{2}}}\ \right]$

Loi des grands nombres

La loi binomiale, son espérance et sa variance, ainsi que l'inégalité de Bienaymé-Tchebychev permettent de démontrer une version simple de la loi des grands nombres.

Références

↑ Bulletin Officiel n°4 du 30 aout 2001.
↑ Émile Borel, « Les probabilités dénombrables et leurs applications arithmétiques », Rendiconti del Circolo Matematico di Palermo, vol. 27, n^o 1,‎ décembre 1909, p. 247-271 (ISSN 0009-725X et 1973-4409, DOI 10.1007/BF03019651, lire en ligne).

Voir aussi

Lien externe

Modèle:Probabilités et Statistiques

Portail des probabilités et de la statistique

[1] Bulletin Officiel n°4 du 30 aout 2001.

[2] Émile Borel, « Les probabilités dénombrables et leurs applications arithmétiques », Rendiconti del Circolo Matematico di Palermo, vol. 27, n^o 1,‎ décembre 1909, p. 247-271 (ISSN 0009-725X et 1973-4409, DOI 10.1007/BF03019651, lire en ligne).

[1]

[2]

@@ Ligne 52 : / Ligne 52 : @@
 *la [[fonction de répartition empirique]],
 *la [[fonction de répartition]] d'une [[Statistique d'ordre#Densité d'une statistique d'ordre|statistique d'ordre]], comme par exemple la médiane d'un échantillon, ou un quartile,
-*l'étude, par [[Émile Borel]], de la fréquence des différents chiffres dans le développement décimal d'un nombre réel, en liaison avec la densité des [[nombre normal|nombres normaux]].
+*l'étude, par [[Émile Borel]], de la fréquence des différents chiffres dans le développement décimal d'un nombre réel, et sa démonstration du Théorème des [[nombre normal|nombres normaux]]<ref>{{Article
+|langue=fr
+|prénom1=Émile
+|nom1=Borel
+|lien auteur1=
+|titre=Les probabilités dénombrables et leurs applications arithmétiques
+|périodique=Rendiconti del Circolo Matematico di Palermo
+|mois=décembre
+|année=1909
+|volume=27
+|numéro=1
+|pages=247-271
+|issn=0009-725X
+|issn2=1973-4409
+|doi=10.1007/BF03019651
+|url texte=http://www.springerlink.com/content/d82573l5k1n11722/
+}}.</ref>.