Loi normale

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Page d'aide sur l'homonymie Ne doit pas être confondu avec : des théorèmes et lemmes de Gauss parfois appelés lois de Gauss, les autres lois de Laplace ou les autres sens du terme Normal.
Loi normale
Image illustrative de l'article Loi normale
Densité de probabilité (ou fonction de masse)
La courbe rouge représente la fonction \scriptstyle \varphi,
densité de probabilité de la loi normale centrée réduite.

Image illustrative de l'article Loi normale
Fonction de répartition
La courbe rouge représente la fonction \scriptstyle \Phi,
fonction de répartition de la loi normale centrée réduite.

Paramètres \mu, moyenne (nombre réel)
\sigma^2>0, variance (nombre réel)
Support \R
Densité de probabilité (fonction de masse) \frac1{\sigma\sqrt{2\pi}}\; \exp\left(-\frac{\left(x-\mu\right)^2}{2\sigma^2} \right) \!~
Fonction de répartition \frac12 \left(1 + \mathrm{erf}\,\frac{x-\mu}{\sigma\sqrt2}\right) \!~
Espérance \mu
Médiane \mu
Mode \mu
Variance \sigma^2
Asymétrie 0
Kurtosis normalisé 0
Entropie \ln\left(\sigma\sqrt{2\,\pi\,e}\right)\!~
Fonction génératrice des moments \exp\left(\mu\,t+\frac{\sigma^2 t^2}{2}\right)
Fonction caractéristique \exp\left(\mu\,i\,t-\frac{\sigma^2 t^2}{2}\right)

En théorie des probabilités et en statistique, la loi normale est l'une des lois de probabilité les plus adaptées pour modéliser des phénomènes naturels issus de plusieurs événements aléatoires. Elle est en lien avec de nombreux objets mathématiques dont le mouvement brownien, le bruit blanc gaussien ou d'autres lois de probabilité. Elle est également appelée loi gaussienne, loi de Gauss ou loi de Laplace-Gauss des noms de Laplace (1749-1827) et Gauss (1777-1855), deux mathématiciens, astronomes et physiciens qui l'ont étudiée.

Plus formellement, c'est une loi de probabilité absolument continue qui dépend de deux paramètres : son espérance, un nombre réel noté \scriptstyle \mu, et son écart type, un nombre réel positif noté \scriptstyle \sigma. La densité de probabilité de la loi normale est donnée par :

f(x) = \tfrac{1}{\sigma \sqrt{2\pi}} \mathrm{e}^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}.

La courbe de cette densité est appelée courbe de Gauss ou courbe en cloche, entre autres. C'est la représentation la plus connue de cette loi. La loi normale de moyenne nulle et d'écart type unitaire est appelée loi normale centrée réduite ou loi normale standard.

Lorsqu'une variable aléatoire \scriptstyle X suit la loi normale, elle est dite gaussienne ou normale et il est habituel d'utiliser la notation avec la variance \scriptstyle \sigma^2 :

X \sim \mathcal{N}(\mu,\sigma^2).

Parmi les lois de probabilité, la loi normale prend une place particulière grâce au théorème central limite. En effet, elle correspond au comportement d'une suite d'expériences aléatoires similaires et indépendantes lorsque le nombre d'expériences est très élevé. Grâce à cette propriété, la loi normale permet d'approcher d'autres lois et ainsi de modéliser de nombreuses études scientifiques comme des mesures d'erreurs ou des tests statistiques, en utilisant par exemple les tables de la loi normale.

Définition et explications informelles[modifier | modifier le code]

Cinq diagrammes en bâtons convergeant vers la densité de la loi normale
Les diagrammes en bâtons représentent les lois discrètes de la somme de 1, 2, 3, 4 ou 5 dés. La courbe noire est la densité de la loi normale vue comme limite des diagrammes en bâtons.

Les lois de probabilité permettent de décrire de manière théorique le caractère aléatoire d'une expérience qui est considérée comme aléatoire. La loi normale en est un cas particulier. La manière historique de l'aborder est par approximation[1].

Lorsque le résultat de cette expérience aléatoire est à valeurs discrètes, par exemple la somme du lancer de deux dés vaut 2, 3… ou 12, une loi dite discrète modélise l'expérience. Les probabilités d'apparition de chaque valeur peuvent être représentées par des diagrammes en bâtons ou histogrammes (voir la figure ci-contre). Une question que se sont posés plusieurs scientifiques (voir Histoire de la loi normale) est d'effectuer un grand nombre d'expériences et de s'intéresser au comportement de la loi de probabilité associée. Il apparaît que les fréquences d'apparition des valeurs possibles sont de plus en plus « lissées »[2] (voir la figure ci-contre). Il existe une certaine répartition autour d'une valeur centrale, ces probabilités peuvent être alors représentées par la fameuse courbe de Gauss ou courbe en cloche obtenue par calcul ou par expérience[3]. Cette courbe est la densité de probabilité de la loi normale, c'est-à-dire que l'aire sous la courbe vaut 1. Le rôle central de cette loi de probabilité vient du fait qu'elle est la limite d'un grand nombre de lois de probabilité, comme le montre le théorème central limite.

Une autre manière visuelle de voir apparaître cette courbe est par la planche de Galton. Des billes sont lâchées en haut de la planche, à chaque étage elles ont deux possibilités : aller à droite ou aller à gauche, après plusieurs étages elles ont donc eu plusieurs choix aléatoires. Lorsque le nombre de billes est grand, la répartition des billes suivant leur position est approximativement une loi normale.

Ainsi, des mesures faites sur une population de grande taille donnent des valeurs qui sont distribuées selon une loi similaire à la loi normale, par exemple la taille des femmes adultes d'une population donnée[4] ou le poids des graines de pois de senteur[3].

La loi normale est alors devenue une loi de probabilité dont plusieurs définitions équivalentes existent : par la densité de probabilité (la courbe de Gauss), la fonction de répartition, la fonction caractéristique, etc. La loi normale dépend de deux paramètres : le premier donne la moyenne, c'est-à-dire la valeur « centrale » des valeurs possibles[5] (par exemple, c'est la valeur 7 pour la somme des deux dés) ; le deuxième paramètre renseigne sur la dispersion des valeurs autour de cette valeur centrale[5], plus ce paramètre est faible plus les valeurs proches de la valeur centrale auront une forte probabilité d'apparaître. Beaucoup de grandeurs physiques peuvent être représentées par ces deux paramètres[6].

Lors de l'étude statistique, une valeur observée peut être considérée comme aléatoire et de loi normale. La moyenne de la loi normale est alors considérée comme la valeur « réelle » de la valeur observée, la dispersion de la loi renseigne alors sur l'« erreur » d'observation[7]. C'est-à-dire qu'il est possible de calculer[7] une valeur approchée de la probabilité qu'une variable suivant une loi normale soit dans un intervalle [\mu - \sigma, \mu + \sigma] autour de la moyenne \scriptstyle \mu. Il s'agit de pouvoir obtenir une approximation de la valeur de l'expérience observée en considérant les erreurs dues aux instruments de mesures ou autres[2].

Histoire[modifier | modifier le code]

page de couverture de l'essai de Laplace
p90 de l'essai de Laplace
Le théorème central limite, Pierre-Simon de Laplace, Essai sur la philosophie des probabilités,‎ 1840, 6e éd., p. 90

Une des premières apparitions de la loi normale est due[a 1] à Abraham de Moivre en 1733 en approfondissant l'étude de la factorielle \scriptstyle n! lors de l'étude d'un jeu de pile ou face. Il publie The Doctrine of Chances en 1756 dans lequel la loi normale apparaît comme limite d'une loi binomiale, ce qui sera à l'origine du théorème central limite[a 2]. En 1777, Pierre-Simon de Laplace reprend ces travaux et obtient une bonne approximation de l'erreur entre cette loi normale et la loi binomiale grâce à la fonction gamma d'Euler[a 1]. Dans son ouvrage publié en 1781, Laplace donne une première table de cette loi. En 1809, Carl Friedrich Gauss assimile des erreurs d'observation en astronomie à la courbe, dite des erreurs, de la densité de la loi normale[a 2].

La loi normale est alors pleinement définie lorsque le premier théorème central limite, alors appelé théorème de Laplace, est énoncé par Laplace en 1812[a 1]. Son nom « normale » est donné par Henri Poincaré à la fin du XIXe siècle[8]. La loi porte également les noms de loi de Gauss ou loi de Laplace-Gauss[9] en fonction de l'attribution de la paternité de la création de cette loi ; la dénomination de deuxième loi de Laplace est également utilisée occasionnellement[10].

La loi normale est toujours une loi étudiée. Par exemple, de nouvelles tables numériques sont données en 1948 par Egon Sharpe Pearson, en 1952 par le National Bureau of Standards et en 1958 par Greenwood et Hartley[11].

Loi normale centrée réduite[modifier | modifier le code]

La loi normale est une loi de probabilité (c'est-à-dire une mesure \scriptstyle N de masse totale unitaire[a 3]) unidimensionnelle (c'est-à-dire à support réel \scriptstyle \R). C'est une loi absolument continue, c'est-à-dire que la mesure est absolument continue par rapport à la mesure de Lebesgue. Autrement dit, il existe une densité de probabilité, souvent notée \scriptstyle \varphi pour la loi normale centrée réduite, telle que : \scriptstyle N(dx)=\varphi(x) \mathrm{d}x. Elle est généralisée par la loi normale multidimensionnelle. La loi normale centrée réduite est appelée loi normale standard[12].

Définition par la fonction de densité[modifier | modifier le code]

Courbe de Gauss
Fonction de densité de la loi normale centrée réduite (dite courbe de Gauss ou courbe en cloche).
Articles détaillés : Fonction gaussienne et Intégrale de Gauss.

La loi normale centrée réduite est la loi de probabilité absolument continue dont la densité de probabilité est donnée par la fonction \scriptstyle\varphi : \R \to \R_+ définie par[13] :

\varphi(t)=\frac{1}{\sqrt{2\;\pi}}\, \mathrm{e}^{-\frac 12 t^2}, pour tout t\in \mathbb R.

Cette loi est dite centrée puisque son moment d'ordre 1 (espérance) vaut 0 et réduite puisque son moment d'ordre 2 (écart type ou variance) vaut 1. Le graphe de la densité \scriptstyle\varphi est appelé fonction gaussienne, courbe de Gauss ou courbe en cloche. Cette loi est notée grâce à la première lettre de « normal », une variable aléatoire X qui suit la loi normale centrée réduite est notée :

X \sim \mathcal N(0,1).

Quelques remarques et propriétés immédiates (voir également les propriétés ci-dessous) :

Définition par la fonction de répartition[modifier | modifier le code]

Fonction de répartition
Fonction de répartition de la loi normale centrée réduite.

Historiquement, la loi normale est apparue comme loi limite dans le théorème central limite à l'aide de sa fonction de répartition. Il est alors utile de définir la loi par cette fonction. La loi normale est la loi de probabilité dont la fonction de répartition est donnée par la fonction \scriptstyle\Phi : \R \to \R_+ définie par[16] :

\Phi(x)=\frac{1}{\sqrt{2\;\pi}}\int_{-\infty}^x \mathrm{e}^{-\frac 12 t^2} \mathrm{d}t, pour tout x\in \mathbb R.

Elle donne la probabilité qu'une variable aléatoire de loi normale appartienne à un intervalle \scriptstyle [a,b] : \scriptstyle \mathbb P(X\in[a,b])=\Phi(b)-\Phi(a). (pour plus de détails de calcul, voir la section Tables numériques et calculs)

Quelques remarques et propriétés immédiates :

  • il n'existe pas d'expression analytique de la fonction de répartition \scriptstyle \Phi, c'est-à-dire qu'elle ne s'exprime pas à partir de fonctions usuelles mais devient elle-même une fonction usuelle[17] ;
  • elle s'exprime en fonction de la fonction d'erreur grâce aux deux formules équivalentes suivantes[a 4] :
    1. \scriptstyle \Phi(x) = \frac12 +\frac12 \operatorname{erf}\left(\frac{x}{\sqrt{2}}\right),
    2. \scriptstyle\operatorname{erf}(x) = 2\Phi\left(x\sqrt{2}\right)-1 ;
  • elle est dérivable une infinité de fois et vérifie \scriptstyle \Phi'(x)=\varphi(x). L'écriture équivalente \scriptstyle\mathrm{d}\Phi(x)=\varphi(x)\mathrm{d}x permet de définir l'intégrale de Lebesgue-Stieltjes par rapport à la loi normale ;
  • elle est absolument continue et strictement croissante, c'est donc une bijection[a 5] de \scriptstyle \R dans \scriptstyle ]0,1[. Sa réciproque \scriptstyle \Phi^{-1} existe et s'appelle la fonction probit. Cette fonction est utilisée pour le modèle Probit (en)[18] ;
  • par parité de la loi, \scriptstyle\Phi(-x)=1-\Phi(x) et ainsi \scriptstyle\Phi(0)=\frac 12. Ceci montre[a 5] que la médiane de la loi normale centrée réduite est 0 ;
  • par définition de la fonction de répartition, \scriptstyle \Phi(x)=\mathbb P(X\leq x) lorsque la variable aléatoire X suit la loi normale centrée réduite, \scriptstyle X\sim \mathcal N(0,1). Pour obtenir les valeurs de cette probabilité, il faut approcher cette fonction par d'autres fonctions usuelles et il existe des tables de valeurs (voir la section Table de la loi normale ci-dessous).

Définition par la fonction caractéristique[modifier | modifier le code]

Fonction caractéristique
Fonction caractéristique et fonction génératrice des moments de la loi normale centrée réduite.

La caractérisation de la loi normale par sa fonction caractéristique a son intérêt pour démontrer certaines propriétés telles que la stabilité par la somme (voir la section ci-dessous) ou le théorème central limite. La loi normale est la loi de probabilité dont la fonction caractéristique est donnée par  \scriptstyle \phi:\R \to \R_+ définie par[19],[20] :

 \phi(t) = e^{-\frac{t^2}{2}}, pour tout t\in \mathbb R.

Cette fonction caractéristique est égale, à une constante près, à la densité de probabilité de la loi. On dit que la fonction caractéristique d'une gaussienne est gaussienne[a 3]. Elle possède de « bonnes » propriétés et permet de démontrer certaines propriétés, comme la stabilité par addition ou le théorème central limite.

Quelques remarques et propriétés immédiates :

  • la fonction caractéristique de la loi normale peut s'obtenir à partir de la fonction de densité par les égalités[16] :
\phi(t)=\int_{-\infty}^{+\infty} e^{itx}\mathrm{d}\Phi(x)=\int_{-\infty}^{+\infty} e^{itx-\frac{x^2}{2}}\mathrm{d}x=e^{-\frac{t^2}{2}} ;
  • si une variable aléatoire X suit la loi normale centrée réduite de fonction caractéristique \scriptstyle \phi définie ci-dessus, alors[21] la transformation linéaire \scriptstyle Y=aX+b admet pour fonction caractéristique : \scriptstyle \phi_Y(t)=e^{ibt}\phi(at). C'est donc une variable aléatoire de loi normale de moyenne \scriptstyle b et de variance \scriptstyle a^2.

Définition par la fonction génératrice des moments[modifier | modifier le code]

Une autre manière de définir la loi normale est par l'utilisation de sa fonction génératrice des moments. C'est la loi de probabilité dont la fonction génératrice des moments est donnée par  \scriptstyle M:\R \to \R_+ définie par[22] :

 M(t) = e^{\frac{t^2}{2}}, pour tout t\in \mathbb R.

Son intérêt est de pouvoir calculer les moments de la loi normale[23] (voir la section Moments ci-dessous).

Quelques remarques et propriétés immédiates :

  • la fonction génératrice des moments de la loi normale peut s'obtenir à partir de la fonction de densité[22] :
    M(t)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{+\infty} e^{xt}e^{-\frac{x^2}{2}}\mathrm{d}x=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{+\infty} e^{-(\frac{(x-t)^2-t^2}{2})}\mathrm{d}x=e^{\frac{t^2}{2}}\,\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{+\infty} e^{-\frac{x^2}{2}}\mathrm{d}x=e^{\frac{t^2}{2}} ;
  • si une variable aléatoire X suit la loi normale centrée réduite de fonction génératrice des moments \scriptstyle M définie ci-dessus, alors la transformation linéaire \scriptstyle Y=aX+b admet pour fonction génératrice des moments : \scriptstyle M_Y(t)=e^{bt}M(at). C'est donc une variable aléatoire de loi normale[23] de moyenne \scriptstyle b et de variance \scriptstyle a^2.

Loi normale générale[modifier | modifier le code]

Définition[modifier | modifier le code]

Plus généralement que la loi normale centrée réduite, la loi normale (non centrée et non réduite) est la loi de probabilité absolument continue dont l'un des quatre points suivants est vérifié :

\scriptstyle \mu\in \R et \scriptstyle \sigma\in \R_+^\star.

Pour le cas où \scriptstyle \sigma=0, les fonctions de densité et de répartition ne sont pas définies. Ce cas correspond à un comportement dégénéré de la loi normale, parfois appelée la loi normale impropre[19]. C'est alors la mesure de Dirac au point \scriptstyle \mu.

La valeur \scriptstyle \mu est la moyenne de la loi et \scriptstyle \sigma est l'écart type alors que \scriptstyle \sigma^2 en est la variance. Cette loi est notée grâce à la première lettre de « normal », une variable aléatoire X qui suit la loi normale centrée réduite est notée de deux manières différentes suivant les auteurs[25],[12] :

X \sim \mathcal N(\mu,\sigma) ou X \sim \mathcal N(\mu,\sigma^2).

La deuxième notation a l'intérêt de pouvoir noter la stabilité par addition de manière simple[a 5], elle sera utilisée dans cet article.

Remarques et propriétés immédiates[modifier | modifier le code]

  • Si la variable aléatoire X suit une loi normale centrée réduite \scriptstyle \mathcal N(0,1), alors la variable aléatoire \scriptstyle \sigma X +\mu suit une loi normale \scriptstyle \mathcal N(\mu,\sigma^2) de moyenne \scriptstyle \mu et de variance \scriptstyle \sigma^2. Réciproquement, si Y suit une loi normale \scriptstyle \mathcal N(\mu,\sigma^2), alors \scriptstyle \frac{Y-\mu}{\sigma} suit une loi normale centrée réduite[1]. Dit autrement, toute loi normale peut s'obtenir par translation (shifting en anglais) et par dilatation (scaling en anglais) d'une loi centrée réduite.
    Cette première propriété permet d'obtenir la formule très utile[26] :
    \mathbb P (Y\leq x) = \mathbb P\left(\frac{Y-\mu}{\sigma}\leq\frac{x-\mu}{\sigma}\right)=\mathbb P\left(X\leq \frac{x-\mu}{\sigma}\right).
    Il est alors possible de déduire les propriétés de la loi normale à partir de celles de la loi normale centrée réduite, et vice versa. La variable \scriptstyle \frac{Y-\mu}{\sigma} est parfois[27] appelée la « standardisation » de Y ou variable Y centrée réduite.
  • La densité \scriptstyle f est symétrique par rapport à \scriptstyle \mu[14].
  • Le maximum de la fonction \scriptstyle f est atteint en \scriptstyle \mu et vaut[14] \scriptstyle \frac{1}{\sigma\sqrt{2\pi}}.
  • La décroissance de la densité à droite et à gauche de \scriptstyle \mu est surexponentielle[14].
  • Puisque la loi normale est une loi de probabilité absolument continue, l'événement \scriptstyle [X=x] est négligeable, c'est-à-dire que presque sûrement une variable aléatoire de loi normale X n'est jamais égale à une valeur fixée \scriptstyle x. Ceci se traduit mathématiquement par : \scriptstyle \mathbb P(X=x)=0.
  • La largeur à mi-hauteur permet de donner une valeur d'amplitude de la loi. C'est la largeur de la courbe à une hauteur qui vaut la moitié de la hauteur totale. Cette largeur à mi-hauteur de la loi normale est proportionnelle à l'écart type[a 6] : \scriptstyle H = 2 \sqrt{2\ln(2)}\sigma \approx 2,3548 \sigma . Le facteur 2 est issu de la propriété de symétrie de la loi normale.
  • La densité possède[a 3] deux points d'inflexion en \scriptstyle \mu+\sigma et en \scriptstyle \mu-\sigma. Ce sont les points en lesquels la dérivée seconde \scriptstyle f'' s'annule et change de signe. Les deux points se situent approximativement aux trois cinquièmes de la hauteur totale.
  • La loi normale est une loi de la famille exponentielle, c'est-à-dire que sa densité s'écrit sous la forme : \scriptstyle f(x)=a(\theta)b(x) \mathrm e^{-c(\theta)d(x)} ou, de manière équivalente, sous la forme[28] \scriptstyle f(x)=\mathrm exp\left(\frac{x\theta_1 - \beta(\theta_1)}{\alpha(\theta_2)}\right) avec \scriptstyle \theta_1=\mu, \scriptstyle \theta_2=\sigma, \scriptstyle \beta(\mu)=\mu^2/2 et \scriptstyle \alpha(\sigma)=\sigma^2.

Propriétés[modifier | modifier le code]

Autres caractérisations[modifier | modifier le code]

En addition de la densité de probabilité, de la fonction de répartition, de la fonction caractéristique et de la fonction génératrice des moments, il existe d'autres caractérisations de la loi normale.

  • Caractérisation due à Georges Darmois (1951) et Sergeï Bernstein (1954)[a 2] : si deux variables aléatoires \scriptstyle X_1 et \scriptstyle X_2 sont indépendantes et de même loi et si les deux variables aléatoires \scriptstyle X_1+X_2 et \scriptstyle X_1- X_2 sont également indépendantes, alors la loi commune \scriptstyle X_1 et \scriptstyle X_2 est la loi normale.
  • Caractérisation due à Charles Stein (1972)[a 3] : la loi normale est l'unique loi de probabilité (mesure de probabilité) \scriptstyle\mathbb P telle que, pour toute fonction \scriptstyle g de classe C¹ (c'est-à-dire dérivable et de dérivée continue) :
\int_{\mathbb R} g'(x) \mathrm{d}\mathbb P(x) = \int_{\mathbb R} x g(x) \mathrm{d}\mathbb P(x).

Moments[modifier | modifier le code]

Le moment d'ordre un est appelé la moyenne (\scriptstyle \mu) et est donné en paramètre dans la loi normale \scriptstyle \mathcal N(\mu,\sigma^2). Le deuxième paramètre est son écart type (\scriptstyle\sigma), c'est-à-dire la racine carrée de la variance qui est par définition la moyenne des carrés des écarts à la moyenne. Il est alors également intéressant d'obtenir les moments centrés de la loi normale, ils sont donnés par[23] :

\begin{cases}
\mu_{2k} = \mathbb E[(X-\mu)^{2k}] = \frac{(2\, k) !}{2^k k!}\sigma^{2k}\\
\mu_{2k+1} = \mathbb E[(X-\mu)^{2k+1}] = 0 
\end{cases}

pour \scriptstyle k\geq 0 et X une variable aléatoire de loi normale \scriptstyle \mathcal N(\mu,\sigma^2). Le moment centré d'ordre n peut s'obtenir comme une fonction des moments d'ordre inférieur à n, ainsi le moment d'ordre n peut s'obtenir à partir des moments d'ordre inférieur à n-1 et du moment centré d'ordre n. Les premiers moments de la loi normale sont alors[29] :

m_1= \mathbb E[X] =\mu ;
m_2= \mathbb E[X^2] =\sigma^2+\mu^2 ;
m_3= \mathbb E[X^3] =3\mu\sigma^2+\mu^3.
Calcul direct

Grâce à la symétrie autour de \scriptstyle \mu de la fonction de densité de la loi normale, les moments centrés d'ordre impair sont tous nuls[23].

Les moments d'ordre pairs de la loi normale centrée réduite \scriptstyle \mathcal N(0,1) peuvent s'obtenir à partir de la relation de récurrence \scriptstyle m_{2k}=(2k - 1) m_{2k - 2} qui provient de l'intégration par parties suivante, pour \scriptstyle k\geq 1 :

m_{2k} = \int_{-\infty}^{+\infty} t^{2k - 1} t \varphi(t) \mathrm{d}t =-\int_{-\infty}^{+\infty} t^{2k - 1} \varphi'(t) \mathrm{d}t = (2 k - 1) \int_{-\infty}^{+\infty} t^{2k - 2} \varphi(t) \mathrm{d}t.

S'en déduit la formule des moments centrés réduits[16] \scriptstyle m_{2k} = (2k-1)\cdots 3 \cdot 1 = \frac{(2\, k) !}{2^k k!} ainsi que la formule des moments centrés : \scriptstyle \mu_{2k} = \frac{(2\, k) !}{2^k k!}\sigma^{2k}.

Par la fonction génératrice des moments

Les moments centrés \scriptstyle (\mu_n, n\geq 0) d'une loi peuvent s'obtenir à partir de la fonction génératrice des moments centrés. Pour la loi \scriptstyle \mathcal N(\mu,\sigma^2), le changement de variable \scriptstyle y=\frac{x-\mu}{\sigma\sqrt{2}} permet d'obtenir les formules[23] :

M_{\text{centré}}(t)=e^{\frac{\sigma^2t^2}{2}}=\sum_{k=0}^\infty \frac{1}{k!}\left(\frac{\sigma^2t^2}{2}\right)^k

d'une part et

M_{\text{centré}}(t)=\sum_{n=0}^\infty \frac{1}{n!}\mu_n t^n

d'autre part.

Densités de lois avec différents kurtosis
Densités de probabilités de lois de kurtosis différents. Loi de Laplace en rouge, loi sécante hyperbolique en orange, loi logistique en vert, loi normale en noir, loi du cosinus surélevé en cyan, loi du demi-cercle en bleu et loi uniforme en violet.

Par l'identification des coefficients des deux séries, cela implique que les moments d'ordre impair sont nuls, \scriptstyle\mu_{2k+1}=0, et donne une formule pour les moments d'ordre pair : \scriptstyle\mu_{2k}=\frac{(2k)!}{2^k k!}\sigma^{2k}.

Asymétrie et aplatissement

L'asymétrie \scriptstyle \gamma_1, le kurtosis \scriptstyle \beta_2 et le kurtosis normalisé \scriptstyle \gamma_2 s'obtiennent à partir des formules des moments[30] :

\gamma_1 = \frac{\mu_3}{\sigma^3} = 0 ;
\beta_2 = \frac{\mu_4}{\sigma^4} = 3 ;
\gamma_2=\beta_2-3=0.

La loi normale sert de point de référence pour la comparaison des épaisseurs de traîne : si une loi possède un kurtosis normalisé \scriptstyle \gamma_2>0, alors la loi possède une traîne plus épaisse que la loi normale et est dite leptokurtique ; à l'inverse si \scriptstyle \gamma_2<0, la loi possède une traîne moins épaisse que la loi normale et est appelée platikurtique ; les lois de kurtosis normalisé nul possèdent une traîne comparable à la loi normale et sont dites mésokurtiques.

Cumulants

La fonction caractéristique permet d'obtenir la fonction génératrice des cumulants par la formule \scriptstyle \ln (\phi(t))=\sum_{n=1}^{+\infty} K_n \frac{(it)^n}{n!} et permet d'obtenir les cumulants[31] : \scriptstyle K_1=\mu, \scriptstyle K_2=\sigma^2 et \scriptstyle K_n=0 pour \scriptstyle n\geq 3.

Théorèmes de convergence[modifier | modifier le code]

Animation montrant la convergence d'une loi discrète vers une loi continue.
Lorsque le nombre \scriptstyle n de variables augmente, la densité de probabilité de la variable \scriptstyle S_n (centrée réduite) se rapproche de la courbe en cloche de la loi normale.

La première version du théorème central limite, appelé alors théorème de De Moivre-Laplace, a été énoncée dans le cas de variables aléatoires de loi de Bernoulli. De manière plus générale, si \scriptstyle X_1, X_2,\dots,X_n sont des variables indépendantes et identiquement distribuées de variance finie et si la somme est notée \scriptstyle S_n=X_1+X_2+\dots+X_n, alors[17] pour tout \scriptstyle a<b

\lim_{n\rightarrow +\infty}\mathbb P\left(a\leq \frac{S_n-\mathbb E[S_n]}{\sqrt{Var(S_n)}} \leq b\right) = \int_a^b \varphi(x)\mathrm{d}x

\scriptstyle \varphi est la densité de probabilité de la loi normale centrée réduite.

Ce théorème signifie que tout ce qui peut être considéré comme étant la somme d'une grande quantité de petites valeurs aléatoires indépendantes est approximativement de loi normale[4]. Ceci montre le caractère central de la loi normale en théorie des probabilités. Un énoncé physique de ce théorème peut être formulé[32] :

Si une grandeur physique subit l'influence d'un nombre important de facteurs indépendants et si l'influence de chaque facteur pris séparément est petite, alors la distribution de cette grandeur est une distribution gaussienne.

Ce théorème central limite est valide pour toute loi de probabilité initiale des variables iid \scriptstyle (X_i ; i=1,2,\dots,n) ayant un écart type fini, il permet d'obtenir de bonne approximation de la somme \scriptstyle S_n, par exemple[33] :

  • si les variables \scriptstyle X_i sont de loi de Bernoulli : \scriptstyle B(p), alors \scriptstyle S_n suit approximativement une loi normale \scriptstyle \mathcal N(np,np(1-p)). Cette approximation est satisfaisante[34] dans le cas où \scriptstyle np(1-p)>10 ;
  • si les variables \scriptstyle X_i sont de loi du χ² : \scriptstyle \xi^2(1), alors \scriptstyle S_n suit approximativement une loi normale \scriptstyle \mathcal N(n,4n^2) ;
  • si les variables \scriptstyle X_i sont de loi exponentielle : \scriptstyle \mathcal E(\lambda), alors \scriptstyle S_n suit approximativement une loi normale \scriptstyle \mathcal N\left(\frac{n}{\lambda},\frac{n}{\lambda^2}\right).

Il existe des versions plus générales de ce théorème, par exemple en considérant des variables aléatoires indépendantes, pas de même loi mais ayant des variances petites comparées à celle de leur moyenne[35]. Un théorème de Gnedenko (de) et Kolmogorov (1954) stipule qu'une variable aléatoire normale est la somme d'un grand nombre de variables aléatoires indépendantes petites dont aucune n'est prépondérante :

Théorème — Considérons une suite de variables aléatoires \scriptstyle (X_n,n\geq 1) dont chacune est la somme d'un nombre fini de variables aléatoires \scriptstyle X_{n,1},\dots,X_{n,k_n} avec \scriptstyle k_n \rightarrow +\infty. Pour tout \scriptstyle \varepsilon>0, introduisons la variable aléatoire tronquée : \scriptstyle X^\varepsilon =\begin{cases}\scriptstyle X & \scriptstyle \text{ si }|X|\leq \varepsilon; \\\scriptstyle 0 &\scriptstyle \text{ sinon;}\end{cases} et supposons

  1. \sum_{1\leq k \leq n}|X_{nk}| \underset{n\rightarrow \infty}{\longrightarrow}0 (en probabilité) ;
  2. Pour tout \scriptstyle \varepsilon >0, \sum_{1\leq k \leq n}\mathbb E[X_{nk}^\varepsilon] \underset{n\rightarrow \infty}{\longrightarrow}\mu et \sum_{1\leq k \leq n}\text{Var}[X_{nk}^\varepsilon] \underset{n\rightarrow \infty}{\longrightarrow}\sigma^2.
Alors la loi de \scriptstyle X_n converge vers la loi normale \scriptstyle \mathcal N(\mu, \sigma^2).

Stabilités et famille normale[modifier | modifier le code]

Stabilité par additivité (propriété de conservation[a 2])

La loi normale est stable par additivité, c'est-à-dire que la somme de deux variables aléatoires indépendantes de lois normales est elle-même une variable aléatoire de loi normale. Plus explicitement : si \scriptstyle X_1\sim \mathcal N(\mu_1,\sigma_1^2), \scriptstyle X_2\sim \mathcal N(\mu_2,\sigma_2^2) et \scriptstyle X_1 et \scriptstyle X_2 sont indépendantes, alors la variable aléatoire \scriptstyle X_1+X_2 suit la loi normale \scriptstyle \mathcal N(\mu_1 + \mu_2, \sigma_1^2 + \sigma_2^2).

Cette propriété se généralise pour n variables, c'est-à-dire si pour tout \scriptstyle i\in \{1,2,\dots,n\}, les variables aléatoires \scriptstyle X_i suivent la loi normale \scriptstyle \mathcal N(\mu_i,\sigma_i^2) et sont indépendantes, alors[36] la somme \scriptstyle X_1+X_2+\dots+X_n suit la loi normale \scriptstyle \mathcal N(\mu_1+\mu_2+\dots+\mu_n,\sigma_1^2+\sigma_2^2+\dots+\sigma_n^2).

Cette propriété se démontre directement au moyen des fonctions caractéristiques. La densité de probabilité de la somme de deux variables indépendante de loi normale est donnée par la convolution des deux densités. Ceci se traduit par les formules de convolution de fonctions[19] ou de convolution de mesures normales[37] que l'on note \scriptstyle \mathcal N_{\mu_1,\sigma_1^2} :

\varphi\left(\frac{x-\mu_1}{\sigma_1}\right) \ast \varphi\left(\frac{x-\mu_2}{\sigma_2}\right) = \varphi\left(\frac{x-(\mu_1+\mu_2)}{\sqrt{\sigma_1^2+\sigma_2^2}}\right) et \mathcal N_{\mu_1,\sigma_1^2} \ast \mathcal N_{\mu_2,\sigma_2^2} = \mathcal N_{\mu_1+\mu_2,\sigma_1^2+\sigma_2^2} .

Il ne faut pas confondre avec la loi dont la densité est la somme de densité de loi normale (voir la section Constructions à partir de la loi normale ci-dessous).

densités de lois stables
Différentes densités de probabilité de lois stables dont la loi normale est un cas particulier : la courbe noire est la courbe en cloche.
Famille normale

L'ensemble de fonctions \scriptstyle \{ \varphi(\frac{x-\mu}{\sigma}) ; \mu\in \mathbb R, \sigma>0\} forme la famille dite famille normale. La famille normale est également le nom de l'ensemble des lois normales[37] \scriptstyle \{ \mathcal N_{\mu,\sigma^2} ; \mu\in \mathbb R, \sigma>0\}. La famille de fonctions est fermée pour la convolution au sens où[38] : la fonction \scriptstyle \varphi est la seule qui engendre la famille ; si la convolution de deux densités est dans la famille alors les deux fonctions sont dans la famille ; et toute densité convolée un nombre suffisamment grand de fois et convenablement renormalisée est proche d'une fonction de la famille normale. Les trois théorèmes suivants donnent plus de précisions mathématiques.

  1. Théorème[38] : si pour une fonction de densité \scriptstyle f de moyenne 0 et d'écart type 1, il existe \scriptstyle \mu\in \mathbb R et \scriptstyle \sigma\in \mathbb R_+^* satisfaisant : \scriptstyle f\left(\frac{x-\mu_1}{\sigma_1}\right) \ast f\left(\frac{x-\mu_2}{\sigma_2}\right) = f\left(\frac{x-\mu}{\sigma}\right), alors \scriptstyle f\equiv \varphi est la densité de la loi normale centrée réduite.
  2. Théorème de Lévy-Cramér (1936) (conjecturé par Paul Lévy en 1935)[39],[a 2] : si deux fonctions de densités \scriptstyle f_1 et \scriptstyle f_2 vérifient : \scriptstyle f_1(x) \ast f_2(x) = \varphi\left(\frac{x-\mu}{\sigma}\right), alors \scriptstyle f_1(x)=\varphi\left(\frac{x-\mu_1}{\sigma_1}\right) et \scriptstyle f_2(x)=\varphi\left(\frac{x-\mu_2}{\sigma_2}\right) avec \scriptstyle \mu_1+\mu_2=\mu et \scriptstyle \sigma_1+\sigma_2=\sigma. Autrement dit, si la somme de deux variables aléatoires indépendantes est normale, alors les deux variables sont de lois normales.
  3. Théorème[39] : si \scriptstyle f est la densité commune de n variables aléatoires indépendantes de moyenne 0 et d'écart type 1, alors la convolée n fois de \scriptstyle f converge uniformément en x : \scriptstyle \left( f(x/\sqrt{n})\right)^{\ast n}\rightarrow \varphi(x) (ce théorème est équivalent au théorème central limite). Il ne faut pas confondre cette famille normale avec la famille normale de fonctions holomorphes.
Stabilité par linéarité

La loi normale est stable par linéarité : si \scriptstyle \alpha \geq 0 et \scriptstyle \beta sont deux réels et \scriptstyle X\sim \mathcal N(\mu,\sigma^2), alors[40] la variable aléatoire \scriptstyle \alpha X + \beta suit la loi normale \scriptstyle \mathcal N(\alpha \mu + \beta, \alpha^2 \sigma^2).

Grâce aux stabilités par addition et par linéarité, la loi normale est un cas particulier de loi stable[a 7] avec pour paramètre de stabilité \scriptstyle \alpha=2. Parmi les lois stables, la loi normale, la loi de Lévy (\scriptstyle \alpha=1/2) et la loi de Cauchy (\scriptstyle \alpha=1) sont les seules à posséder une expression analytique de leur fonction de densité.

Stabilité par moyenne

La loi normale est stable par moyennisation, c'est-à-dire si \scriptstyle X_{1},X_{2},\dots,X_{n} sont des variables aléatoires indépendantes suivant respectivement les lois normales \scriptstyle \mathcal N (\mu_1,\sigma_1^2),\mathcal N (\mu_2,\sigma_2^2),\dots,\mathcal N(\mu_n,\sigma_n^2), alors la moyenne \scriptstyle\frac{1}{n}(X_1+X_2+\dots+X_n) suit la loi \mathcal N\left(\tfrac {\mu_1+\mu_2+...+\mu_n} n,\tfrac {\sigma_1^2+\sigma_2^2+....+\sigma_n^2} {n^{2}}\right).

Convexité

La loi normale n'est pas convexe[41], c'est-à-dire que l'inégalité \scriptstyle \lambda \mathbb P(A) + (1-\lambda)\mathbb P(B) \leq \mathbb P(\lambda A+(1-\lambda)B) pour tous boréliens A et B n'est pas vérifiée lorsque la mesure \scriptstyle \mathbb P est normale. Cependant, lorsque l'on normalise cette inégalité avec l'inverse de la fonction de répartition de la loi normale centrée réduite, on obtient le théorème (inégalité de Ehrhard) :

Pour la mesure normale standard \scriptstyle \mathcal N_{0,1}, pour tous intervalles A et B et pour tout \scriptstyle \lambda \in ]0,1[,
\lambda\Phi^{-1}\left( \mathcal N_{0,1}(A)\right) + (1-\lambda)\Phi^{-1}\left(\mathcal N_{0,1}(B)\right) \leq \Phi^{-1}\left(\mathcal N_{0,1}(\lambda A+(1-\lambda)B)\right).

Entropie et quantité d'information[modifier | modifier le code]

Entropie de Shannon

L'entropie de Shannon d'une loi de probabilité absolument continue de densité donnée par \scriptstyle f permet de mesurer une quantité d'information et est définie par :

H=-\int_{-\infty}^{+\infty} f(x)\ln f(x) \mathrm{d}x.

Dans l'ensemble des lois absolument continues de variance \scriptstyle \sigma^2 fixée, les lois normales \scriptstyle \mathcal N(\cdot,\sigma^2) sont d'entropie maximum[a 8]. L'entropie maximum, pour une loi normale donc, est donnée par : \scriptstyle H=\ln \left(\sigma \sqrt{2\pi e}\right). Ainsi la théorie de maximisation de l'entropie dit que, même si elle n'est pas la meilleure loi adaptée aux valeurs, la loi normale ajustée aux valeurs est adéquate pour prendre une décision.

Il y a également une connexion entre la convergence de suites de lois de probabilité vers la loi normale et la croissance de l'entropie, ce qui en fait un outil majeur dans la théorie de l'information[a 2].

La quantité d'information de Fisher

L'information de Fisher d'une loi à densité de probabilité est une autre notion de quantité d'information. Pour une densité \scriptstyle f, elle est donnée par :

I=\int_{-\infty}^{+\infty} \left(\frac{f'(x)}{f(x)}\right)^2 f(x) \mathrm{d}x.

Pour toute densité suffisamment régulière d'une loi centrée réduite, cette information vérifie \scriptstyle I\geq 1. La loi normale se distingue des autres densités puisque l'inégalité précédente est une égalité si et seulement si la densité est celle de la loi normale centrée réduite[a 2].

Distance entre lois

La divergence de Kullback-Leibler entre deux lois permet de mesurer une distance entre les deux lois, ou une perte d'information entre les deux lois. La divergence de Kullback-Leibler entre les deux lois normales \scriptstyle \mathcal N(\mu_1,\sigma_1^2) et \scriptstyle \mathcal N(\mu_2,\sigma_2^2) est :

D_{KL}(\mathcal N(\mu_1,\sigma_1^2) \|\mathcal N(\mu_2,\sigma_2^2)) = \log \left( \frac{\sigma_1}{\sigma_2} \right) + \frac{1}{2} \left( \frac{\sigma_1^2}{\sigma_2^2} - \frac{\sigma_2^2}{\sigma_1^2} + \frac{(\mu_2 - \mu_1)^2}{\sigma_2^2} \right) .

Cette divergence est nulle pour \scriptstyle \mu_1=\mu_2 et \scriptstyle \sigma_1=\sigma_2 ; de plus elle croît lorsque \scriptstyle |\mu_1-\mu_2| croît[a 9].

Approximation de la fonction de répartition[modifier | modifier le code]

Il n'existe pas d'expression analytique pour la fonction de répartition \scriptstyle \Phi de la loi normale centrée réduite, c'est-à-dire qu'il n'existe pas de formule simple entre la fonction de répartition et les fonctions classiques telles que les fonctions polynomiales, exponentielle, logarithmique, trigonométriques, etc. Cependant la fonction de répartition apparaît dans plusieurs résultats à vocation à être appliqués, il est donc important de mieux cerner cette fonction. Différentes écritures sous forme de séries ou de fractions continues généralisées sont possibles[42].

Pour les valeurs de \scriptstyle 0<x \ll 1, la fonction de répartition de la loi normale centrée réduite s'écrit sous la forme[a 10] :

 \Phi(x) = \frac{1}{2}+\frac{1}{\sqrt{2\pi}} \sum_{n=0}^{\infty} \frac{(-1)^n}{n! 2^n (2n+1)} x^{2n+1} = \frac{1}{2} + \frac{1}{\sqrt{2 \pi}} \left(x-\frac{x^3}{6}+\frac{x^5}{40}+\dots\right) ,

ou sous la forme :

 \Phi(x) = \frac{1}{2}+\varphi(x) \sum_{n=0}^{\infty} \frac{1}{1 \cdot 3 \cdot 5\dots (2n+1)} x^{2n+1} = \frac{1}{2} + \varphi(x) \left(x+\frac{x^3}{3}+\frac{x^5}{15}+\dots\right).

Pour \scriptstyle 1 \ll x, la fonction de répartition de la loi normale centrée réduite s'écrit sous la forme[42],[a 10] :

 \Phi(x) = 1-\frac{\varphi(x)}{x}\left(1-\frac{1}{x^2}+\frac{1 \cdot 3}{x^4}-\frac{1 \cdot 3\cdot 5}{x^6}+\dots+\frac{1 \cdot 3\dots (2n-1)}{x^{2n}}\right)+R_n avec R_n=(-1)^{n+1}1 \cdot 3\dots (2n+1) \int_x^\infty \frac{\varphi(y)}{y^{2n+2}}\mathrm{d}y.

De manière plus numérique et facilement calculable, les approximations suivantes donnent des valeurs de la fonction de répartition \scriptstyle \Phi de la loi normale centrée réduite avec :

  • une erreur de l'ordre de[43] \scriptstyle 10^{-5} : pour \scriptstyle x>0, \Phi(x) = 1- \frac{e^{-\frac{x^2}{2}}}{\sqrt{2\pi}} \left( \frac{0,4361836}{1+0,33267\,x} + \frac{-0,1201676}{(1+0,33267\,x)^2}+ \frac{0,9772980}{(1+0,33267\,x)^3} \right)+\epsilon(x)|\epsilon(x)| < 10^{-5}  ;
  • une erreur de l'ordre de[43] \scriptstyle 2,5\,.\,10^{-4} : pour \scriptstyle x>0 : \Phi(x) \approx 1- \frac{1}{2\left(1+0,196854\, x + 0,115194\, x^2 + 0,000344\, x^3 + 0,019527\, x^4\right)^4} ;
  • une erreur de l'ordre de[a 10] \scriptstyle 10^{-2} : \Phi(x)=\begin{cases}0,1 x(4,4-x) & \text{ pour }0\leq x \leq 2,2 \\ 0,49 & \text{ pour }2,2\leq x\leq 2,6 \\ 0,5 & \text{ pour } x\geq 2,6 \end{cases}.

Voici un exemple d'algorithme[a 4] pour le langage C :

double Phi(double x){
   long double s=x,t=0,b=x,q=x*x,i=1;
 
   while(s!=t)
      s = (t=s) + (b*=q/(i+=2));
   return 0.5 + s*exp(-0.5*q - 0.91893853320467274178L);
}

Une autre écriture de la fonction de répartition de la loi normale centrée réduite utilise une fraction continue généralisée[a 4] :

\Phi(x\sqrt{2})=\frac 12 - \cfrac{1}{\sqrt{\pi}} \cfrac{\cfrac 12 e^{-x^2}}{x+\cfrac{1}{2x+\cfrac{2}{x+\cfrac{3}{2x+\cfrac{4}{x+\dots}}}}}

Tables numériques et calculs[modifier | modifier le code]

Comme mentionné dans la section précédente, il est utile de bien connaître la fonction de répartition \scriptstyle \Phi pour les applications numériques. Des tables de valeurs ont alors été calculées pour la fonction de répartition, mais également pour son inverse, ce qui permet d'obtenir les quantiles et les intervalles de confiance pour un seuil de tolérance fixé.

Les tables sont données pour les valeurs positives de la loi normale centrée réduite. Grâce aux formules de la fonction de répartition, il est possible d'obtenir d'autres valeurs.

Les valeurs négatives de la fonction de répartition sont données par la formule[11] \scriptstyle \Phi(-x)=1-\Phi(x). Par exemple :

\Phi(-1,07)=\mathbb P[X\leq -1,07]\approx 1-0,85769=0,14231\; pour X\sim \mathcal N(0,1).

Les valeurs de la fonction de répartition de la loi générale s'obtiennent par la formule[45] \scriptstyle F(y)=\Phi(\frac{y-\mu}{\sigma}). Par exemple[46] :

F(12,14)=\mathbb P[Y\leq 12,14]=\mathbb P\left[\frac{Y-10}{2}\leq \frac{12,14-10}{2}\right]=\mathbb P[X\leq 1,07]=\Phi(1,07)\approx 0,85769\;, pour Y\sim \mathcal N(10,2^2)

La table de valeurs permet également d'obtenir la probabilité qu'une variable aléatoire de loi normale \scriptstyle X\sim \mathcal N(0,1) appartienne à un intervalle donné \scriptstyle [a,b] par la formule : \scriptstyle \mathbb P\left[X\in [a,b]\right]=\mathbb P[X\leq b]-\mathbb P[X < a]=\Phi(b)-\Phi(a). Par exemple :

  • \mathbb P[X\geq 1,07]=1-\mathbb P[X < 1,07]=1-\mathbb P[X \leq 1,07]\approx 0,14231\; pour X\sim \mathcal N(0,1).
  • \mathbb P[0\leq X\leq 1,07]=\Phi(1,07)-\Phi(0)=\Phi(1,07)-0,5\approx 0,85769-0,5=0,35769\; pour X\sim \mathcal N(0,1).
Plages de normalité, intervalles de confiance

Un des intérêts de calculer des probabilités sur des intervalles est l'utilisation des intervalles de confiance pour les tests statistiques. La loi normale est définie par deux valeurs : la moyenne \scriptstyle \mu et l'écart type \scriptstyle \sigma. Ainsi il est utile de s'intéresser aux intervalles[47] du type \scriptstyle [\mu-r\sigma, \mu+r\sigma].

\mathbb P[\mu-r\sigma\leq Y\leq \mu+r\sigma] = \Phi(r) - (1 - \Phi(r)) = 2\Phi(r) - 1\; pour Y\sim \mathcal N(\mu,\sigma^2).
boite à moustache et courbe de Gauss
Représentation d'une boîte à moustaches et le lien avec les quantiles d'une loi normale.

Cette table de valeurs des intervalles de confiance permet d'obtenir les plages de normalité pour un niveau de confiance donné. Pour \scriptstyle Y\sim \mathcal N(\mu,\sigma^2), le tableau donne[7] :

  • \ P(\mu - \sigma \leq Y \leq \mu + \sigma) \approx 0,6827.
    L'intervalle [\mu - \sigma,\, \mu + \sigma] est la plage de normalité au niveau de confiance 68 % ;
  • \ P(\mu - 0,5H \leq Y \leq \mu + 0,5H) \approx 0,76.
    L'intervalle [\mu - 0,5H,\, \mu + 0,5H] , H étant la largeur à mi-hauteur, est la plage de normalité au niveau de confiance 76 % ;
  • \ P(\mu - 2\sigma \leq Y \leq \mu + 2\sigma) \approx 0,9545
    L'intervalle [\mu - 2\, \sigma,\, \mu + 2\, \sigma] est la plage de normalité au niveau de confiance 95 % ;
  • \ P(\mu - 3\sigma \leq Y \leq \mu + 3\sigma) \approx 0,9973
    L'intervalle [\mu - 3\sigma,\mu + 3\, \sigma] est la plage de normalité au niveau de confiance 99 %.

Inversement, lorsque la valeur de la probabilité \scriptstyle \alpha\in [0,1] est fixée, il existe[a 5] une unique valeur \scriptstyle r>0 telle que : \scriptstyle \mathbb P(\mu - r\sigma \leq Y \leq \mu + r\sigma) = 2\Phi(r)-1= \alpha. L'intervalle \scriptstyle [\mu - r\sigma, \mu + r\sigma] est appelé plage de normalité ou intervalle de confiance au niveau de confiance \alpha. Pour une loi normale \scriptstyle \mathcal N(\mu,\sigma^2) et le seuil \scriptstyle \alpha donnés, la méthode pour retrouver cette valeur \scriptstyle r consiste[48] à utiliser le tableau de valeur des quantiles (ci-dessus) pour trouver la valeur \scriptstyle r telle que \scriptstyle \Phi(r)=\frac{\alpha+1}{2}, l'intervalle de confiance est alors : \scriptstyle [\mu - r\sigma, \mu + r\sigma].

Par exemple, la plage de normalité au niveau de confiance 95 % d'une loi normale \scriptstyle \mathcal N(10,2^2) est l'intervalle \scriptstyle [10-2r ; 10+2r]\scriptstyle r vérifie \scriptstyle \Phi(r)=\frac{0,95+1}{2}=0,975, soit \scriptstyle r=q_{0,975}\approx 1,96, l'intervalle est donc : \scriptstyle [6,08 ; 13,92] aux arrondis près.

Liens avec d'autres lois[modifier | modifier le code]

Grâce à son rôle central parmi les lois de probabilité et dans les applications, la loi normale possède beaucoup de liens avec les autres lois. Certaines lois sont même construites à partir de la loi normale pour mieux correspondre aux applications.

Lois usuelles[modifier | modifier le code]

Différentes lois du \chi et \chi^2
Lois en fonction de variables de loi normale
loi du χ² \sum_{i=1}^k \left(\frac{X_i-\mu_i}{\sigma_i}\right)^2
loi du χ² non centrée \sum_{i=1}^k \left(\frac{X_i}{\sigma_i}\right)^2
loi du χ \sqrt{\sum_{i=1}^k \left(\frac{X_i-\mu_i}{\sigma_i}\right)^2}
loi du χ non centrée \sqrt{\sum_{i=1}^k \left(\frac{X_i}{\sigma_i}\right)^2}
Lois unidimensionnelles
  • Si une variable aléatoire \scriptstyle X suit la loi normale \scriptstyle \mathcal N(\mu,\sigma^2), alors[49] la variable aléatoire \scriptstyle \exp(X) suit la loi log-normale.
  • Si U et V sont deux variables aléatoires indépendantes de loi uniforme sur [0,1], alors les deux variables aléatoires \scriptstyle X=\sqrt{-2\ln(U)}\, \cos(2\pi V) et \scriptstyle Y=\sqrt{-2\ln(U)}\, \sin(2\pi V) sont de loi normale centrée réduite[45]. De plus X et Y sont indépendantes. Ces deux formules sont utilisées pour simuler la loi normale.
  • Si les variables \scriptstyle X_1,X_2,\dots,X_n sont indépendantes et de loi commune \scriptstyle \mathcal N(0,1), alors[50] la somme de leur carré : \scriptstyle \sum_{k=1}^n X_k^2 suit une loi du χ² à n degrés de liberté : \scriptstyle \chi^2(n). La formule s'étend pour des variables normales non centrées et non réduites. De plus, le même type de lien existe avec la loi du χ² non centrée, la loi du χ et la loi du χ non centrée (voir le tableau ci-contre).
  • Si la variable U suit une loi normale centrée réduite : \scriptstyle \mathcal N(0,1), si V suit une loi du χ² à n degrés de liberté : \scriptstyle \chi^2(n) et si U et V sont indépendantes, alors[50] la variable \scriptstyle \frac{U}{\sqrt{\frac{V}{n}}} suit une loi de Student à n degrés de liberté : \scriptstyle t(n).
  • Si \scriptstyle X est une variable aléatoire de loi normale centrée réduite et \scriptstyle U de loi uniforme sur [0,1], alors \scriptstyle \frac{X}{U} est de loi dite de Slash[a 11].
  • Pour une variable aléatoire \scriptstyle X de loi normale centrée réduite \scriptstyle \mathcal N(0,1), la variable \scriptstyle \mathrm{signe}(X) |X|^p est de loi normale puissance p. Pour \scriptstyle p=1, cette variable est de loi normale centrée réduite[a 11].
  • Si \scriptstyle Z_1 et \scriptstyle Z_2 sont deux variables aléatoires indépendantes de loi normale centrée réduite, alors[51] le quotient \scriptstyle \frac{Z_1}{Z_2} suit la loi de Cauchy de paramètre 0 et 1 : \scriptstyle Cau(0,1).
Lois multidimensionnelles
  • Il existe une version multidimensionnelle de la loi normale, appelée loi normale multidimensionnelle, loi multinormale ou loi de Gauss à plusieurs variables. Lorsque \scriptstyle X_1,X_2,\dots,X_n sont des variables aléatoires de lois normales, alors la loi de probabilité du vecteur aléatoire \scriptstyle (X_1,X_2,\dots,X_n) est de loi normale multidimensionnelle. Sa densité de probabilité prend la même forme que la densité de la loi normale mais avec une écriture matricielle. Si le vecteur aléatoire \scriptstyle (X_1,X_2) est de loi normale multidimensionnelle \mathcal N(\mu,\mathbf{\Sigma})\scriptstyle \mu est le vecteur des moyennes et \scriptstyle \mathbf\Sigma est la matrice de variance-covariance, alors la loi conditionnelle \scriptstyle (X_1|X_2=x) de \scriptstyle X_1 sachant que \scriptstyle X_2=x est la loi normale[52] \scriptstyle \mathcal N(\mu_{1|x},\sigma_{1|x}) :
Si (X_1,X_2) \sim \mathcal N \left( \left(\begin{matrix} \mu_1 \\ \mu_2 \end{matrix}\right) , \left(\begin{matrix} \sigma_{11} & \sigma_{12} \\ \sigma_{21} & \sigma_{22} \end{matrix}\right) \right), alors (X_1|X_2=x)\sim \mathcal N(\mu_{1|x},\sigma_{1|x}) avec \mu_{1|x}=\mu_1+\frac{\sigma_{12}}{\sigma_{22}} \left( x - \mu_2 \right) et \sigma_{1|x} = \sigma_{11} - \frac{\sigma_{12}\sigma_{21}}{\sigma_{22}}.
  • La loi de la norme d'un vecteur dont les coordonnées sont indépendantes et de lois normales centrées réduites est la loi de Rayleigh[a 2].

Il est à noter que la loi inverse-gaussienne et loi inverse-gaussienne généralisée n'ont pas de lien avec une formule simple créée à partir de variables de loi normale, mais ont une relation avec le mouvement brownien.

Lois normales généralisées[modifier | modifier le code]

Plusieurs généralisations de la loi normale ont été introduites afin de changer sa forme, son asymétrie, son support, etc.

Un nouveau paramètre \scriptstyle \beta>0 dit de forme a été introduit dans la loi normale pour obtenir une loi normale généralisée. Cette famille de lois contient la loi normale, c'est le cas pour \scriptstyle \beta=2, mais également la loi de Laplace pour \scriptstyle \beta=1. La nouvelle densité de probabilité est donnée par[a 12] :

f(x)= \frac{\beta}{2\alpha\Gamma(1/\beta)} \; e^{-\left(\frac{|x-\mu|}{\sigma}\right)^\beta} .

Il existe une manière de changer l'asymétrie de la loi normale afin d'obtenir la loi dite loi normale asymétrique (skew normal distribution en anglais)[a 13]. L'introduction d'un paramètre \scriptstyle \lambda\in \mathbb R permet d'obtenir la loi normale lorsque \scriptstyle \lambda=0, une asymétrie vers la droite lorsque \scriptstyle \lambda>0 et une asymétrie vers la gauche lorsque \scriptstyle \lambda<0. La densité de cette loi est donnée par :

f(x)=2\varphi(x)\Phi(\lambda x).

Afin de changer le support de la loi normale et notamment de le rendre borné, une modification possible de la loi est de la tronquer. Elle est alors changée d'échelle pour que les parties coupées se répartissent sur l'ensemble des valeurs gardées (à la différence de la loi repliée, voir ci-dessous). La loi normale centrée réduite tronquée en -T et en T a pour support l'intervalle \scriptstyle [-T,T] et sa fonction de densité se définit par[a 14] :

f(x)=\begin{cases} \frac{\varphi(x)}{2\Phi(T)-1} & \text{ si } x\in [-T,T]\\ 0 & \text{ sinon }. \end{cases}

Il est également possible de tronquer la loi normale d'un seul côté. Elle est alors appelée « loi normale rectifiée ». Si une variable aléatoire \scriptstyle X suit une loi normale \scriptstyle \mathcal N(\mu, \sigma^2), alors \scriptstyle \max(X,0) suit la loi normale rectifiée[a 15].

Une autre manière de changer le support de la loi normale est de « replier » la densité à partir d'une valeur, la loi obtenue est la loi normale repliée. Les valeurs retirées, par exemple \scriptstyle ]-\infty,0[, sont alors réparties proche de la valeur charnière, 0 ici (à la différence de la loi tronquée, voir ci-dessus). La densité de probabilité de la loi normale repliée en 0 est donnée par[a 16] :

f(x)=\begin{cases} \frac{1}{\sigma\sqrt{2\pi}} \, \exp \left( -\frac{(x+\mu)^2}{2\sigma^2} \right) + \frac{1}{\sigma\sqrt{2\pi}} \, \exp \left( -\frac{(x-\mu)^2}{2\sigma^2} \right)& \text{ pour }x \ge 0 \\ 0 &\text{ sinon.}\end{cases}

Une version généralisée de la loi log-normale permet d'obtenir une famille de lois comprenant la loi normale comme cas particulier[53]. La famille est définie à partir de trois paramètres : un paramètre de position \scriptstyle \mu, un paramètre d'échelle \scriptstyle \sigma et un paramètre de forme \scriptstyle \kappa\in \mathbb R. Lorsque \scriptstyle \kappa=0, cette loi log-normale généralisée est la loi normale. La densité est donnée par :

f(x)=\frac{\varphi(y)}{\alpha-\kappa(x-\xi)}, où y = \begin{cases} - \frac{1}{\kappa} \log \left[ 1- \frac{\kappa(x-\xi)}{\alpha} \right] & \text{si } \kappa \neq 0 \\ \frac{x-\xi}{\alpha} & \text{si } \kappa=0 \end{cases} .
Différentes formes pour la densité de la loi normale généralisée.
Différentes formes pour la densité de la loi normale asymétrique.
Loi normale centrée réduite tronquée en 1,5 pour la courbe rouge et en 2,5 pour la courbe bleue.
En vert, la densité de la loi normale repliée en 0.
Différentes formes pour la densité de la loi log-normale.
 

Constructions à partir de la loi normale[modifier | modifier le code]

Mélange de lois
Article détaillé : Modèle de mélanges gaussiens.
densité d'un mélange de lois normales.
En bleu : densité d'une combinaison linéaire de deux densités normales.

Un mélange gaussien est une loi de probabilité dont la densité est définie par une combinaison linéaire de deux densités de loi normales. Si on note \scriptstyle f_1 la densité de \scriptstyle \mathcal N(\mu_1,\sigma_1^2) et \scriptstyle f_2 la densité de \scriptstyle \mathcal N(\mu_2,\sigma_2^2), alors \scriptstyle \lambda f_1+(1-\lambda)f_2 est la densité d'une loi de probabilité dite mélange gaussien[54].

Il ne faut pas confondre la combinaison linéaire de deux variables aléatoires indépendantes de loi normale, qui reste une variable gaussienne, et la combinaison linéaire de leurs deux densités, qui permet d'obtenir une loi qui n'est pas la loi normale.

Les modes des deux lois normales sont donnés par \scriptstyle \mu_1 et \scriptstyle \mu_2, le mélange gaussien est alors une loi bimodale. Ses maxima locaux sont proches de mais non égaux[54] aux valeurs \scriptstyle \mu_1 et \scriptstyle \mu_2.

Généralités

Il est possible de construire d'autres densités de probabilité grâce à la densité \scriptstyle \varphi de la loi normale centrée réduite. Harald Cramér énonce en 1926 un résultat général[55] : si une densité de probabilité \scriptstyle g est deux fois dérivable, si l'intégrale \scriptstyle \int (g''(x))^2 e^{x^2/2}dx converge et si \scriptstyle \lim_{+\infty}g(x)=\lim_{-\infty}g(x)=0, alors la fonction \scriptstyle g peut être développée en une série absolument et uniformément convergente en fonction des dérivées de la densité de la loi normale centrée réduite et des polynômes d'Hermite \scriptstyle H_k :

g(x) = \sum_{k=0}^\infty \frac{1}{k!} \varphi^{(k)}(x) \int g(y) H_k(y) dy.

Utilisations[modifier | modifier le code]

Historiquement, la loi normale est introduite lors d'études d'objets célestes ou de jeux de hasard. Elle est ensuite étudiée et généralisée mathématiquement puis elle est utilisée dans de nombreuses autres applications : en mathématiques, dans d'autres sciences exactes, dans des sciences plus appliquées ou des sciences humaines et sociales. Voici une sélection d'exemples.

Balistique[modifier | modifier le code]

Au XIXe siècle, pour améliorer les précisions des tirs de l'artillerie, de nombreux tirs de canons sont réalisés. Il est observé que la direction et la portée sont assimilables à des lois normales[a 17]. Cette compréhension permet de mieux entraîner les servants pour régler les tirs. Cette loi normale provient de différents facteurs comme les conditions climatiques, mais également de l'usure du matériel militaire. La dispersion des points d'impact, et donc de la loi, renseigne sur l'état du matériel et sur le nombre éventuel de tirs anormaux. L'ajustement à la loi normale est alors effectué par le test de Lhoste sur une série de 200 tirs. Le mathématicien Jules Haag applique la méthode pour 2 680 tirs de différentes portées et de différentes directions[a 17].

Quotient intellectuel[modifier | modifier le code]

Le quotient intellectuel (QI) a pour objectif de donner une valeur numérique à l’intelligence humaine. En 1939, David Wechsler donne une définition à ce quotient de manière statistique. Une note de 100 est donnée à la moyenne des valeurs obtenues dans une population de même âge et 15 points sont retranchés pour un écart égal à l'écart type obtenu à partir des valeurs de la population testée[56]. Pour cette raison, en pratique, la courbe de répartition du QI est modélisée par la courbe en cloche de la loi normale centrée en 100 et d'écart type 15 : \scriptstyle \mathcal N(100,15^2). Cependant cette modélisation est remise en cause par certains scientifiques. En effet, les résultats des tests seraient dépendants des classes sociales de la population ; la population ne serait donc plus homogène, c'est-à-dire que la propriété d'indépendance des individus ne serait pas vérifiée[a 18]. Le quotient intellectuel ne serait alors qu'une approximation de mesure de l'intelligence humaine dont on ne connaît pas l'erreur.

Anatomie humaine[modifier | modifier le code]

Courbe de croissance du poids.
Exemple de courbe de croissance du poids.

Un caractère observable et mesurable dans une population d'individus comparables a souvent une fréquence modélisée par une loi normale. C'est le cas par exemple de la taille humaine pour un âge donné (en séparant les hommes et les femmes)[57], de la taille des becs dans une population d'oiseaux comme les pinsons de Darwin étudiés par Darwin[58]. Plus précisément, un caractère mesurable dans une population peut être modélisé à l'aide d'une loi normale s'il est codé génétiquement par de nombreux allèles ou par de nombreux loci[58] ou si le caractère dépend d'un grand nombre d'effets environnementaux[59].

Les courbes de croissance données par l'OMS, et présentes par exemple dans les carnets de santé, sont issues de modélisations grâce à la loi normale. Grâce à une étude détaillée des centiles mesurés dans une population d'âge fixé et grâce à des tests statistiques d'adéquation, les répartitions du poids et de la taille par tranche d'âge ont été modélisées par des lois de probabilité. Parmi ces lois on retrouve la loi normale, la loi normale de Box-Cox (en) (généralisation de la loi normale), la loi Student de Box-Cox (généralisation de la loi normale de Box-Cox) ou encore la loi exponentielle-puissance de Box-Cox[a 19]. Graphiquement, pour chaque âge, c'est-à-dire pour chaque axe vertical, la médiane \scriptstyle m est représentée (elle donne la courbe centrale) et les deux valeurs de \scriptstyle m+\sigma et \scriptstyle m-\sigma\scriptstyle \sigma est l'écart type, donnent les deux courbes et ainsi représentent l'évolution d'un intervalle de confiance.

Traitement du signal et mesures physiques[modifier | modifier le code]

lissage gaussien
Un filtre gaussien a été appliqué à l'image du haut, issue d'un journal, pour obtenir l'image du bas, plus lisse, moins granuleuse.

Lorsqu'un signal est transmis, une perte d'information apparaît à cause du moyen de transmission ou du décodage du signal. Lorsqu'une mesure physique est effectuée, une incertitude sur le résultat peut provenir d'une imprécision de l'appareil de mesure ou d'une impossibilité à obtenir la valeur théorique. Une méthode pour modéliser de tels phénomènes est de considérer un modèle déterministe (non aléatoire) pour le signal ou la mesure et d'y ajouter ou multiplier un terme aléatoire qui représente la perturbation aléatoire, parfois appelée erreur ou bruit. Dans beaucoup de cas cette erreur additive est supposée de loi normale, de loi log-normale dans le cas multiplicatif[60]. C'est le cas, par exemple, pour la transmission d'un signal à travers un câble électrique[27]. Lorsque le processus dépend du temps, le signal ou la mesure est alors modélisé grâce à un bruit blanc (voir ci-dessus)[61].

En traitement d'images, la loi normale est utilisée pour améliorer les images et notamment diminuer le bruit, c'est-à-dire les imperfections de l'image. Un lissage grâce à un filtre gaussien est alors utilisé.

Économie[modifier | modifier le code]

Les prix de certaines denrées sont données par une bourse, c'est le cas du cours du blé, du coton brut ou de l'or. Au temps \scriptstyle t, le prix \scriptstyle Z(t) évolue jusqu'au temps \scriptstyle t+T par l'accroissement \scriptstyle Z(t+T)-Z(t). En 1900, Louis Bachelier postule que cet accroissement suit une loi normale de moyenne nulle et dont la variance dépend de \scriptstyle t et \scriptstyle T. Cependant ce modèle satisfait peu l'observation faite des marchés financiers. D'autres mathématiciens proposent alors d'améliorer ce modèle en supposant que c'est l'accroissement \scriptstyle \ln Z(t+T)-\ln Z(t) qui suit une loi normale[a 7], c'est-à-dire que l'accroissement du prix suit une loi log-normale. Ce modèle est encore amélioré, par Benoît Mandelbrot notamment, en supposant que l'accroissement suit une loi stable (la loi normale est un cas particulier de loi stable). Il apparaît alors le mouvement brownien dont l'accroissement est de loi normale et le processus de Lévy (stable) dont l'accroissement stable pour modéliser les courbes des marchés[a 7].

Mathématiques[modifier | modifier le code]

Bruit blanc gaussien
Bruit blanc gaussien unidimensionnel.

La loi normale est utilisée dans plusieurs domaines des mathématiques. Le Bruit blanc gaussien est un processus stochastique tel qu'en tout point, le processus est une variable aléatoire de loi normale indépendante du processus aux autres points[62]. Le mouvement brownien \scriptstyle (B(t),t\geq 0) est un processus stochastique dont les accroissements sont indépendants, stationnaires et de loi normale[a 7]. Notamment pour une valeur \scriptstyle t>0 fixée, la variable aléatoire \scriptstyle B(t) suit la loi normale \scriptstyle \mathcal N(0,t). Ce processus aléatoire possède de nombreuses applications, il fait un lien ente l'équation de la chaleur et la loi normale[a 3]. Lorsque l'extrémité d'une tige métallique est chauffée pendant un court instant, la chaleur se propage le long de la tige sous la forme d'une courbe en cloche.

La loi normale a également des applications dans des domaines mathématiques non aléatoires comme la théorie des nombres. Tout nombre entier n peut s'écrire comme la multiplication de puissances de nombres premiers. Notons \scriptstyle \omega(n) le nombre de nombres premiers différents dans cette décomposition. Par exemple, puisque \scriptstyle 60=2^2\times 3 \times 5, \scriptstyle \omega(60)=3. Le théorème d'Erdős-Kac assure[a 3] que cette fonction \scriptstyle n\mapsto \omega(n) pour \scriptstyle n\leq N est apparentée à la densité de la loi normale \scriptstyle \mathcal N\left(\ln\ln(N),\sqrt{\ln\ln(N)}\right). C'est-à-dire que pour un grand nombre de l'ordre de \scriptstyle 1000000000=10^9, il y a une forte probabilité pour que le nombre de diviseurs premiers soit 3, puisque \scriptstyle \ln\ln(10^9)\approx 3,03.

Tests et estimations[modifier | modifier le code]

Critères de normalité[modifier | modifier le code]

Droite de Henry.
Quatre valeurs ainsi que la droite de Henry représentées sur un papier gausso-arithmétique.

Il est important de savoir si des valeurs sont distribuées suivant la loi normale. Quelques critères peuvent être étudiés avant de réaliser un test statistique (voir la section Tests de normalité ci-dessous).

Le premier critère, le plus simple, consiste à tracer le diagramme en bâtons de la distribution et à vérifier visuellement si le diagramme est en forme de « cloche ». Ce critère, subjectif, permet cependant d'éliminer une partie des distributions jugées alors non gaussiennes.

De manière plus précise, l'utilisation des plages de normalité permet de comparer avec les fréquences observées facilement calculables. Le critère consiste à utiliser les plages de normalité ou intervalles de confiance. Lorsque des valeurs suivent la loi normale :

  • 68 % d'entre elles sont dans l'intervalle \scriptstyle [\overline{x} -\sigma\, ;\, \overline{x}+\sigma] ;
  • 95 % d'entre elles sont dans l'intervalle \scriptstyle [\overline{x} -2\, \sigma\, ;\, \overline{x} + 2\, \sigma] ;
  • 99,7 % d'entre elles sont dans l'intervalle \scriptstyle [\overline{x} - 3\, \sigma\, ;\, \overline{x} + 3\, \sigma].

Si ce n'est pas le cas, le choix de modéliser la loi des valeurs observées par la loi normale n'est pas conseillé.

La droite de Henry permet de faire un ajustement des valeurs observées avec une loi normale. C'est-à-dire qu'en représentant la droite de Henry, il est possible de porter un diagnostic sur la nature normale ou non de la distribution et, dans le cas où celle-ci a des chances d'être normale, elle permet d'en déterminer la moyenne et l'écart type. Les valeurs \scriptstyle (x_i , i\leq n) sont observées et représentées par leur fonction de répartition empirique \scriptstyle F_n. Elles sont gaussiennes si les points \scriptstyle (x_i,F_n(x_i)) représentés sur un papier gausso-arithmétique sont alignés suivant une droite dite de Henri[63]. Un papier gausso-arithmétique est gradué avec une échelle arithmétique en abscisse et graduée suivant l'inverse de la fonction de répartition de la loi normale centrée réduite \scriptstyle \Phi^{-1} en ordonnée[64].

Ces critères sont nécessaires mais non suffisants. Cependant, il ne suffit pas de remplir les critères pour affirmer que les valeurs suivent la loi normale.

Tests de normalité[modifier | modifier le code]

Articles détaillés : Test statistiques et Test de normalité.

Grâce à son rôle dans le théorème central limite, la loi normale se retrouve dans de nombreux tests statistiques dits gaussiens ou asymptotiquement gaussiens. L'hypothèse dite de normalité est faite sur une loi a priori dans un test d'adéquation pour indiquer que cette loi suit, approximativement, une loi normale[a 17]. Il existe plusieurs tests de normalité.

  • Un test du χ² d'adéquation à la loi normale est possible pour tester si une série de k valeurs observées suit une loi normale[65]. Dans ce type de test, l'hypothèse nulle est : la distribution observée peut être approchée par la loi normale. Après avoir regroupé les k valeurs observées en classes, il faut calculer les probabilités qu'une variable aléatoire de loi normale appartienne à chaque classe en estimant les paramètres de la loi grâce aux valeurs observées. Ces probabilités peuvent être obtenues avec les tables numériques de la loi normale. Si l'hypothèse nulle est vraie, la statistique du χ² calculée à partir des valeurs observées et des probabilités précédentes suit une loi du χ². Le nombre de degré de liberté est k-1 si la moyenne et l'écart type sont connus, k-2 si l'un des deux paramètres est inconnu, ou k-3 si les deux paramètres sont inconnus. L'hypothèse nulle est rejetée si la statistique du χ² est supérieure à la valeur obtenue grâce à la table de la loi du χ² au seuil \scriptstyle \alpha.
est supérieure à une valeur critique calculée grâce au seuil \scriptstyle \alpha et à la taille de l'échantillon, alors l'hypothèse de normalité est rejetée au seuil \scriptstyle \alpha.
  • Le test de Anderson-Darling (en) est une autre version du test de Kolmogorov-Smirnov mieux adaptée à l'étude des queues de distribution[a 20]. En reprenant les mêmes notations que le test de Lilliefors, si la statistique :
     A = -n-\frac{1}{n} \sum_{i=1}^n (2i-1) \left( \ln(F_i) + \ln(1-F_{n-i+1}) \right)
est supérieure à une valeur critique calculée grâce au seuil \scriptstyle \alpha et à la taille de l'échantillon, alors l'hypothèse de normalité est rejetée au seuil \scriptstyle \alpha.
  • Le test de D'Agostino (en) est basé sur les coefficients de symétrie et d'aplatissement. Il est particulièrement efficace à partir de \scriptstyle n\geq 20 valeurs observées[a 20]. Même si l'idée de ce test est simple, les formules sont plus compliquées à écrire. L'idée est de construire des modifications des coefficients de symétrie et d'aplatissement pour obtenir des variables \scriptstyle z_1 et \scriptstyle z_2 de loi normale centrée réduite. Il faut alors effectuer un test du χ² avec la statistique \scriptstyle z_1^2+z_2^2.
  • Le test de Jarque Bera est également basé sur les coefficients de symétrie et d'aplatissement. ce test n'est intéressant que pour un nombre élevé de valeurs observées[a 20]. En considérant les deux estimateurs :
    b_1=\frac{\frac{1}{n}\sum_{i=1}^n (x_i-\overline{x})^3}{\left(\frac{1}{n}\sum_{i=1}^n (x_i-\overline{x})^2\right)^{\frac{3}{2}}} et b_2=\frac{\frac{1}{n}\sum_{i=1}^n (x_i-\overline{x})^4}{\left(\frac{1}{n}\sum_{i=1}^n (x_i-\overline{x})^2\right)^2},
comme précédemment, il faut effectuer un test du χ² avec la statistique \scriptstyle T=n\left( b_1^2/6 + (b_2-3)^2/24 \right).
  • Le test de Shapiro-Wilk (proposé en 1965) est efficace pour les petits échantillons de moins de 50 valeurs[a 20]. Les valeurs observées \scriptstyle (x_i , i\leq n) sont rangées par ordre croissant \scriptstyle (x_{(i)},i\leq n) et des coefficients \scriptstyle a_i sont calculés à partir de quantiles, moyenne, variance et covariance d'une loi normale. Si la statistique
     W = \frac{ \left( \sum_{i=1}^{[n/2]} a_i \left(x_{(n-i+1)} - x_{(i)}\right)\right)^2 }{ \sum_{i=1}^n (x_i-\overline{x})^2 }
est inférieure à une valeur critique calculée grâce au seuil \scriptstyle \alpha et à la taille de l'échantillon, alors l'hypothèse de normalité est rejetée au seuil \scriptstyle \alpha.

Estimations des paramètres[modifier | modifier le code]

Lorsqu'un phénomène aléatoire est observé et qu'il est considéré comme pouvant être modélisé par une loi normale, une des questions que l'on peut se poser est : que valent les paramètres \scriptstyle \mu et \scriptstyle \sigma de la loi normale \scriptstyle \mathcal N(\mu,\sigma^2) ? Une estimation est alors à effectuer. Les observations récupérées lors de l'observation du phénomène sont notées par des variables aléatoires \scriptstyle X_1,X_2,\dots,X_n, les notations de la moyenne arithmétique et de la moyenne des carrés sont également utiles[66] :

S_n=\frac{1}{n}(X_1+X_2+\dots+X_n)

et

T_{n-1}^2=\frac{1}{n-1} \sum_{k=1}^n (X_k-S_n)^2.

Ces deux valeurs sont respectivement des estimateurs de la moyenne et de l'écart type qui se calculent à partir des valeurs observées. Puisque les variables \scriptstyle X_1,X_2,\dots,X_n sont de loi normale, alors \scriptstyle S_n est de loi \scriptstyle \mathcal N(\mu, \frac{\sigma^2}{n}) et \scriptstyle T_{n-1} est de loi du χ² : \scriptstyle \chi^2 (n-1)[66].

Estimation de la moyenne \scriptstyle \mu (lorsque l'écart type \scriptstyle \sigma est connu)

Une méthode est de chercher un intervalle de confiance à un seuil \scriptstyle \alpha autour de la moyenne théorique \scriptstyle \mu. En utilisant les quantiles d'ordre \scriptstyle \frac{\alpha}{2} et \scriptstyle 1-\frac{\alpha}{2}, la formule définissant les quantiles permet d'obtenir[66] :

\mathbb P\left( S_n+\frac{\sigma}{\sqrt{n}}q_{\alpha/2} \leq \mu \leq S_n-\frac{\sigma}{\sqrt{n}}q_{\alpha/2} \right)\geq 1- \alpha.

Grâce aux valeurs observées et aux tables numériques de la loi normale centrée réduite (voir la table), il est alors possible de donner les valeurs numériques de l'intervalle \scriptstyle \left[S_n-\frac{\sigma}{\sqrt{n}}q_{\alpha/2} , S_n-\frac{\sigma}{\sqrt{n}}q_{1-\alpha/2} \right] au seuil \scriptstyle \alpha.

Estimation de la moyenne \scriptstyle \mu (lorsque l'écart type \scriptstyle \sigma est inconnu)

Une méthode est d'utiliser une variable intermédiaire qui peut s'écrire à l'aide de nouvelles variables aléatoires \scriptstyle U de loi \scriptstyle \mathcal N(0,1) et \scriptstyle V de loi \scriptstyle \chi^2 (n-1) : \scriptstyle \sigma\frac{S_n-\mu}{T_{n-1}} = \frac{U\sqrt{n-1}}{\sqrt{V}} est de loi de Student \scriptstyle t(n-1). En utilisant les quantiles d'ordre \scriptstyle \frac{\alpha}{2} et \scriptstyle 1-\frac{\alpha}{2}, la formule définissant les quantiles permet d'obtenir[67] :

\mathbb P\left( S_n+\frac{T_{n-1}}{\sqrt{n}}q_{\alpha/2} \leq \mu \leq S_n-\frac{T_{n-1}}{\sqrt{n}}q_{\alpha/2} \right)\geq 1- \alpha.

Grâce aux valeurs observées et aux tables numériques de la loi normale centrée réduite (voir la table), il est alors possible de donner les valeurs numériques de l'intervalle \scriptstyle \left[S_n+\frac{T_{n-1}}{\sqrt{n}}q_{\alpha/2} , S_n-\frac{T_{n-1}}{\sqrt{n}}q_{\alpha/2} \right] au seuil \scriptstyle \alpha.

Estimation de l'écart type \scriptstyle \sigma (lorsque la moyenne \scriptstyle \mu est inconnue)

La méthode est la même que la précédente. L'introduction de la variable aléatoire \scriptstyle T_{n-1}^2\frac{n-1}{\sigma^2} de loi du χ² à \scriptstyle n-1 degrés de liberté permet d'obtenir[68] :

\mathbb P\left( T_{n-1}^2\frac{n-1}{q_{1-\alpha/2}} \leq \sigma \leq T_{n-1}^2\frac{n-1}{q_{\alpha/2}} \right)\geq 1- \alpha

\scriptstyle q_{1-\alpha/2} et \scriptstyle q_{\alpha/2} sont les quantiles de la loi du χ² à \scriptstyle n-1 degrés de liberté que l'on peut obtenir à partir de la table numérique du χ². L'intervalle \scriptstyle \left[T_{n-1}^2\frac{n-1}{q_{1-\alpha/2}} , T_{n-1}^2\frac{n-1}{q_{\alpha/2}}\right] est l'intervalle de confiance au seuil \scriptstyle \alpha.

Simulation[modifier | modifier le code]

Il est possible de simuler, par exemple par ordinateur, un tirage aléatoire dont la loi est normale.

Les logiciels ou les langages de programmation possèdent en général un générateur de nombres pseudo-aléatoires ayant une distribution uniforme sur ]0,1[. On cherche donc une fonction transformant ces nombres. De manière générale, on peut prendre la fonction réciproque de la fonction de répartition : en l'occurrence, si la variable aléatoire U suit la loi uniforme sur ]0,1[, alors la variable aléatoire \ \Phi^{-1}(U) suit la loi normale centrée réduite ; cependant, cette méthode est très malcommode, faute d'expressions simples des fonctions \ \Phi et \ \Phi^{-1}. En revanche, on peut facilement utiliser la méthode décrite ci-dessous.

Si \scriptstyle U_1,U_2,\dots,U_{12} sont douze variables indépendantes de loi uniforme sur \scriptstyle [0,1], alors la variable \scriptstyle \sum_{k=1}^{12}U_k-6 est de moyenne nulle et d'écart type unitaire. Ainsi, grâce au théorème central limite, cette variable suit approximativement la loi normale centrée réduite[a 21]. C'est une manière simple de générer une loi normale, cependant l'approximation n'est pas très précise.

Un meilleur algorithme a été proposé par Box et Muller. Cette méthode de Box-Muller utilise une représentation en polaire de deux coordonnées uniformes donnée par les formules :

Si \begin{cases}U\sim\mathcal U(0,1) \\ V\sim\mathcal U(0,1)\end{cases} alors \begin{cases}\sqrt{-2\ln(U)}\cos(2\pi V)\sim\mathcal N(0,1) \\ \sqrt{-2\ln(U)}\sin(2\pi V)\sim\mathcal N(0,1)\end{cases}.

Cet algorithme est simple à réaliser mais le calcul d'un logarithme, d'une racine carrée et d'une fonction trigonométrique rend la simulation informatique lente[a 21]. Une amélioration a été proposée par Marsaglia et Bray en 1964, en remplaçant les cosinus et sinus des formules par la variable aléatoire \scriptstyle V_1/\sqrt{W} et \scriptstyle V_2/\sqrt{W}\scriptstyle V_1 et \scriptstyle V_2 sont indépendantes de loi \scriptstyle \mathcal U(0,1) et \scriptstyle W=V_1^2+V_2^2, ainsi :

\begin{cases} V_1\sqrt{\frac{2}{W}\ln\left(\frac{1}{W}\right)}\sim\mathcal N(0,1) \\ V_2\sqrt{\frac{2}{W}\ln\left(\frac{1}{W}\right)}\sim\mathcal N(0,1).\end{cases}

L'algorithme n'est pas plus compliqué à mettre en œuvre et la simulation gagne en vitesse[a 21].

Mise en œuvre dans des logiciels de calcul[modifier | modifier le code]

La loi normale a été intégrée dans de nombreux logiciels de calcul.

Tableurs
Les tableurs Microsoft Excel (propriétaire), OpenOffice.org Calc et LibreOffice Calc (libres et gratuits) disposent des fonctions suivantes :
  • LOI.NORMALE(x ; mu ; sigma ; cumulative) (ou en anglais NORMDIST) donne :
    • si cumulative est le booléen FAUX, la densité de probabilité de la loi normale d'espérance mu et d'écart type sigma en x,
    • si cumulative est le booléen VRAI, la fonction de répartition de la loi normale d'espérance mu et d'écart type sigma en x ;
  • PHI(x) (idem) donne la densité de probabilité de la loi normale centrée réduite φ en x ;
  • LOI.NORMALE.STANDARD(x) (NORMSDIST) donne la fonction de répartition de la loi normale centrée réduite Φ en x ;
  • LOI.NORMALE.INVERSE(p ; mu ; sigma) (NORMINV) : donne le quantile q d'une loi normale pour une probabilité p ;
  • LOI.NORMALE.STANDARD.INVERSE(p) (NORMSINV) : idem avec la loi normale centrée réduite ;
  • CENTREE.REDUITE(x ; mu ; sigma) (STANDARDIZE) : renvoie (x - mu)/sigma ;
Langage de programmation de statistiques S
Le langage S, mis en œuvre dans les logiciels R (libre et gratuit) et S-PLUS (propriétaire), propose les fonctions suivantes :
  • dnorm() : densité de probabilité de la loi normale :
    • dnorm(x) : pour une loi normale centrée réduite en x ; dnorm(x, log=TRUE) donne le logarithme népérien de la valeur,
    • dnorm(x, mu, sigma) ou dnorm(x, mean = mu, sd = sigma) : pour une loi normale d'espérance mu et d'écart type sigma en x ; on peut y adjoindre l'option log = TRUE,
  • pnorm() : fonction de répartition d'une loi normale :
    • pnorm(q) : pour une loi normale centrée réduite ; l'option lower.tail = FALSE donne le complémentaire 1 - Φ, l'option log.p = TRUE donne le logarithme népérien de la valeur
    • pnorm(q, mu, sigma) ou pnorm(q, mean = mu, sd = sigma) : idem pour une loi normale d'espérance mu et d'écart type sigma en x ;
  • qnorm() : donne les quantiles d'une loi normale :
    • qnorm(p) : pour une loi normale centrée réduite ; l'option lower.tail = FALSE donne le quantile du complémentaire 1 - Φ, l'option log.p = TRUE donne le logarithme népérien de la valeur
    • qnorm(p, mu, sigma) ou qnorm(p, mean = mu, sd = sigma) : idem pour une loi normale d'espérance mu et d'écart type sigma ;
  • rnorm() : générateur de nombre aléatoire suivant une distribution normale
    • rnorm(n) : génère n nombres aléatoires selon une loi normale centrée réduite ;
    • rnorm(n, mu, sigma) ou rnorm(n, mean = mu, sd = sigma) : idem avec une loi normale d'espérance mu et d'écart type sigma ;
  • ks.test(A, "dnorm") : test de normalité de Kolmogorov-Smirnov.
Matlab/Octave
Le logiciel Matlab (propriétaire, ou sa variante libre: GNU Octave) propose les commandes suivantes :
  • randn(n) : génère n nombres aléatoires selon une loi normale centrée réduite ;
    randn(m, n) génère une matrice m×n ;
  • normcdf(x, mu, sigma), cdf('norm', x, mu, sigma) et cdf('Normal', x, mu, sigma) : fonction de répartition en x de la loi normale d'espérance mu et d'écart type sigma (cumulative distribution function) ;
  • normpdf(x, mu, sigma), pdf('norm', x, mu, sigma) et pdf('Normal', x, mu, sigma) : densité de probabilité en x de la loi normale d'espérance mu et d'écart type sigma (probability distribution function)
  • [mu, sigma] = normfit(X) : détermine l'espérance et l'écart type d'un jeu de données X par régression.
Scilab
Le logiciel Scilab (libre et gratuit) propose les commandes suivantes :
  • rand(m, n, "normal") : matrice m×n de nombres aléatoires tirés suivant une loi normale centrée réduite ; rand(A, "normal") donne une matrice de même dimension que la matrice A ;
  • grand(m, n, "nor", mu, sigma) : matrice m×n de nombres aléatoires tirés suivant une loi normale d'espérance mu et d'écart type sigma ;
  • cdfnor("PQ", x, mu, sigma) : valeur p de la fonction de répartition (cumulative distribution function) en x pour une loi normale d'espérance mu et d'écart type sigma ;
  • cdfnor("X", mu, sigma, p, 1 - p) : valeur du quantile q pour une probabilité p ;
  • cdfnor("Mean", sigma, p, 1 - p, x) : espérance d'une loi normale dont l'écart type vaut sigma, et la probabilité cumulée en x vaut p ;
  • cdfnor("Std", p, 1 - p, x, mu) : écart type d'une loi normale dont la probabilité cumulée en x vaut p et l'espérance vaut mu.
Les options "Mean" et "Std" effectuent une régression si x et p sont des vecteurs.
L'extension Atoms CASCI fournit d'autres fonctions ayant une syntaxe plus simple :
  • cdfnormal(x) : fonction de répartition Φ de la loi normale centrée réduite ;
    cdfnormal(x, mu, sigma) : fonction de répartition d'une loi normale d'espérance mu et d'écart type sigma ;
  • idfnormal(p) : quantile Φ-1 de la loi centrée réduite (inverse cumulative distribution function) ;
    idfnormal(p, mu, sigma) : idem pour une loi d'espérance mu et d'écart type sigma ;
  • pdfnormal(x) : densité de probabilité φ de la loi normale centrée réduite (probability distribution function) ;
    pdfnormal(x, mu, sigma) : idem pour une loi d'espérance mu et d'écart type sigma ;
  • rndnormal(n) : génère n nombres aléatoires selon une loi normale centrée réduite ; rndnormal(m, n) génère une matrice m×n ;
    rndnormal(n, mu, sigma), rndnormal(m, n, mu, sigma) : idem pour une loi d'espérance mu et d'écart type sigma.

Hommages[modifier | modifier le code]

Une peinture à l'huile contenant la courbe en cloche.

Par son utilisation généralisée dans les sciences, la loi normale, souvent par l'utilisation de la courbe en cloche, est mise en avant dans différents contextes et est utilisée pour représenter l'universalité d'une répartition statistique, entre autres.

Carl Friedrich Gauss et la courbe en cloche sur un billet de dix Deutsche Mark.

Francis Galton parle de la loi normale dans son œuvre Natural Inheritence de 1889 en ces termes élogieux[a 2] :

« Je ne connais rien d'autre si propre à frapper l'imagination que cette merveilleuse forme d'ordre cosmique donnée par la Loi de Fréquence des Erreurs... Elle règne avec sérénité et en toute abnégation au milieu de la confusion sauvage[b 1]. »

— Francis Galton

En 1989, un hommage est rendu à Carl Friedrich Gauss en imprimant un billet à son effigie, la courbe en cloche est également présente sur le billet. Des pierres tombales portent le signe de la courbe en cloche, c'est le cas pour certains mathématiciens.

Le statisticien William Youden (en) écrit[69] en 1962 une explication du but et de la position de la loi normale dans les sciences. Il la présente sous forme de courbe en cloche :

THE
NORMAL
LAW OF ERROR
STANDS OUT IN THE
EXPERIENCE OF MANKIND
AS ONE OF THE BROADEST
GENERALIZATIONS OF NATURAL
PHILOSOPHY ♦ IT SERVES AS THE
GUIDING INSTRUMENT IN RESEARCHES
IN THE PHYSICAL AND SOCIAL SCIENCES AND
IN MEDICINE AGRICULTURE AND ENGINEERING ♦
IT IS AN INDISPENSABLE TOOL FOR THE ANALYSIS AND THE
INTERPRETATION OF THE BASIC DATA OBTAINED BY OBSERVATION AND EXPERIMENT

« La loi normale des erreurs se distingue dans l'expérience de l'humanité comme une des plus larges généralisations de la philosophie naturelle ♦ Elle sert de guide dans la recherche en sciences physique et sociale, en médecine, en agriculture et en ingénierie ♦ C'est un outil indispensable pour l'analyse et l'interprétation des données de base obtenues par l'observation et l'expérience. »

Notes et références[modifier | modifier le code]

Notes[modifier | modifier le code]

  1. Initialement en anglais : « I know of scarcely anything so apt to impress the imagination as the wonderful form of cosmic order expressed by the Law of Frequency of Error... It reigns with serenity and in complete self-effacement amidst the wildest confusion. »

Références[modifier | modifier le code]

Ouvrages
  1. a et b Dodge 2004, p. 310
  2. a et b Quinio Benamo 2005, p. 36
  3. a et b Grinstead et Snell 1997, p. 351
  4. a et b Grinstead et Snell 1997, p. 345
  5. a et b Grinstead et Snell 1997, p. 212
  6. Protassov 2002, p. 30
  7. a, b et c Protassov 2002, p. 29
  8. Stigler 1999, p. 407
  9. Stigler 1999, p. 406
  10. Voir par exemple Paul Lévy, Théorie de l'addition des variables aléatoires, Gauthier-Villars,‎ 1937, p. 42 ou, plus récemment, Michel Lejeune, Analyse statistique des données spatiales, Technip,‎ 2006 (ISBN 9782710808732), p. 2
  11. a et b Dodge 2004, p. 502
  12. a et b Lifschitz 1995, p. 1
  13. a et b Dodge 2004, p. 309
  14. a, b, c, d et e Lifschitz 1995, p. 2
  15. Tassi et Legait 1990, p. 128
  16. a, b et c Cramér 1970, p. 50
  17. a et b Grinstead et Snell 1997, p. 330
  18. Droesbeke, Lejeune et Saporta 2005, p. 104
  19. a, b, c et d Cramér 1970, p. 51
  20. Bogaert 2006, p. 122
  21. Bogaert 2006, p. 123
  22. a et b Protassov 2002, p. 27
  23. a, b, c, d et e Protassov 2002, p. 28
  24. Ross 2007, p. 408
  25. Quinio Benamo 2005, p. 1699
  26. Bogaert 2006, p. 116
  27. a et b Ross 2007, p. 239
  28. Droesbeke, Lejeune et Saporta 2005, p. 85
  29. Bogaert 2006, p. 120
  30. Bogaert 2006, p. 119
  31. Abramovitch et Stegun 1972, p. 930
  32. Protassov 2002, p. 44
  33. Bogaert 2006, p. 223
  34. Ross 2007, p. 240
  35. Yger et Weill 2009, p. 651
  36. Ross 2007, p. 299
  37. a et b Lifschitz 1995, p. 4
  38. a et b Cramér 1970, p. 52
  39. a et b Cramér 1970, p. 53
  40. Ross 2007, p. 235
  41. Lifschitz 1995, p. 125
  42. a et b Abramovitch et Stegun 1972, p. 932
  43. a et b Tassi et Legait 1990, p. 126
  44. Bogaert 2006, p. 354
  45. a et b Grinstead et Snell 1997, p. 213
  46. Grinstead et Snell 1997, p. 214
  47. a et b Protassov 2002, p. 72
  48. Bogaert 2006, p. 90
  49. Ross 2007, p. 301
  50. a et b Yger et Weill 2009, p. 703
  51. Bogaert 2006, p. 330
  52. Bogaert 2006, p. 341
  53. Hosking et Wallis 1997, p. 197
  54. a et b Bogaert 2006, p. 86
  55. Tassi et Legait 1990, p. 205
  56. Bogaert 2006, p. 68
  57. Ridley 2004, p. 76
  58. a et b Ridley 2004, p. 226
  59. Ridley 2004, p. 252
  60. Hosking et Wallis 1997, p. 157
  61. Dodge 2004, p. 354
  62. Yger et Weill 2009, p. 573
  63. Tassi et Legait 1990, p. 144
  64. Dodge 2004, p. 228
  65. Dodge 2004, p. 519
  66. a, b et c Yger et Weill 2009, p. 715
  67. Yger et Weill 2009, p. 716
  68. Yger et Weill 2009, p. 717
  69. Stigler 1999, p. 415
Articles et autres sources
  1. a, b et c Bernard Bru, « La courbe de Gauss ou le théorème de Bernoulli raconté aux enfants », Mathematics and Social Sciences, vol. 175, no 3,‎ 2006, p. 5-23 (lire en ligne)
  2. a, b, c, d, e, f, g, h et i Aimé Fuchs, « Plaidoyer pour la loi normale », Pour la Science,‎ 1995, p. 17 (lire en ligne [PDF])
  3. a, b, c, d, e, f et g Jean-Pierre Kahane, « La courbe en cloche », sur Images des maths, CNRS,‎ 2009
  4. a, b et c (en) George Marsaglia, « Evaluating the Normal Distribution », Journal of Statistical Software, vol. 11, no 4,‎ 2004, p. 1-11 (lire en ligne)
  5. a, b, c et d Ministère de l'éducation nationale de la jeunesse et de la vie associative, Ressources pour la classe terminale générale et technologique - Probabilités et statistique,‎ 2012, pdf (lire en ligne)
  6. Eric W. Weisstein, « Gaussian Function », sur MathWorld, a Wolfram Web Resource
  7. a, b, c et d Benoît Mandelbrot, « Nouveaux modèles de la variation des prix (Cycles lents et changements instantanés) », Cahiers du Séminaire d'Économétrie, no 9,‎ 1966, p. 53-66 (lire en ligne)
  8. (en) Claude Shannon, « A Mathematical Theory of Communication », The Bell System Technical Journal, vol. 27,‎ 1948, p. 379-423
  9. Lloyd Allison, « Normal, Gaussian »,‎ 2012
  10. a, b et c Eric W. Weisstein, « Normal Distribution Function », sur MathWorld, a Wolfram Web Resource
  11. a et b Nicolas Ferrari, « Prévoir l'investissement des entreprises Un indicateur des révisions dans l'enquête Investissement », Économie et Statistique, no 395-396,‎ 2006, p. 39-64 (lire en ligne)
  12. (en) Liang Faming, « A robust sequential Bayesian method for identification of differentially expressed genes », Statistica Sinica, vol. 17, no 2,‎ 2007, p. 571-597 (lire en ligne)
  13. (en) Norbert Henze, « A Probabilistic Representation of the 'Skew-Normal' Distribution », Scandinavian Journal of Statistics, vol. 13, no 4,‎ 1986, p. 271-275 (lire en ligne)
  14. G Rouzet, « Étude des moments de la loi normale tronquée », Revue de statistique appliquée, vol. 10, no 2,‎ 1962, p. 49-61 (lire en ligne)
  15. (en) Sepp Hochreiter, Djork-Arne Clevert et Klaus Obermayer, « A new summarization method for affymetrix probe level data », Bioinformatics, vol. 22, no 8,‎ 2006, p. 943-949 (lire en ligne)
  16. (en) Richard Irvine, « A geometrical approach to conflict probability estimation », Air Traffic Control Quarterly seminar, vol. 10, no 2,‎ 2002, p. 1-15 (lire en ligne)
  17. a, b et c Nacira Hadjadji Seddik-Ameur, « Les tests de normalité de Lhoste », Mathematics and Social Sciences, vol. 41, no 162,‎ 2003, p. 19-43 (lire en ligne)
  18. Suzanne Mollo, « Tort (Michel). — Le quotient intellectuel », Revue française de pédagogie, vol. 33, no 33,‎ 1975, p. 66-68 (lire en ligne)
  19. (en) Borghi, de Onis, Garza, Van den Broeck, Frongillo, Grummer-Strawn, Van Buuren, Pan, Molinari, Martorell, Onyango1 et Martines, « Construction of the World Health Organization child growth standards: selection of methods for attained growth curves », Statistics in medecine, vol. 25,‎ 2006, p. 247-265 (lire en ligne [PDF])
  20. a, b, c, d et e [PDF] Ricco Rakotomalala, « Tests de normalité »,‎ 2011
  21. a, b et c (en) A. C. Atkinson et M. C. Pearce, « The Computer Generation of Beta, Gamma and Normal Random Variables », Journal of the Royal Statistical Society, vol. 139, no 4,‎ 1976, p. 431-461 (lire en ligne)

Voir aussi[modifier | modifier le code]

Bibliographie[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Sur les autres projets Wikimedia :

Liens externes[modifier | modifier le code]

Cet article est reconnu comme « bon article » depuis sa version du 30 janvier 2013 (comparer avec la version actuelle).
Pour toute information complémentaire, consulter sa page de discussion et le vote l'ayant promu.