Variables indépendantes et identiquement distribuées

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

En statistique, des variables indépendantes et identiquement distribuées (iid) sont des variables aléatoires qui ont toutes la même loi de probabilité et sont mutuellement indépendantes.

En inférence statistique ou en apprentissage automatique, il est très courant de supposer que le tirage des échantillons d'apprentissage sont i.i.d. C'est une condition souvent nécessaire à l'application des théorèmes les plus courants. En particulier le théorème central limite dans sa forme classique stipule que la somme de variables aléatoires tendent vers une distribution normale quand ces variables sont i.i.d.

Exemples[modifier | modifier le code]

Un exemple de tirage aléatoire i.i.d est celui du pile ou face. Chaque lancer de pièce suit la même loi de Bernoulli de paramètre p et est indépendant de ceux qui l'ont précédé ou vont lui succéder. Si p=0.5 (pile et face ont la même chance d'apparition), et que nous avons obtenu 10 fois face lors des 10 tirages précédents, les chances d'obtenir pile et face lors du prochain tirage sont néanmoins égales.

Dans l'exemple précédent, le tirage ne serait plus i.i.d :

  • si on utilise alternativement deux pièces biaisées différemment (p_1 \ne p_2) car dans ce cas les tirages ne suivent pas la même loi. Ils restent néanmoins indépendants.
  • si on choisit systématiquement la pièce ayant le plus de chance de donner face après chaque tirage pile (et que l'on prend les pièces au hasard après un tirage face), les tirages ne sont plus indépendants car conditionnées par le résultat du tirage précédent.