Variable de contrôle

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Pour la méthode de Monte-Carlo, une variable de contrôle peut être utilisée afin d'obtenir une réduction de la variance, en exploitant la corrélation entre plusieurs statistiques.

Exposé du principe[modifier | modifier le code]

On cherche à estimer le paramètre µ, et on dispose d'une estimation m non-biaisée de µ ; autrement dit, \mathbb{E}\left[m\right] = \mu. On dispose d'une autre statistique t, telle que \mathbb{E}\left[t\right] = \tau, et sa corrélation avec m, \rho_{mt}, est connue. En supposant connues toutes ces constantes, on peut construire un nouvel estimateur, pour une constante c donnée:

m^{\star} := m-c\left(t-\tau\right).

On montre que cet estimateur est un estimateur non-biaisé de µ, quel que soit le choix de la constante c. En outre, on peut montrer que le choix

c :=\frac{\sigma_m}{\sigma_t}\rho_{mt}

permet de minimiser la variance \sigma^2_{m^{\star}} de m^{\star}. Pour ce choix de c, la variance de l'estimateur vaut alors

\sigma^2_{m^{\star}} = \left(1-\rho_{mt}^2\right) \sigma^2_{m};

Par construction, la variance de m^{\star} sera inférieure à celle de l'estimateur initial m, d'où le terme de réduction de variance. Plus la corrélation |\rho_{tm}| est importante, plus la réduction de la variance sera importante.

Lorsque les écart-type \sigma_m, \sigma_t, ou la corrélation \rho_{mt} sont inconnus, on peut les remplacer par leurs estimations empiriques.

Exemple[modifier | modifier le code]

On souhaite évaluer

\int_0^1 \frac{1}{1+t} \,\mathrm{d}t

dont la vraie valeur est \ln(2)=0,69315. Puisque cette intégrale peut être vue comme l'espérance de f(U), avec U la loi uniforme continue et f(x) = (1+x)^{-1}, une estimation de Monte-Carlo est envisageable.

L'estimation classique se base sur un échantillon de n tirages de la loi uniforme u_1, \cdots, u_n et vaut

I_n = \frac{1}{n} \sum_i f(u_i)

On introduit comme variable de contrôle T=1+U. Cette variable est uniforme, son espérance vaut 3/2 et sa variance 1/12. Par construction, sa covariance avec f(U) est

1-{3 \over 2} \times \mathrm{E}(m) = -\frac{3\log 2 -2}{2}.

À l'aide d'un logiciel de calcul formel, on peut continuer à évaluer exactement toutes les autres quantités entrant en jeu dans la méthode ; mais le plus pratique reste de remplacer tous les moments par leur contrepartie empirique. Avec un échantillon de n=1500 réplications, on trouve \sigma_m = 0,14195, \rho = -0,98430 et \sigma_t = 0,29002. La constante optimale vaut -0,48175. On trouve les résultats suivants :

Estimation Variance
Monte Carlo basique 0,69631 0,02015
Monte Carlo – contrôle 0,69356 0,00063

Grâce à la corrélation massivement négative avec la variable de contrôle, on parvient à réduire très significativement la variance de l'estimateur de Monte-Carlo.

Notes et références[modifier | modifier le code]

Bibliographie[modifier | modifier le code]

  • (en) M. Kahn et A. W. Marshall, Methods of reducing sample size in Monte-Carlo computations, Operations Research, 1, 263, 1953.

Références[modifier | modifier le code]

  • (en) Averill M. Law & W. David Kelton, Simulation Modeling and Analysis, 3e édition, 2000, ISBN 0-07-116537-1
  • (en) S. P. Meyn. Control Techniques for Complex Networks, Cambridge University Press, 2007. ISBN 9780521884419. en ligne

Liens internes[modifier | modifier le code]