Régression quantile

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

La Régression quantile est un type de régression utilisée en statistiques. Alors que la méthode des moindres carrés fournit une estimation de la moyenne conditionnelle de la variable réponse étant donné certaines valeurs des variables prédictives, la régression quantile donne par approximation soit la médiane soit les autres quantiles de la variable réponse[1].

Dans la régression linéaire le coefficient de régression représente le changement opéré dans la variable réponse produit par une unité de changement dans la variable prédictive associée à ce coefficient. Le paramètre de régression quantile procure une estimation du changement dans un quantile spécifique de la variable réponse produit par une unité de changement de la variable prédictive[2].

Historique[modifier | modifier le code]

Roger Koenker et George Bassett ont développé le modèle de régression quantile en 1978. Dans leur approche, ils font l'hypothèse que les quantiles conditionnels ont une forme linéaire[3],[4].

En 1986, James Powell généralise la régression quantile aux variables censurées[5],[6],[Note 1].

Applications[modifier | modifier le code]

En économie, Moshe Buchinsky utilise les régressions quantiles pour étudier l'évolution des inégalités salariales aux États-Unis[7].

Le modèle[modifier | modifier le code]

On définit la fonction quantile conditionnelle de la variable aléatoire y conditionnellement au vecteur de variable explicatives x pour le quantile τ comme

la plus petite valeur de y telle que la fonction de distribution de y conditionnellement à x soit au moins égale à τ.

Formellement, on adopte la notation suivante[8] :


Q_{\tau} (y_i | x_i ) = \inf\left\{ y : F_y(y|x_i) \geqslant \tau)\right\}

Si on se restreint au cas où les quantiles conditionnels sont des fonctions linéaires du vecteur de variables explicatives x, on définit[9] :


\beta_\tau = \text{Argmin}_{b} \mathbb E\left[ \rho_\tau (y_i - x_i'b)\right]

avec


\rho_\tau(u) = (\tau - \mathbb I(u\leqslant 0))u

[Note 2]

L'estimateur des paramètres de la régression quantile est alors obtenu en minimisant l'équivalent empirique de la fonction objectif[10] :


\widehat{\beta_\tau} = \text{Argmin}_{b} \mathbb \sum_{i=1}^{N}\left[ \rho_\tau (y_i - x_i'b)\right]

Notes et références[modifier | modifier le code]

Notes[modifier | modifier le code]

(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Quantile regression » (voir la liste des auteurs)

  1. En statistiques et en économétrie, une variable censurée est une variable pour laquelle on n'observe pas les valeurs en dessous ou au-dessus d'un certain seuil. Par exemple, dans certaines enquêtes pour des raisons de confidentialité, on ne demande pas aux individus gagnant plus d'un certain seuil de revenu le montant exact de leur revenu. Dans ce cas, la variable obtenue est une variable censurée : on a la valeur du revenu pour tous les individus gagnant moins que le seuil et pour les autres, on sait simplement que leur revenu est supérieur à ce seuil (Buchinsky 1998).
  2. On note \mathbb I() la fonction indicatrice qui vaut 1 ou 0 selon que l'expression à l'intérieur des parenthèses est vraie ou fausse

Références[modifier | modifier le code]

  1. [PDF]Pauline Givord, « Régression de quantiles »,‎ 2008 (consulté le 29 octobre 2011)
  2. [PDF] (en) Cornell Statistical Consulting Unit, « « StatNews #70: Quantile Regression » »,‎ 2007 (consulté le 29 octobre 2011)
  3. (en) Roger Koenker et G. Bassett, « Regression quantiles », Econometrica,‎ 1978, p. 33-50
  4. Angrist et Pischke 2008, p. 272
  5. (en) James Powell, « Censored quantile regression », Journal of Econometrics, vol. 32, no 1,‎ juin 1986, p. 143-155 (lire en ligne)
  6. (en) Moshe Buchinsky, « Recent Advances in Quantile Regression Models : A Practical Guideline for Empirical Research », The Journal of Human Resources, vol. 33, no 1,‎ hiver 1998, p. 88-126 (lire en ligne)
  7. (en) Moshe Buchinsky, « Changes in the U.S. Wage Structure 1963-1987: Application of Quantile Regression », Econometrica, vol. 62, no 2,‎ mars 1994, p. 405-458 (lire en ligne)
  8. (en) Joshua Angrist et Jörn-Steffen Pischke, Mostly Harmless Econometrics : An Empiricist's Companion, Princeton University Press,‎ 2008, 1e éd., 392 p. (ISBN 978-0691120355), p. 270
  9. Angrist et Pischke 2008, p. 271, équation 7.1.2
  10. Angrist et Pischke 2008, p. 271-272

Voir aussi[modifier | modifier le code]

Bibliographie[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Liens externes[modifier | modifier le code]