Auto-régression simultanée

Cet article est une ébauche concernant les probabilités et la statistique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Le Modèle d’Auto-régression simultanée (« Simultaneous AutoRegressive Model » ou « SAR ») est une généralisation du modèle de régression linéaire défini pour tenir compte de l'autocorrélation spatiale dans les problèmes de classification et de régression spatiale^[1]^,^[2]. Alors que dans la régression classique il est présupposé que le phénomène est stationnaire dans l'espace étudié, dès que l'analyste géographe détecte une dépendance entre l'observation effectuée et le lieu géographique, il doit employer un modèle non stationnaire tels que SAR, CAR ou GWR.

Description[modifier | modifier le code]

Ce modèle prend la forme suivante :

y=\rho W_{1}y+x\beta +\epsilon

\epsilon =\lambda W_{2}\epsilon +u

où $\rho$ et $\lambda$ sont des coefficients d’auto-régression, $W_{1}$ et $W_{2}$ sont les matrices de poids spatiaux, $x$ les variables explicatives, $y$ la variable expliquée, $\epsilon$ et $u$ représentent les erreurs^[1].

Selon que les paramètres $\rho$ et $\lambda$ sont nuls ou non le modèle peut prendre les quatre formes suivantes^[1] :

le modèle de régression linéaire

y=x\beta +\epsilon

le modèle de décalage spatial (« spatial lag model »), où la dépendance spatiale est portée par la variable réponse et apparait dans le modèle comme une variable explicative supplémentaire

y=\rho Wy+x\beta +\epsilon

le modèle d'erreur spatiale (« spatial error model »), où la dépendance spatiale est portée par la perturbation

y=x\beta +\lambda W\epsilon +u

et le modèle général, rarement utilisé^[1]

y=\rho W_{1}y+x\beta +\lambda W_{2}\epsilon +u

Utilisation[modifier | modifier le code]

On l'utilise ces modèles dans la fouille de données spatiales. Le modèle de décalage spatial est utilisé lorsque l'analyste suppose que le phénomène à analyser est influencé directement par le voisinage immédiat. L'analyste utilise le modèle d'erreur spatiale lorsque la dépendance est présente et identifié dans les résidus^[1].

L'estimation des coefficients du modèle est en général effectuée à l'aide de la méthode du maximum de vraisemblance^[3], bien que extrêmement consommatrice de ressource machine^[4].

Notes et références[modifier | modifier le code]

Notes[modifier | modifier le code]

Références[modifier | modifier le code]

↑ ^{a b c d et e} [PDF](en) Krista Collins, Colin Babyak, Joanne Moloney, « « Treatment of Spatial Autocorrelation in Geocoded Crime Data » » (consulté le 15 octobre 2011)
↑ [PDF](en) Baris M. Kazar, Shashi Shekhar, David J. Lilja, Ranga R. Vatsavai, R. Kelley Pace, « « Comparing Exact and Approximate Spatial AutoRegression Model Solutions for Spatial Data Analysis » » (consulté le 20 septembre 2011)
↑ James P. LeSage, « « Lecture 1: Maximum likelihood estimation of spatial regression models » », 2008 (consulté le 30 octobre 2011)
↑ Mete Celik, Baris M. Kazar, Shashi Shekhar, Daniel Boley, « « Parameter Estimation for the Spatial Autoregression Model: A Rigorous Approach » » (consulté le 30 octobre 2011)

Voir aussi[modifier | modifier le code]

Bibliographie[modifier | modifier le code]

(en) Harvey Miller et Jiawei Han, Geographic Data Mining and Knowledge Discovery, Boca Raton, CRC Press, 2009, 458 p. (ISBN 978-1-4200-7397-3).
(en) Yee Leung, Knowledge Discovery in Spatial Data, Heidelberg, Springer, 2010, 360 p. (ISBN 978-3-6420-2664-5)
(en) Hillol Kargupta, Jiawei Han, Philip Yu, Rajeev Motwani et Vipin Kumar, Next Generation of Data Mining, CRC Press, 2009, 3^e éd., 605 p. (ISBN 978-1-4200-8586-0)
Franck Guarnieri et Emmanuel Garbolino, Systèmes d'information et risques naturels, Paris, Presses des MINES, 2003, 251 p. (ISBN 978-2-911762-52-9, lire en ligne)

Articles connexes[modifier | modifier le code]

Régression linéaire
Régression linéaire multiple
Régression logistique
Modèle linéaire généralisé
Régression non paramétrique
Modèles de régression multiple postulés et non postulés
Régression géographiquement pondérée
Auto-régression conditionnelle
Champ aléatoire de Markov

Liens externes[modifier | modifier le code]

Hans-Peter Kriegel, Spatial Data Mining

[KCollins-1] {a b c d et e} [PDF](en) Krista Collins, Colin Babyak, Joanne Moloney, « « Treatment of Spatial Autocorrelation in Geocoded Crime Data » » (consulté le 15 octobre 2011)

[2] [PDF](en) Baris M. Kazar, Shashi Shekhar, David J. Lilja, Ranga R. Vatsavai, R. Kelley Pace, « « Comparing Exact and Approximate Spatial AutoRegression Model Solutions for Spatial Data Analysis » » (consulté le 20 septembre 2011)

[3] James P. LeSage, « « Lecture 1: Maximum likelihood estimation of spatial regression models » », 2008 (consulté le 30 octobre 2011)

[4] Mete Celik, Baris M. Kazar, Shashi Shekhar, Daniel Boley, « « Parameter Estimation for the Spatial Autoregression Model: A Rigorous Approach » » (consulté le 30 octobre 2011)

[1]

[2]

[3]

[4]