Auto-régression simultanée
Le Modèle d’Auto-régression simultanée (« Simultaneous AutoRegressive Model » ou « SAR ») est une généralisation du modèle de régression linéaire défini pour tenir compte de l'autocorrélation spatiale dans les problèmes de classification et de régression spatiale[1],[2]. Alors que dans la régression classique il est présupposé que le phénomène est stationnaire dans l'espace étudié, dès que l'analyste géographe détecte une dépendance entre l'observation effectuée et le lieu géographique, il doit employer un modèle non stationnaire tels que SAR, CAR ou GWR.
Description
Ce modèle prend la forme suivante :
où et sont des coefficients d’auto-régression, et sont les matrices de poids spatiaux, x les variables explicatives, y la variable expliquée, et représentent les erreurs[1].
Selon que les paramètres et sont nuls ou non le modèle peut prendre les quatre formes suivantes[1] :
- le modèle de régression linéaire
- le modèle de décalage spatial (« spatial lag model »), où la dépendance spatiale est portée par la variable réponse et apparait dans le modèle comme une variable explicative supplémentaire
- le modèle d'erreur spatiale (« spatial error model »), où la dépendance spatiale est portée par la perturbation
- et le modèle général, rarement utilisé[1]
Utilisation
On l'utilise ces modèles dans la fouille de données spatiales. Le modèle de décalage spatial est utilisé lorsque l'analyste suppose que le phénomène à analyser est influencé directement par le voisinage immédiat. L'analyste utilise le modèle d'erreur spatiale lorsque la dépendance est présente et identifié dans les résidus[1].
L'estimation des coefficients du modèle est en général effectuée à l'aide de la méthode du maximum de vraisemblance[3], bien que extrêmement consommatrice de ressource machine[4].
Notes et références
Notes
Références
- [PDF](en) Krista Collins, Colin Babyak, Joanne Moloney, « « Treatment of Spatial Autocorrelation in Geocoded Crime Data » » (consulté le )
- [PDF](en) Baris M. Kazar, Shashi Shekhar, David J. Lilja, Ranga R. Vatsavai, R. Kelley Pace, « « Comparing Exact and Approximate Spatial AutoRegression Model Solutions for Spatial Data Analysis » » (consulté le )
- James P. LeSage, « « Lecture 1: Maximum likelihood estimation of spatial regression models » », (consulté le )
- Mete Celik, Baris M. Kazar, Shashi Shekhar, Daniel Boley, « « Parameter Estimation for the Spatial Autoregression Model: A Rigorous Approach » » (consulté le )
Voir aussi
Bibliographie
- (en) Harvey Miller et Jiawei Han, Geographic Data Mining and Knowledge Discovery, Boca Raton, CRC Press, , 458 p. (ISBN 978-1-4200-7397-3).
- (en) Yee Leung, Knowledge Discovery in Spatial Data, Heidelberg, Springer, , 360 p. (ISBN 978-3-6420-2664-5)
- (en) Hillol Kargupta, Jiawei Han, Philip Yu, Rajeev Motwani et Vipin Kumar, Next Generation of Data Mining, CRC Press, , 3e éd., 605 p. (ISBN 978-1-4200-8586-0)
- Franck Guarnieri et Emmanuel Garbolino, Systèmes d'information et risques naturels, Paris, Presses des MINES, , 251 p. (ISBN 978-2-911762-52-9, lire en ligne)
Articles connexes
- Régression linéaire
- Régression linéaire multiple
- Régression logistique
- Modèle linéaire généralisé
- Régression non paramétrique
- Modèles de régression multiple postulés et non postulés
- Régression géographiquement pondérée
- Auto-régression conditionnelle
- Champ aléatoire de Markov
Liens externes
- Hans-Peter Kriegel, Spatial Data Mining