Aller au contenu

Auto-régression simultanée

Un article de Wikipédia, l'encyclopédie libre.
Ceci est une version archivée de cette page, en date du 3 octobre 2022 à 13:50 et modifiée en dernier par Ruyblas13 (discuter | contributions). Elle peut contenir des erreurs, des inexactitudes ou des contenus vandalisés non présents dans la version actuelle.

Le Modèle d’Auto-régression simultanée (« Simultaneous AutoRegressive Model » ou « SAR ») est une généralisation du modèle de régression linéaire défini pour tenir compte de l'autocorrélation spatiale dans les problèmes de classification et de régression spatiale[1],[2]. Alors que dans la régression classique il est présupposé que le phénomène est stationnaire dans l'espace étudié, dès que l'analyste géographe détecte une dépendance entre l'observation effectuée et le lieu géographique, il doit employer un modèle non stationnaire tels que SAR, CAR ou GWR.

Description

Ce modèle prend la forme suivante :


et sont des coefficients d’auto-régression, et sont les matrices de poids spatiaux, x les variables explicatives, y la variable expliquée, et représentent les erreurs[1].

Selon que les paramètres et sont nuls ou non le modèle peut prendre les quatre formes suivantes[1] :

  • le modèle de décalage spatial (« spatial lag model »), où la dépendance spatiale est portée par la variable réponse et apparait dans le modèle comme une variable explicative supplémentaire
  • le modèle d'erreur spatiale (« spatial error model »), où la dépendance spatiale est portée par la perturbation
  • et le modèle général, rarement utilisé[1]

Utilisation

On l'utilise ces modèles dans la fouille de données spatiales. Le modèle de décalage spatial est utilisé lorsque l'analyste suppose que le phénomène à analyser est influencé directement par le voisinage immédiat. L'analyste utilise le modèle d'erreur spatiale lorsque la dépendance est présente et identifié dans les résidus[1].

L'estimation des coefficients du modèle est en général effectuée à l'aide de la méthode du maximum de vraisemblance[3], bien que extrêmement consommatrice de ressource machine[4].

Notes et références

Notes


Références

  1. a b c d et e [PDF](en) Krista Collins, Colin Babyak, Joanne Moloney, « « Treatment of Spatial Autocorrelation in Geocoded Crime Data » » (consulté le )
  2. [PDF](en) Baris M. Kazar, Shashi Shekhar, David J. Lilja, Ranga R. Vatsavai, R. Kelley Pace, « « Comparing Exact and Approximate Spatial AutoRegression Model Solutions for Spatial Data Analysis » » (consulté le )
  3. James P. LeSage, « « Lecture 1: Maximum likelihood estimation of spatial regression models » », (consulté le )
  4. Mete Celik, Baris M. Kazar, Shashi Shekhar, Daniel Boley, « « Parameter Estimation for the Spatial Autoregression Model: A Rigorous Approach » » (consulté le )

Voir aussi

Bibliographie

  • (en) Harvey Miller et Jiawei Han, Geographic Data Mining and Knowledge Discovery, Boca Raton, CRC Press, , 458 p. (ISBN 978-1-4200-7397-3).Document utilisé pour la rédaction de l’article
  • (en) Yee Leung, Knowledge Discovery in Spatial Data, Heidelberg, Springer, , 360 p. (ISBN 978-3-6420-2664-5)
  • (en) Hillol Kargupta, Jiawei Han, Philip Yu, Rajeev Motwani et Vipin Kumar, Next Generation of Data Mining, CRC Press, , 3e éd., 605 p. (ISBN 978-1-4200-8586-0)
  • Franck Guarnieri et Emmanuel Garbolino, Systèmes d'information et risques naturels, Paris, Presses des MINES, , 251 p. (ISBN 978-2-911762-52-9, lire en ligne)

Articles connexes

Liens externes