Indice de Moran
En statistiques, l’indice de Moran (ou I de Moran) est une mesure de l'autocorrélation spatiale développée par Patrick Moran[1]. L'autocorrélation spatiale est caractérisée par une corrélation entre les mesures géographiquement voisines d'un phénomène mesuré.
Définition
Soit un champ réel X défini sur un réseau discret de N sites ; soit une matrice de poids positifs W, carrée de dimension N, quantifiant les influences de j sur i[2]. Notant X la moyenne de X, on définit l'indice I de Moran pour X et W par :
L'espérance mathématique de l'indice de Moran sous des hypothèses de non autocorrélation spatiale est donnée par :
Sa variance est égale à où
Les valeurs négatives (resp. positives) de l'indice indiquent une autocorrélation spatiale négative (resp. positive). Ses valeurs s'étendent de −1 (indiquant une dispersion parfaite) à 1 (corrélation parfaite). Une valeur nulle est significative d'un modèle spatial parfaitement aléatoire. Pour le test d'hypothèse statistique, l'indice I de Moran peut être transformé en Z-score dans lequel les valeurs plus grandes que 1,96 ou plus petites que −1,96 indiquent une autocorrélation spatiale significatives avec un taux d'erreur de 5 %.
L'indice de Moran est relié à celui de Geary, mais n'est pas identique. L'indice de Moran est une mesure de l'autocorrélation spatiale globale, tandis que l'Indice de Geary est plus sensible à l'autocorrélation spatiale locale.
Influence de la définition du voisinage
En analyse spatiale, la codification de la structure de voisinage influence les observations que l'on peut faire après. C'est pour quoi l'indice de Moran doit être calculé selon plusieurs méthodes de voisinage[3] afin de pouvoir comparer les résultats et proposer des interprétations plus solides. A titre d'exemple, le tableau suivant liste les valeurs de l'indice de Moran pour les demandes de valeur foncière sur Paris en et selon plusieurs méthodes de voisinages :
En règle général, plus une méthode de voisinage va accorder de voisins aux entités, moins l'indice de Moran sera élevé. Le fait d'augmenter le nombre de voisins par observation augmente la probabilité d'obtenir des observations hétérogènes dans le voisinage, ce qui a pour conséquence une autocorrélation spatiale moins visible (surtout pour les indices globaux). Le choix de voisinage a donc une importance certaine dans l'identification de l'autocorrélation spatiale.
Notes et références
Notes
Références
- Moran, P.A.P. (1950), "Notes on Continuous Stochastic Phenomena," Biometrika, 37, 17–33. DOI 10.1093/biomet/37.1-2.17 JSTOR:2332142
- On peut choisir pour wi,j, par exemple :
- une fonction de la forme (pourcentage de la frontière de i partagée avec j)coefficient b ÷ (distance de i à j)coefficient a ;
- ou simplement 1 si i et j sont contigus, 0 sinon.
- Insee - Eurostat, Manuel d'analyse spatiale, Institut national de la statistique et des études économiques,
Voir aussi
Bibliographie
- (en) P.A.P. Moran, Notes on Continuous Stochastic Phenomena, Biometrika, 37, 17–23 (1950) JSTOR:2332142, DOI 10.1093/biomet/37.1-2.17
Articles connexes
- Analyse spatiale
- Système d'information géographique
- Glossaire du data mining
- Fouille de données spatiales
- Indice de Geary
- Structure spatiale totalement aléatoire
Liens externes
(en) Esri,Spatial Autocorrelation (Morans I) (Spatial Statistics)