Corrélation de Spearman

Un article de Wikipédia, l'encyclopédie libre.
Sauter à la navigation Sauter à la recherche
Un coefficient de corrélation de Spearman de 1 est obtenu quand les deux variables comparées ont une relation parfaitement monotone, même si cette relation n'est pas linéaire. En revanche, la corrélation de Pearson (linéaire) n'est pas parfaite.

En statistique, la corrélation de Spearman ou rho de Spearman, nommée d'après Charles Spearman (1863-1945) et souvent notée par la lettre grecque (rho) ou est une mesure de dépendance statistique non paramétrique entre deux variables.

La corrélation de Spearman est étudiée lorsque deux variables statistiques semblent corrélées sans que la relation entre les deux variables soit de type affine. Elle consiste à trouver un coefficient de corrélation, non pas entre les valeurs prises par les deux variables mais entre les rangs de ces valeurs. Elle estime à quel point la relation entre deux variables peut être décrite par une fonction monotone. S'il n'y a pas de données répétées, une corrélation de Spearman parfaite de +1 ou -1 est obtenue quand l'une des variables est une fonction monotone parfaite de l'autre.


Définition[1][modifier | modifier le code]

Pour un échantillon de taille n, les variables de rang sont calculées à partir des données .

La corrélation de Spearman est définie par :

  • est la covariances de variables de rang,
  • et sont les écarts-type des variables de rang.

On constate que cette définition correspond à la corrélation de Pearson des variables de rang.

Interprétation[modifier | modifier le code]

Le coefficient de Spearman permet de détecter des tendances monotones. Lorsque la tendance est affine, il se comporte de façon similaire au coefficient de Pearson. En revanche, il sera plus élevé que la corrélation de Pearson si la tendance est monotone mais non affine. Plus la tendance monotone est marquée, plus la valeur du coefficient est proche de 1 ou -1.

De façon similaire au coefficient de Pearson, le coefficient de Spearman aura une valeur positive lorsque la tendance est croissante et négative lorsqu'elle est décroissante.

Lorsque la tendance n'est pas monotone, il aura une valeur proche de 0.

Notes et références[modifier | modifier le code]

  1. (en) « Spearman's rank correlation coefficient », dans Wikipedia, (lire en ligne)

Voir aussi[modifier | modifier le code]