Autocorrélation

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

L'autocorrélation est un outil mathématique souvent utilisé en traitement du signal. C'est la corrélation croisée d'un signal par lui-même. L'autocorrélation permet de détecter des régularités, des profils répétés dans un signal comme un signal périodique perturbé par beaucoup de bruit, ou bien une fréquence fondamentale d'un signal qui ne contient pas effectivement cette fondamentale, mais l'implique avec plusieurs de ses harmoniques.

Définitions[modifier | modifier le code]

Généralités[modifier | modifier le code]

Note : La confusion est souvent faite entre l'autocovariance et l'autocorrélation obtenue en divisant cette dernière par la variance. Ces deux notions généralisent les notions classiques de covariance ayant pour dimension la dimension de la variable élevée au carré et de coefficient de corrélation compris entre -1 et +1. Les considérations qui suivent utilisent le langage le plus répandu chez les praticiens, sans division par la variance. Il existe d'autre part deux définitions fondamentalement différentes.

À un processus stochastique discret ou continu, correspond une « autocorrélation » statistique qui généralise la notion de covariance. Dans le cas d'un processus continu (en toute généralité complexe) X(t)\,, la fonction d'autocorrélation statistique se définit comme :

R_X(t_1,t_2) = E[X(t_1).X^*(t_2)]\,

Dans le cas d'un signal stationnaire, on peut écrire :

R_X(\tau) = E[X(t).X^*(t-\tau)]\,

\tau\, est le décalage temporel et l'espérance mathématique se définit à partir de la densité de probabilité.

À partir d'un signal x(t)\,, on peut définir l'autocorrélation temporelle en remplaçant la moyenne d'ensemble par une moyenne temporelle (voir autocovariance) :

R_x(\tau) = \overline{x(t) x(t+\tau)}

Lorsque le signal est considéré comme réalisation d'un processus stationnaire ergodique, l'autocorrélation temporelle est identique à l'autocorrélation statistique. Elle peut être utilisée pour calculer le contenu en fréquence du signal (voir densité spectrale).

Dans certains problèmes, elle permet d'analyser le signal sans référence à son contenu en fréquences.

Statistiques[modifier | modifier le code]

En statistique, l'autocorrélation d'une série temporelle discrète ou d'un processus Xt est simplement la corrélation du processus par rapport à une version décalée dans le temps de lui-même. Si Xt est un processus stationnaire d'espérance μ alors la définition est

R(k) = \frac{E[(X_i - \mu)(X_{i+k} - \mu)]}{\sigma^2}

où E est l'espérance mathématique et k est le décalage temporel, \sigma^2 est la variance et \mu la moyenne de la série. C'est une fonction à valeur dans l'intervalle [−1, 1] avec 1 indiquant une parfaite corrélation (Les signaux se recouvrent exactement quand le temps est décalé de k) et −1 indiquant une parfaite anti-corrélation. Il est d'usage pratique dans de nombreuses disciplines de tracer la normalisation par σ2 et d'utiliser le terme autocorrélation sans distinction avec celui d'autocovariance.

Traitement du Signal[modifier | modifier le code]

En traitement du signal, pour un signal donné f(t), l'autocorrélation continue Rf(τ) est la corrélation croisée continue de f(t) avec elle-même, à l'intervalle de temps τ, et est définie comme:

R_f(\tau) = f^*(\cdot-\tau) \circ f(\cdot) = \int_{-\infty}^{\infty} f(t+\tau)f^*(t)\, dt = \int_{-\infty}^{\infty} f(t)f^*(t-\tau)\, dt

f* représente le conjugué complexe et le cercle représente l'opération de convolution. Pour une fonction réelle, f* = f.

Formellement, l'autocorrélation discrète R pour l'intervalle de temps j et le signal xn est

R(j) = \sum_n (x_n-m)(x^*_{n-j}-m) \,

m est la valeur moyenne (valeur attendue) de xn. Souvent, les autocorrélations sont calculées pour un signal centré sur zéro. C’est-à-dire un signal dont la valeur moyenne est nulle. L'autocorrélation est alors définie par

R(j) = \sum_n x_n x^*_{n-j}.\,

L'autocorrélation multi-dimensionelle est définie de manière similaire. Par exemple, en trois dimensions l'autocorrélation devient

R(j,k,\ell) = \sum_{n,q,r} (x_{n,q,r}-m)(x_{n-j,q-k,r-\ell}-m).

Propriétés[modifier | modifier le code]

Dans ce qui suit, nous décrirons les propriétés d'autocorrélation uni-dimensionnelle uniquement, puisque la plupart des propriétés sont facilement étendues du cas à une dimension aux cas multidimensionnels.

  • Une propriété fondamentale de l'autocorrélation est la symétrie, R(i) = R(−i), ce qui se démontre à partir de la définition. Dans un cas continu, l'autocorrélation est même une fonction paire
R_f(-\tau) = R_f(\tau)\,
quand f est une fonction réelle, et une fonction Hermitienne
R_f(-\tau) = R_f^*(\tau)\,
quand f est une fonction complexe.
  • La fonction continue d'autocorrélation atteint son pic à l'origine, où elle prend une valeur réelle. C’est-à-dire que pour tout délai τ, |R_f(\tau)| \leq R_f(0). C'est une conséquence de l'inégalité de Cauchy-Schwarz. Le même résultat est obtenu pour un cas discret.
  • L'autocorrélation d'une fonction périodique est elle-même périodique, avec exactement la même période.
  • L'autocorrélation de la somme de deux fonctions totalement non-corrélées (la corrélation croisée est zéro pour tout τ) est la somme des autocorrélations de chacune des fonctions.
  • Puisque l'autocorrélation est un type spécifique de corrélation croisée, elle conserve toutes les propriétés de la corrélation croisée.
  • L'autocorrélation d'un bruit blanc aura un pic important à τ = 0 et sera proche de 0 pour tout autre τ. Cela montre qu'un enregistrement de bruit blanc à un certain moment n'est pas corrélé statistiquement à un enregistrement du même bruit blanc à un autre moment.
R(\tau) = \int_{-\infty}^\infty S(f) e^{j 2 \pi f \tau} \, df
S(f) = \int_{-\infty}^\infty R(\tau) e^{- j 2 \pi f \tau} \, d\tau.

Applications[modifier | modifier le code]

  • En optique, l'autocorrélation normalisée et la corrélation croisée donnent le degré de cohérence d'un champ électromagnétique.
  • En traitement du signal, l'autocorrélation peut donner une information sur des événements répétés tels que les battements musicaux ou les fréquences de pulsar, même si cela ne peut pas donner la position dans le temps du battement.

L'exemple suivant montre le signal d'un fichier sonore MIDI Le Beau Danube bleu (à gauche), et son autocorrélation (seulement les 4 premières secondes).

Signal original, Le Beau Danube bleu.
L'autocorrélation du signal (les quatre premières secondes).