Aller au contenu

Utilisateur:Manay Kimak/Processus gaussien

Une page de Wikipédia, l'encyclopédie libre.
## Cette page est un brouillon qui vise à traduire et à compléter l'article anglais sur les Processus Gaussien

En théorie des probabilités et en statistiques, un Processus Gaussien est un processus stochastique pour lequel tout sous-ensemble fini de ses variables aléatoires suit une loi normale multidimensionnelle. Par équivalence, cela induit que tout combinaison linéaire d'un sous-ensemble fini d'un processus gaussien suit une loi normale. Ainsi, la distribution d'un processus gaussien est la distribution jointe de ses variables aléatoires et peut être vue ainsi comme une distribution sur les fonctions définies avec le même ensemble de définition que le processus gaussien.

Comme tout processus stochastique, un processus gaussien peut être défini sur un espace discret ou continu de petite ou de grande dimension. Il peut être intuitif, dans un premier temps, de considérer des espaces spatio-temporels pour appréhender la notion de processus stochastique mais il est important de retenir qu'il peuvent être définis dans des espaces bien plus complexes. Par exemple, dans le cadre de la régression par des processus gaussiens et de ses application en apprentissage automatique ou en optimisation bayésienne, l'ensemble de définition conjuguera souvent des espaces discrets et continus de grande dimension.

Un des avantages majeurs de travailler avec des processus gaussien est de bénéficier de toutes les propriétés de la loi normale en théorie des probabilités. Entre autres, puisque la loi du processus gaussien (en tant que loi jointe de variables aléatoires normales) suit une distribution normale, les lois marginales et conditionnelles suivent également des distribution normales dont les paramètres (moyenne et covariance) ont une forme analytique connue. Leur calcul numérique peut être plus ou moins évident en fonction de la fonction de covariance puisqu'il implique des inverses de matrices et pose évidemment la question de l'inversibilité de ces dernières et la question de la manière de les calculer dans des espaces de grande dimension.

Le concept de processus gaussien a été nommé ainsi en référence à Carl Friedrich Gauss puisqu'il est essentiellement basé sur la notion de distribution gaussienne et peut être vu comme une généralisation en dimension infinie des distribution normales multidimensionnelles.

Définition

[modifier | modifier le code]

Soit un processus stochastique indexé sur tel que, pour tout , est une variable aléatoire à valeurs dans un ensemble . On dit que est un processus gaussien si et seulement si la loi fini-dimensionnelle de est une loi normale multidimensionnelle. Autrement dit, est un processus gaussien si et seulement si, pour tout

,

et .

Ceci est équivalent à dire que tout combinaison linéaire des suit une loi normale, c'est à dire que pour tout coefficients

et .

On peut également caractériser un processus gaussien par le biais des fonctions caractéristiques. Si pour tout , et pour tout -uplet de points il existe des réels avec tels que l'égalité suivante est vérifiée pour tout  :

est le nombre imaginaire tel que . On peut alors prouver que et sont les valeurs de la moyenne et de la covariance du processus gaussien, c'est à dire les paramètre de loi fini-dimensionnelle normale.

Les définitions ci-dessus caractérisent le processus gaussien à l'aide des lois fini-dimensionnelles. Cependant, on peut construire soi-même des processus gaussien de telle sorte à ce que ces propriétés soient vérifiés par construction comme il est détaillé dans la section suivante.

Construction d'un processus gaussien

[modifier | modifier le code]

On reprend les notations de la section précédente avec l'ensemble sur lequel est indexé le processus gaussien et l'ensemble où il prend ses valeurs. Pour définir un processus gaussien, il suffit de définir une fonction de moyenne ainsi qu'une fonction de covariance (aussi appelée noyau, kernel en anglais). Ainsi, si l'on définit le processus stochastique tel que

c'est à dire que, pour tout point , la variable aléatoire suit une loi normale de moyenne et de variance , alors est un processus gaussien.

En effet, si on prend un ensemble de points alors le vecteur aléatoire suit une loi normale multidimensionnelle, c'est à dire :

est le vecteur où l'on applique la fonction à chaque point de et la matrice de covariance est définie ainsi : .