Matrice hessienne

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

En mathématiques, la matrice hessienne (ou simplement la hessienne) d'une fonction numérique f est la matrice carrée, notée H(f), de ses dérivées partielles secondes.

Plus précisément, étant donnée une fonction f à valeurs réelles f: Rn → R :f(x1, x2, ..., xn),

et en supposant que toutes les dérivées partielles secondes de f existent, le coefficient d'indice i, j de la matrice hessienne de f vaut

H_{ij}(f) = \frac{\partial^2 f}{\partial x_i\partial x_j}

ou, en d'autres termes,

H(f) = \begin{bmatrix}
\frac{\partial^2 f}{\partial x_1^2} & \frac{\partial^2 f}{\partial x_1\partial x_2} & \cdots & \frac{\partial^2 f}{\partial x_1\partial x_n} \\
\frac{\partial^2 f}{\partial x_2\partial x_1} & \frac{\partial^2 f}{\partial x_2^2} & \cdots & \frac{\partial^2 f}{\partial x_2\partial x_n} \\
\vdots & \vdots & \ddots & \vdots \\
\frac{\partial^2 f}{\partial x_n\partial x_1} & \frac{\partial^2 f}{\partial x_n\partial x_2} & \cdots & \frac{\partial^2 f}{\partial x_n^2}
\end{bmatrix} .

On appelle hessien (ou discriminant hessien) le déterminant de cette matrice.

Le terme « hessien » a été introduit par James Joseph Sylvester, en hommage au mathématicien allemand Ludwig Otto Hesse.

Soit notamment f une fonction de classe \mathcal C^2 définie sur un ouvert U de l'espace E, à valeurs réelles. Sa matrice hessienne est bien définie et en vertu du théorème de Schwarz, elle est symétrique.

On appelle forme hessienne la forme quadratique associée à la matrice hessienne.

Application à l'étude des points critiques[modifier | modifier le code]

Point col

On suppose f fonction de classe C2 sur un ouvert U. La matrice hessienne permet, dans de nombreux cas, de déterminer la nature des points critiques de la fonction f, c'est-à-dire des points d'annulation du gradient.

Condition nécessaire d'extremum local[modifier | modifier le code]

  • Si a est un point de minimum local de f, alors c'est un point critique et la hessienne en a est positive (c'est-à-dire que la forme hessienne est positive).
  • Si a est un point de maximum local de f, alors c'est un point critique et la hessienne en a est négative (c'est-à-dire que la forme hessienne est négative)[1].

En particulier, si la hessienne en un point critique admet au moins une valeur propre strictement positive et une valeur propre strictement négative, le point critique est un point col.

Condition suffisante d'extremum local[modifier | modifier le code]

Article connexe : Loi d'inertie de Sylvester.

Précisément, un point critique de f est dit dégénéré lorsque le discriminant hessien s'annule, autrement dit lorsque 0 est valeur propre de la hessienne. En un point critique non dégénéré, le signe des valeurs propres (toutes non nulles) détermine la nature de ce point (point d'extremum local ou point col) :

  • si la hessienne est définie positive, la fonction atteint un minimum local strict au point critique ;
  • si la hessienne est définie négative, la fonction atteint un maximum local strict au point critique ;
  • s'il y a des valeurs propres de chaque signe, le point critique est un point col (cf. supra).

Dans ce dernier cas, on définit l'indice du point critique comme le nombre de valeurs propres négatives.

En dimension deux notamment, le discriminant hessien étant le produit des valeurs propres, son signe suffit à déterminer la nature d'un point critique non dégénéré.

Enfin pour un point critique dégénéré, aucune de ces implications n'est vraie. L'un des exemples les plus simples de point critique dégénéré est la selle de singe.

Courbe hessienne[modifier | modifier le code]

Si C est la courbe algébrique d'équation projective (homogène) f(x,y,z)=0, on appelle courbe hessienne (ou simplement hessienne) de C la courbe dont l'équation projective est |H(f)|(x,y,z)=0, où |H(f)| est le hessien (le déterminant de la matrice hessienne) de f. La hessienne de C a pour intersection avec C les points critiques et les points d'inflexion de C[2]. Si C est de degré d, sa hessienne est de degré 3(d – 2) ; d'après le théorème de Bézout, le nombre des points d'inflexion d'une courbe régulière de degré d est donc 3d(d – 2), ce qui est un cas particulier d'une des formules de Plücker.

Extension au cadre des variétés[modifier | modifier le code]

Lorsque M est une variété différentielle et f une fonction numérique indéfiniment différentiable sur M, il est possible de définir la différentielle de f en tout point, mais pas la matrice hessienne, comme on le voit en écrivant une formule de changement de cartes.

Cependant, lorsque m est un point critique pour la fonction f, la matrice hessienne de f en m peut effectivement être définie. On peut donc parler de point critique dégénéré ou non et prolonger les résultats du paragraphe précédent.

Lemme de Morse[modifier | modifier le code]

Le lemme de Morse[3] montre que le comportement d'une fonction régulière au voisinage d'un point critique non dégénéré est entièrement déterminé par la connaissance de l'indice du point critique.

Lemme de Morse — Soit f une fonction C^\infty sur une variété différentielle de dimension n. On considère un point critique non dégénéré m de la fonction f, et on note k son indice. Alors il existe un système de coordonnées locales  x_1, \dots, x_n centré en m et tel que l'expression correspondante de f est

f(x)=f(m)-x_1^2-\cdots -x_k^2 +x_{k+1}^2+\cdots +x_n^2

On qualifie un tel système de coordonnées de Morse.

Il résulte notamment du lemme que les points critiques non dégénérés sont isolés.

Le lemme de Morse se généralise aux espaces de Hilbert sous le nom de lemme de Morse-Palais (en).

Théorie de Morse[modifier | modifier le code]

Article détaillé : Théorie de Morse.

Une fonction dont tous les points critiques sont non dégénérés est qualifiée de fonction de Morse. La théorie de Morse a pour objectif de relier l'étude de la topologie de la variété à celle des points critiques des fonctions qui peuvent y être définies.

Notes et références[modifier | modifier le code]

  1. Comme l'exemple des fonctions constantes le montre, la hessienne en un point de minimum local (resp. de maximum local) peut ne pas être définie positive (resp. définie négative).
  2. (en) G. Salmon, Higher Plane Curves, Stechert (1934)
  3. (en) John Milnor, Morse Theory, Princeton University Press, 1963. ISBN 0-691-08008-9, p. 6.

Voir aussi[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Lien externe[modifier | modifier le code]

G. Vial, Mini-cours d’optimisation