Polynôme caractéristique

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

En mathématiques, et plus particulièrement en algèbre linéaire, à toute matrice carrée à coefficients dans un anneau commutatif ou à tout endomorphisme d'un espace vectoriel de dimension finie est associé un polynôme appelé polynôme caractéristique. Il renferme d'importantes informations sur la matrice ou sur l'endomorphisme, comme ses valeurs propres, son déterminant et sa trace. Le théorème de Cayley-Hamilton assure que toute matrice carrée annule son polynôme caractéristique.

Motivation[modifier | modifier le code]

Étant donné une matrice carrée M d'ordre n, on cherche un polynôme dont les racines sont précisément les valeurs propres de M.

Si M est une matrice diagonale ou plus généralement une matrice triangulaire, alors les valeurs propres de M sont les coefficients diagonaux λ1, …, λn de M et nous pouvons définir le polynôme caractéristique comme étant

(X-\lambda_1)(X-\lambda_2)\ldots(X-\lambda_n)\qquad (1)

Nous remarquons que ce polynôme est le déterminant \det(XI_n-M)In est la matrice unité.

Pour une matrice quelconque M, si λ est une valeur propre de M, alors il existe un vecteur colonne propre V non nul tel que MV = λV, soit (λIn-M)V = 0 (où In est la matrice unité.) Puisque V est non nul, cela implique que la matrice λIn-M est singulière, et donc a son déterminant nul. Cela montre que les valeurs propres de M sont des zéros de la fonction λ ↦ det(λ·In − M) ou des racines du polynôme \det(XI_n-M).

Définition formelle[modifier | modifier le code]

Soit M une matrice carrée d'ordre n à coefficients dans un anneau commutatif. Le polynôme caractéristique de M, noté pM(X), est[1] le polynôme défini par

p_M(X):=\det(XI_n-M) = \sum_{\sigma\in\Sigma_n} \varepsilon(\sigma) a_{1\sigma(1)}\dots a_{n\sigma(n)} \qquad (2)

où det est le déterminant des matrices, In désigne la matrice identité d'ordre n, ai j = le polynôme δi j X − mi j, coefficient d'indice (i, j) de la matrice XI – M ; la somme de droite (prise sur l'ensemble des permutations des indices) donne une expression explicite du polynôme caractéristique.

Remarque. Au lieu de l'expression (2), certains auteurs définissent le polynôme caractéristique comme étant \det(M-XI_n). Avec cette définition, on a l'équation p_M(0)=\det(M). Ceci n'est pas le cas pour la définition (2) lorsque l'ordre n est impair et \det(M)\ne 0, puisque l'on a : \det(M-XI_n) = (\!-\,1)^n ~\det(XI_n-M). La définition (2) présente l'« avantage » de rendre le polynôme caractéristique unitaire.

Coefficients[modifier | modifier le code]

Le développement du polynôme caractéristique pM(X) d'une matrice carrée M d'ordre n est donné par

\det(XI_n-M)=X^n-f_1(M)X^{n-1}+f_2(M)X^{n-2}-\dots+(-1)^nf_n(M)

fi(M) est une fonction polynomiale[2] en les coefficients de la matrice M. Deux matrices semblables ont même polynôme caractéristique. Autrement dit, pour toute matrice inversible P, f_i(PMP^{-1})=f_i(M). Un développement explicite du déterminant de X-M donne[3] :

f_k(M)=\sum_{1\leq h_1<\dots<h_k\leq n}\det \left[M_{h_ih_j}\right].

En particulier, le coefficient constant pM(0) est égal à (-1)n fois le déterminant de M, et le coefficient de Xn-1 est égal à l'opposé de la trace de M.

La propriété la plus importante des polynômes caractéristiques est que les valeurs propres de M sont exactement les racines du polynôme pM(X). En notant (\lambda_1,\dots,\lambda_n) les racines de P prises avec multiplicité,

f_k(M)=s_k(\lambda_1,\dots,\lambda_n)

sk désigne le k-ième polynôme symétrique élémentaire. (Ici, les racines sont prises dans une extension finie L de K lorsque K n'est pas algébriquement clos ; ainsi, M est triangularisable sur L. C'est ce qui permet, pour démontrer la formule ci-dessus, de se ramener au cas décrit dans le paragraphe Motivation.)

Lorsque le corps de base K est de caractéristique nulle (par exemple, K=R ou C), grâce aux identités de Newton, les coefficients fk (M) s'expriment comme des fonctions polynomiales des valeurs propres :

\sum_{i=1}^n \lambda_i^j=\operatorname{Tr}(M^j).

Toute fonction M\mapsto f(M) polynomiale en les coefficients de la matrice M et invariante par similitude est une fonction polynomiale en les coefficients du polynôme caractéristique. Cette propriété est par exemple utilisée dans la définition et la classification des classes caractéristiques en géométrie différentielle, ce qui dépasse de loin le niveau de cet article.

Exemples[modifier | modifier le code]

  • Pour une matrice M d'ordre 2, le polynôme caractéristique s'exprime simplement comme
X^2 - \operatorname{tr}(M)X+ \det(M),

mais peut aussi se calculer directement à partir de la définition.

Déterminons par exemple le polynôme caractéristique pM(X) de la matrice

M=\begin{pmatrix}
2 & 1\\
-1& 0
\end{pmatrix}

C'est le déterminant de la matrice

XI_2-M = \begin{pmatrix}
X-2&-1\\
1&X
\end{pmatrix}

On a donc

p_M(X)=(X-2)(X)-1(-1) = X^2-2X+1 = (X-1)^2

On en déduit que 1 est une valeur propre double de la matrice.

  • Pour une matrice A d'ordre 3, le polynôme caractéristique s'exprime comme
X^3 - \operatorname{tr}(A)X^2 + Z(A)X - \det(A)

\begin{align} Z(A)&= -\frac{1}{2}\Bigl(\operatorname{tr}(A^2) - \bigl(\operatorname{tr}(A)\bigr)^2\Bigr)\\&= (a_{1,1}  a_{2,2} + a_{1,1}  a_{3,3} + a_{2,2}  a_{3,3} ) - ( a_{2,1}  a_{1,2} + a_{3,1}  a_{1,3} + a_{3,2}  a_{2,3})\\&= \operatorname{tr} (\operatorname{com} (A))\end{align},

avec  a_{i, j} l'élément en position (i, j) dans la matrice A.

Propriétés[modifier | modifier le code]

 p_{AB} = p_{BA}

Matrice compagnon[modifier | modifier le code]

Soit p(X)=X^n-\sum_{k=0}^{n-1} a_{k}X^{k} un polynôme à coefficients dans \mathbb{K}. La matrice d'ordre n

M=\begin{pmatrix}
0      & 1      & 0      & \ldots & \ldots & 0 \\
\vdots & \ddots & \ddots & \ddots &        & \vdots \\
\vdots &        & \ddots & \ddots & \ddots & \vdots \\
\vdots &        &        & \ddots & \ddots & 0 \\
0      & \ldots & \ldots & \ldots & 0      & 1 \\
a_0    & a_1    & a_2    & \ldots &a_{n-2} & a_{n-1}
\end{pmatrix}

qui admet p(X) comme polynôme caractéristique (et polynôme minimal), est appelée matrice compagnon du polynôme (ou selon certains ouvrages, sa transposée). Une des méthodes utilisées en calcul numérique pour calculer des valeurs approchées des racines d'un polynôme est d'en construire la matrice compagnon puis de calculer des valeurs approchées des valeurs propres de cette matrice à l'aide d'une méthode itérative.

Matrice triangulaire[modifier | modifier le code]

Dans le cas d'une matrice triangulaire (supérieure) d'ordre n, matrice de la forme :

T=\begin{pmatrix}
t_{1,1} & t_{1,2} & \ldots & \ldots & t_{1,n} \\
0       & t_{2,2} & \ldots & \ldots & t_{2,n} \\
\vdots  & \ddots  & \ddots &        & \vdots  \\
\vdots  &         & \ddots & \ddots & \vdots  \\
0       & \ldots  & \ldots & 0       & t_{n,n}
\end{pmatrix}

le déterminant p_T(X)=\det(XI_n-T) qui exprime le polynôme caractéristique se factorise :


p_T(X)=(X-t_{1,1}) (X-t_{2,2}) \ldots (X-t_{n,n})

Le même raisonnement s'applique bien sûr au cas d'une matrice triangulaire inférieure. D'une façon générale, les valeurs propres d'une matrice triangulaire coïncident donc effectivement avec ses éléments diagonaux, comme annoncé au début.

Généralisations et applications[modifier | modifier le code]

Polynôme caractéristique d'un endomorphisme[modifier | modifier le code]

Si f est un endomorphisme d'un espace vectoriel E de dimension finie, on appelle polynôme caractéristique de f le polynôme caractéristique de la matrice représentant f dans une base de E. Les polynômes caractéristiques de deux matrices semblables étant égaux, cette définition ne dépend pas de la base choisie ; on a  p_f(X)= \det(f-X. {\rm Id}_E).

Équations caractéristiques[modifier | modifier le code]

La recherche des valeurs propres d'une matrice (ou d'un endomorphisme) revient à déterminer les zéros de son polynôme caractéristique, et donc à résoudre l'équation p_A(X)=0. Lorsque cette matrice apparaît comme outil de résolution d'un problème, tel que la recherche des solutions d'une équation différentielle, ou d'une formule explicite pour une suite définie par récurrence, par exemple, on dit que l'équation précédente est l’équation caractéristique de ce problème. Ainsi, pour résoudre l'équation différentielle y''+by'+cy=0, on construit le système différentiel y'=z, z'=-cy-bz, de matrice M=\begin{pmatrix}
0 & 1\\
-c&-b
\end{pmatrix} ; le polynôme caractéristique de M est X^2+bX+c, et on retrouve bien l'équation caractéristique au sens d'Euler.

Polynôme caractéristique d'un graphe[modifier | modifier le code]

On appelle polynôme caractéristique du graphe G le polynôme caractéristique de la matrice d'adjacence de G. L'étude de ce polynôme et de ses racines est l'objet de la théorie spectrale des graphes.

Notes et références[modifier | modifier le code]

  1. (en) K. Itô L. and S. Nihon, Encyclopedic dictionary of mathematics, MIT Press, 2nd ed., (1993), p. 995
  2. Gerard Walschap, Metric Structures in Differential Geometry, p. 179
  3. Ibid, p. 181

Articles connexes[modifier | modifier le code]