Trace (algèbre)

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Page d'aide sur l'homonymie Pour les articles homonymes, voir Trace.

En algèbre linéaire, la trace d'une matrice carrée A est définie comme la somme de ses coefficients diagonaux et souvent[1] notée Tr(A). La trace peut être vue comme une forme linéaire sur l'espace vectoriel des matrices. Elle vérifie l'identité : Tr(AB)=Tr(BA), et est en conséquence invariante par similitude.

De façon voisine, si u est un endomorphisme d'un espace vectoriel de dimension finie sur un corps commutatif K, on peut définir la trace de l'opérateur u, par exemple comme trace de sa matrice dans n'importe quelle base.

Parmi les applications :

Plus généralement, sur une algèbre A, une trace est une forme linéaire \lambda telle que \lambda(ab)=\lambda(ba). Cette définition se rencontre en particulier dans l'étude des algèbres de von Neumann, qui sont des algèbres d'opérateurs sur des espaces de Hilbert.

Définitions[modifier | modifier le code]

Trace d'une matrice carrée[modifier | modifier le code]

Étant donnée une matrice carrée

A = (a_{i \, j})_{1 \leq i,j \leq n}

à coefficients dans un corps commutatif K (ou seulement dans un anneau commutatif), sa trace, notée \mathrm{Tr}(A), est le scalaire somme des coefficients de sa diagonale principale[2] :

\mathrm{Tr}(A) = \sum_{i=1}^{n} a_{i \, i} .

Pour toutes matrices carrées A et B (de même ordre) et pour tout scalaire α∊K, les propriétés suivantes sont vérifiées :


\begin{matrix}
\mathrm{Tr}(A + B) &=& \mathrm{Tr}(A) + \mathrm{Tr}(B) \\
\mathrm{Tr}(\alpha A) &=& \alpha \mathrm{Tr}(A) \\
\mathrm{Tr}(A^T) &=& \mathrm{Tr}(A), \\
\end{matrix}

AT désigne la transposée de A.

Autrement dit, la trace est une forme linéaire sur l'espace vectoriel[3]n(K) des matrices carrées d'ordre n, invariante par transposition.

Si maintenant A et B sont des matrices (n,m) et (m,n) (non nécessairement carrées, mais fournissant des matrices carrées par multiplication), on a l'identité[4] :


\begin{matrix}
\mathrm{Tr}(AB) &=& \mathrm{Tr}(BA). \\
\end{matrix}

On peut montrer par une preuve assez brève, faisant intervenir les unités matricielles (en) (i.e. les matrices de la base canonique de ℳn(K)) qu'une forme linéaire sur l'espace ℳn(K) vérifiant cette identité (pour toutes matrices carrées (n,n)) est nécessairement proportionnelle à la trace[4].

L'égalité précédente a pour conséquence l'identité suivante, valable pour toute matrice carrée A et pour toute matrice inversible P de même ordre[5] :


\begin{matrix}
\mathrm{Tr}(P^{-1}AP) &=& \mathrm{Tr}(A) \\
\end{matrix}

Autrement dit, la trace est un « invariant de similitude » pour les matrices carrées d'ordre donné.

Trace d'un endomorphisme[modifier | modifier le code]

Si la trace d'une matrice carrée peut être définie sans technicités particulières sur n'importe quel anneau commutatif, il n'en est pas de même pour la trace d'un endomorphisme. En utilisant une représentation matricielle, c'est faisable à assez peu de frais pour un endomorphisme d'espace vectoriel ; une construction plus abstraite, utilisant l'algèbre tensorielle, permet d'étendre le concept à certains endomorphismes de module - mais pas tous.

Dans un espace vectoriel[modifier | modifier le code]

Si E est un espace vectoriel de dimension finie n, la trace d'un endomorphisme u \in \mathcal{L}(E), notée Tr(u), est définie comme la trace de la matrice de u relativement à une base préalablement fixée \mathcal{B} de E[6]. L'identité d'invariance par similitude ci-dessus montre que cette définition ne dépend pas du choix arbitraire de \mathcal{B} ; en effet, étant données deux bases \mathcal{B} et \mathcal{B}', et notant P la matrice de passage de la base \mathcal{B} à la base \mathcal{B}', les matrices A et A' représentant u respectivement dans \mathcal{B} et \mathcal{B}' vérifient la relation dite « de changement de base » : A'=P^{-1}AP . Or on sait que \mathrm{Tr}(P^{-1}AP)=\mathrm{Tr}(A), donc \mathrm{Tr}(A')=\mathrm{Tr}(A) .

Les propriétés suivantes sont vérifiées pour tous les endomorphismes u,v \in \mathcal{L}(E) et pour tout scalaire \alpha \in \mathbb{K}.


\begin{matrix}
\mathrm{Tr}(u + v) &=& \mathrm{Tr}(u) + \mathrm{Tr}(v) \\
\mathrm{Tr}(\alpha u) &=& \alpha \mathrm{Tr}(u) \\
\mathrm{Tr}(u^T) &=& \mathrm{Tr}(u) \\
\mathrm{Tr}(u \circ v) &=& \mathrm{Tr}(v \circ u) \\
\end{matrix}

De plus, si v \in \mathrm{GL}(E) (c'est-à-dire que v est un automorphisme), alors :


\begin{matrix}
\mathrm{Tr}(v^{-1} \circ u \circ v) &=& \mathrm{Tr}(u) \\
\end{matrix}

Autrement dit la trace est une forme linéaire sur l'espace vectoriel \mathcal{L}(E), invariante par transposition et par conjugaison.

Dans un module[modifier | modifier le code]

En utilisant la contraction tensorielle, il est possible d'étendre le concept de trace aux endomorphismes des modules projectifs de type fini[7].

Trace d'une forme quadratique[modifier | modifier le code]

Soit (E,g) un espace euclidien. On définit une bijection (détaillée dans la section Forme bilinéaire symétrique (resp. forme hermitienne) associée de l'article Opérateur autoadjoint) entre les formes quadratiques q sur E, et les opérateurs symétriques A sur (E,g) par :

q(v)=g(v,Av).

La trace de A est appelée trace de la forme quadratique q par rapport à g[8].

Exemples[modifier | modifier le code]

Soit E un K-espace vectoriel de dimension finie n.

  • La trace de l'identité Id est : \mathrm{Tr}(\mathrm{Id}) = n\cdot 1_K=\dim(E)\cdot 1_K
  • La trace d'une transvection est aussi dim E.
  • La trace d'un projecteur vérifie \mathrm{Tr}(p)=\mathrm{rg}(p)\cdot 1_K, où rg(p) est le rang de p[9].
  • Pour deux endomorphismes u et v de E, on pose [u,v]=uv-vu (on l'appelle le commutateur de u et v). La trace de [u,v] est nulle : c'est une autre façon d'exprimer l'identité fondamentale Tr(uv)=Tr(vu).

Dans les espaces euclidiens :

  • La trace d'une rotation de ℝ2 d'angle \theta est donnée par : \mathrm{Tr}(R_{\theta})=2 \cos \theta.
  • De même, la trace d'une rotation d'axe \Delta et d'angle \theta dans l'espace à 3 dimensions est donnée par : \mathrm{Tr}(R_{\Delta , \theta})=1+2 \cos \theta.

Pour des matrices :

  • Toute permutation \sigma \in \mathfrak{S}_n\,\! (où \mathfrak{S}_n \,\! représente le groupe symétrique d'ordre n \,\!) est représentée par une matrice M_{\sigma}=(m_{i \, j})_{1 \leq i,j \leq n} \,\! carrée d'ordre n \,\!, définie par :
    \left\{ \begin{array}{lll}
  m_{i \, j} &= 1  \quad &\mathrm{si} \quad \sigma(i)=j \\
  m_{i \, j} &= 0  \quad &\mathrm{sinon} \end{array} \right.
    La trace de la matrice M_{\sigma} s'interprète alors comme le nombre de points fixes de la permutation \sigma  :
    \mathrm{Tr}(M_{\sigma}) = \mathrm{Card} \left\{ i \in \{1,...,n\} \ | \ \sigma(i)=i  \right\}
  • La trace de la matrice d'adjacence d'un graphe est nulle (si un sommet ne boucle pas sur lui-même).

Trace, polynôme caractéristique et valeurs propres[modifier | modifier le code]

Soit A une matrice carrée d'ordre n à coefficients dans un anneau commutatif.

On définit son polynôme caractéristique comme le polynôme

p_A(X):=\det(XI_n-A)

In désigne la matrice identité d'ordre n. On note c_i le coefficient de X^i dans p_A(X), en d'autres termes on pose :

p_A(X)=X^n+c_{n-1}X^{n-1}+\cdots+c_1X+c_0

Trace et polynôme caractéristique[modifier | modifier le code]

Cas particulier de coefficients dans un anneau intègre

Dans cette sous-section, on suppose l'anneau des coefficients intègre. On peut alors considérer A comme une matrice à coefficients dans un corps commutatif K, à savoir le corps des fractions de cet anneau.

On se place alors dans un corps L contenant K et où p_A est scindé, (par exemple sa clôture algébrique ou le corps de décomposition de p_A) et on note :

p_A(X)=(X-\lambda_{1})(X-\lambda_{2})\cdots(X-\lambda_{n}).

Les \lambda_i sont les valeurs propres de A, comptées avec multiplicité. Par la théorie de la trigonalisation, on sait trouver une matrice carrée triangulaire T, à coefficients dans L et semblable à A, dont la diagonale principale est formée des \lambda_i. En utilisant l'invariance de la trace par similitude, on conclut :

\textrm{Tr}(A)=\sum_{i=1}^n\lambda_i.

De plus, si on développe l'écriture de p_A en facteurs du premier degré, la somme des \lambda_i apparaît comme l'opposé du coefficient de X^{n-1} dans ce polynôme. On en conclut donc que, si note c_{n-1} ce coefficient :

\textrm{Tr}(A)=-c_{n-1}.

Cas général

On ne suppose désormais plus A intègre, on peut néanmoins obtenir des résultats analogues par une autre voie.

Dans le développement du déterminant qui définit le polynôme caractéristique par la formule utilisant des permutations, on constate qu'il n'apparaît de monôme en X^{n-1} que dans un seul des n! termes de la somme, celui qui est produit des termes diagonaux de XI_n-A, c'est-à-dire :

(X-a_{11})(X-a_{22})\cdots(X-a_{nn}),

La trace de A apparaît alors comme le coefficient de X^{n-1}. On a prouvé différemment la formule :

\textrm{Tr}(A)=-c_{n-1}.

On suppose maintenant en outre le polynôme caractéristique de A scindé et on note :

p_A(X)=(X-\lambda_{1})(X-\lambda_{2})\cdots(X-\lambda_{n}),

une[10] décomposition de ce polynôme en facteurs du premier degré.

En développant ce produit, on obtient une nouvelle expression de c_{n-1} ; par rapprochement de celle-ci et de la formule précédente, on obtient :

\textrm{Tr}(A)=\sum_{i=1}^n\lambda_i.

Trace d'un polynôme de matrice[modifier | modifier le code]

Soit q un polynôme (à coefficients dans le même anneau que A).

Si l'anneau est intègre, les techniques et notations utilisées ci-dessus sont utilisables. La matrice q(A) est semblable à q(T), tandis que la diagonale principale de T est formée des q(\lambda_i). On en déduit que :

\textrm{Tr}[q(A)]=\sum_{i=1}^nq(\lambda_i).

Cette formule reste valable sans l'hypothèse d'intégrité, la preuve reposant sur le traitement préalable du cas des anneaux intègres[11].

En particularisant la formule précédente au monôme q=Xk, on obtient :

\textrm{Tr}(A^k)=\sum_{i=1}^n \lambda_i^k.

En caractéristique nulle, les polynômes symétriques élémentaires peuvent être reconstitués polynomialement à partir des sommes de Newton, via les identités de Newton. De ce fait, il existe des formules polynomiales universelles permettant d'exprimer les coefficients du polynôme caractéristique d'une matrice (n,n) en fonction des traces de ses puissances (et même des puissances d'exposant inférieur ou égal à n). Pour en donner un exemple :

c_{n-2}=\frac{\textrm{Tr}(A)^2-\textrm{Tr}(A^2)}{2}.

En voici une application[12] : si A est une matrice (n,n) à coefficients dans un corps de caractéristique nulle et vérifie : \rm{Tr}(A)=\rm{Tr}(A^2)=\dots=\rm{Tr}(A^n)=0, alors A est nilpotente.

Applications[modifier | modifier le code]

Divergence[modifier | modifier le code]

Article détaillé : Divergence (mathématiques).

Étant donné un espace vectoriel réel E de dimension finie, le déterminant définit une application det de l'espace des opérateurs sur E vers R, qui est homogène de degré n. Le nombre det(u) s'exprime comme une fonction polynômiale en les coefficients de la matrice représentant u dans une base quelconque de E. La fonction det est donc différentiable. Sa différentielle en l'identité est la trace. Autrement dit, pour tout opérateur u sur E,

\textrm{det}(I+u)=1+\textrm{Tr}(u)+o(u)

où o(u) signifie que le reste est négligeable devant u quand u tend vers zéro. Comme conséquence, pour tout opérateur u sur E,

\det(\exp(u))=\exp(\textrm{Tr}(u)).

En particulier, l'exponentielle de u est de déterminant 1 ssi u est un opérateur de trace nulle. Ce résultat s'interprète dans la théorie des groupes de Lie comme suit. L'application det est un morphisme continu de groupes du groupe linéaire GL(E) vers R. Son noyau, l'ensemble des opérateurs de déterminant 1, donc est un sous-groupe de GL(E), noté SL(E). Il s'agit d'un groupe de Lie classique, c'est-à-dire d'un sous-groupe fermé de GL(E). Géométriquement, un opérateur appartient à SL(E) si et seulement s'il préserve le volume de Lebesgue de E. Son algèbre de Lie est exactement l'ensemble des opérateurs u de trace nulle, noté \mathfrak{sl}(E).

Sur un ouvert U de E, un champ de vecteurs X est une application X:U\rightarrow \R^n. Si cette application est lipschitzienne, le théorème de Cauchy-Lipschitz affirme l'existence de solutions maximales de l'équation différentielle ordinaire

c'(t)=X(c(t)) (1).

Le flot de X est la famille de difféomorphismes f_t qui envoient x sur c(t), où c est la solution de (1) avec comme condition initiale c(0)=x. Le flot est défini localement. On introduit la divergence de X

\rm{div}(X)(x)=\rm{Tr}(dX(x))

où dX(x) désigne la différentielle de X en x, qui est un opérateur sur E. Le flot ft préserve le volume de Lebesgue ssi la divergence est nulle. Plus précisément, pour tout ouvert \Omega dont l'adhérence est incluse dans U,

\left. \frac{d}{dt}\right|_{t=0}Vol(f_t(\Omega))=\int_{\Omega} \textrm{div}(X)(x)dx.

(Cette égalité permet d'étendre la définition de la divergence, par exemple sur des variétés orientées en présence de formes volumes. Voir divergence (mathématiques).)

Forme de Killing[modifier | modifier le code]

Article détaillé : Forme de Killing.

Si \mathfrak{g} est une algèbre de Lie sur un corps K, la représentation adjointe de \mathfrak{g}, notée ad, est donnée par

ad(X)(Y)=[X,Y].

La forme de Killing sur \mathfrak{g} est la forme bilinéaire symétrique

B(X,Y)=\textrm{Tr}\left(ad(X)\circ ad(Y)\right).

Les automorphismes de l'algèbre de Lie \mathfrak{g} préserve la forme de Killing. En particulier, sa représentation adjointe préserve B. La forme de Killing a été introduite par Élie Cartan[13] pour caractériser la semi-simplicité des algèbres de Lie. Quand K=R, elle fournit aussi des informations sur le groupe de Lie associé. Voir critère de Cartan (en).

Soit G un groupe de Lie (par exemple, un sous-groupe fermé de GL(E)). Par définition, son algèbre de Lie est l'espace des champs de vecteurs sur G invariants à gauche, muni du crochet de Lie [,] (commutateur de champs de vecteurs). La forme de Killing associée B définit une métrique pseudo-riemannienne bi-invariante sur G. Si la forme de Killing B est définie positive, alors la métrique associée est une métrique riemannienne à courbure positive. Le théorème de Meyers implique que G est compact. D'autres liens existent.

Produit scalaire canonique[modifier | modifier le code]

Soit  A=(a_{i,j})_{1\le i\le n,\ 1\le j\le p} et  B=(b_{i,j})_{1\le i\le n,\ 1\le j\le p} deux matrices dans \mathcal M_{n,p}(\R). On remarque que

 (A\mid B) = \sum_{1\le i\le n,\ 1\le j\le p} a_{i,j}b_{i,j} = \mathrm{Tr}(^tAB)=\mathrm{Tr}(^tBA)

On dispose ainsi d'une écriture agréable du produit scalaire canonique sur l'espace R^{np}.

Si H est un espace euclidien ou hermitien, l'opérateur adjoint d'un opérateur u sur H est un opérateur sur H. On définit alors le produit scalaire suivant sur l'espace \mathcal{L}(H) des opérateurs sur H :

 (u\mid v)=\textrm{Tr}(u^*v).

Avec cette définition, il apparait clairement que les opérateurs autoadjoints et les opérateurs antiautoadjoints forment deux sous-espaces orthogonaux de \mathcal{L}(H). L'adjonction est la symétrie orthogonale par rapport à l'espace des opérateurs autoadjoints.

Laplacien[modifier | modifier le code]

Article détaillé : Laplacien.

Soit U un ouvert de l'espace vectoriel réel \R^n contenant 0, et soit f:U\rightarrow\R de classe C2. La hessienne H de f en 0 est une forme bilinéaire symétrique sur E, vérifiant

f(x)-f(0)=\mathrm{d}f(0)(x)+H(f)(x,x)+o(\|x\|^2).

Par définition, le laplacien de f en 0 est la trace de la hessienne :

\Delta f(0)=\mathrm{Tr} [H(f)(0)]=\sum_{i=1}^n \frac{\partial^2f}{\partial x_i^2} (0)

Les fonctions de classe C2 de laplacien nul sont dites harmoniques. Nécessairement analytiques, ces fonctions interviennent notamment en analyse complexe et en analyse fonctionnelle. En particulier, les fonctions de laplacien nul sont les solutions du problème de Dirichlet qui est la recherche des extrémales de l'énergie de Dirichlet.

Par ailleurs, la définition du Laplacien se généralise en géométrie différentielle pour des fonctions sur des variétés riemanniennes, mais aussi pour des objets plus généraux comme, par exemple, les formes différentielles. Y compris dans ce cadre plus général, la définition peut être donnée par des traces de formes bilinéaires. Les formes de laplacien nul sont appelées harmoniques, et la théorie de Hodge en montre l'importance.

Termes de courbure[modifier | modifier le code]

Article détaillé : Courbure moyenne.

Étant donné une surface orientée lisse S de l'espace euclidien \R^3, la courbure moyenne de S en x est la moyenne des deux courbures principales de S en x. Formellement, ces courbures sont les valeurs propres d'une forme quadratique sur le plan tangent TxS, appelée la seconde forme fondamentale de S en x, notée II_x. La courbure moyenne de S en x est

m(x)=\frac{\mathrm{Tr} (II_x)}{2}.

La définition de la courbure moyenne s'étend aux sous-variétés lisses N des variétés riemanniennes. Sa valeur en x n'est plus un scalaire mais un vecteur orthogonal à T_xN, qui se définit encore au moyen de traces. Les sous-variétés de courbure moyenne nulle sont appelées minimales et sont les extrémales du volume riemannien.

Opérateurs à trace[modifier | modifier le code]

Article détaillé : Opérateur à trace.

Soit H un espace de Hilbert, de base hilbertienne (ei)iI (non nécessairement dénombrable). Un opérateur borné A ∈ ℒ(H) est dit à trace si

\sum_{i\in I}\langle P(e_i),e_i\rangle~<\infty\quad\text{pour}\quad P=\sqrt{A^*A}.

(Cette somme ne dépend pas du choix de la base hilbertienne.) Dans ce cas, on pose

\textrm{Tr}(A)=\sum_{i\in I}\langle Ae_i|e_i\rangle.

Les opérateurs à trace[14] sont compacts. Ils forment un idéal de ℒ(H) noté ℒ1(H), qui est complet pour la norme ‖ ‖1 définie ci-dessous. La trace Tr est une forme linéaire continue définie positive sur ℒ1(H).

|\textrm{Tr}(A)|\leq \|A\|_1=\textrm{Tr}(\sqrt{A^*A}).

En dimension finie, la trace d'un opérateur est la somme des coefficients diagonaux d'une représentation matricielle. L'exemple suivant en est une généralisation. Soit μ une mesure borélienne sur un espace compact K. Soit f : K2 → ℝ une application continue. Sur l'espace de Hilbert L2(K,ℝ) des fonctions de K dans ℝ de carré sommable, l'opérateur à noyau

\begin{matrix}
\mathrm L^2(K,\R) & \rightarrow &\mathrm L^2(K,\R)\\ h & \mapsto & x\mapsto \int_K f(x,y)h(y)~\mathrm d\mu(y)\end{matrix}

est à trace, et sa trace vaut :

\int_K f(x,x)~\mathrm d\mu(x).

Notes et références[modifier | modifier le code]

  1. Par exemple Roger Godement, Cours d'algèbre, Hermann, 3e éd., 1978, p. 526 ou N. Bourbaki, Éléments de mathématique, Algèbre, Springer,‎ 2006, p. II.158. D'autres auteurs la notent tr(A) ou trace(A).
  2. Serge Lang, Algèbre, Dunod,‎ 2004 [détail des éditions], p. 515, ou Bourbaki A, op. cit., p. II.158, présente la définition sous une forme légèrement plus générale, et écrit la formule pour une matrice carrée supposée indexée par un ensemble fini quelconque, pas nécessairement celui des entiers entre 1 et n.
  3. Ou le module si K est seulement un anneau commutatif.
  4. a et b Bourbaki A, op. cit., p. II.158
  5. Lang 2004, op. cit., p. 515
  6. Lang 2004, op. cit., p. 520
  7. Bourbaki A, op. cit., p. II.78
  8. N. Bourbaki, Éléments de mathématique, EVT, chap. V, §4, n°9 s'intitule : Trace d'une forme quadratique par rapport à une autre.
  9. Henri Roudier, Algèbre linéaire, Vuibert,‎ 2003 (ISBN 2-7117-8966-7)
  10. L'anneau n'étant pas supposé intègre, cette écriture n'est pas nécessairement unique.
  11. Lang 2004, op. cit., p. 576-579 (pour l'ensemble de la section, jusqu'à l'appel de notes)
  12. E. Leichtnam, Oral Maths Polytechnique - ENS Algèbre et Géométrie, p. 70-71, ou Roudier 2003, op. cit., p. 512. La preuve fournie dans ces sources ne repose pas sur les identités de Newton mais est plus rapide, par récurrence sur la dimension en s'appuyant sur le lemme des noyaux.
  13. Élie Cartan, Sur la structure des groupes de transformations finis et continus, Thèse, éd. Nony, 1894
  14. (en) John B. Conway (en), A Course in Operator Theory, AMS,‎ 2000 (ISBN 978-0-82182065-0, lire en ligne), p. 86-94

Voir aussi[modifier | modifier le code]

Sur les autres projets Wikimedia :