Covariant et contravariant

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Page d'aide sur les redirections Pour le principe physique, voir Principe de covariance générale.
Page d'aide sur les redirections Pour la notion probabiliste, voir Covariance.
Page d'aide sur les redirections Pour la notion informatique, voir Covariant et contravariant (informatique).

En physique classique ou en physique relativiste utilisant l'algèbre linéaire, multilinéaire, ou la géométrie différentielle, les adjectifs covariant et contravariant désignent la manière dont les composantes d'une grandeur (vecteur, tenseur) s'expriment, suivant qu'on utilise la base vectorielle de référence (avec laquelle les coordonnées sont dites contravariantes) ou/et sa base duale (qui donne les coordonnées covariantes) définie à l'aide du produit scalaire de l'espace vectoriel. Cette notation permet, avec la convention de sommation d'Einstein, d'alléger les écritures des calculs algébriques.

Pour des coordonnées de vecteurs ou de tenseurs, les indices dits contravariants sont par convention des indices supérieurs (placés en haut à droite), et les covariants sont des indices inférieurs (placés en bas à droite). Le tenseur métrique g_{ij} de l'espace vectoriel permet de transformer un indice contravariant en indice covariant, et vice-versa : u_i = g_{ij} .u^j , f_{ij} = f^{~k}_i .g_{kj} , f_{ij} = f^{km}.g_{ki}.g_{mj} , etc.

En physique classique, et dans l'espace usuel muni de la métrique euclidienne, lors d'un changement de base, utilisant une matrice A, le changement des coordonnées covariantes se fait par l'utilisation de la même matrice A, alors que les coordonnées contravariantes sont changées en utilisant la matrice ^T\!A^{-1} (transposée de la matrice inverse) : les co-variantes varient comme les bases, les contra-variantes varient de manière contraire.

En dehors du travail sur un espace où une métrique est imposée par les hypothèses physiques, les mathématiques limitent les coordonnées covariantes à l'espace dual de l'espace utilisé, et seules les coordonnées contravariantes d'un vecteur sont définies (ce sont les coordonnées dans la base utilisée). C'est aussi le cas en mécanique analytique, par exemple, quand le système est étudié dans un espace de configuration où nulle métrique ne s'impose.

Le produit scalaire et la dualité covariance/contravariance[modifier | modifier le code]

Étant donné E un espace vectoriel de dimension finie sur \R muni d'une base \{\mathbf{e}_1 , \mathbf{e}_2,..., \mathbf{e}_n \} et d'un produit scalaire \begin{matrix} \ E \times E \mapsto \R \\ ~~~( \mathbf{u}~;\mathbf{v} ) \to \mathbf{u}.\mathbf{v}\end{matrix} supposé non dégénéré et symétrique.

On introduit la base duale \{\mathbf{e}^j \}_{j=1,..,n} définie par la relation \mathbf{e}^j .\mathbf{e}_i= \delta_i^j (symbole de Kronecker). On remarque que la base duale de la base duale est la base initiale, le processus de dualisation peut donc s'arrêter dès la base duale.

Dans un espace euclidien, en choisissant une base orthonormée, on a \mathbf{e}_i\mathbf{.e}_j = \delta_{ij}, et donc \mathbf{e}^i = \mathbf{e}_i. Il n'y alors aucun intérêt à utiliser cette distinction entre une base et sa base duale, ni à s'embarrasser de ces conventions de notations contra ou covariantes.

Les coordonnées d'un vecteur \mathbf{u} dans la base sont notées u^i (coordonnées contravariantes du vecteur), et on écrit \mathbf{u} = \sum_{i=1}^n u^i. \mathbf{e}_i, ou \mathbf{u} = u^i. \mathbf{e}_i avec la convention de sommation d'Einstein. Quand on utilise les coordonnées contravariantes d'un vecteur, on parle de vecteur contravariant.

De même, les coordonnées du vecteur \mathbf{u} dans la base duale sont notées u_i (coordonnées covariantes du vecteur), et on écrit \mathbf{u} = \sum_{i=1}^n u_i. \mathbf{e}^i, ou \mathbf{u} = u_i. \mathbf{e}^i avec la convention de sommation d'Einstein. Quand on utilise les coordonnées covariantes d'un vecteur, on parle de vecteur covariant.

Avec l'une et l'autre base, on peut donc écrire \mathbf{u} = u^i. \mathbf{e}_i = u_i. \mathbf{e}^i

On a u^i = u^j \delta_j^i = u^j \mathbf{e}_j.\mathbf{e}^i = \mathbf{u}\mathbf{.e}^i et de même u_i = \mathbf{u}\mathbf{.e}_i : dans chacune de ces deux bases, les coordonnées d'un vecteur sont les produits scalaires du vecteur avec les vecteurs de sa base duale.

La véritable dualité sous-jacente[modifier | modifier le code]

Article détaillé : Tenseur.

D'un point de vue mathématique, les coordonnées covariantes (associées à la base duale) sont définies comme des coordonnées de vecteurs de l'espace dual E^* (dont la base duale est une base particulière), et non pas de E.

Il n'existe pas de bijection naturelle entre E et E^*, que ce soit en dimension finie ou infinie, mais dans le cas où l'espace est muni d'une métrique (due à une forme bilinéaire non dégénérée), l'utilisation du théorème de représentation de Riesz permet de définir une bijection. De plus, si le travail théorique utilise un espace (de dimension finie) où le principe de relativité impose une métrique invariante par changement de référentiel de l'observateur, alors, dans cette théorie, la bijection entre E et E^* est indépendante du référentiel (de l'observateur), et on se permet alors, abusivement, de confondre E et E^*.

C'est le cas en physique classique quand l'étude est menée dans l'espace physique \R^3 muni de la métrique euclidienne (par exemple la physique newtonienne, la cristallographie, la mécanique des milieux continus), et, de manière similaire, en relativité restreinte (dont l'espace associé est l'espace de Minkowski) et en relativité générale dont l'invariance de l'intervalle d'espace-temps est un fondement.

Ce n'est pas le cas quand, en mécanique analytique, on utilise des coordonnées généralisées du système étudié, ou en mécanique statistique : l'espace de configuration n'est pas doté d'une métrique rendue incontournable par des hypothèses physiques.

Tenseur métrique[modifier | modifier le code]

La base et la forme bilinéaire non-dégénérée de l'espace étant donnés (la forme bilinéaire joue le rôle de produit scalaire, c'est-à-dire, d'un point de vue physique, permet d'introduire une notion similaire à celle de distance), on définit le tenseur métrique \left( g_{ij} \right)_{i,j=1,...n}, par g_{ij} = \mathbf{e}_i.\mathbf{e}_j\;. En général, on considère que le produit scalaire est commutatif (symétrique) : g_{ij} = g_{ji}\;.

Le tenseur métrique permet de transformer les coordonnées contravariantes en coordonnées covariantes : u_i = g_{ij} .u^j . En effet, on a :

g_{ij} .u^j = \mathbf{e}_i\mathbf{.e}_j. u^j = \mathbf{e}_i\mathbf{.u}= \mathbf{e}_i .(u_j .\mathbf{e}^j)  = u_j.\delta_i^j = u_i

De manière similaire, le tenseur métrique dual, g^{ij} = \mathbf{e}^i.\mathbf{e}^j\;, inverse du précédent (on vérifie aisément que g_{ij}.g^{jk}=\delta_i^k), permet de passer des coordonnées covariantes aux coordonnées contravariantes : u^i = g^{ij} .u_j

En écriture matricielle, en prenant la matrice g=\left( g_{ij} \right)_{i,j=1,...n} et le vecteur de coordonnées contravariantes en colonne \mathbf{u} = (u^i), on a : (u_i) = g.(u^i). La matrice g est la matrice de changement de base de la base des coordonnées contravariantes vers la base des coordonnées covariantes. Et g^{-1} = \left( g^{ij} \right)_{i,j=1,...n}.

Écritures du produit scalaire[modifier | modifier le code]

Avec le tenseur métrique et les coordonnées contra ou covariantes, on peut écrire : \mathbf{u}.\mathbf{v} = u^i.v_i = u_i.v^i = g_{ij}.u^i.v^j = g^{ij}.u_i.v_j

En effet, avec la convention de sommation d'Einstein, on a : \mathbf{u}.\mathbf{v} = \left( u^i.\mathbf{e}_i \right).\left( v^j.\mathbf{e}_j \right) = u^i.v^j.\mathbf{e}_i . \mathbf{e}_j = u^i.v^j. g_{ij} =...

En écriture matricielle, on a : \mathbf{u}.\mathbf{v} = {}^t\!(u^i).g.(v^i)

Pour les formes linéaires[modifier | modifier le code]

Soit f : E \to \R une forme linéaire sur E.

Si \mathbf{u} = u^i. \mathbf{e}_i est un vecteur contravariant, on a  f (\mathbf{u} ) = u^i. f(\mathbf{e}_i). En posant f_i = f(\mathbf{e}_i) \in \R, on a f (\mathbf{u} ) = u^i. f_i et on définit le tenseur covariant \left(f_i \right)_{i=1,...,n} d'ordre 1 (un seul indice).

Si \mathbf{u} = u_i. \mathbf{e}^i est un vecteur covariant, on a f (\mathbf{u} ) = u_i. f(\mathbf{e}^i). En posant f^i = f(\mathbf{e}^i) \in \R, on a f (\mathbf{u} ) = u_i. f^i et on définit le tenseur contravariant \left(f^i \right)_{i=1,...,n} d'ordre 1.

Du fait que \mathbf{e}_i = \mathbf{e}^j.g_{ij}, on obtient f_i = \ f^j.g_{ij} et, de manière similaire, on obtient f^i = \ f_j.g^{ij}.

En algèbre linéaire[modifier | modifier le code]

Fonctions linéaires[modifier | modifier le code]

Soit f : E \to E une fonction linéaire.

Si \mathbf{u} = u^i. \mathbf{e}_i est un vecteur contravariant, on a \mathbf{v} = f (\mathbf{u} ) = u^i. f(\mathbf{e}_i).

  • Si on veut exprimer les images de cette fonction comme des vecteurs contravariants, on écrit f (\mathbf{e}_i ) = f^{~j}_i .\mathbf{e}_j, et on obtient v^j  = f^{~j}_i .u^i : les coefficients f^{~j}_i sont les coefficients de la matrice associée à la fonction f.
  • Si on veut exprimer les images de cette fonction comme des vecteurs covariants, on écrit f (\mathbf{e}_i ) = f_{ij} .\mathbf{e}^j, et on obtient v_j  = f_{ij} .u^i : les coefficients \ f_{ij} sont les coefficients du tenseur d'ordre 2, \left( f_{ij} \right)_{ij=1,...,n}, dit covariant, associé à la fonction f. Comme \mathbf{e}_i = \mathbf{e}^j.g_{ij}, on obtient f_{ij} = f^{~k}_i .g_{kj}

De manière similaire, si on part des vecteurs covariants, on obtient la matrice de coefficients f^{i}_{~j}, et le tenseur contravariant \left( f^{ij} \right)_{ij=1,...,n}, avec f^{i}_{~j} = g^{ik}.f_{k}^{~p}.g_{pj} , f^{ij} = f^{i}_{~p}.g^{pj} , etc.

En un mot, pour les coefficients : un indice en haut est dit contravariant et un indice en bas est dit covariant. Et g_{ij} permet de baisser un indice, alors que g^{ij} permet d'en monter un, en utilisant la convention de sommation d'Einstein.

Équivalence avec les formes bilinéaires[modifier | modifier le code]

La donnée d'une fonction linéaire f(\mathbf{u}) = f (u^i. \mathbf{e}_i ) = u^i. f_i^{~j}.\mathbf{e}_j \in E est équivalente à la donnée d'une forme bilinéaire \phi (\mathbf{u};\mathbf{v}) = \phi (u^i. \mathbf{e}_i ; v_j. \mathbf{e}^j ) = u^i.f_i^{~j}.v_j \in \R, avec \phi (\mathbf{e}_i;\mathbf{e}^j) = f_i^{~j}.

Suivant que pour la forme \phi : E \times E \to \R on considère la base ou la base duale dans chaque exemplaire de E, les coefficients associés à \phi sont f_i^{~j} ou f_{ij} ou ... avec les égalités du type f_{ij} = f^{km}.g_{ki}.g_{mj} qui permettent de passer d'une écriture à l'autre.

Transposition[modifier | modifier le code]

Si \mathbf{f} = \left( f_i^{~j} \right)_{i,j=1,...n} est la matrice de la transformation affine  \mathbf{u}=(u^i) \mapsto \mathbf{v} = (v^i) = \mathbf{f}.(u^i), alors {}^t \mathbf{f} = \left( f_j^{~i} \right)_{i,j=1,...n} est sa matrice transposée, ou encore {}^t\! f_{i}^{~j} =  f^{~i}_j , {}^t\! f_{ij} =  f_{ji} , etc.

On a  \mathbf{u}=(u^i) \mapsto \mathbf{f}.(u^i) = \left( \sum_i f_i^{~j}. u^i \right) = \left( f_i^{~j}. u^i \right)= \left( f^{ij}. u_i \right)

Et on a  \mathbf{u}= (u^j) \mapsto {}^t\!(u^j).\mathbf{f} = \left( \sum_{j} u^j.f_i^{~j} \right) = \left( u^j.{}^t\!f_j^{~i} \right) = \left( u_j.{}^t\!f^{ji} \right) = \left( f^{ij}.u_j \right)

En algèbre multilinéaire[modifier | modifier le code]

Cette situation est similaire au cas des formes bilinéaires.

Soit \phi : E^{\times p} \to \R une forme multilinéaire.

Si dans l'espace initial E^{\times p} on n'utilise que les bases non duales, alors on a \phi (\mathbf{u};\mathbf{v};...;\mathbf{w}) = \phi (u^i. \mathbf{e}_{i} ; v^j. \mathbf{e}_j;...;w^k. \mathbf{e}_k  ) = u^i.v^j...w^k.f_{ij...k} et le tenseur covariant, d'ordre p, associé est \left( f_{ij...k} \right)_{i,j,...,k \in \{1,...,n\} }

Si on utilise des bases non duales ou duales de manière variable dans les p exemplaires de E, on obtient un tenseur mixte (avec des indices contravariants et d'autres covariants). Le tenseur métrique permet là encore de monter ou baisser des indices. Par exemple f^{~m}_{i ~~r ... k}= g^{mj}.f_{i j r ... k}

Contraction tensorielle[modifier | modifier le code]

Article détaillé : Contraction tensorielle.

La contraction d'un tenseur d'ordre p \ge 2 donne un tenseur d'ordre \ p - 2, sachant qu'un tenseur d'ordre 0 est une constante indépendante de la base choisie. Un indice sur lequel une contraction est faite est dit muet.

Par exemple pour f_{ij} , un tenseur d'ordre 2, sa contraction est f_{ij}.g^{ij} = f_i^{~i}=f_{~i}^i= f_0^{~0}+f_1^{~1}+...+f_n^{~n} = Trace \left( f_i^{~j} \right).

La contraction sur r indices de deux tenseurs, d'ordres p et q, donne un tenseur d'ordre  p+q-2r.

Par exemple, pour f_{ij} et \ h_{i}, des tenseurs d'ordre 2 et 1, leur contraction donne f_{ij}.h_k.g^{jk}=f_{ij}.h^j =f_{i0}.h^0 +f_{i1}.h^1 +...+f_{in}.h^n , tenseur d'ordre 1.

Changement de base et terminologie[modifier | modifier le code]

On considère deux bases \{ \mathbf{e}_j \}_{j=1,...,n} et \{ \mathbf{e'}_i \}_{i=1,...,n} liées entre elles par la relation (on utilise ici la notation d'Einstein) : \mathbf{e'}_i = A_i^j.\mathbf{e}_j.

On suppose de plus que dans ces deux bases le produit scalaire soit identique, c'est-à-dire g_{ij} = \mathbf{e'}_i.\mathbf{e'}_j = \mathbf{e}_i.\mathbf{e}_j et \mathbf{u}.\mathbf{v} = g_{ij}.u^i.v^j = g_{ij}.u'^i.v'^j. Cette condition est fondamentale en physique où un changement de référentiel inertiel (les seuls admis) ne change pas la mesure de la distance entre deux objets (en physique classique) ou de la pseudo-distance entre deux événements (en relativité restreinte). En physique classique, le choix d'un référentiel non inertiel est possible mais impose des modifications dans les lois newtoniennes.

Notons \left( \tilde A^{~j}_i \right)_{ij=1,...,n} la matrice inverse de \left( A_i^{~j} \right)_{ij=1,...,n}, c'est-à-dire \tilde A^{~j}_i.A_j^{~k} = \delta_i^k.

Alors les coordonnées contravariantes u^i et \ u'^j d'un vecteur \mathbf{u} dans ces bases vérifient u'^j = \tilde A_i^{~j}.u^i : on voit que si les vecteurs \mathbf{e}_j de la base sont modifiés suivant une matrice, alors les coordonnées sont modifiées suivant la matrice inverse.

En effet, \mathbf{u} = u^j. \mathbf{e}_j = u'^i. \mathbf{e'}_i = u'^i. A_i^{~j}\mathbf{e}_j d'où u^j = u'^i. A_i^{~j} \Rightarrow u'^i = \tilde A^{~i}_j.u^j

De manière similaire, on a u'_i = A_i^{~j}.u'_j et \mathbf{e'}^j = \tilde A_i^{~j}.\mathbf{e}^i

La matrice inverse \tilde A_i^{~j} peut s'écrire à l'aide de A_i^{~j} et du tenseur métrique (généralisant la notion de matrice orthogonale) : \tilde A_i^{~j} = g^{kj}.A_k^{~p}.g_{pi} = A^j_{~i}.

En relativité générale, on accepte g'_{ij} = \mathbf{e'}_i.\mathbf{e'}_j \ne g_{ij} = \mathbf{e}_i.\mathbf{e}_j (tout référentiel est accepté), on obtient quand même \mathbf{u}.\mathbf{v} = g_{ij}.u^i.v^j = g'_{ij}.u'^i.v'^j et la matrice inverse s'écrit \tilde A_i^{~j} = g'^{kj}.A_k^{~p}.g_{pi} = A^j_{~i}. Les autres informations sont identiques aux cas précédents.

Les coordonnées covariantes sont changées en utilisant la même matrice utilisée pour le changement de bases. Les coordonnées contravariantes sont changées en utilisant la matrice inverse de celle utilisée pour le changement de bases. Ces deux propriétés justifient les choix des termes co-variant et contra-variant accolés à chaque type de coordonnées.

Coordonnées curvilignes[modifier | modifier le code]

Un système de coordonnées curviligne \left( x^i \right)_{i = 1,...,n} étant donné pour l'espace affine, l'espace vectoriel tangent est différent en chaque point de l'espace, ou du moins sa base est différente. Une base est \mathbf{e}_i = {\partial\over\partial x^i} =  \partial_{x^i} = \partial_i, avec \partial_i \phi (x) la coordonnée du vecteur tangent d \phi (x) de la fonction \phi : V \mapsto \R en \ M(x) \in V et dans la direction définie par la courbe de x^i. D'ailleurs, la base duale est en général notée dx^i, avec dx^i . \partial_j = \delta^i_j ce qui permet d'écrire[1] dx^i . \partial_i \phi= d \phi.

Ainsi, pour un changement de coordonnées (curvilignes ou non), des coordonnées \left( x^i \right)_{i=1,..,n} à \left( x^{j'} \right)_{j'=1,..,n} (convention de notation : x'~^j = x^{j'}) on a \partial_{j'} = {{\partial x^{i}} \over {\partial x^{j'}}}. \partial_i et dx^{j'} = {{\partial x^{j'}} \over {\partial x^{i}}}. dx^i, où \left({{\partial x^{i}} \over {\partial x^{j'}}} \right)_{i,j'} doit être compris comme la matrice jacobienne du changement de référentiel.

On remarquera que si x^i sont des coordonnées curvilignes, la notation x_i n'a pas de sens car les coordonnées curvilignes ne sont ni covariantes ni contravariantes (la dualité des coordonnées nécessite qu'elles soient définies par des données vectorielles).

La dérivée covariante n'est alors que la réécriture, avec les coordonnées curvilignes, de la dérivée dans un référentiel vectoriel, et apparaissent alors les symboles de Christoffel dus à la métrique dans son écriture : \nabla_{{\mathbf e}_i} {\mathbf e}_j =  \Gamma^k {}_{i j} {\mathbf e}_k,

De même que dans le cadre des coordonnées purement vectorielles, on définit alors sur chaque espace tangent des tenseurs aux indices co et contravariants.

Généralisation en géométrie différentielle[modifier | modifier le code]

Dans une variété différentielle V, les espace vectoriel considérés sont les espaces vectoriels tangents, chacun considéré en un point de la variété.

L'espace tangent, regardé comme l'ensemble des vecteurs vitesse de tous les chemins possibles sur la variété, a une base \mathbf{e}_i = {\partial\over\partial x^i} =  \partial_{x^i} = \partial_i, de manière similaire aux coordonnées curvilignes dans le cas de l'espace affine.

Le passage de toutes ses données d'un point à l'autre de la variété nécessite une connexion affine qui permet ensuite de définir une dérivée covariante. Pour des coordonnées curvilignes d'un espace affine, le choix naturel de la dérivée covariante est la dérivée dans un repère rectiligne réécrite avec les coordonnées curvilignes, mais dans une variété différentielle, en chacun de ses points la dérivée dans un repère rectiligne n'existe pas, ou plutôt, il existe une infinité de possibilités d'identifications entre un ouvert d'un point et le plan tangent où existent des lignes droites permettant une définition naturelle de la dérivée : chaque choix d'identification est un choix de géodésiques (envoyées sur les lignes droites) et donc d'une dérivée covariante.

La relativité générale utilise la connexion de Levi-Civita qui se présente naturellement du fait que le principe d'équivalence d'Einstein relie la gravitation uniquement à la métrique de l'espace temps : la dérivée covariante s'y écrit de manière identique au cas d'un espace affine doté de coordonnées curvilignes. On dit alors d'une grandeur qu'elle est covariante sur la variété \ V, lorsque ses caractéristiques scalaires varient comme les vecteurs de base des espaces vectoriels tangents le font avec la dérivée covariante.

De même que dans le cadre affine, on définit alors sur chaque espace tangent des tenseurs aux indices co et contravariants.

Notes et références[modifier | modifier le code]

  1. p 37 à 39 du cours de relativité générale par Bernard Linet.

Bibliographie[modifier | modifier le code]

  • Jean Hladik , Le calcul tensoriel en physique , Masson 1995
  • Jean-Claude Boudenot ; Électromagnétisme et gravitation relativistes, ellipse (1989), (ISBN 2-7298-8936-1)

Voir aussi[modifier | modifier le code]

Sur les autres projets Wikimedia :