Mathématiques de la relativité générale

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Les mathématiques de la relativité générale se réfèrent à différentes structures et techniques mathématiques utilisées par la théorie de la relativité générale d'Albert Einstein. Les principaux outils utilisés dans cette théorie géométrique de la gravitation sont les champs tensoriels définis sur une variété pseudo-riemannienne représentant l'espace-temps.

Pourquoi les tenseurs ?[modifier | modifier le code]

Le principe de relativité généralisé (ou principe de covariance généralisée, ou encore covariance sous la transformation) affirme que les lois de la Physique prennent les mêmes formes mathématiques dans tous les référentiels et a été l'un des principes centraux dans le développement de la relativité générale. Le terme de « covariance généralisée » a été utilisé lors de la formulation initiale de la relativité générale, mais est maintenant connu sous le nom de covariance par difféomorphisme. Bien que la covariance par difféomorphisme ne soit pas l'élément central de la relativité générale et qu'une controverse soit toujours présente concernant son statut dans la théorie, la propriété d'invariance des lois de la Physique associée au fait que la relativité générale soit une théorie essentiellement géométrique (dans le cadre de la géométrie non-riemannienne) suggèrent que soient utilisés les tenseurs dans sa formulation. Ceci sera discuté plus bas.

L'espace-temps comme une variété[modifier | modifier le code]

Article détaillé : Espace-temps.

La plupart des approches modernes de la relativité générale se basent sur le concept de variété. Plus précisément, la construction physique de base représentant la gravitation – un espace-temps courbe – est modélisée par une variété pseudo-riemanienne lorentzienne à quatre dimensions, continue, connexe et constituant un espace séparé ou espace de Hausdorff. Les autres grandeurs physiques sont représentées par différents tenseurs (voir plus loin).

L'objectif dans le choix d'une variété comme structure mathématique de base est de pouvoir refléter au mieux les propriétés physiques. Par exemple, dans la théorie des variétés, chaque point p est contenu dans un voisinage muni d'un système de coordonnées appelé carte, et peut être pensé comme une représentation locale de l'espace-temps autour de l'observateur (représenté par le point p). La carte munie de son système de coordonnées permet de décrire localement l'espace autour du point de la variété. Le principe de covariance de Lorentz local, qui affirme que les lois de la relativité restreinte s'appliquent localement en chaque point de l'espace-temps, fournit une raison supplémentaire pour le choix de la variété pour représenter l'espace-temps : on peut préciser ce point en affirmant que localement autour d'un point d'une variété, la région « ressemble » à un espace de Minkowski (espace-temps plat).

L'idée d'une carte munie d'un système de coordonnées comme un observateur local pouvant effectuer des mesures à proximité a aussi un sens du point de vue physique, car cela correspond à la manière de fonctionner pour les mesures expérimentales – effectuées localement. Pour des problèmes cosmologiques, une carte peut être un voisinage relativement grand. En revanche, la description complète de l'espace-temps entier nécessite en général plusieurs cartes, regroupées au sein d'un atlas.

Structure globale et structure locale[modifier | modifier le code]

Une distinction importante en physique consiste à considérer la différence entre les structures locale et globale. Les mesures en physique sont effectuées dans une région de l'espace-temps relativement petite. On comprend alors pourquoi étudier la structure locale de l'espace-temps en relativité générale, alors que déterminer la topologie de l'espace-temps a du sens, spécialement en cosmologie afin de déterminer la structure globale de l'espace-temps.

Tenseurs en relativité générale[modifier | modifier le code]

Article détaillé : Tenseur.

La description de phénomènes physiques ne doit pas dépendre de qui fait les mesures – un système de coordonnées n'est pas meilleur qu'un autre. L'une des conséquences profondes de la théorie de la relativité a été la suppression de référentiels préférentiels. Le relativité restreinte a mis fin aux référentiels inertiels pour la description des phénomènes physiques, alors que la relativité générale a éliminé tout référentiel privilégié pour une telle description.

Tout observateur peut faire des mesures et les quantités numériques obtenues dépendent seulement du système de coordonnées utilisé. Ceci suggère une manière de formuler la relativité en utilisation des structures invariantes qui sont indépendantes du système de coordonnées (représenté par l'observateur) utilisé, et qui aient une existence propre. L'outil mathématique le plus adapté pour cela semblait être le tenseur. Pour exemple, lors de la mesure des champs électriques et magnétiques produits par les charges accélérées, les valeurs des champs dépendront du système de coordonnées utilisé, mais les champs sont considérés comme ayant une existence indépendante, représentée par le tenseur de champ électromagnétique, répondant à la formulation tensorielle des équations de Maxwell.

Mathématiquement, les tenseurs sont des opérateurs linéaires généralisés. Ils sont souvent considérés comme une représentation de fonctions multilinéaires. Ainsi les idées de l'algèbre linéaire sont utilisées pour étudier les tenseurs.

À chaque point p d'une variété V peuvent être construits les espaces tangent T_pV et contingent T_p^{\star}V à la variété V en p. Les vecteurs (dénommés parfois vecteurs contravariants) sont définis comme éléments de l'espace tangent et les covecteurs (dénommés parfois vecteurs covariants, mais plus souvent vecteurs duaux ou 1-forme) comme éléments de l'espace contingent.

Ces deux espaces vectoriels peuvent être utilisés pour construire des tenseurs de type (r,s) en p. Ces tenseurs sont des graphes multilinéaires de valeur réelle agissant sur l'espace produit cartésien de r copies de l'espace contingent à M en p d'une part avec s copies de l'espace tangent à M en p d'autre part. L'ensemble de tous ces graphes multilinéaires forment un espace vectoriel, appelé l'espace produit tensoriel de type (r,s) en p et noté par (T_p)^r{}_sM. Si l'espace tangent est de dimension n, il peut être démontré que \dim (T_p)^r{}_sM = n^{r+s}.

Dans la littérature sur la relativité générale, il est conventionnel d'utiliser la convention des composants pour les tenseurs. Un tenseur de type (r,sr) peut être écrit :

 T = {T^{a_1 \ldots a_r}}_{{b_1} \ldots {b_s}} \frac {\partial} {\partial x^{a_1}} \otimes \ldots \otimes \frac {\partial} {\partial x^{a_r}} \otimes\mathrm dx^{b_1} \otimes \ldots \otimes \mathrm dx^{b_s}

\tfrac {\partial} {\partial x^{a_i}} est une base pour le i-ème espace tangent et \mathrm dx^{b_j} une base pour le j-ème espace cotangent.

Du fait que l'espace-temps est supposé de dimension 4, chaque index d'un tenseur ne peut prendre qu'un des 4 valeurs possibles. De ce fait, le nombre total d'éléments d'un tenseur vaut 4^R, où R est la somme du nombre des indices covariants et contravariants du tenseur (ce nombre est appelé rang du tenseur).

Tenseurs symétriques et antisymétriques[modifier | modifier le code]

Certaines quantités physiques peuvent être représentées par des tenseurs dont tous les composants ne sont pas indépendants. On peut notamment citer les exemples des tenseurs symétriques et antisymétriques. Les tenseurs antisymétriques sont couramment utilisés pour représenter des rotations (par exemple, le tenseur de vorticité).

Bien qu'un tenseur générique de rang R et de dimension 4 ait 4^R composants, des contraintes sur ce tenseur telles que la symétrie ou l'antisymétrie permettent de réduire le nombre de composants distincts. Par exemple, un tenseur de rang 2 T symétrique vérifie T_{ab} = T_{ba} et possède 10 composants indépendants, alors qu'un tenseur de rang 2 P antisymétrique vérifie P_{ab} = -P_{ba} et possède 6 composants indépendants. Pour des rangs supérieurs à 2, les paires d'index symétriques et antisymétriques doivent être explicitement identifiés.

Les tenseurs antisymétriques de rang 2 jouent des rôles importants en théorie de la relativité. L'ensemble de tous ces tenseurs – souvent appelés bivecteurs – forment un espace vectoriel de dimension 6, parfois appelé espace bivectoriel.

Le tenseur métrique[modifier | modifier le code]

Article détaillé : tenseur métrique.

Le tenseur métrique est un objet central en relativité générale. Il décrit la géométrie locale de l'espace-temps (en temps de résultat de la résolution de l'équation d'Einstein). En utilisant l'approximation des champs faibles, la métrique peut aussi être considérée comme la représentation d'un potentiel gravitationnel.

Champs de tenseurs en relativité générale[modifier | modifier le code]

Les champs de tenseurs sur une variété sont des applications {\mathbf T} : p \mapsto {\mathbf T}(p) qui associent un tenseur à chaque point p de la variété. Cette notion peut être rendue plus précise en introduisant l'idée d'espace fibré, qui dans le contexte présent est destiné à rassembler tous les tenseurs de tous les points de la variété, en formant ainsi un objet appelé fibré tensoriel. Un champ de tenseurs est alors défini comme une application reliant la variété au fibré tensoriel, associant à chaque point p un tenseur en p.

La notion de champ de tenseurs est d'une importance majeure en Relativité Générale. Par exemple, la géométrie autour d'une étoile est décrite par un tenseur métrique en chaque point, nécessitant que la valeur de la métrique soit donnée en chaque point de l'espace-temps pour déterminer la trajectoire des particules. Autre exemple : les valeurs des champs magnétique et électrique (donnés par le tenseur du champ électromagnétique) et la métrique en chaque point autour d'un trou noir chargé déterminent le mouvement d'une particule chargée soumise à ce champ.

Les champs vectoriels sont des champs tensoriels contravariant de rang 1. La quadrivitesse, U^a = \tfrac{\mathrm dx^a}{\mathrm d \tau}, qui est la distance parcourue dans l'espace-temps par unité de temps propre, la quadri-accélération A^a = \tfrac{\mathrm d^2x^a} {\mathrm d \tau^2} et le 4-courant J^a, décrivant les densités de charge et de courant, sont des exemples de champs vectoriels importants en relativité. D'autres champs de tenseurs utilisés en relativité sont :

Bien que le mot « tenseur » se réfère à un objet en un point, il est courant de parler de champs de tenseurs de l'espace-temps (ou d'une de ses régions) sous la dénomination de « tenseurs ».

En chaque point de l'espace-temps où une métrique est définie, cette dernière peut être réduite à la forme de Minkowski (par la loi d'inertie de Sylvester).

Dérivées de tenseurs[modifier | modifier le code]

Avant l'arrivée de la relativité générale, les modifications dans les processus physiques étaient généralement décrites par des dérivées partielles, permettant par exemple de modéliser les champs électromagnétiques (voir Équations de Maxwell). Même en relativité restreinte, les dérivées partielles sont suffisantes pour décrire de telles modifications. Cependant, en relativité générale, il est apparu que les dérivées s'appliquant aux tenseurs doivent être utilisées.

Le problème pour définir les dérivées sur des variétés qui ne sont pas « plates » est qu'il n'existe pas de manière naturelle pour comparer des vecteurs en des points différents. Une structure supplémentaire sur les variétés est nécessaire pour définir les dérivées. Les paragraphes suivants décrivent deux dérivées importantes qui peuvent être définies en imposant une structure supplémentaire sur les variétés dans les deux cas.

Connexions affines[modifier | modifier le code]

La courbure sur une variété connectée peut être caractérisées intrinsèquement en prenant un vecteur en un point et en le transportant parallèlement le long d'une courbe de la variété. Bien que comparer des vecteurs en différents points n'est généralement pas un processus bien défini, une connexion affine \nabla est une règle qui décrit comment déplacer de manière légitime un vecteur le long d'une courbe de la variété sans changer sa direction (en gardant le vecteur parallèle à lui-même).

La connexion affine est une application linéaire faisant correspondre à deux champs de vecteurs (\vec X et \vec Y) un troisième champ. Si ce champ s'annule, \vec X est dit être transporté parallèlement à \vec Y – ceci exprime que le vecteur pointe toujours dans la même direction le long de la courbe de \vec Y. Cette connexion affine ainsi permet de définir la notion de transport parallèle. La torsion (en) d'une connexion est un champ de vecteurs continu. Si la torsion s'annule, la connexion est dite sans torsion ou plus communément symétrique.

Une connexion affine importante est la connexion de Levi-Civita, qui est une connexion symétrique qui résulte du transport parallèle d'un vecteur tangent le long d'une courbe tout en conservant le produit scalaire de ce vecteur le long de la courbe. Les coefficients de connexion résultant sont appelés symboles de Christoffel et peuvent être calculés directement à partir de la métrique. Pour cette raison, ce type de connexion est souvent appelé une connexion métrique.

Dérivée covariante[modifier | modifier le code]

Article détaillé : Dérivée covariante.

Le champ de vecteurs \nabla_{\vec Y} \vec X est appelé la dérivée covariante de \vec X le long de \vec Y et peut être exprimé dans n'importe quel système de coordonnées en définissant au préalable les fonctions \Gamma ^k _{ji}, appelées les coefficients de connexion :

\nabla _{e_i} e_j = \Gamma ^k _{ji} e_k

Malgré la première apparence, les coefficients de connexion ne sont pas les composants d'un tenseur.

Dans un système de coordonnées, la dérivée covariante de X le long de Y est alors

\nabla _{\vec Y} \vec X = X^a{}_{;b}Y^b \frac {\partial} {\partial x^a} = (X^a{}_{,b}+\Gamma ^a _{bc}X^c)Y^b \frac {\partial} {\partial x^a}

L'expression entre parenthèses, appelée la dérivée covariante de X relativement à la connexion et notée \nabla \vec X est plus souvent utilisée dans les calculs :

\nabla \vec X = X^a{}_{;b} \frac {\partial} {\partial x^a} \otimes \mathrm dx^b = (X^a{}_{,b}+\Gamma ^a _{bc}X^c) \frac {\partial} {\partial x^a} \otimes \mathrm dx^b

La dérivée covariante de X peut ainsi être vue comme un opérateur différentiel agissant sur un champ de vecteurs et lui faisant correspondre un champ de tenseurs de type (1,1) (augmentant l'index de covariance de 1). Elle peut être généralisée pour agir sur des champs de tenseurs de type (r,s) et lui faisant correspondre un champ de tenseurs de type (r, s+1). La notion de transport parallèle peut alors être définie de la même manière que dans le cas des champs vectoriels.

La dérivée de Lie[modifier | modifier le code]

La dérivée de Lie est une autre dérivée de tenseur importante. Tandis que la dérivée covariante nécessite une connexion affine pour permettre la comparaison entre des vecteurs en différents points, la dérivée de Lie utilise la congruence d'un champ de vecteurs pour répondre au même besoin. L'idée de faire glisser une fonction le long d'une congruence amène à la définition de la dérivée de Lie, où une fonction « glissée » est comparée à la valeur de la fonction originale en un point donné. La dérivée de Lie peut être définie pour des champs de tenseurs de type (r,s) et peut être vue comme une carte qui associe un tenseur type (r,s) à un autre tenseur de type (r,s).

La dérivée de Lie est généralement notée \mathcal L_X, où X est le champ de vecteurs dont la congruence de la dérivée de Lie est extraite.

Le tenseur de courbure de Riemann[modifier | modifier le code]

Article détaillé : Tenseur de Riemann.

Un élément fondamental de la relativité générale est le concept de variété courbe. Une manière utile d'exprimer la courbure d'une variété est d'utiliser un objet appelé tenseur (de courbure) de Riemann.

Ce tenseur mesure la courbure en utilisant une connexion affine considérant les effets d'un transport parallèle d'un vecteur reliant deux points le long de deux courbes. La différence entre les résultats de ces deux transports parallèles est quantifiée par le tenseur de Riemann.

Cette propriété du tenseur de Riemann peut être utilisée pour décrire comment des géodésiques initialement parallèles divergent. Ceci est exprimé par l'équation de la déviation des géodésiques et exprime le fait que les forces de marée générées par un champ gravitationnel sont le résultat de la courbure de l'espace-temps.

Le tenseur de Riemann est alors défini comme un tenseur de type (1,3). Exprimé explicitement, il contient les symboles de Christoffel et ses dérivées partielles d'ordre 1. Il contient 20 composantes indépendantes. L'annulation de toutes ces composantes dans une région indique que l'espace-temps y est plat. Du point de vue de la déviation des géodésiques, ceci signifie que des géodésiques initialement parallèles dans cette région le resteront.

Le tenseur de Riemann possède un certain nombre de propriété désignées sous le « terme de symétrie du tenseur de Riemann ». On utilise particulièrement dans le cadre de la relativité générale les identités algébriques et différentielles de Bianchi.

La connexion et la courbure d'une variété riemannienne sont fortement liées. La théorie des groupes d'holonomie, qui sont formés en utilisant des graphes linéaires définis par le transport parallèle le long de courbes de la variété, fournit une description de cette relation.

Le tenseur énergie-impulsion[modifier | modifier le code]

Article détaillé : Tenseur énergie-impulsion.

Les sources du champ gravitationnel (matière et énergie) sont représentées en relativité par un tenseur à deux indices symétrique appelé tenseur énergie-impulsion (les indices pouvant être en haut, en bas ou encore mixtes). Il est intimement relié au tenseur de Ricci. En tant que tenseur à deux indices en 4 dimensions le tenseur peut être considéré comme étant une matrice 4×4. Cependant les différents types de matrices admissibles, appelés formes de Jordan, ne peuvent pas tous être réalisés car des conditions d'énergie imposées sur le tenseur énergie-impulsion en contraignent la forme

Conservation de l'énergie[modifier | modifier le code]

En relativité générale on peut exprimer une forme locale de la conservation de l'énergie-impulsion. Elle est exprimée sous forme condensée par l'équations suivante

T^{ab}{}_{;b} =0

L'équation analogue dans le cadre de la relativité restreinte s'écrit quant à elle

T^{ab}{}_{,b} =0

Ce qui illustre la règle selon laquelle en relativité générale les dérivées partielles correspondent à des dérivées covariantes.

L'équation d'Einstein[modifier | modifier le code]


Les équations de géodésique[modifier | modifier le code]

Article détaillé : géodésique.

Une fois l'équation d'Einstein résolue pour obtenir la métrique, il reste à déterminer le mouvement des objets inertiels dans l'espace-temps. En relativité générale, on suppose que le mouvement inertiel a lieu le long de géodésiques de l'espace-temps, paramétrisées à l'aide de la variable temps propre. Les géodésiques sont des courbes qui transportent parallèlement leur propre vecteur tangent  \vec U. On écrit alors cette condition par \nabla_ {\vec U} \vec U =0, qui constitue l'équation géodésique. Il est possible de décrire cette dernière en fonction d'un système de coordonnées x ^a en prenant le vecteur tangent U^a= \tfrac{\mathrm dx^a}{\mathrm d \tau} :

\ddot{x}^a + {\Gamma^a}_{bc} \, \dot{x}^b \, \dot{x}^c = 0

où le point désigne la dérivée \mathrm d/\mathrm d\tau par rapport au temps propre \tau choisi comme paramétrisation de la courbe dans le cas où la courbe est de genre temps. Dans le cas d'une courbe de genre lumière, on ne peut choisir le temps propre comme coordonnée et il est alors nécessaire d'utiliser un paramètre affine. On observe alors la présence des symboles de Christoffel dans l'équation.

Une caractéristique principale de la relativité générale est de permettre de déterminer le chemin parcouru par des particules test ainsi que la trajectoire des rayons lumineux dans un champ gravitationnel. Il suffit pour cela de résoudre les équations géodésiques.

Les équations d'Einstein relient la distribution totale de matière-énergie à la courbure de l'espace-temps. Leur grande non-linéarité rend difficile la détermination exacte du mouvement précis de la matière dans un espace-temps courbe. Par exemple, dans un système composé d'une planète en orbite autour d'une étoile, le mouvement de la planète est déterminé en résolvant les équations du champ gravitationnel qui font intervenir le tenseur énergie-impulsion de la planète et de l'étoile. Le champ gravitationnel de la planète affecte la géométrie entière de l'espace-temps et par conséquent le mouvement des objets. Il est par conséquent raisonnable que les équations du champ gravitationnel déterminent les équations géodésiques.


Aspects mathématiques[modifier | modifier le code]

Nécessité d'une théorie relativiste de la gravitation[modifier | modifier le code]

Mathématiquement, la force de gravitation de Newton dérive d'une énergie potentielle. Le potentiel de gravitation associé à cette énergie potentielle obéit à l'équation de Poisson, qui n'est pas covariante sous transformation de Lorentz. La théorie de la gravitation de Newton n'est donc pas compatible avec le principe fondamental de relativité restreinte énoncé par Einstein en 1905.

Ce principe étant supposé avoir une validité universelle, Einstein va chercher une théorie de la gravitation qui soit compatible avec lui. Le résultat de sa quête est la théorie de la relativité générale.

Modélisation de l'espace-temps[modifier | modifier le code]

Notre perception intuitive nous indique que l'espace-temps apparait régulier et continu, c'est-à-dire « sans trous ». Mathématiquement, ces propriétés vont se traduire par le fait que l'espace-temps sera modélisé par une variété différentielle lisse[1] à 4 dimensions M_4, c'est-à-dire un espace à 4 dimensions pour lequel le voisinage de chaque point ressemble localement à un espace euclidien à 4 dimensions.

Géométrie de l'espace-temps[modifier | modifier le code]

Cet article suit les conventions de signe classiques de MTW [2]

Il adopte également la convention de sommation d'Einstein.

Tenseur métrique[modifier | modifier le code]

La variété différentielle[3] M est munie d'une métrique lorentzienne définie par un tenseur métrique \mathbf g, et constitue ainsi une variété lorentzienne, qui constitue un cas particulier de variété pseudo-riemannienne (le qualificatif « lorentzienne » sera précisé plus loin dans le texte ; cf. métrique lorentzienne).

Soit un système de coordonnées quelconque x^{\mu} autour d'un point P, et soient {\mathbf e}_{\mu}(x) une base locale de T_xM, espace tangent à la variété au point x \in M. Un vecteur tangent \mathbf w \in T_xM s'écrit alors comme la combinaison linéaire :

 \mathbf{w} \ = \ w^{\mu} \  \mathbf{e}_{\mu}

Les w^{\mu} sont appelée les composantes contravariantes du vecteur \mathbf w. Le tenseur métrique \mathbf g est la forme bilinéaire symétrique :

\mathbf g \ = \ g_{\mu \nu}(x) \ \mathrm dx^{\mu} \ \otimes \mathrm d x^{\nu}

\mathrm dx^{\mu} désigne la base duale de {\mathbf e}_{\mu}(x) dans l'espace cotangent T_x^*M, c'est-à-dire la forme linéaire sur T_xM telle que :

 \mathrm dx^{\nu}({\mathbf e}_{\mu})\ = \ \delta_{\mu}^\nu

Les composantes g_{\mu \nu}(x) du tenseur métrique varient de manière continue dans l'espace-temps[4].

Le tenseur métrique peut ainsi être représenté par une matrice 4×4 réelle symétrique :

g_{\mu \nu} \ = \ g_{\nu \mu}

Or, toute matrice 4×4 réelle possède a priori 4 × 4 = 16 éléments indépendants. La condition de symétrie réduit ce nombre à 10 : il reste en effet les 4 éléments diagonaux, auxquels il faut ajouter (16 − 4)/2 = 6 éléments non diagonaux. Le tenseur g_{\mu \nu} possède donc seulement 10 composantes indépendantes.

Produit scalaire[modifier | modifier le code]

Le tenseur métrique définit pour chaque point x \in M de la variété un pseudo-produit scalaire (pseudo au sens où l'hypothèse de positivité est retirée ; cf. métrique lorentzienne) dans l'espace T_xM euclidien tangent à M au point x. Si \mathbf u et \mathbf v sont deux vecteurs de T_xM, leur produit scalaire s'écrit :

\mathbf u \cdot \mathbf v \ = \ \mathbf g (\mathbf u, \mathbf v) \ = \ g_{\mu \nu} \ u^{\mu} \ v^{\nu}

En particulier, en prenant deux vecteurs de base, on obtient les composantes :

g_{\mu \nu} \ = \ \mathbf g ({\mathbf e}_{\mu}, {\mathbf e}_{\nu}) \ = \ {\mathbf e}_{\mu} \cdot {\mathbf e}_{\nu}

Remarque : w^{\mu} désignant les composantes contravariantes du vecteur \mathbf w, on peut définir de même ses composantes covariantes par :

 w_{\mu} \ = \ \mathbf w \ \cdot \mathbf e_{\mu}

Distance élémentaire[modifier | modifier le code]

Considérons le vecteur déplacement élémentaire \mathrm d\mathbf P \ = \ \epsilon^{\mu} \ \mathbf e_{\mu} entre le point P et un point infiniment voisin :  | \epsilon^{\mu} | \ll 1. Sa norme infinitésimale invariante est le nombre réel noté \mathrm ds^2, et on a  :

\mathrm ds^2 \ = \ g_{\mu \nu}(x) \ \epsilon^{\mu} \ \epsilon^{\nu}

Si l'on note « à la physicienne » \epsilon^{\mu}= \mathrm dx^{\mu} les composantes du vecteur déplacement élémentaire, la longueur infinitésimale s'écrit formellement :

\mathrm ds^2 \ = \ g_{\mu \nu}(x) \ \mathrm dx^{\mu} \ \mathrm dx^{\nu}

Attention : dans cette formule, \mathrm dx^{\mu} représente un nombre réel qui s'interprète physiquement comme la « variation infinitésimale » de la coordonnée x^{\mu}, et non une forme différentielle !

Métrique lorentzienne[modifier | modifier le code]

Précisons maintenant l'expression lorentzienne, qui signifie que le tenseur métrique est de signature (1,3). Le principe d'équivalence assure qu'on peut effacer localement un champ de gravitation en prenant un système de coordonnées localement inertiel bien choisi. Dans un tel système de coordonnées localement inertiel X^{\alpha} autour du point P précédent, l'invariant \mathrm ds^2 s'écrit :

\mathrm ds^2 \ = \ \eta_{\alpha \beta} \ \mathrm dX^{\alpha} \ \mathrm dX^{\beta} \ = \ - \ c^2 \,\mathrm dT^2 \, + \,  \mathrm dX^2 \, + \, \mathrm dY^2 \, + \, \mathrm dZ^2

\eta_{\alpha \beta} est la métrique plate de Minkowski. On adopte ici la convention de signe MTW[2] :

\eta_{\alpha \beta} \ = \ \mathrm{diag} \ ( -, \, +, \, +, \, + \, )

On utilisera ici les conventions usuelles suivantes :

  • un indice grec varie de 0 à 3. Il est associé à une grandeur dans l'espace-temps.
  • un indice latin varie de 1 à 3. Il est associé aux composantes spatiales d'une grandeur dans l'espace-temps.

Par exemple, le 4-vecteur position s'écrit dans un système de coordonnées localement inertiel :

 X^{\alpha} \ = \  \left( \begin{matrix} X^{0} \\ X^{i} \end{matrix} \right) \ = \  \left( \begin{matrix} X^{0} \\ X^{1} \\ X^{2} \\                   X^{3} \end{matrix} \right) \ = \  \left( \begin{matrix}                   c \, T \\ X \\ Y \\ Z  \end{matrix} \right)

Le caractère lorentzien de la variété M assure ainsi que l'espace euclidien tangent à M possède en chaque point un pseudo-produit scalaire (pseudo au sens où l'hypothèse de positivité est retirée) ayant 3 valeurs propres strictement positives (associées à l'espace) et une valeur propre strictement négative (associée au temps). En particulier, l'intervalle élémentaire de temps propre séparant deux évènements vérifie :

\mathrm d \tau^2 \ = \ - \ \frac{\mathrm ds^2}{c^2} \ > \ 0

Notions générales de connexion & dérivée covariante[modifier | modifier le code]

D'une manière générale, on appelle connexion \nabla un opérateur qui associe à un champ de vecteurs \mathbf V du fibré tangent TM un champ d'endomorphismes \nabla \mathbf V de ce fibré. Si {\mathbf w} \in T_xM est un vecteur tangent au point x \in M, on note usuellement :

 \nabla_{\mathbf w} \ \mathbf V(x) \ = \ \nabla \mathbf V(x,\mathbf w)

On dit que  \nabla_{\mathbf w} \ \mathbf V est la dérivée covariante du vecteur \mathbf V dans la direction {\mathbf w}. On impose de plus à \nabla \mathbf V de vérifier la condition supplémentaire que, pour toute fonction f, on ait :

\nabla_{\mathbf w} (f \mathbf V) \ = \ f \ \nabla_{\mathbf w} \mathbf V \ + \mathrm df(\mathbf w) \ \mathbf V

La dérivée covariante vérifie les deux propriétés de linéarité suivantes :

  • linéarité en w, c'est-à-dire que, quels que soient les champs de vecteurs w et u et les nombres réels a et b, on ait :
    \nabla_{(a \mathbf w + b \mathbf u)} \mathbf V \ = \ a \ \nabla_{\mathbf w} \mathbf V \ + \ b \ \nabla_{\mathbf u} \mathbf V
  • linéarité en V, c'est-à-dire que, quels que soient les champs de vecteurs X et Y et les nombres réels a et b, on ait :
    \nabla_{\mathbf w} (a\mathbf X + b\mathbf Y) \ = \ a \ \nabla_{\mathbf w} \mathbf X \ + b \ \nabla_{\mathbf w} \mathbf Y

Une fois que la dérivée covariante est définie pour les champs de vecteurs, elle peut être étendue aux champs tensoriels en utilisant la règle de Leibniz : si \mathbf T et \mathbf S sont deux tenseurs quelconques, on impose que :

\nabla_{\mathbf w}(\mathbf T \otimes \mathbf S) \ = \ (\nabla_{\mathbf w} \mathbf T )\otimes \mathbf S \ + \ \mathbf T \otimes(\nabla_{\mathbf w} \mathbf S)

La dérivée covariante d'un champ de tenseurs le long d'un vecteur \mathbf w est à nouveau un champ de tenseurs du même type.

Connexion associée à la métrique[modifier | modifier le code]

On définit la connexion de Levi-Civita [1] comme étant l'unique connexion vérifiant en plus des conditions précédentes que, pour tous champs de vecteurs X, Y, Z de TM, on ait :

  • \nabla_{\mathbf X}(\mathbf g(\mathbf Y,\mathbf Z)) \ = \ \mathbf g(\nabla_{\mathbf X} \mathbf Y,\mathbf Z) \ + \ \mathbf g(\mathbf Y,\nabla_{\mathbf X} \mathbf Z) (parallélisme).
  • \nabla_{\mathbf X} \mathbf Y \ - \ \nabla_{\mathbf Y} \mathbf X \ = \ [\mathbf X, \mathbf Y], où [\mathbf X,\mathbf Y] est le crochet de Lie de X et Y (torsion nulle).

Description en coordonnées[modifier | modifier le code]

La dérivée covariante d'un vecteur est un vecteur, et peut ainsi être exprimée comme une combinaison linéaire de tous les vecteurs de base :

\nabla_{\mathbf w} V \ = \ \left[ \, \nabla_{\mathbf w} V \, \right]^\rho \ \mathbf e_\rho \ = \ \Gamma^\rho \ \mathbf e_\rho

 \Gamma^\rho représente la composante du vecteur dérivée covariante dans la direction  \mathbf e_\rho (cette composante dépend du vecteur \mathbf w choisi).

Pour décrire la dérivée covariante il suffit de décrire celle de chacun des vecteurs de base  \mathbf e_\nu le long de la direction  \mathbf e_\mu . On définit alors les symboles de Christoffel  \Gamma^\rho {}_{\mu \nu} dépendants de 3 indices[5] par :

 \nabla_{\mu} {\mathbf e}_{\nu} \ = \ \nabla_{{\mathbf e}_{\mu}} {\mathbf e}_{\nu} \ = \ \Gamma^\rho {}_{\mu \nu} \ {\mathbf e}_\rho

La connexion de Levi-Civita est entièrement caractérisée par ces symboles de Christoffel. Appliquons en effet la formule générale :

\nabla_{\mathbf w} (f \mathbf V) \ = \ f \ \nabla_{\mathbf w} \mathbf V \ + \ \mathrm df(\mathbf w) \ \mathbf V

sous la forme :

\nabla_{\mu} \mathbf V \ = \ \nabla_{\mu} (V^\nu \mathbf e_\nu) \ = \ V^\nu \ (\nabla_{\mu} \mathbf e_\nu ) \ + \ \mathrm dV^\nu(\mathbf e_\mu) \ \mathbf e_\nu

Sachant que \mathrm dV^\nu(\mathbf e_\mu) = \partial_\mu V^\nu , on obtient :

\nabla_{\mu} \mathbf V \ = \ V^\nu \ \Gamma^\rho {}_{\mu \nu} \ {\mathbf e}_\rho \ + \ \partial_\mu V^\nu \ \mathbf e_\nu

Le premier terme de cette formule décrit la « déformation » du système de coordonnées par rapport à la dérivée covariante, et le second les changements de coordonnées du vecteur \mathbf V. Les indices sommés étant muets, on peut réécrire cette formule sous la forme :

\nabla_{\mu} \mathbf V \ = \ \left[ \, V^\rho \ \Gamma^\nu {}_{\mu \rho}  \ + \ \partial_\mu V^\nu \, \right] \ \mathbf e_\nu

On en déduit la formule importante pour les composantes :

\nabla_{\mu}  \mathbf{V}^{\nu} \ = \ \left[ \,  \nabla_{\mu}  \mathbf{V} \, \right]^{\nu} \ = \ \partial_{\mu} V^{\nu} \ + \ \Gamma_{~ \mu \rho}^{\nu} \ V^{\rho}

En utilisant la formule de Leibniz, on démontrerait de même que :

 \nabla_{\mu}  \mathbf{V}_{\nu} \ = \ \partial_{\mu} V_{\nu} \ - \ \Gamma_{~ \mu \nu}^{\rho} \ V_{\rho}

Pour calculer explicitement ces composantes, les expressions des symboles de Christoffel doivent être déterminées à partir de la métrique. On les obtient aisément en écrivant les conditions suivantes :

 \nabla_{\mu} \ \mathbf{g}_{\nu \rho} \ = \ 0

Le calcul explicite de cette dérivée covariante conduit à :

\Gamma^\mu {}_{\rho \sigma} \ = \ \frac{1}{2} \ g^{\mu \nu} \ \left(\partial_\sigma g_{\nu \rho } \ + \ \partial_\rho  g_{\nu \sigma} \ - \ \partial_\nu g_{\rho \sigma} \right)

g^{\mu \nu}\ sont les composantes du tenseur métrique inverse, définies par les équations :

g^{\mu \nu} \ g_{\nu \rho} \ = \ \delta^\mu{}_\rho

Les symboles de Christoffel ont une symétrie par rapport aux indices du bas : \Gamma^\mu {}_{\rho \sigma}=\Gamma^\mu {}_{\sigma \rho}.\

Remarque : on définit parfois aussi les symboles suivants :

\Gamma_{\nu \rho \sigma} \ = \ \frac{1}{2} \ \left(\partial_\sigma g_{\nu \rho } \ + \ \partial_\rho  g_{\nu \sigma} \ - \ \partial_\nu g_{\rho \sigma} \right)

tels que :

\Gamma^\mu {}_{\rho \sigma} \ = \  g^{\mu \nu} \ \Gamma_{\nu \rho \sigma}

Tenseur de courbure de Riemann[modifier | modifier le code]

Le tenseur de courbure de Riemann \mathbf R est le tenseur d'ordre 4 défini pour tous champs de vecteurs X, Y, Z de M par :

\mathbf R(\mathbf X,\mathbf Y)\mathbf Z \ = \ \nabla_{\mathbf X} \, (\nabla_{\mathbf Y} \mathbf Z)  \ - \ \nabla_{\mathbf Y} \, (\nabla_{\mathbf X} \mathbf Z) \ - \ \nabla_{[\mathbf X,\mathbf Y]} \mathbf Z

Ses composantes s'écrivent explicitement en termes de la métrique :

 R_{ \mu \nu \rho \sigma } \ = \ \frac{1}{2}\left( \partial^2_{ \nu \rho } g_{ \mu \sigma } \ + \ \partial^2_{ \mu \sigma } g_{ \nu \rho } \ - \ \partial^2_{ \nu  \sigma } g_{ \mu \rho } \ - \ \partial^2_{ \mu \rho } g_{ \nu \sigma } \right) \ + \ g_{ \lambda \tau } \left( \Gamma^\lambda {}_{ \nu  \rho } \Gamma^\tau {}_{ \mu \sigma } \ -  \ \Gamma^\lambda {}_{ \nu \sigma } \Gamma^\tau {}_{ \mu \rho } \right)

Les symétries de ce tenseur sont :

R_{ \mu \nu \rho \sigma }  \ = \ R_{ \rho \sigma \mu \nu }\
R_{ \mu \nu \rho \sigma } \ = \ - \ R_{ \nu \mu \rho \sigma } \ = \ - \ R_{\mu \nu \sigma \rho }

Il vérifie de plus la relation :

R_{ \mu \nu \rho \sigma } \ + \ R_{ \mu \sigma \nu \rho } \ + \ R_{ \mu \rho \sigma \nu } \ = \ 0

Tenseur de courbure de Ricci[modifier | modifier le code]

Le tenseur de Ricci est le tenseur d'ordre 2 défini par contraction du tenseur de courbure de Riemann :

R_{\mu \nu} \ = \ g^{\rho \sigma} \ R_{\rho \mu \sigma \nu} \ = \ R^\sigma_{~ \mu \sigma \nu}

Ses composantes s'écrivent explicitement en fonction de la métrique :

R_{\mu \nu} \ = \ \partial_{\rho} \Gamma^{\rho} {}_{\mu \nu} \ - \ \partial_{\nu} \Gamma^{\rho} {}_{\mu \rho} \ + \ \Gamma^{\rho} {}_{\mu \nu} \Gamma^{\sigma} {}_{\rho \sigma} \ - \ \Gamma^{\sigma} {}_{\mu \rho}\Gamma^{\rho} {}_{\nu \sigma}

Ce tenseur est symétrique : R_{\mu \nu} \ = \ R_{\nu \mu}\ .

Courbure scalaire[modifier | modifier le code]

La courbure scalaire est l'invariant défini par contraction du tenseur de Ricci avec la métrique :

R \ = \ g^{\mu \nu} \ R_{\mu \nu} \ = \ R^\nu_{~ \nu}

Équation d'Einstein[modifier | modifier le code]

L’équation complète du champ gravitationnel, qu'on appelle l'équation d'Einstein, s’écrit :

 R_{\mu \nu} \ - \ \frac{1}{2} \, g_{\mu \nu} \, R  \ - \ \Lambda \ g_{\mu \nu} \ = \ \frac{8 \pi G}{c^4} \ T_{\mu \nu}

\Lambda est la constante cosmologique, c est la vitesse de la lumière dans le vide, G est la constante gravitationnelle qui apparaît aussi dans la loi de la gravitation newtonienne, et T_{\mu \nu} le tenseur énergie-impulsion.

Le tenseur symétrique g_{\mu \nu} possédant 10 composantes indépendantes, l'équation tensorielle d'Einstein est équivalente à un système de 10 équations scalaires indépendantes. Ce système aux dérivées partielles non linéaires couplées est le plus souvent très difficile à étudier.

Tenseur énergie-impulsion[modifier | modifier le code]

Le tenseur énergie-impulsion peut s'écrire sous la forme d'une matrice 4×4 réelle symétrique :

 T_{\mu \nu} \ = \  \left( \begin{matrix}
                   T_{00} & T_{01} & T_{02} & T_{03} \\
                   T_{10} & T_{11} & T_{12} & T_{13} \\
                   T_{20} & T_{21} & T_{22} & T_{23} \\
                   T_{30} & T_{31} & T_{32} & T_{33} 
      \end{matrix} \right)

On y retrouve les grandeurs physiques suivantes :

  • T00 est la densité volumique d'énergie. Elle est positive.
  • T10, T20, T30 sont les densités de moments.
  • T01, T02, T03 sont les flux d'énergie.
  • La sous-matrice 3×3 des composantes spatiale-spatiale :
 T_{ik} \ = \ \left( \begin{matrix}
                   T_{11} & T_{12} & T_{13} \\
                   T_{21} & T_{22} & T_{23} \\
                   T_{31} & T_{32} & T_{33} 
      \end{matrix} \right)

est la matrice des flux de moments. En mécanique des fluides, sa diagonale correspond à la pression, et les autres composantes correspondent aux efforts tangentiels dus à la viscosité.

Pour un fluide au repos, le tenseur énergie-impulsion se réduit à la matrice diagonale \mathrm{diag}(\rho c^2,p,p,p)\rho est la masse volumique et p la pression hydrostatique.

Techniques mathématiques pour analyser l'espace-temps[modifier | modifier le code]

Références[modifier | modifier le code]

  1. Par lisse, on veut dire suffisamment différentiable, sans que l'un cherche à préciser ici le degré de différentiabilité.
  2. a et b C. W. Misner, Kip S. Thorne & John A. Wheeler ; Gravitation, Freeman & Co. (San Francisco-1973), ISBN 0-7167-0344-0.
  3. Dans toute la suite, on omet d'écrire l'indice 4 précisant le dimension de la variété M.
  4. Plus précisément, elles doivent être au moins de classe C2
  5. Attention, les symboles de Christoffel ne sont pas des tenseurs.

Voir aussi[modifier | modifier le code]