Transformations de Lorentz

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Cet article présente les transformations de Lorentz sous un aspect technique. Le lecteur désireux d'obtenir des informations physiques plus générales à ce sujet pourra se référer à l'article relativité restreinte.

Les transformations de Lorentz sont des transformations linéaires des coordonnées d'un point dans l'espace-temps de Minkowski, à quatre dimensions (trois d'espace et une de temps) et relativiste. La terminologie subit quelques variations : suivant que la théorie dans laquelle on travaille a trait ou non à la physique quantique, le terme « transformations de Lorentz » désigne des transformations qui peuvent être différentes. Dans tous les cas, l'ensemble des transformations désigné forme un sous-groupe du groupe de Poincaré.

Dans le cadre de la relativité restreinte, les transformations de Lorentz correspondent à la loi de changement de référentiel galiléen pour laquelle les équations de la physique doivent être préservées, ainsi que la vitesse de la lumière qui est la même dans tout référentiel galiléen, tout en préservant les orientations de l'espace et du temps. L'ensemble de ces transformations des coordonnées, aussi appelées « transformations de Lorentz propres et orthochrones », est composé de transformations spécifiques à la relativité restreinte et des rotations dans l'espace à trois dimensions et forme un groupe nommé « groupe spécial de Lorentz ».

Dans le cadre de la physique quantique relativiste, comme en théorie quantique des champs, ce sont les transformations linéaires de l'espace-temps qui laissent les lois invariantes (en l'absence de charge électrique), ce qui englobe les précédentes et en amène d'autres pour former aussi un groupe nommé « groupe de Lorentz » : la symétrie T et la parité s'invitent parmi les transformations de Lorentz et, comme elles sont interprétées comme des changements d'orientation des axes, elles ne sont pas utiles en relativité restreinte.

Dans l'introduction à la publication « Deux Mémoires de Henri Poincaré sur la physique mathématique », Acta Matematica, vol. 38, p. 293-308, en 1921, Hendrik Antoon Lorentz précise que c'est pour faire en sorte que les équations de Maxwell s'écrivent à l'identique dans tout référentiel galiléen que Henri Poincaré a introduit mathématiquement cette loi[1], en la baptisant du nom de Lorentz. Ce dernier en avait donné une version qu'il a, plus tard, jugée imparfaite[2],[3].

Toujours en relativité restreinte, on nomme aussi transformations de Lorentz les transformations subies par un champ électromagnétique par un changement de référentiel inertiel.

F et F', deux référentiels inertiels pour localiser un même événement.

Les formules[modifier | modifier le code]

Présentations les plus courantes[modifier | modifier le code]

En relativité restreinte 
On considère deux référentiels \mathcal R et \mathcal R' en translation rectiligne uniforme l'un par rapport à l'autre à la vitesse \ v parallèle à l'axe des x, et on note respectivement \ (x,y,z,t) et \ (x',y',z',t') les trois coordonnées spatiales et le temps permettant de repérer un même événement observé depuis chacun de ces référentiels. De plus \ \Delta x, \Delta y, ... et \ \Delta x', \Delta y', ... représentent les différences de coordonnées entre deux événements observés depuis chacun de ces référentiels.
Les transformations de Lorentz entre ces deux référentiels sont alors :
 \left\{ \begin{matrix} \Delta t' = \frac{\Delta t - v \Delta x/c^2}{\sqrt {1-v^2/c^2}} \\ \Delta x' = \frac{\Delta x- v \Delta t}{\sqrt{1-v^2/c^2}} \\ \Delta y' = \Delta y \\ \Delta z' = \Delta z \end{matrix} \right. \, , en posant \beta = \frac{v}{c} et \gamma = \frac{1}{\sqrt{1-\beta^2}}, on écrit : \,~\left\{ \begin{matrix} c \Delta t' = \gamma \left( c \Delta t - \beta \Delta x \right)\\ \Delta x' = \gamma \left( \Delta x-\beta c \Delta t \right) \\ \Delta y' = \Delta y \\ \Delta z' = \Delta z \end{matrix} \right. \,

Sous forme matricielle, ces transformations de Lorentz s'écrivent : 
\begin{bmatrix}
c \Delta t' \\ \Delta x' \\ \Delta y' \\ \Delta z'
\end{bmatrix}
=
\begin{bmatrix}
\gamma&-\beta \gamma&0&0\\
-\beta \gamma&\gamma&0&0\\
0&0&1&0\\
0&0&0&1\\
\end{bmatrix}
\begin{bmatrix}
c\,\Delta t \\ \Delta x \\ \Delta y \\ \Delta z
\end{bmatrix}\ .

En physique quantique relativiste 
Les transformations de Lorentz qui doivent laisser invariantes les équations (en l'absence de charge électrique) sont :
\,~\left\{ \begin{matrix} c \Delta t' = \epsilon_1 \gamma \left( c \Delta t - \beta \Delta x \right)\\ \Delta x' = \epsilon_2 \gamma \left( \Delta x- \beta c \Delta t \right) \\ \Delta y' = \epsilon_2 \Delta y \\ \Delta z' = \epsilon_2 \Delta z \end{matrix} \right. \, avec \epsilon_i = \pm 1 \,~ indiquent s'il y a un changement d'orientation temporelle et/ou spatiale.
En considérant l'inversion temporelle T et l'inversion spatiale P, toute transformation utilisée en physique quantique est de la forme \ \Lambda .L, avec \ L une transformation de Lorentz de la relativité restreinte (orthochrone et propre) et \ \Lambda \in \{Id; T; P; TP \}.
Le groupe des transformations propres et orthochrones étant connexe, la décomposition ci-dessus permet de voir que le groupe de Lorentz est formé de quatre composantes connexes, et que le groupe des transformations spéciales (i.e : de déterminant positif) est composé de deux composantes connexes.

Présentation comme rotation hyperbolique[modifier | modifier le code]

L'égalité \ \gamma = \frac{1}{\sqrt{1-\beta^2}} montre que \ \gamma ^2 - (\gamma.\beta )^2 = 1, ce qui permet de définir la rapidité \scriptstyle\boldsymbol{\phi} entre les deux référentiels inertiels, à l'aide des fonctions hyperboliques, par \ \cosh(\phi) = \gamma > 0 et \ \sinh(\phi) = \gamma.\beta \in \mathbb{R}  \, , soit encore \phi = \operatorname{artanh}{\left( \frac{v}{c} \right) }\, , en utilisant \beta = \frac{v}{c} \in \mathbb{R}.

On obtient en écriture matricielle :


\begin{bmatrix}
c \Delta t' \\ \Delta x' \\ \Delta y' \\ \Delta z'
\end{bmatrix}
=
\begin{bmatrix}
\cosh(\phi) & -\sinh(\phi)&0&0\\
-\sinh(\phi)  & \cosh(\phi) &0&0\\
0&0&1&0\\
0&0&0&1\\
\end{bmatrix}
\begin{bmatrix}
c \Delta t \\ \Delta x \\ \Delta y \\ \Delta z
\end{bmatrix}\ .

Les transformations de Lorentz sont présentées alors comme une rotation hyperbolique d'angle \ \phi (la rapidité) dans l'espace-temps de Minkowski.

Présentation sous forme diagonalisée[modifier | modifier le code]

Avec les définitions et propriétés des fonctions de la trigonométrie hyperbolique, on obtient une présentation un peu différente des transformations de Lorentz :

\begin{cases}
c \Delta t'-\Delta x' = e^{\phi}(c \Delta t - \Delta x) \\
c \Delta t'+\Delta x' = e^{- \phi}(c \Delta t + \Delta x) \\
\Delta y' = \Delta y \\
\Delta z' = \Delta z.
\end{cases}

sous forme matricielle : 
\begin{bmatrix}
c \Delta t' - \Delta x'\\ c \Delta t' + \Delta x' \\ \Delta y' \\ \Delta z'
\end{bmatrix}
=
\begin{bmatrix}
e^{\phi}&0&0&0\\
0&e^{- \phi}&0&0\\
0&0&1&0\\
0&0&0&1\\
\end{bmatrix}
\begin{bmatrix}
c \Delta t-\Delta x \\ c \Delta t+\Delta x \\ \Delta y \\ \Delta z
\end{bmatrix}\ .

ce qui en est une forme diagonalisée avec des choix de repères dont deux axes forment l'intersection du cône de lumière avec le plan (Oxt), ou (Ox't') pour l'autre repère, et qui sont impossibles à matérialiser dans l'espace physique à trois dimensions.

Limites non relativistes[modifier | modifier le code]

Groupe de Galilée[modifier | modifier le code]

Les formules du groupes de Lorentz peuvent s'approximer dans le cas où la vitesse \ v du corps est petite devant celle de la lumière, ou, ce qui revient au même, en faisant tendre la vitesse de la lumière \ c vers l'infini. En négligeant le terme \ v/c dans les formules, on retrouve alors le groupe de Galilée qui est le groupe des transformations correspondantes aux changements de référentiel en physique classique.

Groupe de Carroll[modifier | modifier le code]

Le groupe de Carroll est une autre approximation non relativiste des éléments du groupe de Lorentz dans le cas où on s'intéresse aux intervalles grands de genre espace. Cette approximation, découverte par Jean-Marc Lévy-Leblond en 1965, n'a d'intérêt que pédagogique, d'après son découvreur[4].

Différentes méthodes pour trouver les transformations[modifier | modifier le code]

  • Pour la relativité restreinte, Einstein a initié une méthode[5] :
À partir du principe de relativité et de l'invariance de la vitesse de la lumière par changement de référentiel, de l'homogénéité et de l'isotropie supposées de l'espace, et à l'aide d'une représentation géométrique d'une situation idéale où deux référentiels inertiels permettent de voir, mesurer les longueurs, et chronométrer le temps d'un référentiel à l'autre, on démontre les différentes formules par un système d'équations linéaires dont il faut trouver les coefficients. Les transformations non physiques sont parfois écartées sans détail par le choix de la solution positive dans une équation du second degré, choix dû à l'hypothèse physique de l'orientation des repères par une règle telle que celle de la main droite, illustrée par la représentation géométrique accompagnant le raisonnement[6].
  • En physique quantique relativiste, comme en théorie quantique des champs, les transformations utilisées sont définies comme les symétries de l'espace de Minkowski qui laissent inchangées les équations (en l'absence de charge électrique). Cela revient à déterminer les transformations linéaires laissant inchangé l'intervalle d'espace-temps : c'est une définition mathématique pour laquelle les changements de référentiel pour des observateurs ne sont que certaines de ces transformations et qui permet de les trouver toutes.
    Cette méthode est aussi utilisée dans certains manuels de relativité restreinte, après avoir démontré que l'invariance de l'intervalle d'espace-temps par changement de référentiel découle directement des deux axiomes de la relativité restreinte, et en éliminant les transformations qui ne respectent pas la convention d'orientation pour les repères tridimensionnels (règle de la main droite, en général) et d'orientation de l'axe du temps vers le futur ; élimination faite de diverses manières, parfois marquées du sceau de l'évidence[7], et parfois plus justifiées[8].
  • On peut aussi retrouver ces transformations en cherchant les applications linéaires de l'espace-temps à quatre dimensions, mais a priori sans métrique, conservant la forme des équations de Maxwell[9].

La méthode géométrique[modifier | modifier le code]

Représentation habituelle de deux référentiels inertiels

On suppose que l'espace-temps physique est un espace affine où les référentiels, dont seuls sont considérés ceux qui sont inertiels, sont identifiés aux repères cartésiens de cet espace affine. De plus on néglige les translations constantes entre les repères qui ne se manifestent que par des additions de nombres constants aux coordonnées. Donc, la transformation des coordonnées s'effectue au moyen d'une application linéaire, représentable par une matrice :

Soient deux référentiels \mathcal R et \mathcal R' en translation rectiligne l'un par rapport à l'autre sur des axes parallèles, avec une vitesse relative v selon l'axe Ox. Soient (x,t)\quad les coordonnées spatio-temporelles d'un événement dans le référentiel \mathcal R, et (x',t')\quad ses coordonnées dans le référentiel \mathcal R'\quad. (Pour simplifier les notations, on ne tiendra pas compte dans ce paragraphe des deux autres composantes spatiales y et z).

  • Utilisation du principe de relativité :
Par le principe de relativité, les coefficients de la transformation linéaire ne dépendent que de la vitesse relative entre les référentiels, et d'aucune considération extérieure à ces deux référentiels. Pour plus de précision, on devrait dire des vitesses relatives des référentiels, le sujet est abordé un peu plus loin.
  • Première utilisation de la vitesse de la lumière :
Si dans le référentiel \mathcal R on considère le déplacement d'un signal lumineux dans le sens des x positifs, donc à la vitesse de la lumière, alors \ x=ct. Mais comme cette vitesse est la même dans le référentiel \mathcal R', en considérant le déplacement de ce même signal vu depuis ce référentiel, comme l'axe des x' a la même orientation que celui des x, et de même pour les axes temporels, on doit avoir \ x'=ct'[10]. De même, en commençant par considérer le signal depuis \mathcal R'.
Donc : x-ct=0 \Longleftrightarrow x'-ct'=0
Et comme x, t, x', t' sont liés par des relations linéaires à coefficients constants, on doit avoir \ x' = a.x+b.ct et \ ct' = a'.x+b'.ct (avec a, b, a' et b' coeff constants), d'où \ x'-ct'= \lambda_1.x-\lambda_2.ct, or comme x-ct=0 \Longleftrightarrow x'-ct'=0\ , on en déduit \ \lambda_1 = \lambda_2, d'où \ x'-ct'= \lambda.(x-ct) pour un certain \lambda constant.
  • Deuxième utilisation de la vitesse de la lumière :
En considérant le déplacement d'un signal lumineux dans le sens des x négatifs, et en faisant le même raisonnement, on obtient : \ x'+ct'= \mu.(x+ct) pour un certain \mu constant.
  • Conclusion sur la vitesse de la lumière :
En additionnant et soustrayant les deux égalités précédentes, on obtient :
\left\{\begin{matrix}x' = a.x -b.ct \\ ct'= a.ct - bx \end{matrix}\right.\quad (2)
avec :  a= (\lambda + \mu)/2\quad et \ b= (\lambda - \mu)/2 .
  • Première utilisation de la vitesse relative des référentiels :
Pour l'origine du référentiel \mathcal R', on a x'=0 et donc, d'après la première équation du système (2), on a :
x=\frac{b}{a}.ct
En désignant par \ v la vitesse du référentiel \mathcal R' par rapport au référentiel \mathcal R, on peut donc écrire
v= \frac{x}{t} =\frac{b}{a}.c, ou \ v =\beta.c, avec \beta = \frac{v}{c}= \frac{b}{a}
On peut donc écrire :
\left\{\begin{matrix}x' = a.(x -\beta.ct) \\ ct'= a.(ct - \beta.x)\end{matrix}\right.\quad (3)
  • Deuxième utilisation de la vitesse relative des référentiels :
Pour l'origine du référentiel \mathcal R, on a x=0 et donc, d'après les équations du système (2), on a :
x'=-\frac{b}{a}.ct'
En désignant par \ v' la vitesse du référentiel \mathcal R par rapport au référentiel \mathcal R', on peut donc écrire
v'= \frac{x'}{t'} = -\frac{b}{a}.c = -v .
  • Utilisation des hypothèses sur l'espace :
Quand t=0, on a \ x' = a.x. Le coefficient a permet donc de convertir la mesure d'une longueur faite dans le référentiel \mathcal R, en la mesure faite dans \mathcal R'. Ce coefficient peut dépendre de la vitesse relative \ v entre les référentiels, mais pas de sa direction ni de son sens par l'hypothèse de l'isotropie de l'espace. De plus, comme expliqué en début de paragraphe, a est indépendant des coordonnées x, t, x', t'.
Donc a dépend de la norme de la vitesse \ v, c'est-à-dire de \ v^2.
  • Utilisation du principe de relativité :
En inversant les rôles des référentiels \mathcal R et \mathcal R', et ayant justifié que v'= -v , et que \ a ne dépend pas de la direction ni du sens de \ v, donc \ a(v^2) = a((-v)^2), et on peut écrire :
\left\{\begin{matrix}x = a.(x' +\beta.ct') \\ ct= a.(ct' + \beta.x')\end{matrix}\right.\quad (4)
En utilisant les deux équations du système (3) dans la première équation du système (4), on obtient x= a^2.\left( 1-\beta^2 \right)x \, , soit :
a=\frac{\pm 1}{\sqrt{1-\beta^2}}
Le signe + est choisi, sinon il y a changement dans l'orientation entre l'axe des x et l'axe des x', ce qui n'est pas le cas par hypothèse.
  • Conclusion :
Les transformations de Lorentz s'écrivent :
\left\{\begin{matrix}x' = \frac{1}{\sqrt{1-\beta^2}}.(x -\beta.ct) \\ ct'= \frac{1}{\sqrt{1-\beta^2}}.(ct - \beta.x)\end{matrix}\right.
Ce que l'on écrit souvent :
\left\{\begin{matrix}x' = \gamma.(x -\beta.ct) \\ ct'= \gamma.(ct - \beta.x)\end{matrix}\right.
Avec \beta = \frac{v}{c} et \gamma = \frac{1}{\sqrt{1-\beta^2}}.

La méthode partant de l'invariance de la pseudo-norme[modifier | modifier le code]

Dans ce paragraphe[11], les coordonnées \ (ct,x,y,z) = (ct, \vec r ) sont celles du référentiel inertiel \mathcal{R} et \ (ct',x',y',z') = (ct' , \vec r ~' ) sont celles du référentiel inertiel \mathcal{R'}, ces deux référentiels ayant les mêmes origines spatiales et temporelles.

Dans l'espace-temps de Minkowski, la pseudo-norme est définie par le carré de l'intervalle d'espace-temps : \ ds^2=\eta_{\alpha\beta}dx^{\alpha}dx^{\beta}=dx_{\alpha}dx^{\alpha}=c^2dt^2-dx^2-dy^2-dz^2

Les transformations de Lorentz sont les applications linéaires sur les quadri-coordonnées \ (ct, x,y,z) \longmapsto (ct', x', y', z') qui laissent invariante la pseudo-norme : \ (c.dt)^2-dx^2-dy^2-dz^2 = (c.dt')^2-dx'^2-dy'^2-dz'^2

Cas où la transformation ne concerne que les coordonnées spatiales

Dans ce cas, l'invariance de la pseudo-norme implique \ dx^2+dy^2+dz^2 = dx'^2+dy'^2+dz'^2, c'est-à-dire que la transformation conserve la norme spatiale : la matrice 3x3 associée est une matrice orthogonale.

  • Si son déterminant est positif, il s'agit d'une rotation dans l'espace et elle conserve donc l'orientation de l'espace. La transformation de l'espace-temps laisse le temps inchangé et agit comme une rotation d'un angle constant sur les vecteurs de l'espace, elle est considérée comme physiquement réaliste.
  • Si son déterminant est négatif intervient en plus une symétrie planaire qui inverse l'orientation de l'espace. La transformation, laissant le temps inchangé mais inversant l'orientation spatiale, n'est pas considérée comme physiquement réaliste, mais peut être utilisée pour explorer les propriétés mathématiques des équations.
Cas où la transformation concerne aussi la coordonnée temporelle

Pour plus de légèreté dans les notations, on remplace \ dt par \ t , \ dx par \ x, etc.

  • La linéarité d'une telle transformations permet d'écrire :
\left\{\begin{matrix}
 ct' = a.ct + {}^T\!\vec v . \vec r\\
\vec r ~' = \vec w .ct + A . \vec r\end{matrix}\right.
\ a est un réel constant, \ A est une matrice 3x3 à coefficients constants, \vec v et \vec w sont deux vecteurs constants de l'espace, avec {}^T\!\vec v = le transposé de \vec v, et {}^T\!\vec v . \vec r = le produit scalaire des vecteurs \vec v et \vec r.
Par une transformation de Lorentz ne touchant que les coordonnées spatiales, on peut faire en sorte que les vecteurs \vec v et \vec w soient colinéaires : on a donc \vec v = b . \vec u et \vec w = d . \vec u\vec u est un vecteur unitaire (\| \vec u \| = 1) constant lui aussi, et \ b et \ d deux réels constants (éventuellement nuls).
On peut donc écrire
\left\{\begin{matrix}
 ct' = a.ct + b.{}^T\!\vec u . \vec r\\
\vec r ~' = d.\vec u .ct + A . \vec r\end{matrix}\right.
Or on a B\left( (ct, \vec 0) , (0, \vec r) \right) = 0, donc B\left( (ct', \left(\vec 0 \right)') , ((0)', \vec r ~') \right) = 0, soit B\left( (a.ct, d.ct.\vec u) , (b.{}^T\! \vec u . \vec r, A\vec r ) \right) = ... = ct. \left( ab.{}^T\! \vec u - d. {}^T\! \vec u .A \right). \vec r = 0
Cette égalité étant vraie pour tout \ t \in \R et tout vecteur de l'espace \vec r, on a ab.{}^T\! \vec u = d. {}^T\! \vec u .A. Si {}^T\! \vec u .A = {}^T\!\vec 0, alors la matrice \ A n'est pas inversible (car \ {}^T\!A admet 0 comme valeur propre car \vec u \ne \vec 0) et la transformation de Lorentz associée n'est pas un changement de base de l'espace à quatre dimensions : ce qui ne correspond pas aux hypothèses. Si \ d = 0, alors \ a = 0 ou \ b = 0 et un court travail montre que l'on retombe alors dans le cas où la transformation ne concerne que les vecteurs de l'espace.
Donc \ a \ne 0, \ b \ne 0, \ d \ne 0, et {}^T\! \vec u .A = \alpha. {}^T\! \vec u, avec \alpha = {{ab} \over d}.
  • On pose \ r_{||} = {}^T \! \vec u . \vec r et \vec r ~_{||} = r _{||}. \vec u, on a \vec r = \vec r ~_{||} + \vec r _{\perp}, avec \vec r _{\perp} \perp \vec u et  r^2 = \left(r ~_{||} \right)^2 + \left(r _{\perp} \right)^2.
  • L'invariance par la transformation de Lorentz signifie que \ (ct)^2 - r^2 = (ct')^2 -(r')^2. En développant et en utilisant {}^T\! \vec u .A = \alpha. {}^T\! \vec u, avec \alpha = {{ab} \over d}, on obtient \ (ct)^2 - r^2 = (a^2 - d^2).(ct)^2 +b^2. \left( r_{||} \right)^2 - \left( A. \vec r \right)^2.
Cette égalité étant vraie pour tout \ t \in \R et tout vecteur de l'espace \vec r, on a :
\begin{cases}
 a^2 - d^2 = 1 \\
r^2 = \left( A. \vec r \right)^2 - b^2. \left( r_{||} \right)^2
\end{cases}
En exploitant le cas particulier \vec r = \vec u , on obtient \ b = \pm d.
En exploitant le cas particulier \vec r \perp \vec u (c'est-à-dire \ r_{||} = 0), on obtient \left( A. \vec r_{\perp} \right)^2 = \left( \vec r_{\perp} \right)^2, et l'endomorphisme de matrice \ A est une isométrie de l'espace de dimension 2 des vecteurs perpendiculaires à \vec u dans lui-même[12].
Donc, en posant \tilde A = restriction de \ A au plan des vecteurs perpendiculaires à \vec u, et \epsilon = \pm 1, on a :
\begin{cases}
ct' = a.ct + b.r_{||} \\
\vec r ~' = \epsilon.b.\vec u .ct + \epsilon.a. r_{||}. \vec u + \tilde A . \vec r_{\perp} = \left( \epsilon.b.ct + \epsilon.a. r_{||} \right). \vec u + \tilde A . \vec r_{\perp}
\end{cases}
Avec \ a^2 - b^2 = 1
En utilisant à nouveau une transformation de Lorentz ne concernant que les coordonnées spatiales, et même plus précisément le sous-espace des vecteurs perpendiculaires à \vec u, on peut se ramener au cas \tilde A = Id_{2 \times 2}, et on a alors :
\begin{cases}
ct' = a.ct + b.r_{||} \\
\vec r ~' = \left( \epsilon.b.ct + \epsilon.a. r_{||} \right) .\vec u + \vec r_{\perp}
\end{cases} 
\Rightarrow
\begin{cases}
ct' = a.ct + b.r_{||} \\
r'_{||} = \epsilon.b.ct + \epsilon.a. r_{||} \\
\vec r ~'_{\perp}  = \vec r_{\perp}
\end{cases}
Avec \ a^2 - b^2 = 1
  • En choisissant la direction du vecteur \vec u comme axe des \ x, en utilisant les fonctions hyperboliques, et avec \epsilon_i = \pm 1 permettant de discuter de la conservation ou non des orientations du temps et de l'espace, on obtient :

\begin{bmatrix}
ct' \\ x' \\ y' \\ z'
\end{bmatrix}
=
\begin{bmatrix}
\epsilon_1 \cosh(\phi) & -\epsilon_1 \sinh(\phi)&0&0\\
-\epsilon_2 \sinh(\phi)  & \epsilon_2 \cosh(\phi) &0&0\\
0&0&1&0\\
0&0&0&1\\
\end{bmatrix}
\begin{bmatrix}
ct \\ x \\ y \\ z
\end{bmatrix}\ .

Histoire et genèse des transformations de Lorentz[modifier | modifier le code]

  • Woldemar Voigt publie en 1887 un article sur l'effet Doppler[13] dans lequel il remarque l'invariance de certaines équations différentielles sous les changements de variables (en notation moderne pour en faciliter la lecture) :

x^\prime=x-vt,\quad y^\prime=\frac y \gamma,\quad z^\prime=\frac z\gamma,\quad t^\prime=t-\frac{vx}{c^2},\quad \gamma=\frac1{\sqrt{1-\frac{v^2}{c^2}}}

  • En 1889, George Francis FitzGerald publie dans la revue Science l'article L'éther et l'atmosphère terrestre, dans lequel il formule l'hypothèse de contraction des longueurs, hypothèse que Hendrik Antoon Lorentz formulera aussi, indépendamment de FitzGerald, dans un article de 1892[14].

Dans son ouvrage La théorie électromagnétique de Maxwell et son application aux corps mouvants[15] de 1892, Lorentz utilisera des transformations bien différentes de celles de Voigt :

x^\prime=\dfrac c{\sqrt{c^2-v^2}}x,\quad y^\prime=y,\quad z^\prime=z,\quad t^\prime=t-\dfrac{\epsilon}{c}x^\prime\quad \text{avec } \epsilon=\dfrac v{\sqrt{c^2-v^2}}

Aussi bien pour Voigt que pour Lorentz, ces transformations ne sont encore que des outils mathématiques sans signification particulière.

Lorentz introduit le concept de temps local correspondant à l'image de la coordonnée de temps par ces transformations. Toutefois, ce temps local n'a pas pour lui de signification autre que mathématique :

« It is important to understand that for Lorentz the transformed coordinates and fields were mathematical aids with no direct physical significance. »

— Olivier Darrigol, The genesis of the theory of relativity, séminaire Poincaré, 2005.

  • Dans un article de 1899[16], Lorentz observera que l'hypothèse de contraction découle naturellement des transformations qu'il reformulera :

x^\prime=\dfrac c{\sqrt{c^2-v^2}}x,\quad y^\prime=y,\quad z^\prime=z,\quad t^\prime=t-\dfrac{v}{c^2-v^2}x

  • Dans un article de 1904[17] Lorentz donnera des transformations encore différentes:

x^\prime=klx,\quad y^\prime=ly,\quad z^\prime=lz,\quad t^\prime=\frac lk t-kl\frac w{c^2}x\quad \text{avec } k^2=\dfrac{c^2}{c^2-w^2}

On voit donc qu'en 1904, la forme de ces transformations n'est pas encore parfaitement déterminée, elle apparaît par tâtonnement, par essais/erreurs.

  • L'année suivante, 1905, Henri Poincaré présente à l'Académie des Sciences la note Sur la dynamique de l'électron résumant son article qu'il prévoit de présenter à Palerme[1], et dans laquelle il confirme et corrige les résultats de Lorentz de 1904, donne leur nom aux transformations de Lorentz (corrigées)

x^\prime=kl(x+\epsilon t),\quad y^\prime=ly,\quad z^\prime=lz,\quad t^\prime=kl(t+\epsilon x) \text{avec } k=\dfrac 1{\sqrt{1-\epsilon^2}}

et observe qu'elles doivent former un groupe[18].

Il leur donne ainsi leur forme définitive (au signe près, ce qui revient juste à considérer les transformations inverses) :

x^\prime=k(x+\epsilon t),\quad y^\prime=y,\quad z^\prime=z,\quad t^\prime=k(t+\epsilon x)\quad \text{avec } k=\dfrac 1{\sqrt{1-\epsilon^2}}

  • La même année, Einstein publie son article Sur l'électrodynamique des corps en mouvement dans lequel il reconstruit ces mêmes transformations, et leur donne tout leur sens.

Notes et références[modifier | modifier le code]

  1. a et b Henri Poincaré, Sur la dynamique de l'électron, Comptes rendus de l'Académie des Sciences, vol. 140, p. 1504-1508, 5 juin 1905. Note manuscrite.
  2. Lorentz écrit : « Ce furent ces considérations publiées par moi en 1904 qui donnèrent lieu à Poincaré d'écrire son Mémoire sur la Dynamique de l'électron, dans lequel il a attaché mon nom à la transformation dont je viens de parler. [...] je n'ai pas indiqué la transformation qui convient le mieux. Cela a été fait par Poincaré et ensuite par MM. Einstein et Minkowski. »
  3. Henri Poincaré, Sur la dynamique de l'électron, Rendiconti del Ciorcolo matematico di Palermo, vol. 21, p. 129-176, 1906. Soumis le 23 juillet 1905.
  4. Le groupe de Carroll par JM Levy-Leblond, Annales de l'IHP, 1965.
  5. Que l'on peut trouver dans La théorie de la relativité, par Albert Einstein, Gauthier-Villard éditeur, 1921, traduit par Mlle J. Rouvrière.
  6. Un exemple récent est dans le chapitre 5 du livre Introduction à la relativité par James H.Smith (Masson éditeur, traduit par Philippe Brenier, préfacé par Jean-Marc Levy-Leblond, réédité en 1997, ISBN 2-225-82985-3).
  7. Un exemple de choix justifié par l'évidence est dans le §19 du livre Électromagnétisme et gravitation relativistes de Jean-Claude Boudenot (ellipses éditeur, 1989, ISBN 2-7298-8936-1); un autre est dans le §4, de Lev Landau et Evgueni Lifchits, Physique théorique, tome 2 : Théorie des champs, éd. MIR, Moscou [détail des éditions].
  8. Comme exemples de textes discutant plus en détail des critères de choix, on peut citer (en) Geometrical physics in Minkowski spacetime par E.G. Peter Rowe, Springer-Verlag éditeur ISBN 1852333669, 2001; (en) The geometry of Minkowski Spacetime par Gregory L. Naber, Springer-Verlag ISBN 3540978488, 1992, où au chapitre 1, §1.3, la conservation des orientations spatiale et temporelle est présentée comme la raison de cette sélection ; dans le livre de Philippe Tourrenc, Relativité et gravitation (Armand Colin éditeur, ISBN 2-200-21209-7), aux pages 23 à 25, l'auteur justifie, par l'utilisation du Principe de correspondance, le choix des transformations de Lorentz pour la relativité restreinte parmi toutes les transformations déduites de l'hypothèse de l'invariance de l'intervalle d'espace-temps ; la problématique de la conservation ou non de ces orientations est discutée en détail dans le chapitre 1 du livre La géométrie de la relativité restreinte, par Jean Parizet, éditeur ellipses, 2008, 172 pages, (ISBN 978-2-7298-3902-4)
  9. Cette méthode est présentée, en utilisant des formes différentielles et avec des erreurs typographiques, dans le chapitre 1 du livre La géométrie de la relativité restreinte, par Jean Parizet, éditeur ellipses, 2008, 172 pages, (ISBN 978-2-7298-3902-4).
  10. Cette égalité n'est valable qu'avec l'hypothèse de conservation des orientations de l'espace et du temps par changement de référentiel. En toute généralité, on doit donc écrire x' = \epsilon.ct'\quad, où \epsilon = \pm 1 indique l'orientation relative des référentiels (O,x,t) et (O,x',t') et permet d'enrichir la fin du paragraphe d'une discussion sur les choix entre les différentes transformations de Lorentz compatibles avec les mathématiques de la relativité restreinte, en introduisant explicitement l'hypothèse de non-changement de l'orientation des référentiels.
  11. Les principales étapes de cette démonstration sont, par exemple, dans le chapitre 1 du livre La géométrie de la relativité restreinte, par Jean Parizet, éditeur ellipses, 2008, 172 pages, (ISBN 978-2-7298-3902-4).
  12. On a : si \vec u \perp \vec v, alors {}^T \!\vec u .A.\vec v = \alpha. {}^T \!\vec u.\vec v = 0, donc \vec u \perp A.\vec v. Conclusion : \ A est bien la matrice d'un endomorphisme de l'espace de dimension 2 des vecteurs perpendiculaires à \vec u dans lui-même.
  13. Woldemar Voigt, Ueber das Doppler'sche Princip, Göttinger Nachrichten, num. 7, p41-51, 1887
  14. H.A.Lorentz, Die relative Bewegung der Erde und des Äthers, Zittingsverlag Akad. Wet. Amsterdam, vol. 1, p74, 1892.
  15. H.A.Lorentz, La théorie électromagnétique de Maxwell et son application aux corps mouvants, Archives Néerlandaises des sciences exactes et naturelles, T. XXV, 1892.
  16. H.A.Lorentz, Simplified Theory of Electrical and Optical Phenomena in Moving Systems, Proceedings of the Royal Nétherlands Academy of Arts and Sciences, vol. 1, p427-442, 1899.
  17. H.A.Lorentz, Electromagnetic phenomena in a system moving with any velocity smaller than that of light, Proceedings of the Royal Nétherlands Academy of Arts and Sciences, vol. 6, p809, 1904.
  18. André Rougé, Relativité Restreinte. La contribution d'Henri Poincaré, Ecole polytechnique, 2008.

Voir aussi[modifier | modifier le code]

Sur les autres projets Wikimedia :

Articles connexes[modifier | modifier le code]

Liens externes[modifier | modifier le code]