Théorème d'inversion locale

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

En mathématiques, le théorème d'inversion locale est un résultat de géométrie différentielle. Il indique que si une fonction f est continûment différentiable en un point, si sa différentielle en ce point est une bijection bicontinue, c'est-à-dire qu'elle est continue ainsi que sa réciproque, alors localement f est inversible et son inverse est différentiable.

Ce théorème est équivalent à celui des fonctions implicites, son usage est largement répandu. On le trouve par exemple utilisé, sous une forme ou une autre, dans certaines démonstrations des propriétés du multiplicateur de Lagrange. Il est aussi utilisé pour démontrer le théorème du redressement.

Sa démonstration utilise une version simple du théorème du point fixe. Elle permet d'établir le résultat dans diverses configurations, un espace vectoriel réel de dimension finie, un espace de Banach ou encore une variété différentielle. Il existe une version plus forte : le théorème d'inversion globale.

Énoncés[modifier | modifier le code]

Il en existe plusieurs formes, celle proposée ici est relativement générale[1] :

Théorème d'inversion locale — Soit f une application de U dans F, où U est un ouvert d'un espace de Banach réel et F un espace de Banach et soit x un point de U. Si f est de classe Cp, avec p un entier strictement positif et si la différentielle de f au point x est un isomorphisme bicontinu, alors il existe un voisinage ouvert V de x et un voisinage ouvert W de f(x) tels que f se restreigne en une bijection de V dans W dont la réciproque est de classe Cp.

Cet énoncé mérite quelques explications. Un espace de Banach est un espace vectoriel normé complet pour la distance induite. Un exemple important est celui des espaces vectoriels réels de dimension finie[2]. Certaines versions limitent d'ailleurs leur énoncé à ce cas particulier[3].

Une différentielle correspond à la généralisation de la notion de dérivée. Un accroissement f(x + h) - f(x), si h est petit, est presque égal à f' (x).h. A priori, cette égalité possède un sens si f est une fonction de R dans R et le terme f'(x) désigne la dérivée de la fonction f au point x. Si la fonction est définie d'un espace vectoriel dans un autre, ce résultat se généralise mais f'(x).h, qui est alors noté dfx ou Dfx, est une application linéaire continue appelée différentielle de f au point x. L'application, qui à x associe Dfx, est la différentielle de f, c'est encore une application d'un espace vectoriel dans un autre, on peut parfois la différentier. Si cette opération est réalisable p fois, et si la différentielle pième est continue, l'application f est dite de classe Cp.

On dispose du corollaire suivant[1] :

Théorème d'inversion globale — Sous les hypothèses du théorème précédent, si f est de plus injective et si pour tout x de U la différentielle Dfx de f au point x est un isomorphisme bicontinu, alors f(U) est un ouvert et la bijection réciproque, de f(U) dans U, est de classe Cp.

Remarque : Une application bijective de classe Cp dont la réciproque est aussi de classe Cp est appelée un Cp-difféomorphisme.

Approche intuitive[modifier | modifier le code]

Fonction réelle de la variable réelle[modifier | modifier le code]

Le graphe de la fonction réciproque de f est le symétrique du graphe de f par rapport à la première bissectrice.

Le cas de la fonction réelle de la variable réelle est un peu particulier.

Si f est une fonction continue et strictement monotone sur un intervalle J à valeurs réelles, alors f(J) est aussi un intervalle, f est bijective de J sur f(J), et la bijection réciproque est continue (voir l'article Théorème de la bijection). Le graphe de f−1 est le symétrique de celui de f par rapport à la première bissectrice, d'équation x = y, comme illustré sur la figure de droite. Dans le cas particulier d'une fonction réelle de la variable réelle, les résultats sont donc plus globaux et nécessitent des hypothèses de nature différente. Ils ne sont pas généralisables, car un espace vectoriel ne dispose pas d'un ordre à l'image de l'ensemble des nombres réels.

Si de plus f est dérivable en un point a et que cette dérivée en a est non nulle alors f−1 est dérivable au point f(a) (voir l'article Opérations sur les dérivées). Pour cette propriété-ci, par contre, la méthode se généralise parfaitement.

Dimension deux[modifier | modifier le code]

Théorème-d'inversion-locale.jpg

La dimension 2 indique déjà l'existence d'un comportement différent du paragraphe précédent. Illustrons-le pour la fonction f de R2 dans R2 définie par :

 f(x,y)= \begin{pmatrix} {e^x \cos y}\\ {e^x \sin y}\\ \end{pmatrix}

La figure de gauche indique comment le plan est transformé. L'image de la figure située en haut est illustré au-dessous. Le carré vert a été déformé de manière bijective. À partir d'un point de l'image du carré vert, il est possible de reconstituer le point du carré d'origine. L'application f satisfait les hypothèses du théorème de l'article. Pour vérifier que l'application est localement inversible, il est utile de déterminer sa différentielle. Sa matrice, dite matrice jacobienne est la suivante :

Jf_{(x,y)}=\begin{pmatrix} {e^x \cos y} & {-e^x \sin y}\\ {e^x \sin y} & {e^x \cos y}\\\end{pmatrix}
Théorème-d'inversion-locale (2).jpg

Pour savoir si la différentielle est un isomorphisme, le plus simple est de calculer son déterminant, appelé déterminant jacobien, ou simplement jacobien. Il est égal à exp(2x) et n'est jamais nul. L'application est en conséquence localement inversible en chaque point. À la différence des fonctions différentiables et définies sur un intervalle de R, cette propriété n'implique pas le caractère globalement injectif de f. Ajouter 2π à la deuxième coordonnée ne modifie pas l'image par f, ainsi chaque point de R2 possède une infinité d'antécédents, à l'exception de l'origine qui n'en a pas. Cette fonction peut être vue comme l'exponentielle complexe. Sa réciproque, le logarithme complexe ne peut être défini sur C tout entier et il existe plusieurs méthodes pour le définir.

Un deuxième exemple est donné par la fonction suivante g dont le jacobien est égal à x2/2 :

 g(x,y)= \begin{pmatrix} {x} \\{\frac {x^2y}2} \\ \end{pmatrix}

Cet exemple est illustré avec les mêmes conventions sur la figure de droite. L'image de la zone bleue au haut à gauche est transformé en une espèce de papillon. L'application n'est pas inversible au voisinage d'un point ayant une première coordonnée nulle. Intuitivement, il est visible que les deux figures bleues ne sont pas équivalentes. Si l'on retranche le point central à celle de droite, la figure comporte alors deux composantes connexes. Le retrait d'un point quelconque sur la figure bleue à gauche ne produit jamais cet effet.

Usages[modifier | modifier le code]

Fonction-implicite-(1).jpg

Les usages du théorème d'inversion locale sont multiples et touchent différentes branches des mathématiques. L'une d'entre elles est la branche d'origine du théorème : la géométrie différentielle. Le théorème d'inversion locale est utilisé soit sous sa forme d'origine, soit sous la forme du théorème des fonctions implicites, qui lui est équivalent au sens où chacun peut se déduire de l'autre.

Redressement-d'un-flot.jpg

On utilise le théorème des fonctions implicites pour étudier les figures géométriques définies sous forme d'équations, illustrées par l'exemple suivant :

x(x^2 + y^2) - 10(x^2 - y^2)=0.

Si le terme de gauche est vu comme une fonction f de R2 à valeurs dans R, la figure du plan étudiée est l'intersection du graphe de la fonction f, illustré à droite, et du plan d'équation z = 0. De manière plus générale, une variété différentielle correspond à la généralisation de courbes ou surfaces régulières, en dimension quelconque. Il existe deux manières de les définir localement, à travers une équation, soit cartésienne, soit paramétrique. Le théorème des fonctions implicites montre l'équivalence de ces deux manières.

En calcul différentiel, le multiplicateur de Lagrange permet de trouver des extrema sous contrainte. Si U est un ouvert d'un espace euclidien, l'objectif est de trouver un extremum d'une fonction f définie sur les points x de U et à valeurs dans R vérifiant l'équation g(x) = 0, où g est une fonction à valeurs dans un autre espace euclidien. Le théorème des fonctions implicites fournit une méthode pour résoudre ce problème.

On trouve encore le théorème d'inversion locale dans les équations différentielles, où il est l'outil de démonstration du théorème du redressement d'un flot. Une équation différentielle explicite possède une forme équivalente à (1) x' f(tx). Si la fonction f est indépendante de t l'équation est dite autonome, la fonction est un champ de vecteurs et les solutions de l'équation possèdent des graphes tangents en un point x au vecteur f(x), à l'image de la figure rouge et jaune, à gauche. Le théorème du redressement d'un flot montre que localement, l'équation différentielle est équivalente à celle ayant un champ constant, à l'image de la représentation bleue et jaune, encore à gauche.

Les exemples cités supposent généralement que les espaces vectoriels considérés sont de dimension finie. Tel n'est pas toujours le cas. Une manière d'exprimer les solutions de l'équation (1) est de considérer le flot, c'est-à-dire la fonction α qui, à un instant t et à un point x, associe le point image de la solution s de (1) vérifiant l'égalité s(0) = x. Si la fonction f est de classe Cp, alors le flot α l'est aussi. Une démonstration fait usage du théorème des fonctions implicites dans le contexte d'espaces vectoriels de dimension infinie.

Démonstration[modifier | modifier le code]

Existence d'une réciproque locale[modifier | modifier le code]

Le but est de trouver un voisinage V de x0 et un voisinage W de f(x0) tels que f soit une bijection de V sur W. Le principe de la démonstration consiste à remplacer la recherche d'un antécédent de y par f par la recherche d'un point fixe, l'équation y = f(x) étant équivalente, pour peu que x et f(x) soient dans le même espace de Banach, à y + xf(x) = x. Pour utiliser le théorème du point fixe, il serait en outre souhaitable que la fonction g définie par g(x) = y + xf(x) soit contractante sur un fermé stable. Ces différentes contraintes conduisent à opérer plusieurs simplifications.

On utilise les mêmes notations que dans l'énoncé du théorème, f est une fonction de classe Cp (p > 0) de U dans un espace vectoriel normé F. Par translations, on se ramène[1] au cas où x0 = 0E et f(x0) = 0F. On suppose donc que f(0E) = 0F et que la différentielle de f au point 0E est un isomorphisme continu de E dans F dont la réciproque est aussi continue[4]. Ensuite, par composition par cet isomorphisme, on se ramène[1] au cas où F = E et où la différentielle de f au point 0E (noté désormais 0) n'est autre que l'application identité de E.

Soit φ l'application définie sur U par :

\varphi(x)=x-f(x).

La différentielle de l'application φ est nulle en 0 et, comme cette différentielle est continue, il existe un réel strictement positif r tel que la boule fermée Br de centre 0 et de rayon r soit incluse dans U et tel que la norme de la différentielle de φ soit toujours inférieure à 1/2 sur cette boule. Définissons deux voisinages ouverts V et W de 0 par W = Br/2, V = Brf−1(W) et démontrons que de V dans W, f est bijective.

Pour prouver la surjectivité, considérons, pour tout point y de W, la fonction φy définie sur Br par :

\varphi_y(x)=y+\varphi(x).

L'inégalité des accroissements finis montre que φ est 1/2-lipschitzienne sur Br. On en déduit d'une part que sa translatée φy l'est aussi et d'autre part, que φy envoie Br dans Br car pour tout x dans Br, r/2 majore la norme de φ(x) et majore strictement celle de y. Le théorème du point fixe montre l'existence d'un point fixé par φy dans Br, donc appartenant à Br et envoyé par f sur y. Un tel point appartient à V.

L'injectivité s'obtient en utilisant à nouveau que φ est 1/2 lipschitzienne. Pour tous x1 et x2 dans V, si l'on note y1 et y2 leurs images par f, on a :

\|x_1-x_2\|=\|\varphi(x_1)+f(x_1)-\varphi(x_2)-f(x_2)\|\le\frac12\|x_1-x_2\|+\|y_1-y_2\|,

ce qui se réécrit :

\|x_1-x_2\|\le2\|y_1-y_2\|

et permet de conclure.

Régularité de la réciproque[modifier | modifier le code]

Il s'agit maintenant de montrer que la réciproque de f est de classe Cp sur W.

Remarquons d'abord que pour tout x dans V, l'application linéaire Dfx est inversible et d'inverse continu. En effet, Dfx = idE – (Dφ)x et (Dφ)x est de norme inférieure à 1/2, donc la série

\sum_{n\in\N}\left((\mathrm D\varphi)_x\right)^n

est convergente et sa somme est inverse de Dfx, de norme inférieure à 2.

Soient y dans W et x son antécédent dans V par f, démontrons qu'au point y, f−1 est différentiable et que sa différentielle n'est autre que l'inverse de Dfx. Pour tout vecteur k de E tel que y + k soit encore dans W, notons x + h l'antécédent dans V de y + k par f. De

k=f(x+h)-f(x)=\mathrm Df_x(h)+o(h)~

on déduit :

f^{-1}(y+k)-f^{-1}(y)=h=(\mathrm Df_x)^{-1}\left(k-o(h)\right)=(\mathrm Df_x)^{-1}(k)+o(k),

la dernière égalité venant du fait (démontré plus haut dans la preuve d'injectivité) que ‖h‖ ≤ 2‖k‖.

Il reste encore à montrer que la réciproque de f est de classe Cp. On vient de prouver l'existence de la différentielle de la réciproque de f en montrant qu'elle était la composée de trois fonctions : la fonction f−1, la différentielle de f, et la « fonction inverse » qui à tout isomorphisme bicontinu de E associe son inverse. La fonction inverse est infiniment différentiable[5], f est de classe Cp et la réciproque de f est continue (car différentiable), on en déduit que la réciproque de f est de classe C1. De proche en proche, on vérifie que la réciproque de f est de classe Cp.

Notes et références[modifier | modifier le code]

  1. a, b, c et d François Laudenbach, Calcul différentiel et intégral, éd. École Polytechnique,‎ 2000 (ISBN 978-2-73020724-9, lire en ligne), p. 61 et suivantes.
  2. Voir à ce sujet l'article Topologie d'un espace vectoriel de dimension finie.
  3. V&F Bayart, Théorèmes d'inversion locale et globale sur le site bibmath.net
  4. Attention, en dimension infinie, un opérateur n'est pas nécessairement continu et sa continuité n'implique pas celle de sa réciproque.
  5. Voir Laudenbach 2000, p. 58 ou, pour une démonstration qui ne renvoie pas à un exercice, Jean Dieudonné, Éléments d'Analyse, t. I : Fondements de l'Analyse moderne [détail des éditions], exemple (8.12.1). Ou encore le livre de Mardsen et Ratiu

Voir aussi[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Bibliographie[modifier | modifier le code]