Théorème d'inversion locale

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

En mathématiques, le théorème d'inversion locale est un résultat de calcul différentiel. Il indique que si une fonction f est continûment différentiable en un point, si sa différentielle en ce point est inversible alors, localement, f est inversible et son inverse est différentiable.

Ce théorème est équivalent à celui des fonctions implicites, son usage est largement répandu. On le trouve par exemple utilisé, sous une forme ou une autre, dans certaines démonstrations des propriétés du multiplicateur de Lagrange. Il est aussi utilisé pour démontrer le théorème du redressement.

Sa démonstration utilise une version simple du théorème du point fixe. Elle permet d'établir le résultat dans diverses configurations, un espace vectoriel réel de dimension finie, un espace de Banach ou encore une variété différentielle. Il existe une version plus forte : le théorème d'inversion globale.

Énoncés[modifier | modifier le code]

Il en existe plusieurs formes, celle proposée ici est relativement générale[1] :

Théorème d'inversion locale — Soit f une application de U dans F, où U est un ouvert d'un espace de Banach réel et F un espace de Banach et soit x un point de U. Si f est de classe Cp, avec p un entier strictement positif et si la différentielle de f au point x est inversible, alors il existe un ouvert V contenant x et un ouvert W contenant f(x) tels que f se restreigne en une bijection de V dans W dont la réciproque est de classe Cp.

Cet énoncé mérite quelques explications.

  • Un espace de Banach est un espace vectoriel normé complet pour la distance induite. Un exemple important est celui des espaces vectoriels réels de dimension finie. Certaines versions limitent d'ailleurs leur énoncé à ce cas particulier[2].
  • Une différentielle correspond à la généralisation de la notion de dérivée. Un accroissement f(x + h) – f(x), si h est petit, est presque égal à f'(x).h. A priori, cette égalité possède un sens si f est une fonction de R dans R et le terme f'(x) désigne la dérivée de la fonction f au point x. Si la fonction est définie d'un espace vectoriel dans un autre, ce résultat se généralise mais f'(x).h, qui est alors noté dfx ou Dfx, est une application linéaire continue appelée différentielle de f au point x. L'application qui à x associe Dfx est la différentielle de f ; c'est encore une application d'un espace vectoriel dans un autre, on peut parfois la différentier. Si cette opération est réalisable p fois, et si la différentielle p-ième est continue, l'application f est dite de classe Cp.
  • Une application linéaire continue T : EF entre deux espaces vectoriels normés est dite inversible lorsqu'elle est bijective et que sa réciproque T−1 : FE (linéaire) est continue. Entre espaces de dimension finie, toute application linéaire est continue. Entre espaces de Banach, d'après le théorème de Banach-Schauder, la réciproque d'une bijection linéaire continue est toujours continue[3].

On dispose du corollaire suivant[1] :

Théorème d'inversion globale — Sous les hypothèses du théorème précédent, si f est de plus injective et si pour tout x de U la différentielle Dfx de f au point x est inversible, alors f(U) est un ouvert et la bijection réciproque, de f(U) dans U, est de classe Cp.

Remarque : Une application bijective de classe Cp dont la réciproque est aussi de classe Cp est appelée un Cp-difféomorphisme.

Approche intuitive[modifier | modifier le code]

Fonction réelle de la variable réelle[modifier | modifier le code]

Le graphe de la fonction réciproque de f est le symétrique du graphe de f par rapport à la première bissectrice.

Le cas de la fonction réelle de la variable réelle est un peu particulier.

Si f est une fonction continue et strictement monotone sur un intervalle J à valeurs réelles, alors f(J) est aussi un intervalle, f est bijective de J sur f(J), et la bijection réciproque est continue (voir l'article Théorème de la bijection). Le graphe de f−1 est le symétrique de celui de f par rapport à la première bissectrice, d'équation x = y, comme illustré sur la figure de droite. Dans le cas particulier d'une fonction réelle de la variable réelle, les résultats sont donc plus globaux et nécessitent des hypothèses de nature différente. Ils ne sont pas généralisables, car un espace vectoriel ne dispose pas d'un ordre à l'image de l'ensemble des nombres réels.

Si de plus f est dérivable en un point a et que cette dérivée en a est non nulle alors f−1 est dérivable au point f(a) (voir l'article Opérations sur les dérivées). Pour cette propriété-ci, par contre, la méthode se généralise parfaitement.

Dimension deux[modifier | modifier le code]

Théorème-d'inversion-locale.jpg

La dimension 2 indique déjà l'existence d'un comportement différent du paragraphe précédent. Illustrons-le pour la fonction f de R2 dans R2 définie par :

La figure de gauche indique comment le plan est transformé. L'image de la figure située en haut est illustrée au-dessous. Le carré vert a été « déformé » de manière bijective. À partir d'un point de l'image du carré vert, il est possible de retrouver le point du carré d'origine. L'application f est de classe C et en tout point, sa différentielle est inversible, car le déterminant jacobien,

Théorème-d'inversion-locale (2).jpg

n'est jamais nul. L'application est en conséquence localement inversible en chaque point. À la différence des fonctions différentiables et définies sur un intervalle de R, cette propriété n'implique pas le caractère globalement injectif de f. Ajouter à la deuxième coordonnée ne modifie pas l'image par f, ainsi chaque point de R2 possède une infinité d'antécédents, à l'exception de l'origine qui n'en a pas. Cette fonction peut être vue comme l'exponentielle complexe. Sa réciproque, le logarithme complexe, ne peut être défini continûment sur C* tout entier.

Un deuxième exemple est donné par la fonction suivante g, dont le jacobien est égal à x2/2 :

Cet exemple est illustré avec les mêmes conventions sur la figure de droite. La zone bleue en haut à gauche est transformée en une espèce de papillon délimité par deux paraboles. L'application n'est pas inversible au voisinage d'un point ayant une première coordonnée nulle. Intuitivement, il est visible que les deux figures bleues ne sont pas équivalentes : si l'on retranche le point central à celle de droite, la figure comporte alors deux composantes connexes. Le retrait d'un point quelconque sur la figure bleue à gauche ne produit jamais cet effet.

Usages[modifier | modifier le code]

Fonction-implicite-(1).jpg

Les usages du théorème d'inversion locale sont multiples et touchent différentes branches des mathématiques. L'une d'entre elles est la branche d'origine du théorème : la géométrie différentielle. Le théorème d'inversion locale est utilisé soit sous sa forme d'origine, soit sous la forme du théorème des fonctions implicites, qui lui est équivalent au sens où chacun peut se déduire de l'autre.

Redressement-d'un-flot.jpg

On utilise le théorème des fonctions implicites pour étudier les figures géométriques définies sous forme d'équations, illustrées par l'exemple suivant :

Si le terme de gauche est vu comme une fonction f de R2 à valeurs dans R, la figure du plan étudiée est l'intersection du graphe de la fonction f, illustré à droite, et du plan d'équation z = 0. De manière plus générale, une variété différentielle correspond à la généralisation de courbes ou surfaces régulières, en dimension quelconque. Il existe deux manières de les définir localement, à travers une équation, soit cartésienne, soit paramétrique. Le théorème des fonctions implicites montre l'équivalence de ces deux manières.

En calcul différentiel, le multiplicateur de Lagrange permet de trouver des extrema sous contrainte. Si U est un ouvert d'un espace euclidien, l'objectif est de trouver un extremum d'une fonction f définie sur les points x de U et à valeurs dans R vérifiant l'équation g(x) = 0, où g est une fonction à valeurs dans un autre espace euclidien. Le théorème des fonctions implicites fournit une méthode pour résoudre ce problème.

On trouve encore le théorème d'inversion locale dans les équations différentielles, où il est l'outil de démonstration du théorème du redressement d'un flot. Une équation différentielle explicite possède une forme équivalente à (1) x' f(tx). Si la fonction f est indépendante de t l'équation est dite autonome, la fonction est un champ de vecteurs et les solutions de l'équation possèdent des graphes tangents en un point x au vecteur f(x), à l'image de la figure rouge et jaune, à gauche. Le théorème du redressement d'un flot montre que localement, l'équation différentielle est équivalente à celle ayant un champ constant, à l'image de la représentation bleue et jaune, encore à gauche.

Les exemples cités supposent généralement que les espaces vectoriels considérés sont de dimension finie. Tel n'est pas toujours le cas. Une manière d'exprimer les solutions de l'équation (1) est de considérer le flot, c'est-à-dire la fonction α qui, à un instant t et à un point x, associe le point image de la solution s de (1) vérifiant l'égalité s(0) = x. Si la fonction f est de classe Cp, alors le flot α l'est aussi. Une démonstration fait usage du théorème des fonctions implicites dans le contexte d'espaces vectoriels de dimension infinie.

Démonstration[modifier | modifier le code]

Existence d'une réciproque locale[modifier | modifier le code]

Le but est de trouver un voisinage V de x0 et un voisinage W de f(x0) tels que f soit une bijection de V sur W. Le principe de la démonstration consiste à remplacer la recherche d'un antécédent de y par f par la recherche d'un point fixe, l'équation y = f(x) étant équivalente, pour peu que x et f(x) soient dans le même espace de Banach, à y + xf(x) = x. Pour utiliser le théorème du point fixe, il serait en outre souhaitable que la fonction g définie par g(x) = y + xf(x) soit contractante sur un fermé stable. Ces différentes contraintes conduisent à opérer plusieurs simplifications.

On utilise les mêmes notations que dans l'énoncé du théorème, f est une fonction de classe Cp (p > 0) de U dans un espace vectoriel normé F. Par translations, on se ramène[1] au cas où x0 = 0E et f(x0) = 0F. On suppose donc que f(0E) = 0F et que la différentielle de f au point 0E est inversible. Ensuite, par composition par cet isomorphisme, on se ramène[1] au cas où F = E et où la différentielle de f au point 0E (noté désormais 0) n'est autre que l'application identité de E.

Soit φ l'application définie sur U par :

La différentielle de l'application φ est nulle en 0 et, comme cette différentielle est continue, il existe un réel strictement positif r tel que la boule fermée Br de centre 0 et de rayon r soit incluse dans U et tel que la norme de la différentielle de φ soit toujours inférieure à 1/2 sur cette boule. Définissons deux voisinages ouverts V et W de 0 par W = Br/2, V = Brf−1(W) et démontrons que de V dans W, f est bijective.

Pour prouver la surjectivité, considérons, pour tout point y de W, la fonction φy définie sur Br par :

L'inégalité des accroissements finis montre que φ est 1/2-lipschitzienne sur Br. On en déduit d'une part que sa translatée φy l'est aussi et d'autre part, que φy envoie Br dans Br car pour tout x dans Br, r/2 majore la norme de φ(x) et majore strictement celle de y. Le théorème du point fixe montre l'existence d'un point fixé par φy dans Br, donc appartenant à Br et envoyé par f sur y. Un tel point appartient à V.

L'injectivité s'obtient en utilisant à nouveau que φ est 1/2 lipschitzienne. Pour tous x1 et x2 dans V, si l'on note y1 et y2 leurs images par f, on a :

,

ce qui se réécrit :

et permet de conclure.

Régularité de la réciproque[modifier | modifier le code]

Il s'agit maintenant de montrer que la réciproque de f est de classe Cp sur W.

Remarquons d'abord que pour tout x dans V, l'application linéaire Dfx est inversible et d'inverse continu. En effet, Dfx = idE – (Dφ)x et (Dφ)x est de norme inférieure à 1/2, donc la série

est convergente et sa somme est inverse de Dfx, de norme inférieure à 2.

Soient y dans W et x son antécédent dans V par f, démontrons qu'au point y, f−1 est différentiable et que sa différentielle n'est autre que l'inverse de Dfx. Pour tout vecteur k de E tel que y + k soit encore dans W, notons x + h l'antécédent dans V de y + k par f. De

on déduit :

la dernière égalité venant du fait (démontré plus haut dans la preuve d'injectivité) que ‖h‖ ≤ 2‖k‖.

Il reste encore à montrer que la réciproque de f est de classe Cp. On vient de prouver l'existence de la différentielle de la réciproque de f en montrant qu'elle était la composée de trois fonctions : la fonction f−1, la différentielle de f, et la « fonction inverse » qui à tout élément inversible de l'algèbre des endomorphismes continus de E associe son inverse. La fonction inverse est infiniment différentiable[4], f est de classe Cp et la réciproque de f est continue (car différentiable), on en déduit que la réciproque de f est de classe C1. De proche en proche, on vérifie que la réciproque de f est de classe Cp.

Notes et références[modifier | modifier le code]

  1. a, b, c et d François Laudenbach, Calcul différentiel et intégral, éd. École Polytechnique, (ISBN 978-2-73020724-9, lire en ligne), p. 61 et suivantes.
  2. V&F Bayart, Théorèmes d'inversion locale et globale sur le site bibmath.net.
  3. Laudenbach 2000, p. 49.
  4. Voir par exemple Laudenbach 2000, p. 58, ou Jean Dieudonné, Éléments d'analyse, t. I : Fondements de l'analyse moderne [détail des éditions], exemple (8.12.1), ou encore ce livre de Mardsen et Ratiu.

Voir aussi[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Bibliographie[modifier | modifier le code]