Théorème de Hahn-Banach
En mathématiques, et plus particulièrement en analyse et en géométrie, le théorème de Hahn-Banach, dû aux deux mathématiciens Hans Hahn et Stefan Banach, garantit l'existence d'une forme linéaire vérifiant certaines conditions (valeurs imposées sur une partie de l'espace, mais limitées partout).
En permettant de prouver abstraitement l'existence de nombreuses fonctions continues, c'est un outil fondamental de l'analyse fonctionnelle.
Par son interprétation géométrique en termes d'hyperplans évitant un convexe fixé, il joue également un rôle primordial dans l'étude de la géométrie des convexes, et au-delà en analyse convexe.
Sommaire |
[modifier] Forme analytique et forme géométrique
Les énoncés dénommés « théorème de Hahn-Banach » dans la littérature scientifique sont nombreux, différant les uns des autres parfois par de simples détails et parfois de façon significative. Ils se divisent néanmoins nettement en deux classes : certains garantissent de pouvoir prolonger une forme linéaire, sous certaines exigences de majoration (les formes « analytiques » du théorème) ; d'autres assurent qu'on peut séparer deux ensembles convexes par un hyperplan affine (les formes « géométriques » du théorème).
Donnons pour commencer un exemple d'énoncé pour chacune de ces deux catégories[1].
[modifier] Un énoncé de la forme analytique du théorème
Théorème — Soient
un espace vectoriel sur
et
une fonction convexe bornée de
dans
.
Soient
un sous-espace vectoriel de
et
une forme linéaire sur
qui vérifie en tout point
de
la condition de majoration
.
Alors il existe un prolongement linéaire
de
sur
vérifiant encore la condition
en tout point
de
.
[modifier] Un énoncé de la forme géométrique du théorème
Théorème — Soient
un espace vectoriel topologique et
un convexe ouvert non vide de
.
Soit
un sous-espace affine de
tel que
.
Il existe alors un hyperplan affine
contenant
et qui vérifie lui aussi la condition :
.
De plus,
est un hyperplan fermé.
La forme analytique du théorème est due à Banach[2] (1932) généralisant un résultat de Hahn qui s'intéresse dès 1920 aux espaces vectoriels normés. Il existe une généralisation du théorème de Hahn-Banach aux espaces vectoriels sur le corps des complexes[3] due à Bohnenblust et Sobczyk (1938). Les difficultés de la généralisation du théorème de Hahn-Banach apparaissent même pour des espaces vectoriels de dimension finie.
[modifier] Relations entre les deux énoncés et preuve de la forme « géométrique »
La forme géométrique du théorème —d'où on peut ensuite déduire une succession de variantes diverses relatives à la séparation des convexes— est la retranscription de la forme analytique pour le cas particulier où la fonction convexe qui y intervient est la jauge d'un ouvert convexe d'un espace normé. C'est d'ailleurs le cas dans les utilisations les plus simples et fondamentales du théorème en analyse fonctionnelle qu'on peut selon ses goûts lire depuis une version ou l'autre (on en verra un exemple plus bas).
Voyons de plus près comment la forme géométrique se déduit de la forme analytique :
Quitte à faire préalablement une translation, on supposera que l'origine est dans
. Dès lors, puisque
ne rencontre pas
, c'est donc un sous-espace affine évitant l'origine.
Notons
la jauge du convexe
. Elle est sous-linéaire et donc convexe comme toute jauge ; par définition même d'une jauge il est évident que pour tout
dans
,
. Comme on a supposé
ouvert, on peut aller un peu plus loin : d'une part
est un voisinage de
et toute demi-droite ouverte issue de
contient donc des points de
, ce dont on déduit que
ne prend pas la valeur
; d'autre part on peut améliorer l'inégalité large
et préciser sans peine que les points de
sont caractérisés par l'inéquation stricte
. Voilà pour la fonction sous-linéaire.
Notons
le sous-espace vectoriel engendré par
. Puisque
, la sous-variété affine
est de codimension 1 dans
et il existe une (et une seule) forme linéaire
sur
telle que
soit la partie de
d'équation
. Voilà pour la forme linéaire à prolonger.
Enfin, pour
dans
,
(puisque
) tandis que
. La condition
est donc vérifiée sur
. En jouant sur l'homogénéité positive de
et de
, on étend son domaine de validité à un demi-espace strict de
; sur l'autre demi-espace
prend des valeurs négatives ou nulles tandis que, comme partout,
est à valeurs positives ou nulles. L'inégalité
est donc vraie partout dans
.
Toutes les hypothèses de la version dite « analytique » du théorème sont en place. Appliquons la donc. Elle nous offre une nouvelle forme linéaire encore notée
, cette fois définie sur
tout entier. Notons
l'hyperplan affine d'équation
: par construction, c'est bien un hyperplan contenant
.
Soit maintenant un point
de
: pour ce point,
(puisque
a été produite par la forme analytique de Hahn-Banach) et
(puisqu'on est dans l'ouvert convexe
). Donc
, et
n'est pas dans
. On a bien vérifié que
et
ne se rencontrent pas.
Enfin les hyperplans d'un espace vectoriel topologique sont nécessairement fermés ou denses. Or
n'est pas dense puisqu'il ne rencontre pas le voisinage
de
. C'est donc qu'il est fermé.
On peut s'étonner que la forme géométrique fasse intervenir une topologie tandis que la forme analytique concerne un espace vectoriel sans structure additionnelle. En fait, il est tout à fait possible d'énoncer une forme géométrique dans un espace vectoriel quelconque : il faudra alors supposer que tout translaté du convexe
contenant l'origine est absorbant, à défaut de pouvoir donner un sens à « ouvert » ; on n'a bien sûr plus le complément sur le caractère fermé de l'hyperplan obtenu tombe. La démonstration est la même.
[modifier] La preuve de la forme « analytique »
Deux types d'idées bien distinctes sont à mettre bout à bout pour aboutir à une preuve dans le cadre de généralité où le théorème a été énoncé. Dans un premier temps, quelques calculs assez simples permettent de justifier l'extension de la forme linéaire
dans le cas particulier où
est de codimension 1 dans
. Une fois cette étape franchie, on a déjà le théorème en dimension finie (il suffit de faire grossir pas à pas le sous-espace où on a réussi à étendre
, d'une dimension à chaque pas, et jusqu'à atteindre la dimension de
). En revanche, pour les usages en dimension infinie, il faut adapter cette méthode fort simple d'avancée méthodique et appeler quelques techniques assez standardisées de théorie des ensembles : on exécute ainsi une récurrence transfinie, le plus souvent rédigée sous forme d'un appel au lemme de Zorn.
Première partie : gagner une dimension
Dans un premier temps, on va prolonger la forme linéaire
à un espace plus grand que
en gagnant une dimension. Prenons un élément
de
en dehors de
(s'il n'y en a pas
et on a terminé avant même d'avoir commencé).
Le prolongement de
au sous-espace vectoriel
s'opère en la définissant par la formule :
dans laquelle
est un réel qu'il va falloir choisir judicieusement pour que la condition de majoration de
reste vérifiée dans
.
Il est clair que cette méthode d'extension fournit une forme linéaire, quel que soit le choix de
.
La condition de majoration sera vérifiée si et seulement si, pour chaque
de
et chaque
réel, l'inégalité suivante est vérifiée :
.
Après avoir noté que pour
elle est justifiée par hypothèse, on peut ne s'intéresser qu'aux contraintes correspondant à
. Il est judicieux alors de séparer les conditions correspondant à
et ceux où
; en notant
dans le premier cas, et
dans le second, on a donc à vérifier deux familles d'inégalités :
(où
parcourt
et
parcourt
).
(où
parcourt
et
parcourt
)
Des manipulations élémentaires permettent de les regrouper sous la forme :
Notons
et
les extrémités de l'inégalité précédente. La condition nécessaire et suffisante pour qu'on puisse définir un prolongement valable de
est ainsi que les intervalles
(où
parcourt
et
parcourt
) aient une intersection non vide. Or ceci est équivalent à :
- pour tout
, et tous
.
Mais cette condition est réalisée, par une vérification lourde mais facile qui exploite la convexité de
, la linéarité de
et la majoration supposée vraie sur
: en effet, pour
,
dans
et tous
:
![b_{y,\nu} - a_{x,\mu} = {1\over\nu}\left[p(y+\nu v_0)-f(y)\right] - {1\over\mu}\left[f(x)-p(x-\mu v_0)\right]](//upload.wikimedia.org/wikipedia/fr/math/2/0/7/2077d5bb4c374fd8e14ab94f1e3fafc7.png)
![={{\mu+\nu}\over{\mu\nu}}\left[{\nu\over{\mu+\nu}}p(x-\mu v_0)+{\mu\over{\mu+\nu}}p(y+\nu v_0)-{\nu\over{\mu+\nu}}f(x)-{\mu\over{\mu+\nu}}f(y)\right]](//upload.wikimedia.org/wikipedia/fr/math/7/0/8/7088652ed1c5ea76fc1f1fd09d4adf5f.png)
![\geq{{\mu+\nu}\over{\mu\nu}}\left[p\left({\nu\over{\mu+\nu}}(x-\mu v_0)+{\mu\over{\mu+\nu}}(y+\nu v_0)\right)-f\left({{\nu x}\over{\mu+\nu}}+{{\mu y}\over{\mu+\nu}}\right)\right]](//upload.wikimedia.org/wikipedia/fr/math/1/f/5/1f5c334341b6cf6bd19016bc1cf0a0f9.png)
.
Deuxième partie : exécution d'une récurrence transfinie
En raisonnant de proche en proche, on voit que l'on peut prolonger
à des espaces de plus en plus grands. Si
est de codimension finie dans
, alors le procédé ainsi défini s'arrête. Sinon, on utilise l'axiome du choix.
Pour cela, on considère l'ensemble des couples
dans lesquels
est un sous-espace vectoriel de
contenant
et
est une forme linéaire sur MUNIQ2a6bd632296b0a8a-math-0000045C-QINU prolongeant
(en respectant la contrainte de majoration par
), et on l'ordonne partiellement par :
et
.
L'ensemble des couples est inductif. En effet si
est une chaîne totalement ordonnée, alors on pose :
M est un sous-espace vectoriel. (En général, une union d'espaces vectoriels n'est pas un espace vectoriel, en revanche, ici, c'est le cas car la famille des
est totalement ordonnée).
On définit la forme linéaire g sur l'espace M par :
si
.
On vérifie aisément que cette définition de g est correcte. (M, g) est alors un majorant de la chaîne
. Le lemme de Zorn s'applique, et on peut alors trouver un sous-espace N maximal sur lequel
se prolonge.
Maintenant si N n'est pas égal à V, alors la première partie de la démonstration montre que l'on peut prolonger
(définie sur N) à un espace strictement plus grand que N, ce qui en contradiction avec la maximalité de N.
[modifier] Un exemple d'application en analyse fonctionnelle
Le corollaire suivant illustre comment le théorème de Hahn-Banach peut produire très facilement des résultats essentiels d'analyse fonctionnelle[4].
Corollaire — Soit
un espace normé,
un sous-espace de
et
une forme linéaire continue sur
. On peut alors prolonger
en une application continue définie sur
, de même norme que
.
On note
et on applique le théorème à la fonction convexe
.
Il est inutilement long mais instructif de résoudre la question en utilisant la forme géométrique du théorème de Hahn-Banach : au lieu de penser à la fonction convexe
, on peut aussi penser au convexe ouvert
dont elle est la jauge, à savoir la boule ouverte de centre
et de rayon
. Si on veut se lancer dans cette voie, il faut introduire alors le sous-espace affine
, ensemble des points de
où
. On l'étend en un hyperplan fermé en appliquant Hahn-Banach ; la forme linéaire continue
pour lequel cet hyperplan est l'ensemble d'équation
répond alors au cahier des charges.
[modifier] Quelques autres versions du théorème
On trouvera ci-dessous deux variantes de la « forme analytique » qui se déduisent facilement de celle mise en relief. La première fournit une variante du résultat pour les espaces vectoriels complexes ; la seconde précise que sous une bonne hypothèse de symétrie de
, notamment vérifiée quand
est une semi-norme, on peut obtenir une majoration de la valeur absolue (ou du module dans le cas complexe) de la forme linéaire prolongée[5].
Théorème — Soit
un espace vectoriel sur
et
une fonction convexe définie sur
, qui ne prend pas la valeur
.
Soit
un sous-espace vectoriel de
, et
une forme linéaire sur
qui y vérifie en tout point la condition de majoration :
.
Il existe alors un prolongement de
en une forme linéaire sur l'espace
tout entier, vérifiant encore la condition :
en tout point de
.
Théorème — Soit
un espace vectoriel sur
ou
et
une fonction convexe définie sur
, qui ne prend pas la valeur
.
On suppose en outre que
possède la propriété de symétrie suivante : pour tout scalaire
avec
et tout vecteur
de
,
.
Soit
un sous-espace vectoriel de
, et
une forme linéaire sur
qui y vérifie en tout point la condition de majoration :
.
Il existe alors un prolongement de
en une forme linéaire sur l'espace
tout entier, vérifiant encore la condition :
en tout point de
.
On trouvera des variantes de la forme géométrique à l'article Séparation des convexes.
[modifier] Le rôle de l'axiome du choix
Comme on l'a vu, le lemme de Zorn (équivalent à l'axiome du choix) entraîne le théorème de Hahn-Banach. En réalité, le lemme des ultrafiltres, qui est une proposition plus faible que l'axiome du choix, est suffisant pour démontrer le théorème de Hahn-Banach. Mais inversement, on sait depuis des travaux de D. Pinas de 1972 que le théorème de Hahn-Banach n'est pas suffisant pour démontrer le lemme des ultrafiltres. Ainsi, le théorème de Hahn-Banach n'est pas équivalent à l'axiome du choix dans le système d'axiomes de Zermelo-Fraenkel. On doit ajouter à cela que le seul système de Zermelo-Fraenkel n'est pas à lui seul suffisant pour démontrer Hahn-Banach, dont toute preuve doit donc reposer inévitablement sur une ou autre variante de l'axiome du choix[6].
[modifier] Références
Lorsqu'une note renvoie à un nom d'auteur sans plus de précisions, il s'agit d'un des ouvrages mentionnés ci-dessous en bibliographie.
- L'énoncé analytique est une adaptation du théorème III-5 dans Reed-Simon, p. 75. La forme géométrique est adaptée du théorème 1, p. II-39 dans Espaces vectoriels topologiques de Nicolas Bourbaki, Masson, 1981, (ISBN 2225684103), où figure aussi la remarque qui suit l'énoncé.
- Théorie des opérations linéaires, Varsovie
- H.F. Bohnenblust, A. Sobczyk, Bull. Amer. Math. Soc[1]
- L'exemple donné ici est le corollaire 1-2 dans Brezis, p. 3.
- Ces deux versions sont issues d'un cours donné par Gabriel Nagy à l'Université du Kansas, dont les notes sont disponibles en ligne.
- Toutes ces informations sont disponibles dans Consequences of the Axiom of Choice, de Paul Howard et Jean E. Rubin, coll. « Mathematical surveys and monographs », vol. 59, American Mathematical Society, 1998 (ISBN 0821809776), qui renvoie notamment aux articles de D. Pinas, « Independence of the prime ideal theorem from the Hahn-Banach theorem », dans le Bulletin of the American Mathematical Society, 78 (1972) p. 203-248 et « The strength of the Hahn-Banach theorem », dans Proceedings of the Victoria Symposium on Nonstandard Analysis, coll. « Lecture notes in mathematics », vol. 369, Springer, Heidelberg, 1973. Pinas fournit deux modèles où Hahn-Banach est vrai alors que certaines formes de l'axiome du choix (lemme des ultrafiltres, axiome du choix dénombrable) ne le sont pas, l'un construit pour l'occasion, l'autre étant un modèle déjà connu construit par A. Levy en 1962 à d'autres fins dans lequel il prouve que Hahn-Banach est vérifié. Il prouve par ailleurs qu'il existe des contre-exemples à Hahn-Banach dans le fameux modèle de Solovay de Zermelo-Fraenkel (celui où tout ensemble de réels est Lebesgue-mesurable).
[modifier] Bibliographie
- (de) Hans Hahn, « Über lineare Gleichungssysteme in linearen Räumen », dans Journal für die reine und angewandte Mathematik 157 (1927), p. 214-229
- Stefan Banach, « Sur les fonctionnelles linéaires », dans Studia Mathematica 1 (1929), p. 211-216
- Haïm Brezis, Analyse fonctionnelle : théorie et applications [détail des éditions]
- (en) Lawrence Narici et Edward Beckenstein, « The Hahn–Banach Theorem: The Life and Times », dans Topology and its Applications, Volume 77, 2° édition (3 juin 1997) p. 193-211. Un préprint est disponible en ligne.
- (en) M. Reed (en) et B. Simon (en), Functional Analysis, San Diego, Academic Press, 1980 (ISBN 978-0-12585050-6), section III.3
- Walter Rudin, Analyse fonctionnelle [détail des éditions]

.
(où
(où ![{1\over\mu}\left[f(x)-p(x-\mu v_0)\right]\leq \alpha \leq {1\over\mu}\left[p(x+\mu v_0)-f(x)\right].](http://upload.wikimedia.org/wikipedia/fr/math/5/f/2/5f27220431653b286a094aba5db87128.png)
, et tous
.![b_{y,\nu} - a_{x,\mu} = {1\over\nu}\left[p(y+\nu v_0)-f(y)\right] - {1\over\mu}\left[f(x)-p(x-\mu v_0)\right]](http://upload.wikimedia.org/wikipedia/fr/math/2/0/7/2077d5bb4c374fd8e14ab94f1e3fafc7.png)
![={{\mu+\nu}\over{\mu\nu}}\left[{\nu\over{\mu+\nu}}p(x-\mu v_0)+{\mu\over{\mu+\nu}}p(y+\nu v_0)-{\nu\over{\mu+\nu}}f(x)-{\mu\over{\mu+\nu}}f(y)\right]](http://upload.wikimedia.org/wikipedia/fr/math/7/0/8/7088652ed1c5ea76fc1f1fd09d4adf5f.png)
![\geq{{\mu+\nu}\over{\mu\nu}}\left[p\left({\nu\over{\mu+\nu}}(x-\mu v_0)+{\mu\over{\mu+\nu}}(y+\nu v_0)\right)-f\left({{\nu x}\over{\mu+\nu}}+{{\mu y}\over{\mu+\nu}}\right)\right]](http://upload.wikimedia.org/wikipedia/fr/math/1/f/5/1f5c334341b6cf6bd19016bc1cf0a0f9.png)
.
et
.
si
.