Inégalité de Jensen

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Page d'aide sur l'homonymie Ne doit pas être confondu avec Formule de Jensen.

En mathématiques, et plus précisément en analyse, l’inégalité de Jensen est une relation utile et très générale concernant les fonctions convexes, due au mathématicien danois Johan Jensen et dont il donna la preuve en 1906[1]. On peut l'écrire de deux manières : discrète ou intégrale. Elle apparaît notamment en analyse, en théorie de la mesure et en probabilités (théorème de Rao-Blackwell), mais également en physique statistique, en mécanique quantique et en théorie de l'information (sous le nom d'inégalité de Gibbs (en)).

L'inégalité reste vraie pour les fonctions concaves, en inversant le sens. C'est notamment le cas pour la fonction logarithme, très utilisée en physique.

Énoncé[modifier | modifier le code]

Forme discrète[modifier | modifier le code]

Théorème — Inégalité de convexité

Soient f une fonction convexe, (x1, … , xn) un n-uplet de réels appartenant à l'intervalle de définition de f et (λ1, … , λn) un n-uplet de réels positifs tels que[2] :

\sum_{i=1}^n\lambda_i=1

Alors,

f\left(\sum_{i=1}^n\lambda_ix_i\right)\le\sum_{i=1}^n \lambda_if\left(x_i\right).

De nombreux résultats élémentaires importants d'analyse s'en déduisent, comme l'inégalité arithmético-géométrique : si (x1, … , xn) est un n-uplet de réels strictement positifs, alors :

\frac1n\sum_{i=1}^nx_i \ge \sqrt[n]{\prod_{i=1}^nx_i}.

La preuve découle immédiatement de l'inégalité de Jensen (renversée), appliqué au logarithme des expressions considérées, le logarithme étant concave.

Forme intégrale[modifier | modifier le code]

Cas particulier[modifier | modifier le code]

Inégalité de Jensen —  Soient g une fonction continue de [0, 1] dans ]a, b[ (avec –∞a < b+∞) et φ une fonction convexe de ]a, b[ dans ℝ. Alors,

\varphi\left(\int_0^1g(x)~\mathrm dx\right)\le\int_0^1\varphi(g(x))~\mathrm dx.

(Cet énoncé a un sens car sous ses hypothèses, l'intégrale de g appartient à ]a, b[ et φ ∘ g est continue sur [0, 1] donc intégrable.)

Théorie de la mesure[modifier | modifier le code]

Inégalité de Jensen[3],[4] —  Soient

  • (Ω, A, μ) un espace mesuré de masse totale μ(Ω) égale à 1,
  • g une fonction μ-intégrable à valeurs dans un intervalle réel I et
  • φ une fonction convexe de I dans ℝ.

Alors,

\varphi\left(\int_{\Omega}g~\mathrm d\mu\right) \le \int_\Omega \varphi \circ g\, \mathrm d\mu,

l'intégrale de droite pouvant être égale à +∞[5].

(Cet énoncé a un sens car sous ses hypothèses, l'intégrale de g appartient à I.)

Lorsque φ est strictement convexe, les deux membres de cette inégalité sont égaux (si et) seulement si g est constante μ-presque partout[6].

De ce théorème on déduit, soit directement, soit via l'inégalité de Hölder, une relation importante entre les espaces Lp associés à une mesure finie de masse totale M ≠ 0 :

0<p<q\le+\infty\Rightarrow\mathrm L^p\supset\mathrm L^q\text{ et }\forall f\in\mathrm L^q, \|f\|_p\le M^{\frac1p-\frac1q}\|f\|_q,

avec égalité si et seulement si |f| est constante presque partout.

Probabilités, statistiques[modifier | modifier le code]

L'énoncé ci-dessus se transcrit dans le langage de la théorie des probabilités et de la statistique :

Inégalité de Jensen —  Soit f une fonction convexe sur un intervalle réel I et X une variable aléatoire à valeurs dans I, dont l'espérance \Bbb E(X) existe. Alors,

f(\Bbb E(X))\le\Bbb E[f(X)].

On peut alors en déduire un résultat important de statistique : le théorème de Rao-Blackwell. En effet, si L est une fonction convexe, alors d'après l'inégalité de Jensen,

L(\Bbb{E}\{\delta(X)\}) \le \Bbb{E}\{L(\delta(X))\} \quad \Rightarrow \quad \Bbb{E}\{L(\Bbb{E}\{\delta(X)\})\} \le \Bbb{E}\{L(\delta(X))\}.

Si δ(X) est un estimateur d'un paramètre non observé θ étant donné un vecteur X des observables, et si T(X) est une statistique suffisante pour θ, alors un estimateur plus performant, dans le sens de la minimisation des pertes, est donné par :

\delta_{1}(X) = \Bbb{E}_{\theta}\{\delta(X') \,|\, T(X')= T(X)\},

C'est-à-dire l'espérance de δ par rapport à θ, prise sur tous les vecteurs X compatibles avec la même valeur de T(X).

Démonstration[modifier | modifier le code]

La démonstration historique est une preuve par récurrence de la forme discrète. La forme intégrale se déduit dans le cadre de la théorie de la mesure par des arguments de densité, et se généralise ensuite aux autres contextes.


Voici une preuve, plus simple, de l'énoncé plus général du § « Théorie de la mesure ».

Notons m l'intégrale de g. Si cette intégrale est une extrémité de I alors g est constante presque partout et le résultat est immédiat. Supposons donc que m est intérieur à I. Il existe alors une minorante affine de φ qui coïncide avec φ au point m :

\forall x\in I,~\varphi(x)\ge\alpha x+\beta\text{ et }\varphi(m)=\alpha m+\beta.

On conclut en composant par g cette minoration et en intégrant :

\int\varphi\circ g~\mathrm d\mu\ge\int(\alpha g+\beta)~\mathrm d\mu=\alpha m+\beta\mu(\Omega)=\alpha m+\beta=\varphi(m).

Toutes les autres formes de l'inégalité de Jensen s'en déduisent.

Notes et références[modifier | modifier le code]

  1. Johan Jensen, « Sur les fonctions convexes et les inégalités entre les valeurs moyennes », Acta Math., vol. 30,‎ 1906, p. 175-193
  2. Dans le cas le plus général, on peut ne pas imposer cette relation aux λi, mais il faut alors dans l'inégalité de Jensen diviser les sommes par \scriptstyle \sum_{i=1}^{n} \lambda_i.
  3. (en) Constantin P. Niculescu et Lars Erik Persson, Convex Functions and Their Applications: A Contemporary Approach, Springer,‎ 2006 (ISBN 978-0-38731077-0, lire en ligne), p. 44
  4. a et b Bernard Maurey, Intégration et Probabilités (M43050) 2010-2011, Université Paris-Diderot,‎ 14 mars 2011 (lire en ligne), « cours 15 »
  5. Niculescu et Persson 2006, p. 44 ajoutent l'hypothèse que φ ∘ g est μ-intégrable, mais leur démonstration montre que cet énoncé reste valide si elle ne l'est pas, ce que Maurey 2011 explicite.
  6. Niculescu et Persson 2006, p. 45