Norme matricielle

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

En mathématiques, une norme matricielle est un cas particulier de norme vectorielle, sur un espace de matrices.

Dans ce qui suit, K désigne le corps des réels ou des complexes.

Définition[modifier | modifier le code]

Certains auteurs[1] définissent une norme matricielle comme étant simplement une norme sur un espace vectoriel Mm,n(K) de matrices à m lignes et n colonnes à coefficients dans K.

Pour d'autres[2], une norme matricielle est seulement définie sur une algèbre Mn(K) de matrices carrées et est une norme d'algèbre, c'est-à-dire qu'elle est de plus sous-multiplicative.

Exemples de normes matricielles[modifier | modifier le code]

Norme de Frobenius[modifier | modifier le code]

Le norme de Frobenius sur l'ensemble des matrices réelles de type m\times n, noté M_{m,n}(\R), est celle qui dérive du produit scalaire standard sur cet ensemble, à savoir


(A,B)\in M_{m,n}(\R)^2\mapsto \langle A,B\rangle
=\operatorname{tr} A^\mathsf{T}B
=\operatorname{tr} B^\mathsf{T}A
=\operatorname{tr} AB^\mathsf{T}
=\operatorname{tr} BA^\mathsf{T},

\operatorname{tr} désigne la trace. La norme de Frobenius est souvent notée


\|A\|_F:=(\operatorname{tr} A^\mathsf{T}A)^{1/2}
=(\operatorname{tr} AA^\mathsf{T})^{1/2}.

C'est la norme euclidienne standard de la matrice considérée comme une collection de mn nombres réels.

Le point de vue précédent permet d'en déduire son sous-différentiel, qui s'écrit en A\in\R^{m\times n} :


\partial(\|\cdot\|_F)(A)=\{B\in\R^{m\times n}:\|B\|_F\leq1,~\langle B,A\rangle=\|A\|_F\}.

En réalité \|\cdot\|_F est différentiable sauf en zéro où \partial(\|\cdot\|_F)(0) est la boule unité pour la norme de Frobenius.

La norme de Frobenius peut s'étendre à un espace hibertien (de dimension infinie) ; on parle alors de norme de Hilbert-Schmidt.

Normes d'opérateur[modifier | modifier le code]

On peut aussi voir une matrice A\in M_{m,n}(\R) comme un opérateur linéaire de \R^n dans \R^m et lui associer différents types de normes d'opérateur, à partir des normes utilisées sur \R^n dans \R^m. Par exemple, si l'on munit \R^m de la norme y\in\R^m\mapsto\|y\|_p:=(\sum_{i=1}^m|y_i|^p)^{1/p} (avec p\in[1,\infty[) ou de la norme la norme y\in\R^m\mapsto\|y\|_\infty:=\max\{|y_i|: 1\leqslant i\leqslant m\} et si l'on munit \R^n de la norme \|\cdot\|_q (avec q\in[1,\infty]), l'on obtient la norme d'opérateur


\|A\|_{p,q}:=\sup_{\|x\|_q\leqslant1}\;\|Ax\|_p.

En particulier, on note parfois


\|A\|:=\|A\|_{2,2},

que l'on appelle parfois la norme spectrale.

Norme nucléaire[modifier | modifier le code]

La norme duale de la norme spectrale \|\cdot\| pour le produit scalaire standard de M_{m,n}(\R), notée et définie par


\|A\|_*:=\sup_{\|B\|\leqslant1}\;\langle A,B\rangle,

porte différents noms : norme nucléaire ou norme de Ky Fan ou encore norme 1 de Schatten.

Normes de Schatten[modifier | modifier le code]

La norme p de Schatten est définie en A\in\R^{m\times n} par


\|A\|_{\sigma_p}:=\|\sigma(A)\|_p,

\sigma(A) est le vecteur des valeurs singulières de A. Ces normes ont un lien avec les normes précédentes, puisque, quel que soit A\in\R^{m\times n}, l'on a[3]


\|A\|_F=\|A\|_{\sigma_2},\qquad
\|A\|=\|A\|_{\sigma_\infty},\qquad
\|A\|_*=\|A\|_{\sigma_1}.

On déduit du lien entre les normes matricielles et les normes vectorielles de \sigma(A), et les inégalités sur ces normes, que pour tout A\in\R^{m\times n} :


\|A\|\leqslant \|A\|_F\leqslant \|A\|_*\leq \operatorname{rg}(A)^{1/2}\|A\|_F\leqslant \operatorname{rg}(A)\|A\|,

\operatorname{rg}(A) désigne le rang de A.

Ces inégalités montrent que le rang de A est borné inférieurement par sa norme nucléaire sur la boule unité \mathcal{B}:=\{A\in\R^{m\times n}:\|A\|\leqslant 1\}. En réalité, on peut montrer que la plus grande fonction convexe fermée qui minore le rang sur \mathcal{B} est la restriction à cette boule de la norme nucléaire. De manière plus précise, si l’on définit f : \R^{m\times n}\to\bar{\R} par f = \operatorname{rg}+\mathcal{I}_{\mathcal{B}}, où \mathcal{I}_{\mathcal{B}} est l’indicatrice de \mathcal{B}, alors sa biconjuguée s'écrit f^{**} = \|\cdot\|_*+\mathcal{I}_{\mathcal{B}}[4],[5]. Sans restriction du rang à un ensemble, on obtient \operatorname{rg}^{**}=0, une identité de peu d'utilité.

Propriétés[modifier | modifier le code]

  • L'espace Mn(K), muni d'une norme sous-multiplicative (comme la norme d'opérateur), est un exemple d'algèbre de Banach.
  • Pour toute norme N sur Mn(K), l'application bilinéaire (A, B) ↦ AB étant continue (on est en dimension finie), on est assuré de l'existence d'une constante k > 0 telle que \forall A,B\in M_n(K),\  N(AB)\le kN(A)N(B).Par suite, la norme kN est sous-multiplicative. Toute norme sur Mn(K) est donc proportionnelle à une norme d'algèbre.

Notes et références[modifier | modifier le code]

  1. A. Quarteroni, R. Sacco et F. Saleri, Méthodes Numériques: Algorithmes, analyse et applications, Springer,‎ (ISBN 978-8-84700495-5, lire en ligne), p. 22
  2. M. Ghil et J. Roux, Mathématiques Appliquées aux sciences de la Vie et de la Planète : Cours et exercices corrigés, Dunod,‎ (ISBN 978-2-10056033-2, lire en ligne), p. 50
  3. B. Recht, M. Fazel, P. Parrilo (2010). Guaranteed minimum-rank solutions of linear matrix equations via nuclear norm minimization. SIAM Review, 53, 471-501. DOI.
  4. M. Fazel (2002). Matrix rank minimization with applications. PhD thesis. Department of Electrical Engineering, Stanford University, Stanford, CA, USA.
  5. Cette propriété intervient dans les problèmes où l'on cherche à obtenir des objets parcimonieux par minimisation du rang (en compression d'images par exemple). Le rang étant une fonction à valeurs entières, donc difficile à minimiser, on préfère parfois considérer l'approximation convexe du problème qui consiste à y minimiser la norme nucléaire.