Quotient de Rayleigh

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

En mathématiques, pour une matrice hermitienne A et un vecteur x non nul, le quotient de Rayleigh est l’expression scalaire définie par

R(A, x) = \frac{x^{*} A x}{x^{*} x}

x^{*} désigne le vecteur adjoint de x. Pour une matrice symétrique à coefficients réels, le vecteur x^{*} est remplacé par son transposé x^{T}.

Dans les deux cas, le quotient de Rayleigh fournit une valeur réelle qui renseigne sur le spectre de la matrice par les deux propriétés fondamentales suivantes :

Ces deux propriétés peuvent être exploitées pour déterminer numériquement les valeurs, vecteurs et espaces propres d'un opérateur hermitien ou symétrique.

Le quotient de Rayleigh, dont la propriété d'extremum peut être reliée au principe du minimum de l'énergie potentielle en mécanique, a été étudié pour la première fois par Rayleigh (1877). Walter Ritz reprit l'idée en 1909 pour en faire la base d’une méthode d’approximation variationnelle.

Propriétés[modifier | modifier le code]

Partant d'une matrice symétrique respectivement hermitienne (dont les valeurs propres sont réelles), le quotient de Rayleigh satisfait les propriétés suivantes :

  1. C’est une fonction homogène de degré 1 puisque R(A, c x) = R(A,x) pour tout scalaire c.
  2. Pour tout x non nul, \lambda_{min} \le R(A,x) \le \lambda_{max}\lambda_{min} et \lambda_{max} sont les valeurs propres extrêmes de A. Une égalité est atteinte si et seulement si x est vecteur propre pour la valeur propre extrême correspondante.
  3. Si x_0 est un vecteur propre à valeur propre non extrême, alors R(A,x) présente un point-selle dans le voisinage de x_0.

Combiné au théorème du minimax, le quotient de Rayleigh permet de déterminer une à une toutes les valeurs propres d'une matrice. On peut également l'employer pour calculer une valeur approchée d'une valeur propre à partir d'une approximation d'un vecteur propre. Ces idées forment d'ailleurs la base de l’algorithme d’itération de Rayleigh.

Cas particulier des matrices semi-définies positives[modifier | modifier le code]

Ces matrices possèdent des valeurs propres positives ou nulles et le quotient de Rayleigh reste ainsi toujours positif ou nul. C’est en particulier le cas pour les matrices de covariances et cette propriété est à la base de l’analyse en composantes principales et des corrélations canoniques.


Méthode de Rayleigh-Ritz[modifier | modifier le code]

La Théorie de Sturm-Liouville a trait à l’action de l’application linéaire

L(y) = \frac{1}{w(x)}\left(-\frac{\mathrm d}{\mathrm dx}\left[p(x)\frac{\mathrm dy}{\mathrm dx}\right] + q(x)y\right)

sur l’espace préhilbertien des fonctions y(x) vérifiant des conditions aux limites particulières en x=a et b, muni du produit scalaire : \langle{y_1,y_2}\rangle = \int_a^b{w(x)y_1(x)y_2(x)}\mathrm dx.

Dans ce cas, le quotient de Rayleigh est

\rho(x) =\frac{\langle{y,Ly}\rangle}{\langle{y,y}\rangle} = \frac{\int_a^b{y(x)\left(-\frac{\mathrm d}{\mathrm dx}\left[p(x)\frac{\mathrm dy}{\mathrm dx}\right] + q(x)y(x)\right)}\mathrm dx}{\int_a^b{w(x)y(x)^2}\mathrm dx}.

On le présente parfois sous une forme équivalente, obtenue en découpant l'intégrale du numérateur et en intégrant par parties :

\rho(x) =\frac{\langle{y,Ly}\rangle}{\langle{y,y}\rangle} = \frac{\int_a^b{y(x)\left(-\frac{\mathrm d}{\mathrm dx}\left[p(x)y'(x)\right]\right)}\mathrm dx + \int_a^b{q(x)y(x)^2}\mathrm dx}{\int_a^b{w(x)y(x)^2}\mathrm dx}
= \frac{-y(x)\left[p(x)y'(x)\right]|_a^b + \int_a^b{y'(x)\left[p(x)y'(x)\right]}\mathrm dx + \int_a^b{q(x)y(x)^2}\mathrm dx}{\int_a^b{w(x)y(x)^2}\mathrm dx}
= \frac{-p(x)y(x)y'(x)|_a^b + \int_a^b\left[p(x)y'(x)^2 + q(x)y(x)^2\right]\mathrm dx}{\int_a^b{w(x)y(x)^2}\mathrm dx}.

Pour déterminer une solution approchée \bar y (x) de l’équation

-\frac{\mathrm d}{\mathrm dx}\left[p(x)\frac{\mathrm dy}{\mathrm dx}\right] + q(x)y = 0

vérifiant les conditions aux limites, on choisit un certain nombre de fonctions u_1, u_2, ..., u_p vérifiant elles-mêmes les conditions aux limites, et on cherche la solution approchée comme une combinaison linéaire des p modes retenus : \bar y (x) = \textstyle\sum_{i=1}^p \alpha_i u_i(x). Les coefficients inconnus \alpha_i s’obtiennent en écrivant la stationnarité du quotient de Rayleigh : \tfrac{\partial \rho}{\partial \alpha_i}=0, qui détermine p équations linéaires d'inconnues (\alpha_i)_{i=1...p}

Généralisation[modifier | modifier le code]

On peut étendre la notion de quotient de Rayleigh à deux matrices symétriques définies positives réelles (A, B), et à un vecteur non-nul x, selon :

R(A,B; x) := \frac{x^T A x}{x^T B x}.

Ce « quotient de Rayleigh généralisé » se réduit au quotient de Rayleigh R(D, Cx) par la transformation D = C^{-T} A C^{-1}C est la factorisation de Cholesky de la matrice B.

Notes et références[modifier | modifier le code]

Voir aussi[modifier | modifier le code]

Article connexe[modifier | modifier le code]

Bibliographie[modifier | modifier le code]

  • Philippe Ciarlet, Introduction à l’analyse numérique matricielle et à l’optimisation, Masson, coll. « Math. Appl. pour la Maîtrise »,‎ 1985 (réimpr. 2001) (ISBN 2-225-68893-1)
  • P. Lascaux, R. Théodor, Analyse numérique matricielle appliquée à l’art de l’ingénieur, vol. I, Masson,‎ 1985 (réimpr. 2001) (ISBN 2-225-84546-8), « 1.4 - Forme hermitienne associée... »
  • John William Strutt Rayleigh, The theory of Sound, McMillan Co.,‎ 1877 (réimpr. 1945), 2 vol. (ISBN 0-486-60292-3), « IV-Vibrating systems in general », p. 106-129