Gradient

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Les lignes bleues représentent le gradient de couleur du plus clair vers le plus foncé

En physique et en analyse vectorielle, le gradient est une grandeur vectorielle indiquant la façon dont une grandeur physique varie dans l'espace. En mathématiques, le gradient est un vecteur représentant la variation d'une fonction par rapport à la variation de ses différents paramètres.

Il est courant, selon la façon de noter des vecteurs, d'écrire le gradient d'une fonction f ainsi :

\overrightarrow{\mathrm{grad}}~f ou \overrightarrow{\nabla} f

Souvent, en typographie, on préfère mettre un caractère en gras pour afficher son caractère vectoriel :

\mathbf{grad}~f ou \mathbf{\nabla} ~f .

Le gradient est d'une importance capitale en physique, où il fut d'abord employé. Utilisé en théorie des variations, il est aussi fondamental dans le domaine de l'optimisation ou de la résolution d'équations aux dérivées partielles. Il peut être intéressant d'en voir certains exemples avant d'en donner une définition plus mathématique.

Le gradient de température[modifier | modifier le code]

Article détaillé : Gradient thermique adiabatique.

Gradient dans une seule direction (dérivée)[modifier | modifier le code]

Supposons que l'on place une poutre rectiligne entre deux murs qui n'ont pas la même température, le mur de gauche étant le plus froid. On observe que la température de la poutre n'est pas constante et qu'elle varie de façon croissante de la gauche vers la droite. À ce phénomène thermodynamique, on associe un phénomène de flux de chaleur, lui-même lié à un gradient de température, c'est-à-dire à une variation le long de la poutre de la température, cf. Conduction Thermique, loi de Fourier.

Si on part de l'extrémité gauche de la poutre avec une abscisse x = 0 et qu'on atteint l'autre extrémité de la poutre pour une abscisse x = L (la longueur de la poutre), on définit la température en un point x qu'on écrit T(x). La température T est dite fonction de x.

Entre deux points très proches, distants d'une longueur δx, on mesure un écart de température δT. Au sens usuel, le gradient (de température) est justement le rapport entre ces deux grandeurs

\overrightarrow{\operatorname{grad}} \ {T} = \frac{\delta T}{\delta x} \cdot \vec i.

Au sens analytique (mathématique), on parle de gradient si cette grandeur admet une limite quand δx tend vers 0, limite notée

\overrightarrow \nabla T(x) = T'(x)\cdot \vec i = \frac{\mathrm dT}{\mathrm dx}(x)\cdot \vec i .

Propriétés[modifier | modifier le code]

  • Le rapport \tfrac{\delta T}{\delta x} a un signe, ce qu'on traduit par un sens. Dans le cas qui nous intéresse, il fait plus froid à gauche de la poutre qu'à droite, donc le gradient est orienté vers la droite puisqu'on parcourt aussi la poutre de gauche à droite par l'abscisse x.
  • En dimension 1, il y a convergence de la notion de gradient et de dérivée
  • En physique, la norme de ce gradient est homogène à une température divisée par une distance (mesuré en K·m-1), ou plus usuellement en °C·m-1.

Gradient de température dans l'espace à trois dimensions usuel[modifier | modifier le code]

En réalité, la température de la poutre varie en fonction d'un déplacement dans l'espace. On caractérise un point de l'espace, M, en fonction de ses coordonnées \scriptstyle \vec u=(x,y,z). De même que précédemment, on décrit la température comme fonction : T(x, y, z).

Pour chacune de ces directions, on peut écrire une variation, dite partielle. Si, tout en étant en 3D, on ne se déplace que selon un axe, par exemple selon les ordonnées y, alors on peut réécrire la même formule que précédemment sur l'accroissement de température. Cependant, pour marquer la variation, on passe par l'écriture en dérivée partielle (dite "ronde") plutôt que par la dérivée unidimensionnelle (dite droite). On écrit par exemple la variation le long de y ainsi l'approximation (dite du premier ordre) :

T(x,y + \delta y, z) = T(x,y,z) + \frac{\partial T}{\partial y} \delta y .

On se déplace dans la poutre d'un point M à un point M' tels qu'ils définissent le vecteur :

 \vec{h} = \overrightarrow{MM'} = (h_x,h_y,h_z).

De M à M' , la température passe de la T(x,y,z) à T(x+hx,y+hy,z+hz). En première approximation, cette variation est une fonction linéaire de \scriptstyle \vec het s'exprime comme somme des variations liées à chacune des composantes de \scriptstyle \vec h

T(x+h_x,y+h_y,z+h_z) = T(x,y,z) + \frac{\partial T}{\partial x}(x,y,z) h_x + \frac{\partial T}{\partial y}(x,y,z) h_y + \frac{\partial T}{\partial z}(x,y,z) h_z.

On crée alors un vecteur appelé gradient de température

\mathbb{\nabla} T(x,y,z) = \left(\frac{\partial T}{\partial x}(x,y,z),\frac{\partial T}{\partial y}(x,y,z),\frac{\partial T}{\partial z}(x,y,z) \right).

Notez que c'est bien un vecteur. Dans ce cas, on peut réécrire la relation précédente sous la forme

T(\vec u + \vec h) = T(\vec u) + \mathbf{\nabla} T(\vec u) \cdot \vec h + o(\vec h),

où "\cdot" est le produit scalaire usuel de \R^3 et le symbole o(\vec {h}) signifie que le terme qui reste est négligeable par rapport à \vec{h}.

Propriétés[modifier | modifier le code]

  • Le gradient est un vecteur de même dimension que l'espace sur lequel porte la température (ici ℝ3) alors que la température est fonction de support à trois dimensions mais à valeur réelle scalaire (i.e. la température en un point est un nombre, pas un vecteur).
  • La direction du (vecteur) gradient définit de nouveau la direction du plus froid au plus chaud, mais cette fois en 3D.
  • La norme du gradient est toujours homogène à K.m−1.

Introduction par les éléments différentiels[modifier | modifier le code]

Comme pour la différentielle dont il est une variante, le gradient peut être introduit avec le vocabulaire des éléments différentiels. À titre d'exemple on examine le problème de la variation de l'aire d'un rectangle.

Considérons dans le plan (xOy ) un rectangle de côté x et y. Sa surface est égale à xy et dépend des coordonnées x et y du point M. En suivant une démarche intuitive, on convient de noter par dx une très petite variation de la variable x. Lorsqu'on fait subir au point M un déplacement très faible, la surface va changer et on peut écrire que :

\mathrm S + \mathrm{dS} =(x + \mathrm dx) \cdot (y+\mathrm dy)= x \cdot y +x \cdot \mathrm dy + y \cdot \mathrm dx + \mathrm dx \cdot \mathrm dy

On en déduit facilement que

\mathrm{dS} = y \cdot \mathrm dx + x\cdot \mathrm dy + \mathrm dx \cdot \mathrm dy

Une simple application numérique où x et y seraient des mètres et dx et dy des centimètres illustre que dxdy est négligeable par rapport aux autres grandeurs.

On peut donner un statut mathématique précis aux notations dx et dy (qui sont des formes différentielles), et à la quantité dxdy qui est alors du second ordre. Le calcul précédent est en fait un calcul de développement limité à l'ordre 1, faisant intervenir les dérivées premières de la fonction xy par rapport aux deux variables.

On écrit donc :

 \mathrm{dS} = (x + \mathrm dx) \cdot (y + \mathrm dy) - x \cdot y = y \cdot \mathrm dx + x \cdot \mathrm dy = (y,x) \cdot (\mathrm dx, \mathrm dy) = \overrightarrow \nabla \mathrm S \cdot \overrightarrow{\mathrm{dOM}}
 \overrightarrow\nabla \mathrm S \cdot \overrightarrow{\mathrm{dOM}} = (y \vec i + x \vec j) \cdot (\mathrm dx \vec i+ \mathrm dy \vec j) = \left( \frac{\partial(xy)}{\partial x} \vec i + \frac{\partial(xy)}{\partial y} \vec j \right) \cdot (\mathrm dx \vec i+ \mathrm dy \vec j).

Toutes ces égalités sont différentes façons d'écrire un produit scalaire de deux vecteurs :

 \mathrm{dS} = (x + \mathrm dx) \cdot (y + \mathrm dy) - x \cdot y = y \cdot \mathrm dx + x\cdot \mathrm dy = \mathrm {\overrightarrow{\mathrm{grad}}} (xy) \cdot \overrightarrow{\mathrm{dOM}} = \overrightarrow\nabla (xy) \cdot \overrightarrow{\mathrm{dOM}}

\overrightarrow{\mathrm{grad}}(xy) = (y,x).

L'intérêt de l'introduction de ces vecteurs pour exprimer la variation d'une fonction de plusieurs paramètres est de visualiser le fait que la fonction va varier le plus dans la direction du vecteur gradient et qu'elle ne va pas varier pour tout changement des paramètres dans une direction perpendiculaire au gradient.

 (y \vec i + x \vec j ) \cdot (\mathrm dx \vec i + \mathrm dy \vec j) =0 pour : y \mathrm dx + x \mathrm dy = 0 dans notre exemple du rectangle.
tracé du gradient de surface et d'une courbe d'isosurface

Ceci donnera en électrostatique les courbes de même potentiel : les « équipotentielles ».

Définition mathématique[modifier | modifier le code]

Gradient d'une fonction réelle définie sur un espace euclidien[modifier | modifier le code]

Contexte[modifier | modifier le code]

Soit E un espace vectoriel euclidien et soit U un ouvert de E. Soit f : U\to\R une fonction différentiable. Soit a un élément de U. On note alors \mathcal{D}_a f la différentielle en a, qui est une forme linéaire sur E. On note (\mathcal{D}_a f,u) l'image par cette différentielle d'un vecteur u de E.

Existence et unicité[modifier | modifier le code]

Il existe un vecteur A tel que pour tout vecteur u de E, (\mathcal{D}_a f,u) = \langle A \mid u \rangle, où l'on a noté \langle \cdot \mid \cdot \rangle\,\! le produit scalaire dans E.

Le vecteur A est appelé gradient de f en a, et il est noté \nabla_a f. Il vérifie donc :

\forall u \in E, \langle \nabla_a f \mid u \rangle = ( \mathcal{D}_a f, u ) .

Expression canonique (dérivées partielles)[modifier | modifier le code]

Puisque le gradient est lui-même un vecteur de E, il est naturel qu'on cherche à l'exprimer dans une base orthonormée (e_1, ..., e_n) de cet espace vectoriel. On démontre qu'il s'exprime à l'aide des dérivées partielles sous la forme

\nabla_a f = \sum_{i=1}^n\left[\frac{\partial f}{\partial x_i}\left(a\right)\mathbf{e}_i\right]

Par exemple, en dimension 3, on obtient :

\nabla_a f = \frac{\partial f}{\partial x}(a) \mathbf{e}_x + \frac{\partial f}{\partial y}(a) \mathbf{e}_y + \frac{\partial f}{\partial z}(a) \mathbf{e}_z

Changement de base[modifier | modifier le code]

Lors d'un changement de base, au travers d'un C1-difféomorphisme de E, l'écriture du gradient suit les règles usuelles des changements de base.

Attention, il ne faut pas confondre changement de base pour l'expression d'une fonction écrite en notations cartésiennes (canoniques) et écriture du gradient adaptée à une notation autre. Par exemple pour une fonction exprimée en coordonnées polaires on calcule l'écriture « polaire » du gradient en partant d'une fonction explicitée en fonction de l'abscisse polaire (ρ) et de l'argument (θ) f(ρ,θ).

\nabla f
= \frac{\partial f}{\partial \rho}\mathbf{e}_\rho
+ \frac{1}{\rho}\frac{\partial f}{\partial \theta}\mathbf{e}_{\theta}
+ \frac{\partial f}{\partial z}\mathbf{e}_{z}
\nabla f
= \frac{\partial f}{\partial r}\mathbf{e}_r
+ \frac{1}{r}\frac{\partial f}{\partial \theta}\mathbf{e}_{\theta}
+ \frac{1}{r \sin\theta}\frac{\partial f}{\partial \phi}\mathbf{e}_{\phi}

les vecteurs de type \mathbf{e}_r sont des vecteurs propres aux coordonnées polaires

Cas général[modifier | modifier le code]

Gradient et espace de Hilbert[modifier | modifier le code]

Soit (H,\langle.,.\rangle)\,\! un espace de Hilbert, de dimension finie ou non. Soit U un ouvert de H et f : U \to\R. Si f est différentiable en a \in U, alors puisque \mathcal{D}_a f est par définition une forme linéaire continue sur H, d'après le théorème de représentation de Riesz il existe un vecteur v \in H tel que

\forall h \in H, \mathcal{D}_a f(h) = \langle v , h \rangle

Le vecteur v est appelé gradient de f en a, et est noté généralement \nabla f(a).

Gradient et variété riemanniene[modifier | modifier le code]

On peut encore étendre cette définition à une fonction différentiable définie sur une variété riemannienne (M,g). Le gradient de f en a est alors un vecteur tangent à la variété en a, défini par

\forall h \in \mathrm T_a \mathrm M \qquad \mathrm df (a) \left ( h \right ) = g \left ( \nabla f \big| h \right ).

Enfin, si f est un champ scalaire indépendant du système de coordonnées, c'est un tenseur d'ordre 0, et sa dérivée partielle est égale à sa dérivée covariante : (\nabla f)_i = \partial_i f = f_{,i} = f_{;i}. En coordonnées contravariantes, on calcule le champ de vecteurs appelé gradient de f :

(\nabla f)^i = g^{ij}~f_{;j}

Cette formule permet, une fois établi le tenseur métrique, de calculer facilement le gradient dans un système de coordonnées quelconque.

Développement limité[modifier | modifier le code]

Si une application admet un gradient en un point, alors on peut écrire ce développement limité du premier ordre

f(x+h) = f(x) + \langle\nabla f (x) \mid h \rangle + o(h)

Propriétés géométriques en dimension 2 ou 3[modifier | modifier le code]

Classiquement, on sait que le gradient permet de définir la « normale aux courbes de niveau », ce qui se traduit en 2D et en 3D par des propriétés géométriques intéressantes. La propriété de tangence étant liée à la convexité/concavité, il est aussi intéressant de voir le lien qui existe entre gradient et convexité, toujours en 2D ou 3D.

Dimension 2 : gradient normal à une courbe en un point, droite tangente[modifier | modifier le code]

On considère f : \R^2\to\R continûment différentiable. Soit une courbe définie par l'équation f(u)=k, où k est une constante. Alors, en un point v donné de cette courbe, le gradient s'il existe et n'est pas nul, donne la direction de la normale à la courbe en ce point v. La droite tangente à la courbe est alors orthogonale au gradient et passe par v.

Dimension 3 : gradient normal à une surface en un point, plan tangent[modifier | modifier le code]

Soit une application f :\R^3\to\R continûment différentiable. Soit une surface définie par l'équation f(u)=k, où k est une constante. Alors, en un point v donné de cette surface, le gradient s'il existe et n'est pas nul, donne la direction de la normale à la surface en ce point v : le plan tangent à la surface est alors orthogonal au gradient et passe par v.

Gradient et convexité[modifier | modifier le code]

Soit une application f:\R^n\to\R (n \in \{ 2, 3 \} par exemple) continûment différentiable. Si l'application \mathbf{\nabla} f :\R^n\to\R^n est monotone (resp. strictement monotone), alors f est convexe (resp. strictement convexe). C'est-à-dire, en utilisant la caractérisation par les cordes :

\forall (u,v) \in \left(\R^3\right)^2, \mathbf{\nabla}_u f \cdot \mathbf{\nabla}_v f \geq 0 \Rightarrow \forall (u,v,\lambda) \in \R^3 \times\R^3 \times [0,1], f(\lambda u+(1-\lambda)v) \leq \lambda f(u)+(1-\lambda) f(v)

Cette propriété est intéressante parce qu'elle reste valable même quand f n'est pas deux fois différentiable.

Si f est deux fois différentiable, le hessien est positif si et seulement si le gradient est monotone.

Cas de la dimension 1[modifier | modifier le code]

La monotonie telle que définie ci-dessus permet de définir une fonction croissante ou décroissante au sens usuel. Dans le premier cas, on parle de fonction convexe, dans le second de fonction concave.

Si la fonction est deux fois dérivable, la croissance de la dérivée (donc du gradient) est assurée par la positivité de la dérivée seconde (équivalent du hessien).

Relations vectorielles[modifier | modifier le code]

En analyse vectorielle, le gradient peut être combiné à d'autres opérateurs. Soit f une fonction décrivant un champ scalaire, que l'on suppose de classe C2 par rapport à chaque paramètre, alors :

\frac{\partial}{\partial t} \left( \nabla f \right) = \nabla \frac{\partial f}{\partial t} ;
\mathrm{div} \left( \overrightarrow{\mathrm{grad}} f \right) = \Delta f ;
\overrightarrow{\mathrm{rot}} \left( \overrightarrow{\mathrm{grad}} f \right) = \overrightarrow{0}.

Sources et références[modifier | modifier le code]

  • (en) Serge Lang, Fundamentals of Differential Geometry, Springer
  • (en) Barrett O'Neill, Elementary Differential Geometry, 2e éd. révisée (ISBN 9780120887354)

Voir aussi[modifier | modifier le code]

Sur les autres projets Wikimedia :