Équation du second degré

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

En mathématiques, une équation du second degré, ou équation quadratique, est une équation polynomiale de degré 2, c'est-à-dire qu'elle peut s'écrire sous la forme :

ax^2 + bx + c = 0

x est l'inconnue et les lettres a, b et c représentent les coefficients, avec a différent de 0.

Dans l'ensemble des nombres réels, une telle équation admet au maximum deux solutions, qui correspondent aux abscisses des éventuels points d'intersection de la parabole d'équation y = ax^2 + bx + c avec l'axe des abscisses dans le plan muni d'un repère cartésien. La position de cette parabole par rapport à l'axe des abscisses, et donc le nombre de solutions (0, 1 ou 2) est donnée par le signe du discriminant. Ce dernier permet également d'exprimer facilement les solutions, qui sont aussi les racines de la fonction du second degré associée.

Sur le corps des nombres complexes, une équation du second degré a toujours exactement deux racines distinctes ou une racine double. Dans l'algèbre des quaternions, une équation du second degré peut avoir une infinité de solutions.

Historique[modifier | modifier le code]

Les équations du second degré sont au centre de l'algèbre babylonienne, dès avant le XVIIIe siècle av. J.-C.[1]. La tablette d'argile BM 13901 a été qualifiée de « véritable petit manuel d'algèbre, consacré à l'équation du second degré et aux systèmes d'équations, et donnant les procédures résolutoires fondamentales »[2].

Les équations du second degré ont été étudiées systématiquement par Al-Khwarizmi au IXe siècle, dans un ouvrage intitulé Abrégé du calcul par la restauration et la comparaison qui, via le mot « restauration » (en arabe : al-jabr) a donné son nom à l'algèbre. Al-Khawarizmi distingue six cas d'équations du premier ou second degré dans lesquels les paramètres a, b et c sont tous positifs :

  1. les carrés égalent les racines : ax^2 = bx~;
  2. les carrés égalent les nombres : ax^2 = c~;
  3. les racines égalent les nombres : bx = c~;
  4. les carrés et les racines égalent les nombres : ax^2+bx = c~;
  5. les carrés et les nombres égalent les racines : ax^2+c = bx~;
  6. les racines et les nombres égalent les carrés : bx+c = ax^2.

Il démontre les méthodes de résolution en suivant des raisonnements d'algèbre géométrique.

Éléments clé[modifier | modifier le code]

Introduction par l'exemple[modifier | modifier le code]

On recherche les éventuelles solutions de l'équation suivante[3] :

x^2 - x - 1 = 0.

Le membre de gauche est appelé trinôme du second degré[4]. Il est composé de trois termes, tous de la même forme : un nombre non nul que multiplie une puissance entière de x. Chaque terme est appelé monôme et, comme il en existe trois, on parle de trinôme. La plus grande puissance de ces monômes est deux ; pour cette raison, on parle de second degré. L'expression 0x2 + x + 1 n'est pas un trinôme : x + 1, est un binôme du premier degré[Note 1].

La méthode consiste à forcer l'apparition d'une première identité remarquable. On écrit le polynôme de la manière suivante :

x^2-x-1 = x^2 - 2\cdot \frac 12\cdot x + \frac 14 - \frac 14 - 1.

Les trois premiers termes sont ceux d'une somme remarquable. L'application d'une identité remarquable permet d'écrire le polynôme de la manière suivante :

x^2-x-1 = \left(x - \frac 12\right)^2 - \frac 54.

On peut alors appliquer à cette différence de carrés une deuxième identité remarquable :

x^2-x-1 = \left(x - \frac 12\right)^2 - \left(\frac {\sqrt5}2\right)^2 =  \left(x - \frac 12+ \frac {\sqrt5}2\right)\left(x - \frac 12- \frac {\sqrt5}2\right).

L'équation initiale s'exprime alors sous forme d'un produit de deux facteurs :

\left(x - \frac 12+ \frac {\sqrt5}2\right)\left(x - \frac 12- \frac {\sqrt5}2\right)=0.

Un produit de deux facteurs est nul si, et seulement si, l'un des facteurs est nul[Note 2]. Cette remarque permet de trouver les deux solutions x1 et x2 :

x_1 = \frac {1 + \sqrt 5}2,\quad x_2 = \frac {1 - \sqrt 5}2

Cette équation n'admet qu'une unique racine positive x1, cette valeur est appelée nombre d'or. Il est aussi possible de résoudre une équation du second degré sans la moindre connaissance d'algèbre, le paragraphe méthode géométrique montre comment s'y prendre.

Discriminant[modifier | modifier le code]

Article détaillé : Discriminant.

On considère l'équation suivante, où a, b et c désignent des nombres réels et a est différent de 0 :

ax^2 + bx + c = 0.

On dispose de la définition suivante[5]:

Définition du discriminant — Le discriminant de l'équation est la valeur Δ définie par :

\Delta = b^2 - 4ac.

Cette définition est la source du théorème associé à la résolution de l'équation du second degré, dans le cas où l'on recherche des solutions réelles[6]:

Résolution de l'équation — Si le discriminant est strictement positif, l'équation admet deux solutions x1 et x2 données par les formules suivantes :

x_1 = \frac {-b + \sqrt \Delta}{2a}\quad \text{et}\quad x_2 = \frac {-b - \sqrt \Delta}{2a}.

Si le discriminant est nul, l'équation admet une racine double :

ax^2 + bx + c =a\left(x + \frac b{2a}\right)^2 \quad \text{et}\quad x_1=x_2 = -\frac b{2a}.

Si le discriminant est strictement négatif, l'équation n'admet pas de solution réelle.

Interprétation graphique[modifier | modifier le code]

Article détaillé : Fonction du second degré.
Le signe du discriminant apporte une information sur le graphe de la fonction f.

Une manière d'étudier l'équation du paragraphe précédent est de considérer la fonction f de la variable réelle et à valeurs réelles définie par :

f(x) = ax^2 + bx + c.

L'équation peut encore s'écrire f(x) = 0. Les solutions de l'équation sont les abscisses des points d'intersection du graphe de la fonction f et de l'axe des x. Le graphe de la fonction f est appelé une parabole, elle possède une forme analogue à celle des trois exemples présentés à droite. Si a est positif, les branches de la parabole sont dirigées vers le haut, comme pour les exemples jaunes ou bleus, sinon les branches sont dirigées vers le bas, comme l'exemple rouge.

Si le discriminant est strictement positif, comme pour l'exemple bleu, cela signifie que le graphe de f croise l'axe des abscisses en deux points. Si le discriminant est nul, la configuration est celle de la parabole rouge, le graphe se situe soit dans le demi-plan des ordonnées positives soit dans le demi-plan des ordonnées négatives et son unique extremum est sur l'axe des abscisses. Dans le cas d'un discriminant strictement négatif, comme pour la parabole jaune, le graphe se situe encore dans l'un des deux demi-plans précédents, mais cette fois l'extremum ne rencontre pas l'axe des abscisses.

Ainsi, si le discriminant est strictement positif, le signe des valeurs que prend la fonction f entre les solutions est l'opposé du signe des valeurs prises par f à l'extérieur du segment d'extrémités les solutions de l'équation[7].

Résolution dans l'ensemble des réels[modifier | modifier le code]

Forme canonique[modifier | modifier le code]

En vue de résoudre l'équation f(x) = 0, où f est la fonction du paragraphe précédent, une méthode consiste à l'écrire sous une forme plus adaptée. Comme la valeur a n'est pas nulle, il est déjà possible de la factoriser :

f(x)=ax^2 + bx + c = a\left(x^2 + \frac ba x + \frac ca\right).

La méthode utilisée pour la résolution du premier exemple s'applique encore. Elle revient à « forcer » l'apparition d’une identité remarquable de la forme  \left( A + B \right)^2 = A^2+2AB+B^2 \text{ avec } A = x \text{ et } B = \frac b{2a}, en ajoutant et en retranchant B2 :

f(x) = a\left(x^2 + 2x\left(\frac b{2a} \right) + \left( \left(\frac {b}{2a} \right) ^2 - \left( \frac {b}{2a}\right) ^2 \right)_{\color{red}\nwarrow =0} + \frac ca\right) = a\left(\left(x + \frac b{2a}\right)^2  - \frac {b^2 - 4ac}{4a^2}\right).

Cette forme est à l'origine d'une propriété et d'une définition[8]:

Définition de la forme canonique —  L'équation du second degré peut s'écrire sous la forme suivante, dite canonique, Δ désignant le discriminant[8] :

f(x)=ax^2 + bx + c =a(x -\alpha)^2 + \beta = 0 \quad\text{avec}\quad \alpha = \frac {-b}{2a}, et \; \beta = f(\alpha) = -\frac {\Delta}{4a} = c -\frac{b^2}{4a}.

À noter que \beta représente l'extremum (maximum ou minimum) de la fonction f(x), et que cet extremum est atteint pour x = \alpha  :
         - Si a>0 la fonction f(x) est décroissante puis croissante (fonction en U) et \beta est donc le minimum de la fonction.
         - Si a<0 la fonction f(x) est croissante puis décroissante (fonction en cloche) et \beta est donc le maximum de la fonction.

Dans les deux cas, les coordonnées de l'extremum sont donc M(\frac {-b}{2a};c -\frac{b^2}{4a})

Exemples[modifier | modifier le code]

Considérons l'équation suivante[9] :

f(x) = 0 \quad\text{avec}\quad f(x) = x^2 - 4x + 4.

Deux méthodes permettent de trouver l'expression de la forme canonique. Tout d'abord, f est définie par une identité remarquable ; on en déduit :

f(x) = (x-2)^2.

Il est aussi possible d'utiliser les formules de la définition, on trouve ici a = 1, b = –4 et c = 4. On en déduit que le discriminant Δ est nul et que le coefficient α est égal à 2, ce qui donne à nouveau le résultat précédent.

Considérons maintenant le nouvel exemple[9]:

g(x) = 0 \quad\text{avec}\quad g(x) = 2x^2 - 6x + 1.

Si l'égalité définissant g(x) n'est plus une identité remarquable, la deuxième méthode est toujours efficace. On a a = 2, b = –6 et c = 1. Ce qui permet d'effectuer les calculs suivants :

 \alpha = -\frac b{2a} = \frac 64 = \frac 32,\quad \beta = g(\alpha) = g\left(\frac 32\right) = 2 \frac 94 - 6\frac 32 + 1 = \frac 92 - \frac {18}2 + \frac 22 = -\frac 72.

On en déduit la forme canonique :

 g(x) = 2 \left( x - \frac 32 \right) ^2 - \frac {7}2.

Le graphe de la fonction g(x) est fonc en forme de U et admet un minimum au point M(\frac 32;-\frac 72)

Résolution de l'équation f(x) = 0[modifier | modifier le code]

La résolution de l'équation f(x) = 0 utilise la forme canonique :

Discriminant strictement négatif[modifier | modifier le code]

Si le discriminant est strictement négatif, la valeur β est strictement positive. La fonction f s'exprime comme le produit de a et de la somme d'un terme positif (x - α)2 et d'un terme strictement positif β. On en déduit que, quelle que soit la valeur de x, son image par f n'est jamais nulle, car produit de deux facteurs non nuls, ce qui montre l'absence de solution dans l'ensemble des réels.

On peut tout de même trouver deux solutions en se plaçant dans l'ensemble des nombres complexes.

Discriminant nul[modifier | modifier le code]

Si le discriminant est nul, le terme β l'est aussi et f(x) = a.(x - α)2. Cette expression est nulle si, et seulement si x est égal à α. Une fois encore, on retrouve le résultat exprimé dans le deuxième paragraphe.

Discriminant strictement positif[modifier | modifier le code]

Si le discriminant est strictement positif, en simplifiant par a, l'équation s'écrit encore, si δ désigne la racine carrée du discriminant :

(x-\alpha)^2 - \left(\frac {\delta}{2a}\right)^2 = 0\quad\text{avec}\quad \delta = \sqrt{b^2 - 4ac}.

On reconnait une identité remarquable et l'équation s'écrit encore :

\left(x -\alpha + \frac {\delta}{2a}\right)\left(x -\alpha - \frac {\delta}{2a}\right)=0.

Un produit de deux nombres réels est nul si, et seulement si, l'un des deux facteurs du produit est nul, on en déduit que l'équation est équivalente à l'une des deux équations :

x-\alpha - \frac {\delta}{2a}=0 \quad\text{ou}\quad x -\alpha + \frac {\delta}{2a}=0.

En remplaçant α et δ par leur valeur, on retrouve bien l'expression déjà indiquée des deux solutions.

Propriétés[modifier | modifier le code]

Forme réduite[modifier | modifier le code]

Une équation du second degré n'apparaît pas toujours sous la forme étudiée jusqu'à présent. Considérons l'exemple :

(x+2)^3-(x-1)^3 = 0.

Une analyse trop rapide pourrait laisser penser que les méthodes présentées ici ne sont pas adaptées pour une telle équation. Pour le vérifier, le plus simple est de développer le terme de gauche. On obtient, à l'aide de deux identités remarquables :

(x+2)^3-(x-1)^3 =x^3 + 6x^2 + 12x + 8 - (x^3 - 3x^2 + 3x -1) = 9x^2 + 9x + 9.

L'équation devient alors :

9x^2 + 9x + 9 = 0.

En simplifiant encore par 9, l'équation s'écrit : x2 + x + 1 = 0. Le discriminant étant égal à –3, l'équation n'admet pas de racine réelle. Pour pouvoir appliquer les techniques développées ici, il est utile d'exprimer l'équation sous la forme étudiée jusqu'à présent. Cette forme porte un nom[9].

Définition de la forme réduite — La forme réduite d'une équation du second degré réelle, est la suivante, si a, b et c sont trois nombres réels tels que a soit différent de 0 :

ax^2 + bx + c = 0.

Il existe trois formes importantes pour exprimer une équation du second degré, la forme réduite, la forme canonique et, éventuellement la forme factorisée, qui s'écrit de la manière suivante :

a(x - x_1)(x - x_2) = 0.

Sous la forme factorisée, les solutions sont directement disponibles. Elles sont égales à x1 et x2.

Relations entre coefficients et racines[modifier | modifier le code]

Si les solutions, encore appelées racines, existent, qu'elles soient distinctes ou doubles[10], on dispose de deux manières différentes de noter le polynôme, la forme factorisée et celle réduite. Avec les notations de l'article, on obtient si x1 et x2 sont les deux racines :

ax^2 + bx + c = a(x - x_1)(x - x_2).

Un développement de la forme de droite permet d'obtenir une nouvelle expression de la forme réduite :

ax^2+bx +c= ax^2-a(x_1 + x_2)x+ax_1x_2.

En identifiant les coefficients, on en déduit des relations entre les coefficients de l'équation et ses solutions :

Relations entre coefficients et racines —  On dispose des deux relations suivantes :

x_1 + x_2 = -\frac ba \quad \text{et}\quad x_1x_2 = \frac ca.

Les égalités de cette nature se généralisent pour les équations définies par un polynôme de degré quelconque. Tel est l'objet de l'article détaillé.

Discriminant réduit[modifier | modifier le code]

Parfois, les coefficients a, b et c sont des nombres entiers et b est pair. Dans ce cas, un facteur 2 apparaît à la fois au numérateur et au dénominateur. Si on définit b' comme l'entier vérifiant l'égalité b = 2.b' , on simplifie les calculs :

Définition du discriminant réduit[4] — Le discriminant réduit est la valeur Δ' définie par :

\Delta' = b'^2 -ac.

Le discriminant est égal à quatre fois le discriminant réduit qui est donc de même signe que le discriminant. En conséquence, si le discriminant réduit est strictement positif, il existe deux solutions distinctes, s'il est nul les deux solutions sont confondues et s'il est strictement négatif aucune solution réelle n'existe. Dans le cas où le discriminant est positif, les deux racines x1 et x2 s'expriment, à l'aide du discriminant réduit par les égalités :

x_1 = \frac {-b' + \sqrt {\Delta'}}{a}\quad\text{et}\quad x_2 = \frac {-b' - \sqrt {\Delta'}}a.

Le calcul présenté ici est exact, indépendamment du fait que a, b et c soient entiers. Si l'expression de b' est simple, il peut être utile de faire usage du discriminant réduit, plutôt que du discriminant.

Considérons l'équation suivante :

\sqrt 5 x^2 - 6x + \sqrt 5 = 0.

Le discriminant réduit est un peu plus simple à calculer que le discriminant : il est égal à 9 - (5)2 donc à 4. On trouve, avec les formules précédentes :

x_1 = \frac {3 + 2}{\sqrt 5} = \sqrt 5 \quad\text{et}\quad x_2 = \frac {3 - 2}{\sqrt 5} = \frac {\sqrt 5}5.


Autres méthodes de résolution[modifier | modifier le code]

Racines évidentes[modifier | modifier le code]

Les relations entre les coefficients et racines permettent parfois une accélération dans la résolution. Considérons l'équation précédente, le terme 5 joue un rôle singulier. Il est tentant de calculer son image par le polynôme définissant l'équation. Une solution trouvée à l'aide de cette méthode, c'est-à-dire consistant à choisir une valeur « au hasard » et à vérifier que son image par le polynôme est nulle est appelée racine évidente.

Une fois la première solution connue, les relations entre coefficients et racines permettent aisément de trouver la seconde. Dans l'exemple proposé, le plus simple est de remarquer que le produit des racines, égal à c/a est ici égal à 1. La deuxième racine est donc 1/5.

La méthode de la racine évidente permet de résoudre simplement une équation de degré plus élevé, comme l'exemple suivant[11] :

x^3 - 5x - 2 = 0.

Plusieurs méthodes sont possibles pour en venir à bout. Celle de Cardan possède l'avantage d'être sûre, mais demande une maîtrise des nombres complexes et impose de longs calculs. La méthode des racines évidentes est beaucoup plus rapide. On tente traditionnellement les valeurs 0, ±1 et ±2. Dans le cas présent, –2 est une racine. Cela signifie que le polynôme x + 2 divise celui définissant l'équation. Trouver le deuxième facteur n'est pas trop ardu. C'est un polynôme du second degré, car seul un polynôme du second degré, multiplié par (x + 2) est du troisième degré. Si ax2 + bx + c est le deuxième facteur, on calcule le produit :

(x + 2)(ax^2 + bx + c) = ax^3 + (2a + b)x^2 + (2b+c)x + 2c = x^3 -5x - 2.

On en déduit a = 1, c = –1 puis b = –2. Il reste encore à résoudre l'équation :

x^2 - 2x - 1 = 0.

Pour une rédaction plus concise, on peut toujours prétendre que 1 + 2 est une racine évidente. Comme la somme des racines du polynôme du second degré est égale à 2, la deuxième racine est égale à 1 – 2.

Méthode géométrique[modifier | modifier le code]

Article détaillé : Algèbre géométrique.
603px-Quadrat Gleichung Euklid.png

Les premières méthodes pour résoudre une équation du second degré sont géométriques. Même sans connaître les rudiments d'algèbre, il est possible de résoudre des équations du second degré. Les Grecs utilisaient la méthode suivante[12], pour résoudre ce qu'en langage contemporain on formaliserait par l'équation :

x^2 + 10x = 39.

On considère que les deux termes, de droite et de gauche désignent des surfaces. Le terme x2 désigne l'aire d'un carré de côté x et 10.x désigne l'aire de deux rectangles de côtés 5 et x. On organise le carré et les deux rectangles de la manière indiquée sur la figure de droite, les deux rectangles sont dessinés en gris et le carré correspond au plus petit des deux et contenant le symbole x2 en son milieu.

Cette surface, que l'on appelle un gnomon prend la forme d'un carré si l'on y ajoute un nouveau carré de côté 5, car on obtient alors un carré plus vaste, contenant à la fois les deux rectangles et le carré de côté x. Le carré de côté x et les deux rectangles possèdent une aire de 39, on a ajouté un carré d'aire 25, on obtient un grand carré d'aire 64. En termes algébriques, cette considération graphique s'écrit :

x^2 + 10x + 25 = 64.

Le grand carré est d'aire 64, son côté est donc de longueur 8. Or ce côté est, par construction, égal à 5 + x. En termes algébriques, cela revient à appliquer une identité remarquable, on obtient :

(x + 5)^2 = 64.

On en déduit la solution x = 3. L'algèbre propose aussi une autre solution : –13. Pour les Grecs, cette autre solution n'a aucun sens, x représente le côté d'un carré, c'est-à-dire une longueur. Or une longueur est toujours positive.

D'autres solutions géométriques sont proposées dans les articles Inconnue (mathématiques) et Nombre d'or.

Par les relations entre coefficients et racines[modifier | modifier le code]

Une autre méthode, à l'aide des relations entre les coefficients et les racines, permet de trouver les solutions. On suppose que l'équation admet un discriminant positif et on note s la somme des solutions et p leur produit. En divisant l'équation par le facteur a, qui n'est pas nul par définition, on obtient l'expression :

x^2 - sx + p=0.

Soit m la valeur moyenne des deux solutions, c'est-à-dire l'abscisse de l'extremum de la parabole. Si h est la demi-distance entre les solutions et si x1 et x2 désignent les deux racines, on obtient les égalités :

x_1 = m + h \quad\text{et}\quad x_2 = m -h.

La somme des deux racines est égale à s et aussi à 2.m, ce qui donne la valeur de m = s/2. Le produit des deux racines et une identité remarquable montrent que m2 – h2 = p. Une autre manière d'écrire cette égalité est h2 = m2 – p. Comme le discriminant est positif par hypothèse, le terme de droite est positif. On obtient h, puis les valeurs des racines :

x_1 = \frac {s + \sqrt{s^2 - 4p}}2 \quad\text{et}\quad x_2 = \frac {s - \sqrt{s^2 - 4p}}2.

En remplaçant s et p par leurs valeurs, calculées à l'aide des relations entre les coefficients et les racines, on retrouve les formules classiques.

Résolution dans l'ensemble des nombres complexes[modifier | modifier le code]

Lorsque le discriminant de l'équation du second degré est négatif, celle-ci ne possède pas de solution dans l'ensemble des réels, car il n'est pas possible de prendre la racine carrée d'un nombre négatif. Mais dans un ensemble spécialement construit à cet effet[13], l'ensemble des nombres complexes, il existe des nombres dont le carré est négatif. L'équation du second degré y admet alors des solutions. La question se pose ensuite de savoir si les équations du second degré dont les coefficients sont complexes admettent elles aussi des solutions et sous quelle forme.

Exemple[modifier | modifier le code]

Article détaillé : Nombre complexe.

Considérons l'équation suivante :

x^2 + x + 1 = 0.

Sous sa forme canonique, l'équation s'écrit :

x^2 + 2\frac 12 x + \frac 14 + \frac 34 = \left(x+\frac 12\right)^2 + \left(\frac {\sqrt3}2\right)^2 = 0.

La partie gauche de l'équation est la somme de deux carrés, dont l'un est strictement positif, il ne peut donc exister de solution dans les nombres réels. Une autre manière d'en prendre conscience est de calculer le discriminant, ici égal à –3.

Si i désigne l'unité imaginaire, il est possible d'écrire 3/4 comme l'opposé d'un carré, cet usage lève l'impossibilité, l'équation s'écrit :

\left(x+\frac 12\right)^2 - \left(\frac {{\rm i}\sqrt 3}2\right)^2 = 0.

Les identités remarquables s'appliquent tout autant dans C, le corps des nombres complexes, que dans R celui des nombres réels, comme dans tout anneau commutatif. On en déduit une nouvelle écriture de l'équation, car la différence entre deux carrés est factorisable :

\left(x + \frac 12 + \frac {{\rm i}\sqrt 3}2\right)\left(x + \frac 12 - \frac {{\rm i}\sqrt 3}2\right) = 0.

Ce qui permet d'en déduire les deux solutions :

x_1 = \frac {-1 + {\rm i}\sqrt 3}2\quad\text{et}\quad x_2 = \frac {-1 - {\rm i}\sqrt 3}2.

Les deux solutions sont dites conjugués c'est-à-dire que leurs parties réelles sont égales et leurs parties imaginaires opposées. Cette propriété n'est vraie que dans le cas d'une équation quadratique à coefficients réels.

Coefficients réels et discriminant strictement négatif[modifier | modifier le code]

La méthode utilisée pour l'exemple s'applique de la même manière pour le cas général, si les coefficients sont réels et le discriminant strictement négatif. L'équation s'écrit sous sa forme canonique :

a\left(\left(x + \frac b{2a}\right)^2 - \left(\frac {{\rm i}|\Delta|}{2a}\right)^2\right)=0.

Les symboles |Δ| désignent la valeur absolue du discriminant. On obtient le résultat suivant :

Coefficients réels et discriminant négatif —  Si le discriminant est strictement négatif, l'équation admet deux solutions conjuguées x1 et x2, qui s'écrivent :

x_1 = \frac {-b +{\rm i}\sqrt{|\Delta|}}{2a}\quad\text{et}\quad x_2 = \frac {-b -{\rm i}\sqrt{|\Delta|}}{2a}.

Équation z2 = α[modifier | modifier le code]

Traiter le cas général d'une équation du second degré à coefficients complexes demande l'extraction d'une racine. Cela revient à résoudre le cas particulier d'une équation de la forme z2 = α où α est un nombre complexe, ou encore à trouver une valeur β tel que β2 = α. On note z = x + iy, α = a + ib et |α| désigne le module de α. L'équation s'écrit encore :

z^2 = (x + {\rm i}y)^2 = (x^2 - y^2) +{\rm i}2xy = a+{\rm i}b\quad\text{et}\quad x^2 - y^2 = a,\; 2xy = b.

Le carré du module de z est égal au module de α, on en déduit :

x^2 - y^2 = a,\; x^2 + y^2 = |\alpha| =\sqrt {a^2 + b^2}\quad\text{donc}\quad x = \pm \sqrt {\frac 12(a + \sqrt {a^2 + b^2})},\quad y = \pm \sqrt {\frac 12(-a + \sqrt {a^2 + b^2})}.

L'égalité 2xy = b montre que les seules racines de l'équation sont les valeurs β1 et β2 définies par, si ε désigne le signe de b.

\beta_1 = \sqrt {\frac 12(a + \sqrt {a^2 + b^2})} + \varepsilon {\rm i} \sqrt {\frac 12(-a+\sqrt {a^2 + b^2})},\quad \beta_2 = - \beta_1.

Un rapide calcul montre que ces deux valeurs vérifient bien β2 = α.

Cas général[modifier | modifier le code]

On suppose maintenant que a, b et c sont trois nombres complexes tels que a soit non nul. Il est toujours possible d'écrire l'équation de l'article sous la forme canonique, car les transformations utilisées sont tout aussi valables sur les nombres complexes. En simplifiant par a, l'équation est équivalente à :

\left(x + \frac b{2a}\right)^2 - \frac {\Delta}{4a^2} = 0\quad\text{avec}\quad \Delta = b^2 - 4ac.

Soit δ une racine carrée du discriminant, le premier paragraphe montre qu'une telle valeur existe toujours. L'équation s'écrit encore :

\left(x + \frac b{2a}\right)^2 - \left(\frac {\delta}{2a}\right)^2 = 0\quad\text{avec}\quad \delta^2 = \Delta

L'identité remarquable traitant de la différence de deux carrés permet encore d'écrire dans l'ensemble des nombres complexes :

\left(x + \frac b{2a} + \frac {\delta}{2a}\right)\left(x + \frac b{2a} - \frac {\delta}{2a}\right) = 0.

Ce qui permet d'énoncer le résultat :

Cas des coefficients complexes — Une équation du second degré à coefficients dans les nombres complexes admet deux solutions z1 et z2. Si le discriminant est nul, les deux solutions sont confondues. Dans le cas général, les solutions s'écrivent :

z_1 = \frac {-b + \delta}{2a},\;z_2 = \frac {-b - \delta}{2a}\quad\text{avec}\quad \delta^2 = \Delta = b^2 -4ac.

Remarque : Les solutions d'une équation du second degré à coefficients complexes sont en général deux nombres complexes qui ne sont pas conjugués, contrairement au cas d'une équation du second degré à coefficients réels dont le discriminant est strictement négatif.

Calcul numérique[modifier | modifier le code]

Une mise en informatique « naïve » de la méthode de résolution peut mener à des résultats de précision médiocre dans certains cas.

Dans un ordinateur, la précision des nombres est limitée par le mode de représentation. Si l'on utilise la double précision selon la norme IEEE 754, la valeur absolue des nombres est limitée à environ [10–307 ; 10308].

Erreur d'arrondi[modifier | modifier le code]

Lorsque Δ > 0, le calcul de  \dfrac{-b + \sgn(b)\sqrt{\Delta}}{2a} où sgn(b) est le signe de b, conduit à calculer la différence des deux nombres Δ et |b|. Si ce calcul est fait numériquement, cela entraîne une perte de précision, surtout lorsque Δ est très proche de |b|, c'est-à-dire quand 4ac est petit par rapport à b2. On parle alors d'algorithme de calcul numériquement instable.

Michaël Baudin[14] propose l'exemple suivant :

\varepsilon x^2 + (1/\varepsilon) x - \varepsilon.

Lorsque ε (positif) tend vers 0, on est bien dans le cas où Δ = 1/ε2 + 4ε2 ≈ 1/ε2 = b2. Le comportement asymptotique des racines est

x1 ≈ 1/ε2
x2 ≈ ε2

mais l'erreur de troncature donne des erreurs importantes par rapport à ces valeurs attendues.

Press et coll[15]. recommande le calcul de la valeur intermédiaire

q = - \frac{b + \sgn(b)\sqrt{\Delta}}{2}

ce qui permet d'obtenir les racines

x_1 = \frac{q}{a} \text{ ; } x_2 = \frac{c}q.

Remarquons que comme le coefficient b est réputé grand (tout du moins devant ac), on peut encore gagner en précision en utilisant le discriminant réduit :

b' = b/2 \text{ ; } \Delta' = b'^2 - ac \text{ ; } q' = - (b' + \sgn(b')\sqrt{\Delta'})
x_1 = \frac{q'}{a} \text{ ; } x_2 = \frac{c}{q'}.

Une manière équivalente[16] consiste à calculer d'abord la racine ayant un signe effectif « + »

 x_1=\dfrac{-b - \sgn(b)\sqrt{\Delta}}{2a},

proche de -b/a, et d'utiliser la propriété sur le produit des racines pour déterminer l'autre racine à l'aide de l'égalité

 x_2=\frac c{ax_1}.

Ce nouvel algorithme est dit numériquement stable, car aucune erreur n'est amplifiée par une des étapes du calcul.

Dépassement[modifier | modifier le code]

Lorsque |b| prend des valeurs importantes, le calcul de b2, pour le discriminant, risque de créer une erreur de dépassement (si b2 > 10308). On peut prendre par exemple[14]

x^2 + (1/\varepsilon) x + 1.

Lorsque ε (positif) tend vers 0, le comportement asymptotique des racines est

x1 ≈ –1/ε
x2 ≈ –ε

Mais alors que la valeur finale de x1 est représentable (–10308 < –1/ε), le calcul du discriminant provoque une erreur de dépassement.

Là encore, on a intérêt à utiliser le discriminant réduit : b'2 = b2/4, ce qui réduit d'un facteur quatre le risque de dépassement.

On peut ensuite factoriser de manière intelligente le calcul du discriminant. Si |b' | est grand devant |a| ou bien devant |c| (et non nul), on peut écrire :

\Delta' = b'^2 \left( 1 - \frac{ac}{b'^2} \right) = b'^2 \left( 1 - \frac{a}{b'} \frac{c}{b'} \right) .

On définit alors

e = 1 - \frac{a}{b'}\frac{c}{b'}

qui diminue le risque d'erreur de dépassement, puisque soit |a/b' | < 1, soit |c/b' | < 1 ; puis

\sqrt{\Delta'} = \pm |b'| \sqrt{|e|}

et l'on n'élève donc pas b' au carré.

Si au contraire |c| > |b' | (non nul), on peut alors écrire

\Delta' = c \left ( b' \cdot \frac{b'}{c} - a \right ).

On définit alors

e = b' \cdot \frac{b'}{c} - a

dont le calcul diminue le risque d'erreur de dépassement, puisque |b'/c| < 1, et

\sqrt{\Delta'} = \pm \sqrt{| c |} \sqrt{|e|}.

Sensibilité aux petites variations[modifier | modifier le code]

Si l'on calcule les dérivées partielles des racines par rapport aux coefficients de l'équation (en supposant a ≠ 0 et Δ ≥ 0) :

\left \{ \begin{align}
\frac{\partial x_{1, 2}}{\partial a} =\ & \frac{c}{a \sqrt{\Delta}} + \frac{b \pm \sqrt{\Delta}}{2a^2} \\
\frac{\partial x_{1, 2}}{\partial b} =\ & \frac{-1 \pm b/\sqrt{\Delta}}{2a} \\
\frac{\partial x_{1, 2}}{\partial c} =\ & \pm \frac{1}{\sqrt{\Delta}}
\end{align} \right .

on voit que si a ou Δ sont proches de 0, alors les dérivées partielles sont très grandes, ce qui signifie qu'une petite variation sur les coefficients entraîne une grande variation de la valeur des racines. Dans de telles conditions, une petite erreur de troncature peut entraîner une grande erreur sur le résultat.

Si le discriminant est nul, on retrouve le même problème lorsque a est proche de zéro :

\left \{ \begin{align}
\frac{\partial x_{1, 2}}{\partial a} =\ & \frac{b}{2a^2} \\
\frac{\partial x_{1, 2}}{\partial b} =\ & \frac{-1}{2a} \\
\frac{\partial x_{1, 2}}{\partial c} =\ & 0.
\end{align} \right .

Dans les deux cas, on a un problème dit « mal conditionné ».

Algorithme itératif[modifier | modifier le code]

Une manière d'éviter les problèmes sus-cités consiste à utiliser un algorithme itératif, par exemple l'algorithme de Jenkins-Traub (en) qui permet d'obtenir les racines d'un polynôme P quelconque.

Si l'on connaît la première racine x1, alors P peut s'écrire

P(x) = (x – x1)H

où H est un polynôme de degré inférieur de 1 à P — dans le cas présent, on a H(x) = a(x – x2), voir la section Forme réduite. L'algorithme recherche cette première racine en utilisant une suite de polynômes (Hi) approchant H. Cette suit est construite de manière récursive :

\left \{ \begin{align}
\mathrm{H}_0(x) =\ & \mathrm{P}'(0) \\
(x - s_i) \cdot \mathrm{H}_{i + 1}(x) \equiv\ & \mathrm{H}_i(x) \mod(\mathrm{P}(x))
\end{align} \right .

où (si) est une suite de nombres.

La première étape consiste à calculer les cinq premiers termes, H0 à H4, avec une suite nulle (s0 = … = s4 = 0). Cela donne un ordre de grandeur de la racine la plus petite et permet éventuellement de normaliser les coefficients de l'équation si cette valeur est trop grande ou trop petite. On évite ainsi les problèmes de dépassement ou de soupassement.

La deuxième étape consiste à calculer les neuf premiers termes en prenant une suite uniforme. Il s'agit d'une valeur complexe dont l'argument est pris au hasard (φ = rand), et dont l'affixe R est la solution de l'équation

R2 + |b|R = c

que l'on peut trouver de manière simple (par exemple avec la méthode de Newton-Raphson), la fonction de gauche étant monotone et convexe. On prend donc

s = Re

et si la méthode ne converge pas, on choisit un autre argument.

La troisième étape consiste à calculer les termes de rang supérieurs à 10 en utilisant la raison :

s_{i + 1} = s_i + \frac{\mathrm{P}(s_i)}{\overline{\mathrm{H}}_i(s_i)}

H est le coefficient H normalisé, c'est-à-dire que ses coefficients sont divisés par le coefficient du degré le plus élevé.

Cet algorithme présente des similitudes avec Newton-Raphson, les polynômes Hi jouant le rôle des dérivées.

Cet algorithme peut être adapté si le coefficients de l'équation sont réels ; il est alors plus rapide et plus stable.

Notes et références[modifier | modifier le code]

Notes[modifier | modifier le code]

  1. L'équation qu'il définit n'est pas l'objet de cet article, mais de celui intitulé Équation du premier degré.
  2. voir l'article Équation produit-nul.

Références[modifier | modifier le code]

  1. Høyrup 2010, p. 39.
  2. Caveing 1994, p. 21.
  3. Cet exemple est présenté dans : le nombre d'or avec GéoPlan par P. Debart de l'Académie d'Aix Marseille.
  4. a et b V. & F. Bayart Étude du trinôme du second degré par le site bibmath.net.
  5. On trouve cette définition dans le site : Discriminant par Euler, un site de l'Académie de Versailles.
  6. Équation du second degré dans R par Euler, un site de l'Académie de Versailles.
  7. Ce paragraphe est explicité dans le site : Signe d'une fonction trinôme du second degré par Euler, un site de l'Académie de Versailles.
  8. a et b C. Rossignol, Polynômes du second degré sur le site de l'académie de Grenoble, 2008, p. 2.
  9. a, b et c Cet exemple s'inspire du site déjà cité : C. Rossignol, Polynômes du second degré, p. 2.
  10. Si une unique racine existe et vaut α on dit néanmoins qu'il existe deux racines x1 = x2 = α. On parle alors de racine double. Cette convention possède plusieurs intérêts, entre autres celui d'éviter un cas particulier, par exemple dans le contexte de ce paragraphe.
  11. Il provient d'un exercice de terminale de P. Amposta : Gammes, du site « mathématiques au lycée ».
  12. Pour plus de détails, voir : A. Dahan-Dalmedico et J. Peiffer (lb), Une histoire des mathématiques – Routes et dédales,‎ 1986 [détail des éditions] p. 62.
  13. Dominique Flament, Histoire des nombres complexes (ISBN 2-271-06128-8).
  14. a et b [(en) Scilab is not naive], Consortium Scilab.
  15. (en) W.H. Press, Saul A. Teukolsky, William T. Vetterling et Brian P. Flannery, « 5. Quadratic and Cubic Equations : 5.6 », dans Numerical Recipes in C, Cambridge University Press,‎ 1992.
  16. Michel Pignat et Jean Vignès, Ingénierie du contrôle de la précision des calculs sur ordinateur.

Voir aussi[modifier | modifier le code]

Sur les autres projets Wikimedia :

Article connexe[modifier | modifier le code]

Forme quadratique

Bibliographie[modifier | modifier le code]

  • J. Merker, Du trinôme du second degré à la théorie de Galois, Presses universitaires de Franche-Comté (2007) (ISBN 2848672056)
  • Maurice Caveing, Essai sur le savoir mathématique dans la Mésopotamie et l'Égypte anciennes, Presses Univ. Septentrion,‎ 1994, 417 p. (ISBN 285939415X)
  • Jens Høyrup, L'algèbre au temps de Babylone, Vuibert/Adapt, coll. « Inflexions »,‎ août 2010, 162 p. (ISBN 9782356560162)