Virgule flottante

Un article de Wikipédia, l'encyclopédie libre.
Aller à : Navigation, rechercher

Les nombres à virgule flottante sont les nombres les plus souvent utilisés dans un ordinateur pour représenter des valeurs non entières. Ce sont des approximations de nombres réels.

Les nombres à virgule flottante possèdent un signe s (dans {-1, 1}), une mantisse m (aussi appelée significande) et un exposant e. Un tel triplet représente un réel s.m.beb est la base de représentation (généralement 2 sur ordinateur, mais aussi 16 sur certaines anciennes machines, 10 sur de nombreuses calculatrices, ou éventuellement toute autre valeur). En faisant varier e, on fait « flotter » la virgule décimale. Généralement, m est d'une taille fixée.

Ceci s'oppose à la représentation dite en virgule fixe, où l'exposant e est fixé.

Le terme "virgule flottante" vient donc du fait que la virgule peut être placée n'importe où dans un nombre donné, en fonction du nombre de chiffres significatifs désiré. La position de la virgule est indiquée séparément dans la représentation interne, les nombres en virgule flottante peuvent ainsi être vus comme l'équivalent informatique de la notation scientifique.

L'avantage de la représentation en virgule flottante par rapport à la virgule fixe ou à l'entier, est que la virgule flottante est capable de gérer un bien plus grand nombre de valeurs. Par exemple, une représentation en virgule fixe qui a sept chiffres décimaux et fixée à deux chiffres après la virgule peut représenter les nombres 12345.67, 123.45, 1.23, etc. La représentation en virgule flottante (comme le format IEEE 754 decimal32) peut quant à elle, avec sept chiffres décimaux, représenter en plus 1.234567, 123456.7, 0.00001234567, 1234567000000000, etc.

En revanche, le format à virgule flottante occupe un peu plus de place, car il est nécessaire d'encoder la position de la virgule. Pour le même espace disponible, la virgule flottante offre donc une étendue de nombres plus grande au détriment de la précision. Si l'on souhaite mettre l'accent sur la précision, il faudra donc utiliser des nombres à virgule fixe.

La vitesse des opérations en virgule flottante, communément appelées FLOPS dans les mesures de performances, est une caractéristique importante des machines, en particulier dans les logiciels qui effectuent des calculs mathématiques à grande échelle.

Au cours des ans, un certain nombre de représentations à virgule flottante a vu le jour, ce qui constituait un frein au portage des programmes de calcul scientifique d'une machine à l'autre, en raison des différences de représentations internes et de comportement des nombres flottants. Pour cette raison, une norme a finalement été mise en place par l'IEEE : IEEE 754.


Sommaire

[modifier] Mises en œuvre

[modifier] Norme IEEE 754

Article détaillé : IEEE 754.

La norme IEEE 754 (reprise par la norme internationale CEI 60559) spécifie deux formats de nombres en virgule flottante (et deux formats étendus optionnels) et les opérations associées. La quasi-totalité des architectures d'ordinateurs actuelles, y compris IA32, PowerPC, et AMD64, incluent une implémentation matérielle des calculs sur flottants IEEE, directement dans le microprocesseur, garantissant une exécution rapide.

Les deux formats fixés par la norme IEEE 754 sont sur 32 bits (« simple précision ») et 64 bits (« double précision »). La répartition des bits est la suivante, où 1 ≤ M < 2 :

  Encodage Signe Exposant Mantisse Valeur d'un nombre Précision Chiffres significatifs
Simple précision 32 bits 1 bit 8 bits 23 bits (-1)^S \times M \times 2^{(E-127)} 24 bits 7
Double précision 64 bits 1 bit 11 bits 52 bits (-1)^S \times M \times 2^{(E-1023)} 53 bits 16

Le tableau ci-dessus indique les bits représentés. Le premier bit de la mantisse d'un nombre normalisé étant toujours 1, il n'est représenté dans aucun de ces deux formats : on parle de bit implicite. Pour ces deux formats, les précisions sont donc respectivement de 24 et de 53 bits.

[modifier] Flottants étendus

Certaines implémentations ajoutent un ou plusieurs types de précision supérieure (ainsi, IA32 a un type étendu sur 80 bits). La norme IEEE 754 prévoit des tailles minimales pour ces types étendus :

  Signe Exposant Mantisse
Simple précision étendue 1 bit 11 bits ou plus 32 bits ou plus
Double précision étendue 1 bit 15 bits ou plus 64 bits ou plus

Ces représentations « étendues » n'utilisent pas forcément le bit implicite de la mantisse.

Dans la pratique, seule la double précision étendue est encore utilisée, dans sa forme minimale (1+15+64 = 80 bits, le fameux type étendu de l'IA32).

Lorsque les flottants IEEE offrent une précision insuffisante, on peut devoir recourir à des calculs sur des flottants en précision supérieure. Citons notamment la bibliothèque MPFR.

[modifier] Précautions d'emploi

Les calculs en virgule flottante sont pratiques, mais présentent divers désagréments, notamment :

  • leur précision limitée, qui se traduit par des arrondis (dus aux opérations, ainsi qu'aux changements de base implicites, si la base est différente de 10) qui peuvent s'accumuler de façon gênante. Pour cette raison, les travaux de comptabilité ne sont pas effectués en virgule flottante, car tout doit tomber juste au centième près. En particulier, la soustraction de deux nombres très proches provoque une grande perte de précision relative : on parle de « cancellation ».
  • une plage d'exposants limitée, pouvant donner lieux à des « overflows » (lorsque le résultat d'une opération est plus grand que la plus grande valeur représentable) et à des « underflows » (lorsqu'un résultat est plus petit, en valeur absolue, que le plus petit flottant normalisé positif), puis à des résultats n'ayant plus aucun sens.

Il est par exemple tentant de réorganiser des expressions en virgule flottante comme on le ferait d'expressions mathématiques. Cela n'est cependant pas anodin, car les calculs en virgule flottante, contrairement aux calculs sur les réels, ne sont pas associatifs. Par exemple, dans un calcul en flottants IEEE double précision, (260+1)-260 ne donne pas 1, mais 0. La raison est que 260+1 n'est pas représentable exactement et est approché par 260.

Une valeur particulière du champ d'exposant est réservée à la représentation de valeurs spéciales :

  • NaN (« not a number »), qui sera par exemple le résultat de la tentative de division flottante de zéro par zéro, ou de la racine carrée d'un nombre strictement négatif. Les NaN se propagent : la plupart des opérations faisant intervenir un NaN donnent NaN (des exceptions sont possibles, comme NaN puissance 0, qui peut donner 1).
  • Un infini positif et un infini négatif, qui sont par exemple le résultat d'un « overflow » en arrondi au plus près.

Une autre valeur du champ d'exposant est réservée aux zéros (signés) et aux dénormalisés.

[modifier] Voir aussi

[modifier] Articles connexes

[modifier] Liens externes

Outils personnels
Espaces de noms
Variantes
Actions
Navigation
Contribuer
Imprimer / exporter
Boîte à outils
Autres langues