Fermi (architecture de carte graphique)

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Page d'aide sur l'homonymie Pour les articles homonymes, voir Fermi.

Fermi est le nom de code d'une architecture de carte graphique de la société NVidia[1]. Les premières cartes, gravées en 40 nm, sont sorties en mars 2010[2] et comportent plus de 3 milliards de transistors, soit plus qu'un micro-processeur courant. Certaines GeForce M disposent de processeurs gravés en 28 nm au lieu de 40 nm[3].

Historique[modifier | modifier le code]

  • Mars 2010, NVidia sort la GTX 480, la première carte graphique à utiliser l'architecture Fermi avec le GF 100. Même si la carte est la plus puissante du moment elle souffre d'une surconsommation, de températures très élevées, tout en étant bruyante. À cause de ces inconvénients un des SM est désactivé.
  • Novembre 2010, sortie de la GTX 580, par rapport au GF 100 de la GTX 480, son GF 110 dispose des 16 SM de Fermi, et de petites améliorations permettent de réduire un peu la consommation, et l'utilisation d'un refroidissement amélioré réduit les nuisances sonores.
  • Mars 2011, lancement de la GTX 590, une carte bi-GPU qui utilise deux GF 110. C'est la plus puissante carte utilisant l'architecture Fermi.
  • Avril 2012, arrêt de la fabrication des GTX 580 et abandon de l'architecture Fermi.

Architecture[modifier | modifier le code]

On retrouve une puce gravée en 40 nm organisée selon quatre GPC. Chaque GPC contient quatre SM qui contiennent diverses unités spécialisées (comme les unités de ROP ou de texture, par exemple). Une puce contient 48 unités de ROP. Pour soutenir les SM, la puce propose deux niveaux de mémoire cache auxquels il faut ajouter la quantité de GDDR5[4].

Le GPC[modifier | modifier le code]

Le GPC ou Graphics Processing Cluster est l’équivalent d'un cœur d'un microprocesseur sauf qu'il est dépourvu de mémoire cache, il est constitué de quatre SM.

Le SM[modifier | modifier le code]

Un SM peut contenir jusqu'à 32 cœurs CUDA et quatre unités de textures dans la version la plus évoluée, ainsi que le premier niveau de mémoire cache. Chaque SM se dote d'un double scheduler. Le scheduler est une sorte de chef de gare qui va agencer et distribuer le travail en fonction de la charge et des unités disponibles. Chaque scheduler peut envoyer une instruction à 16 processeurs CUDA à chaque cycle d'horloge. Le SM utilise le système de double cadencement qui multiplie par deux la fréquence des cœurs CUDA.

GPU utilisant l'architecture Fermi[modifier | modifier le code]

  • GF 100 : il est utilisé dans les GTX 480
  • GF 104 : il est utilisé dans les GTX 460
  • GF 110 : il est utilisé dans les GTX 560 Ti 448 Core, les GTX 570, les GTX 580 et les GTX 590
  • GF 114 : il est utilisé dans les GTX 560 Ti et les GTX 560
  • GF 116 : il est utilisé dans les GTX 550 Ti, GeForce GT 640
  • GF 118 : il est utilisé dans les GT 530
  • GF 119 : il est utilisé dans les GT 520[5], GeForce 605, GeForce GT 610, GeForce GT 620
  • GF 117 : gravure 28 nm[6]
Modèles GeForce GT430 GeForce GT440 GeForce GTS450 GeForce GTX460 SE GeForce GTX460 768 Mo GeForce GTX460 1 Go GeForce GTX460 v2 GeForce GTX465 GeForce GTX470 GeForce GTX480
processeur GF108-400-A1 GF108-400-A1 GF106-450-A1 GF104-225-A1 GF104-300-A1 GF104-300-A1 GF114-375-A1 GF100-200-A1 GF100-275-A1 GF100-375-A1
Aire du die 116 mm2 116 mm2 238 mm2 332 mm2 332 mm2 332 mm2 332 mm2 529 mm2 529 mm2 529 mm2
Gravure 40 nm 40 nm 40 nm 40 nm 40 nm 40 nm 40 nm 40 nm 40 nm 40 nm
Transistors 585 millions 585 millions 1,17 milliards 1,95 milliards 1,95 milliards 1,95 milliards 1,95 milliards 3,00 milliards 3,00 milliards 3,00 milliards
Mémoire 1 024 Mo 1 024 Mo 1 024 Mo 1 024 Mo 768 Mo 1 024 Mo 1 024 Mo 1 024 Mo 1 280 Mo 1 536 Mo
Type de mémoire GDDR5 GDDR5 GDDR5 GDDR5 GDDR5 GDDR5 GDDR5 GDDR5 GDDR5 GDDR5
Vitesse mémoire 1300 MHz 800 MHz 902 MHz 900 MHz 900 MHz 900 MHz 1002 MHz 802 MHz 848 MHz 924 MHz
Largeur de bus 128 bits 128 bits 128 bits 256 bits 192 bits 256 bits 192 bits 256 bits 320 bits 384 bits
Bande passante 12.80 GB/s 28.80 GB/s 57.70 GB/s 108.80 GB/s 86.00 GB/s 115.20 GB/s 96.20 GB/s 102.50 GB/s 133.90 GB/s 177.40 GB/s
Fréquence GPU 700 MHz 810 MHz 783 MHz 650 MHz 675 MHz 675 MHz 778 MHz 607 MHz 607 MHz 700 MHz
Fréquence Streams processors 1400 MHz 1620 MHz 1566 MHz 1300 MHz 1350 MHz 1350 MHz 1556 MHz 1215 MHz 1215 MHz 1401 MHz
Streams processors 96 96 192 288 336 336 336 352 448 480
Unités TMU 16 16 32 48 56 56 56 44 56 60
Unités ROP 4 4 8 32 24 32 32 32 40 48
Filtrage Pixels 2.800 GP/s 3.240 GP/s 12.530 GP/s 20.800 GP/s 16.200 GP/s 21.600 GP/s 18.670 GP/s 19.420 GP/s 24.280 GP/s 33.600 GP/s
Filtrage Textures 11.200 GT/s 12.960 GT/s 25.060 GT/s 31.200 GT/s 37.800 GT/s 37.800 GT/s 43.570 GT/s 26.710 GT/s 34.000 GT/s 42.000 GT/s
Calcul FP32 269 GFLOP/s 311 GFLOP/s 601 GFLOP/s 749 GFLOP/s 907 GFLOP/s 907 GFLOP/s 1046 GFLOP/s 855 GFLOP/s 1089 GFLOP/s 1345 GFLOP/s
Calcul FP64 - - 240 GFLOP/s 300 GFLOP/s 363 GFLOP/s 363 GFLOP/s 418 GFLOP/s 342 GFLOP/s 436 GFLOP/s 538 GFLOP/s
Consommation 49 watts 65 watts 106 watts 150 watts 150 watts 160 watts 160 watts 200 watts 215 watts 250 watts
Date de sortie
Prix actuel

Nouvelles gammes[modifier | modifier le code]

Selon la roadmap de Nvidia, les nouvelles gammes de carte se nomment respectivement Kepler et Maxwell [7]. Les gains en performance annoncés par le constructeur entre chaque gamme sont :

  • 4-6 GFlops par watt en double précision pour Kepler
  • 15-16 GFlops par watt en double précision pour Maxwell.

L'architecture Maxwell était attendue pour 2013 mais elle ne sera pas utilisée avant 2014[8].

Article connexe[modifier | modifier le code]

Références[modifier | modifier le code]

  1. http://www.nvidia.fr/content/PDF/fermi_white_papers/NVIDIA_Fermi_Compute_Architecture_Whitepaper.pdf [PDF]
  2. date de sortie sur le site Zdnet
  3. Article sur les GeForces 6xxM
  4. [1]
  5. GeForce
  6. [2]
  7. http://www.vizworld.com/2010/09/nvidia-product-roadmap-fermi-kepler-maxwell/
  8. http://www.hardware.fr/news/11703/nvidia-kepler-maxwell-2012-2014.html