Kepler (architecture de carte graphique)

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

L'architecture Kepler a été développée par NVidia pour ses cartes graphiques. Elle est censée doubler les performances par Watt par rapport à Fermi, l'architecture précédente, ce qui permet de l'utiliser dans des cartes graphiques mobiles. La première carte graphique utilisant cette architecture est la GTX 680, utilisant le processeur graphique GK 104.

Historique[modifier | modifier le code]

  • Mars 2012 : sortie de la GTX 680, première carte graphique à utiliser l'architecture Kepler
  • Mai 2012 : sortie de la GTX 690, première carte graphique utilisant deux puces Kepler
  • Novembre 2012 : sortie des Tesla K20 et K20X, premières cartes à utiliser le GK 110
  • Février 2013 : sortie de la GeForce Titan, première carte graphique grand public à utiliser le GK 110
  • Mai 2013 : Sortie de la Geforce GTX 780
  • Novembre 2013: Sortie de la GeForce GTX 780 Ti, première carte grand public à utiliser un GK 110 complet.
  • Février 2014 : Sortie de la GeForce GTX Titan Black Edition, évolution de la GTX Titan avec toutes ses unités de calculs actives.
  • Mai 2014 : Sortie de la GeForce GTX Titan Z, première carte graphique à utiliser deux GK 110 complets.

Architecture[modifier | modifier le code]

Elle reprend à peu près l'architecture Fermi, c'est donc une puce divisée en plusieurs GPC ou Graphics Processing Cluster qui sont les équivalents d'un cœur de microprocesseur sauf qu'ils sont dépourvus de mémoire cache, ils sont constitués d'un, deux ou trois SMX et ils contiennent 8 unités de ROP. Pour soutenir les cœurs CUDA, qui sont les unités de calculs, la puce propose deux niveaux de mémoire cache (L1 et L2). La puce est dotée de 512 Ko de mémoire cache L2, avec un débit revu à la hausse par rapport à Fermi[1].

Un SMX, est la grande nouveauté introduite par Kepler, c'est le remplaçant des SM de Fermi. Il peut contenir jusqu'à 192 cœurs CUDA, ou unités de calculs, dans la version la plus évoluée contre 32 cœurs CUDA avec les SM de Fermi. Par contre, le SMX abandonne le système de double cadencement de Fermi qui multipliait par deux la fréquence SM et donc des unités de calculs. Chaque SMX dispose de 64 ko de mémoire partagée et 16 unités de textures[2],[3].

GPU Boost[modifier | modifier le code]

NVidia profite de Kepler pour introduire le « GPU Boost » qui augmente la fréquence du processeur en fonction de sa consommation et de sa température, qui sont directement mesurées sur la carte. Le gain peut atteindre plusieurs dizaines de MHz. Avec la GeForce Titan, Nvidia utilise le nom « GPU Boost 2.0 », dont le seul changement est que la température remplace la consommation comme facteur limitant[4],[5].

Liste des processeurs et des cartes graphiques utilisant Kepler[modifier | modifier le code]

L'architecture Kepler est utilisée dans plusieurs GPU :

  • le GK 104, qui est utilisé dans les GTX 680, GTX 690, GTX 670, GTX 660, GTX 660ti, GTX 760, GTX 770 et Tesla K10[6];
  • le GK 106, qui est utilisé dans les GTX 660, il est composé de 5 SMX;
  • le GK 107, qui est utilisé dans les cartes mobiles de NVidia, ainsi que dans les cartes entré de gamme, à partir de la GT 640 ;
  • le GK 110, qui a 15 SMX plus puissants et 1,5 Mo de mémoire cache, il est utilisé dans les Tesla K20, GeForce Titan, GeForce GTX 780 et GeForce GTX 780 Ti

En 2013, les puces Kepler sont toutes gravées en 28 nm.

Sous la marque GeForce[modifier | modifier le code]

Cette section ne cite pas suffisamment ses sources (mai 2013). Pour l'améliorer, ajouter en note des références vérifiables ou les modèles {{Référence nécessaire}} ou {{Référence souhaitée}} sur les passages nécessitant une source.

Elles fonctionnent toutes avec DirectX 11.0[7], OpenGL 4.3, OpenCL 1.2, et le PCI-Express 16x 3.0.

Modèles GeForce GT 640 (A2) GeForce GT 640 (DDR3) GeForce GT 640 (DDR5) GeForce GTX 650 GeForce GTX 650Ti GeForce GTX 650Ti Boost GeForce GTX 660 GeForce GTX 660 OEM GeForce GTX 660Ti GeForce GTX 670 GeForce GTX 680 GeForce GTX 770 GeForce GTX 690 GeForce GTX 780 GeForce GTX Titan[8] GeForce GTX780 Ti
Finesse de gravure des processeurs 28nm
Code de la puce GK107 GK106 GK104 2× GK104 GK110
Surface de la puce 118mm² 221mm² 294mm² 2× 294mm² 569mm²
Transistors 1,3 G 2.54 G 3.54 G 2× 3,54 G 7,1 G
Fréquence 3D 797 MHz 900 MHz 950 MHz 1058 MHz 928 MHz 980 MHz 823 MHz 915 MHz 1006 MHz 1045 MHz 915 MHz 863 MHz 837 MHz 875 Mhz
Fréquence Turbo N/A N/A N/A N/A N/A 1032 MHz 888 MHZ 980 MHz 1006 MHz 1058 MHz 1084 MHz 1019 MHZ 902 MHz 876 MHz 928 Mhz
Fréquence TDP Headroom N/A N/A N/A N/A N/A 1110 MHz 927 MHz 1136 MHz 1084 MHz 1123 MHz 1136 MHz 1071 MHz 1006 MHz 1020 Mhz
Température maximale avec Turbo 94°C 94°C 80°C 80°C 80°C 80°C
Nombre de ROP 16 24 32 2× 32 48
TMU 32 64 80 96 112 128 2× 128 192 224 240
Nombre de coeurs Cuda 384 768 960 1152 1344 1536 2× 1536 2304 2688 2880
Nombre de FP32 320 640 800 912 1064 1216 2× 1216 1824 1344 2280
Nombre de FP64 - - - 48 56 64 2× 64 96 896 120
Nombre de SFU 64 128 160 192 224 256 2× 256 384 448 480
Nombre de GPC 1 2 3 4 2× 4 5
Nombre de SMX 2 4 5 6 7 8 2× 8 12 14 15
Enveloppe thermique 50 Watts 65 Watts 75 Watts 65 Watts 85 Watts 130 Watts 140 Watts 130 Watts 150 Watts 170 Watts 195 Watts 230 Watts 300 Watts 250 Watts 250 Watts 250 Watts
Type de mémoire DDR3 GDDR5
Capacité possible 1/2 Go 1 Go 1/2 Go 1 Go 1/2 Go 2 Go 1,5/3 Go 2/3 Go 2/4 Go 2× 2/4 Go 3 Go 6 Go 3 Go
Vitesse de la mémoire 1782 MHz 1250 MHz 1350 MHz 1500 MHz 1450 MHz 1500 MHz 1750 MHz 1500 MHz 1750 Mhz
Largeur du bus mémoire 128 bits 192 bits 256 bits 2× 256 bits 384 bits
Bande passante mémoire 28,5 Go/s 80 Go/s 86,4 Go/s 144,2 Go/s 134 Go/s 144,2 Go/s 192,3 Go/s 209 Go/s 250 Go/s 2× 192,3 Go/s 268 Go/s
Pixels Fillrate 12,8 Gpixels/s 14,4 Gpixels/s 15,2 Gpixels/s 16,9 Gpixels/s 14,8 Gpixels/s 23,5 Gpixels/s 19,8 Gpixels/s 21,9 Gpixels/s 29,3 Gpixels/s 32,2 Gpixels/s 2× 29,3 Gpixels/s 27,6 Gpixels/s 33,5 Gpixels/s 42,0 Gpixels/s
Turbo N/A N/A N/A N/A N/A 26,6 Gpixels/s 22,3 Gpixels/s 27,3 Gpixels/s 34,7 Gpixels/s 35,9 Gpixels/s 2× 34,3 Gpixels/s 40,2 Gpixels/s 40,2 Gpixels/s 44,54 Gpixels/s
Textures Fillrate 25,5 Gtexels/s 28,8 Gtexels/s 30,4 Gtexels/s 33,9 Gtexels/s 59,4 Gtexels/s 62,7 Gtexels/s 78,4 Gtexels/s 79 Gtexels/s 102,5 Gtexels/s 128,8 Gtexels/s 2× 117,1 Gtexels/s 166 Gtexels/s 187,5 Gtexels/s 210,0 Gtexels/s
Turbo N/A N/A N/A N/A N/A 71 Gpixels/s 88,8 Gpixels/s 89 Gpixels/s 127,2 Gpixels/s 121,4 Gpixels/s 143,7 Gpixels/s 2× 137,1 Gpixels/s 193 Gpixels/s 225,3 Gpixels/s 222,72 Gtexels/s
Filtrage Géométrique 797 Mtriangles/s 900 Mtriangles/s 950 Mtriangles/s 1058 Mtriangles/s 1856 Mtriangles/s 1960 Mtriangles/s 2450 Mtriangles/s 2469 Mtriangles/s 3203 Mtriangles/s 4024 Mtriangles/s 2× 3660 Mtriangles/s 5178 Mtriangles/s 5859 Mtriangles/s 5250 Mtriangles/s
Turbo N/A N/A N/A N/A N/A 2220 Mtriangles/s 2775 Mtriangles/s 2781 Mtriangles/s 3976 Mtriangles/s 3794 Mtriangles/s 4492 Mtriangles/s 2× 4284 Mtriangles/s 6036 Mtriangles/s 7042 Mtriangles/s 5555 Mtriangles/s
Calcul Simple Précision 612,1 Gflo/s 691,2 Gflo/s 729,6 Gflo/s 812,5 Gflo/s 1425,4 Gflo/s 1505,3 Gflo/s 1881,6 Gflo/s 1896,2 Gflo/s 2459,5 Gflo/s 3090,4 Gflo/s 2× 2810,9 Gflo/s 3977 Gflo/s 4500 Gflo/s  ?
Turbo N/A N/A N/A N/A N/A 1704,9 Gflo/s 2131,2 Gflo/s 2135,8 Gflo/s 3053,6 Gflo/s 2913,8 Gflo/s 3449,9 Gflo/s 2× 3290,1 Gflo/s 4636 Gflo/s 5408,3 Gflo/s 5040 Gflo/s
Calcul Double Précision 25,7 Gflo/s 28,8 Gflop/s 30,4 Gflop/s 33,9 Gflop/s 59,4 Gflop/s 62,7 Gflop/s 78,4 Gflop/s 79 Gflop/s 102,5 Gflop/s 128,8 Gflop/s 2× 117,1 Gflop/s 166 Gflo/s 1499,9 Gflop/s  ?
Turbo N/A N/A N/A N/A N/A 71 Gflo/s 88,8 Gflo/s 89 Gflo/s 127,2 Gpixels/s 121,4 Gpixels/s 143,7 Gpixels/s 2× 137,1 Gpixels/s 193 Gpixels/s 1523 Gpixels/s 210 Gflo/s
Prix actuel (avril 2013) 45€ H.T. l'unité pour 1000ex 79€ 99€ 119€ 169€ 179€ 185€ H.T. l'unité pour 1000ex 255€ 340€ 450€ 840€ 650€ 980€ 700€

Sous la marque Quadro[modifier | modifier le code]

La série QUADRO 'Kx000' est conçue via le même schéma que les TESLA K. Les spécifications des GK104/106/110 sont donc identiques entre les séries TESLA et QUADRO.


Modèles Quadro 410 Quadro K600 Quadro K2000 Quadro K4000 Quadro K5000 Quadro K6000 Quadro K7000
Gravure 28 nm
processeur GK107 GK106 GK104 GK110
Aire du die 118mm² 221mm² 294mm² 550mm²
Transistors 1.27 G 2.54 G 3.54 milliards 7.10 G
Fréquence GPU 706 MHz 876 MHz 954 MHz 811 MHz 705 MHz 735 MHz
Streams processors 192 192 384 768 1536 2496 2688
Unités TMU 16 32 64 128 208 224
Unités ROP 8 16 24 32 40 48
Nombre de blocs SMX 1 2 4 8 14 15
Nombre de GPC 1 2 4 5
Enveloppe thermique 38 Watts 41 Watts 51 Watts 80 Watts 122 Watts 225 Watts 250 Watts
Type de mémoire DDR3 GDDR5
Mémoire 512 Mo 1 Go 2 Go 3 Go 4 Go 5 Go 6 Go
Vitesse mémoire 891 MHz 1000 MHz 1404 MHz 1350 MHz 1300 MHz 1300 MHz
Largeur de bus 64 Bits 128 Bits 192 Bits 256 Bits 320 Bits 384 Bits
Bande passante 13,3 Go/s 26,5 Go/s 59,6 Go/s 125,5 Go/s 160,9 Go/s 193,7 Go/s 232,5 Go/s
Filtrage Pixels 5,6 Gpixels/s 14 Gpixels/s 15,3 Gpixels/s 19,5 Gpixels/s 22,6 Gpixels/s 28,2 Gpixels/s 35,3 Gpixels/s
Filtrage Textures 11,3 Gtexels/s 14 Gtexels/s 30,5 Gtexels/s 51,9 Gtexels/s 90,2 Gtexels/s 146,6 Gtexels/s 164,6 Gtexels/s
Filtrage Géométrique 706 Mtriangles/s 876 Mtriangles/s 954 Mtriangles/s 1622 Mtriangles/s 2820 Mtriangles/s 4935 MTr/s 5513 Mtriangles/s
Calcul Simple Précision 271,1 Gflo/s 336,4 Gflo/s 732,7 GFLOP/s 1245,7 Gflo/s 1082,9 GFLOP/s 3519,4 Gflo/s 3951,4 Gflo/s
Calcul Double Précision 11,3 Gflo/s 14 Gflo/s 30,5 Gflo/s 51,9 Gflo/s 90,2 Gflo/s 1173,1 Gflo/s 1317,1 Gflo/s
Date de sortie 7 août 2012 1 mars 2013 1 mars 2013 1 mars 2013 17 août 2012 1 juin 2013 -- 2013

Sous la marque Tesla[modifier | modifier le code]

L'architecture Kepler est présente dans les Tesla K10, K20, K20X et K40 dernière architecture de la marque annoncée en novembre 2013.

Notes et références[modifier | modifier le code]

  1. GeForce GTX 680 : Kepler envoie Tahiti à la retraite sur Tom's Hardware.
  2. article sur Kepler
  3. site officiel de NVidia
  4. Article sur le GPU Boost
  5. [1]
  6. Article sur les Tesla Kx0
  7. Article expliquant le support de DirectX 11 pour les GeForces 600 séries dans clubic.com; [2] et [3] dans hardware.fr
  8. Chris Angelini, « GeForce GTX Titan : le vrai Kepler haut de gamme », sur Tom's Hardware,‎ 19 février 2013 (consulté le 20 février 2013)

Articles connexes[modifier | modifier le code]