GTX 1070/1080 vs. GTX 980 Ti: Effizienzanalyse & Leistungsaufnahme

Da mittlerweile auch Custom-Designs der Hersteller verfügbar sind, lassen wir in unserem Vergleich sogar fünf Karten gegeneinander antreten: Den Founders-Edition-Modellen der GeForce GTX 1070 und GeForce GTX 1080 stellen wir die MSI GeForce GTX 1070/1080 Gaming X 8G gegenüber und komplettieren dieses Pascal-Quartett mit einer MSI GeForce GTX 980 Ti Lightning, die noch auf Nvidias Maxwell-GPU basiert.

Zusammenhang von Takt, Leistungsaufnahme und Performance

Was wir vorhaben, bedeutet zwar eine Menge Arbeit in Form unzähliger Messreihen, lohnt sich aber. Wir messen die Leistungsaufnahme gestaffelt über einen sehr großen Taktfrequenzbereich, stellen die Gaming-Performance den jeweiligen Taktraten gegenüber und wissen am Ende mehr über die resultierende Effizienzkurve jeder einzelnen Karte und ob bzw. bis wohin sich sowohl Übertaktung als auch das Energiesparen überhaupt lohnen könnten.

Außerdem vergleichen wir in all diesen Rubriken auch taktbereinigt Maxwell und Pascal, was uns am Ende auf die verfügbare Shader-Leistung jeder einzelnen Einheit (in Wechselwirkung mit der restlichen Architektur der GPU sowie der technischen Umsetzung der gesamten Grafikkarte) schließen lässt. Natürlich folgen als Nebenwirkung zur Untersuchung der Leistungsaufnahme der Grafikkarten auch noch die Analysen ihrer jeweiligen Temperaturentwicklung und der damit verbundenen Geräuschentwicklung ihrer Kühllösungen.

Bevor wir jedoch genauer auf unsere Methoden und das Test-Setup eingehen, schnell alle fünf Karten noch einmal im tabellarischen Überblick:

GPU	Nvidia GeForce GTX 1070 Founders Edition	MSI GeForce GTX 1070 Gaming X 8G	Nvidia GeForce GTX 1080 Founders Edition	MSI GeForce GTX 1080 Gaming X 8G	MSI GeForce GTX 980 Ti Lightning 6GB
SMs	15	15	20	20
CUDA-Kerne	1920	1920	2560	2560	2816
Basistakt	1506 MHz	1607 MHz	1607 MHz	1709 MHz	1203 MHz
GPU-Boost-Takt	1683 MHz	1797 MHz	1733 MHz	1848 MHz	1304 MHz
GFLOPs (Basistakt)	5783	6171	8228	8750	6775
Textur-Einheiten	120	120	160	160	176
Textur-Füllrate	180.7 GT/s	192.8 GT/s	257,1 GT/s	273,4 GT/s	211,7 GT/s
Speichergröße	8 GByte	8 GByte	8 GByte	8 GByte	6 GByte
Speicherbandbreite	256 GByte/s	259,5 GByte/s	320 GByte/s	323,6 GByte/s	340,6 GByte/s
Speichertakt	2002 MHz	2027 MHz	2502 MHz	2528 MHz	1774 MHz
ROPs	64	64	64	64	96
L2-Cache	2 MByte	2 MByte	2 MByte	2 MByte	3 MByte
TDP	150 Watt	>190 Watt	180 Watt	>200 Watt	>280 Watt
Transistoren	7,2 Mrd.	7,2 Mrd.	7,2 Mrd.	7,2 Mrd.	8 Mrd.
Die-Größe	314 mm²	314 mm²	314 mm²	314 mm²	601 mm²
Fertigunsprozess	16nm	16nm	16nm	16nm	28nm

Methodik und Benchmark-Auswahl

Um möglichst realitätsnah zu bleiben, betreiben wir diesmal alle Grafikkarten in einem geschlossenen Gehäuse (Nanoxia Deep Silence 5), dessen serienmäßige Front- und Hecklüfter wir auf niedrigster respektive mittlerer Stellung laufen lassen. Die Messung der Leistungsaufnahme erfolgt analog zu dem üblichen Vorgehen, auch wenn die Positionierung der Stromzangenadapter und Spannungstastköpfe diesmal nicht ganz einfach war (nachzulesen in unserem Grundlagenartikel Grundlagen GPUs: Leistungsaufnahme, Netzteilkonflikte & andere Mythen).

Leistungsaufnahme
Messverfahren:	berührungslose Gleichstrommessung am PCIe-Slot (Riser-Card) berührungslose Gleichstrommessung an der externen PCIe-Stromversorgung direkte Spannungsmessung am Netzteil
Messgeräte:	2x Rohde & Schwarz HMO 3054 (500 MHz Mehrkanal-Oszillograph mit Speicherfunktion) 4x Rohde & Schwarz HZO50, Stromzangenadapter (1 mA bis 30 A, 100 KHz, DC) 4x Rohde & Schwarz HZ355, Tastteiler (10:1, 500 MHz) 1x Rohde & Schwarz HMC 8012 (Digitalmultimeter mit Speicherfunktion) 1x Optris PI640, Infrarotkamera + PI Connect

Das nächste Problem betraf die Benchmark-Auswahl. Aufgrund der sehr aufwändigen und umfangreichen Messreihen mussten wir uns auf einen einzelnen Benchmark festlegen – und selbst das bedeutete am Ende noch fast sechs volle Arbeitstage. Um wirklich repräsentativ zu bleiben, haben wir nach vielen Plausibilitätstests im Vorfeld auf Metro Last Light in der Ultra-HD Auflösung zurückgegriffen. Wir vermeiden damit eine CPU-Limitierung, umgehen ein mögliches Speicher-Limit und können die Grafikkarten doch vollends auslasten. Somit kommt die Leistungsaufnahme fast schon dem Worst-Case nahe, ohne jedoch gleichzeitig den Boost allzusehr zum Abriegeln und Heruntertakten zu zwingen.

Als Testsystem nutzen wir diesmal unsere im obengenannten Gehäuse eingebaute Workstation von Happyware, diesmal jedoch mit einem auf 4,5 GHz übertakteten Intel Core i7-6700K samt AiO-Kompaktwasserkühlung bestückt, was zu keiner Zeit die Messergebnisse negativ beeinflussen konnte.

Happyware Crossover Workstation
Testsystem:	Core i7-6700K @4,5 GHz 2x 8 GByte DDR4 @3400 Asus P10 WS 2x Samsung SM863 (3D V-NAND) Seagate Constellation Server-HDD Windows 10 Enterprise (TH2, alle Updates)
Treiber:	GeForce 368.39

So ausgerüstet stürzten wir uns in ein nahezu einwöchiges Abenteuer – mit den Pascal-Geschwistern und dem guten alten Onkel Maxwell als Reisebegleiter.

Pages: