Grafikkarten Testberichte VGA

GTX 1070/1080 vs. GTX 980 Ti: Effizienzanalyse & Leistungsaufnahme

Da mittlerweile auch Custom-Designs der Hersteller verfügbar sind, lassen wir in unserem Vergleich sogar fünf Karten gegeneinander antreten: Den Founders-Edition-Modellen der GeForce GTX 1070 und GeForce GTX 1080 stellen wir die MSI GeForce GTX 1070/1080 Gaming X 8G gegenüber und komplettieren dieses Pascal-Quartett mit einer MSI GeForce GTX 980 Ti Lightning, die noch auf Nvidias Maxwell-GPU basiert.

 

Zusammenhang von Takt, Leistungsaufnahme und Performance

Was wir vorhaben, bedeutet zwar eine Menge Arbeit in Form unzähliger Messreihen, lohnt sich aber. Wir messen die Leistungsaufnahme gestaffelt über einen sehr großen Taktfrequenzbereich, stellen die Gaming-Performance den jeweiligen Taktraten gegenüber und wissen am Ende mehr über die resultierende Effizienzkurve jeder einzelnen Karte und ob bzw. bis wohin sich sowohl Übertaktung als auch das Energiesparen überhaupt lohnen könnten.

Außerdem vergleichen wir in all diesen Rubriken auch taktbereinigt Maxwell und Pascal, was uns am Ende auf die verfügbare Shader-Leistung  jeder einzelnen Einheit (in Wechselwirkung mit der restlichen Architektur der GPU sowie der technischen Umsetzung der gesamten Grafikkarte) schließen lässt. Natürlich folgen als Nebenwirkung zur Untersuchung der Leistungsaufnahme der Grafikkarten auch noch die Analysen ihrer jeweiligen Temperaturentwicklung und der damit verbundenen Geräuschentwicklung ihrer Kühllösungen.

Bevor wir jedoch genauer auf unsere Methoden und das Test-Setup eingehen, schnell alle fünf Karten noch einmal im tabellarischen Überblick:

GPU Nvidia GeForce
GTX 1070
Founders Edition

MSI GeForce
GTX 1070
Gaming X 8G
Nvidia GeForce
GTX 1080
Founders Edition
MSI GeForce
GTX 1080
Gaming X 8G
MSI GeForce
GTX 980 Ti
Lightning 6GB
SMs 15 15 20 20  
CUDA-Kerne 1920 1920 2560 2560 2816
Basistakt 1506 MHz 1607 MHz 1607 MHz 1709 MHz 1203 MHz
GPU-Boost-Takt 1683 MHz 1797 MHz 1733 MHz 1848 MHz 1304 MHz
GFLOPs (Basistakt) 5783 6171 8228 8750 6775
Textur-Einheiten 120 120 160 160 176
Textur-Füllrate 180.7 GT/s 192.8 GT/s 257,1 GT/s 273,4 GT/s 211,7 GT/s
Speichergröße 8 GByte 8 GByte 8 GByte 8 GByte 6 GByte
Speicherbandbreite 256 GByte/s 259,5 GByte/s 320 GByte/s 323,6 GByte/s 340,6 GByte/s
Speichertakt 2002 MHz 2027 MHz 2502 MHz 2528 MHz 1774 MHz
ROPs 64 64 64 64 96
L2-Cache 2 MByte 2 MByte 2 MByte 2 MByte 3 MByte
TDP 150 Watt >190 Watt 180 Watt >200 Watt >280 Watt
Transistoren 7,2 Mrd. 7,2 Mrd. 7,2 Mrd. 7,2 Mrd. 8 Mrd.
Die-Größe 314 mm² 314 mm² 314 mm² 314 mm² 601 mm²
Fertigunsprozess 16nm 16nm 16nm 16nm 28nm

Methodik und Benchmark-Auswahl

 

Um möglichst realitätsnah zu bleiben, betreiben wir diesmal alle Grafikkarten in einem geschlossenen Gehäuse (Nanoxia Deep Silence 5), dessen serienmäßige Front- und Hecklüfter wir auf niedrigster respektive mittlerer Stellung laufen lassen.  Die Messung der Leistungsaufnahme erfolgt analog zu dem üblichen Vorgehen, auch wenn die Positionierung der Stromzangenadapter und Spannungstastköpfe diesmal nicht ganz einfach war (nachzulesen in unserem Grundlagenartikel Grundlagen GPUs: Leistungsaufnahme, Netzteilkonflikte & andere Mythen).

Leistungsaufnahme
Messverfahren:
berührungslose Gleichstrommessung am PCIe-Slot (Riser-Card)
berührungslose Gleichstrommessung an der externen PCIe-Stromversorgung
direkte Spannungsmessung am Netzteil
Messgeräte:
2x Rohde & Schwarz HMO 3054
(500 MHz Mehrkanal-Oszillograph mit Speicherfunktion)
4x Rohde & Schwarz HZO50, Stromzangenadapter
(1 mA bis 30 A, 100 KHz, DC)
4x Rohde & Schwarz HZ355, Tastteiler (10:1, 500 MHz)
1x Rohde & Schwarz HMC 8012
(Digitalmultimeter mit Speicherfunktion)
1x Optris PI640, Infrarotkamera + PI Connect

Das nächste Problem betraf die Benchmark-Auswahl. Aufgrund der sehr aufwändigen und umfangreichen Messreihen mussten wir uns auf einen einzelnen Benchmark festlegen – und selbst das bedeutete am Ende noch fast sechs volle Arbeitstage. Um wirklich repräsentativ zu bleiben, haben wir nach vielen Plausibilitätstests im Vorfeld auf Metro Last Light in der Ultra-HD Auflösung zurückgegriffen. Wir vermeiden damit eine CPU-Limitierung, umgehen ein mögliches Speicher-Limit und können die Grafikkarten doch vollends auslasten. Somit kommt die Leistungsaufnahme fast schon dem Worst-Case nahe, ohne jedoch gleichzeitig den Boost allzusehr zum Abriegeln und Heruntertakten zu zwingen.

Als Testsystem nutzen wir diesmal unsere im obengenannten Gehäuse eingebaute Workstation von Happyware, diesmal jedoch mit einem auf 4,5 GHz übertakteten Intel Core i7-6700K samt AiO-Kompaktwasserkühlung bestückt, was zu keiner Zeit die Messergebnisse negativ beeinflussen konnte.

Happyware Crossover Workstation
Testsystem:
Core i7-6700K @4,5 GHz
2x 8 GByte DDR4 @3400
Asus P10 WS
2x Samsung SM863 (3D V-NAND)
Seagate Constellation Server-HDD
Windows 10 Enterprise (TH2, alle Updates)
Treiber:
GeForce 368.39

So ausgerüstet stürzten wir uns in ein nahezu einwöchiges Abenteuer – mit den Pascal-Geschwistern und dem guten alten Onkel Maxwell als Reisebegleiter.

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kann Du per PayPal spenden.

About the author

Igor Wallossek

Chefredakteur und Namensgeber von igor'sLAB als inhaltlichem Nachfolger von Tom's Hardware Deutschland, deren Lizenz im Juni 2019 zurückgegeben wurde, um den qualitativen Ansprüchen der Webinhalte und Herausforderungen der neuen Medien wie z.B. YouTube mit einem eigenen Kanal besser gerecht werden zu können.

Computer-Nerd seit 1983, Audio-Freak seit 1979 und seit über 50 Jahren so ziemlich offen für alles, was einen Stecker oder einen Akku hat.

Folge Igor auf:
YouTube   Facebook    Instagram Twitter