Da mittlerweile auch Custom-Designs der Hersteller verfügbar sind, lassen wir in unserem Vergleich sogar fünf Karten gegeneinander antreten: Den Founders-Edition-Modellen der GeForce GTX 1070 und GeForce GTX 1080 stellen wir die MSI GeForce GTX 1070/1080 Gaming X 8G gegenüber und komplettieren dieses Pascal-Quartett mit einer MSI GeForce GTX 980 Ti Lightning, die noch auf Nvidias Maxwell-GPU basiert.
Zusammenhang von Takt, Leistungsaufnahme und Performance
Was wir vorhaben, bedeutet zwar eine Menge Arbeit in Form unzähliger Messreihen, lohnt sich aber. Wir messen die Leistungsaufnahme gestaffelt über einen sehr großen Taktfrequenzbereich, stellen die Gaming-Performance den jeweiligen Taktraten gegenüber und wissen am Ende mehr über die resultierende Effizienzkurve jeder einzelnen Karte und ob bzw. bis wohin sich sowohl Übertaktung als auch das Energiesparen überhaupt lohnen könnten.
Außerdem vergleichen wir in all diesen Rubriken auch taktbereinigt Maxwell und Pascal, was uns am Ende auf die verfügbare Shader-Leistung jeder einzelnen Einheit (in Wechselwirkung mit der restlichen Architektur der GPU sowie der technischen Umsetzung der gesamten Grafikkarte) schließen lässt. Natürlich folgen als Nebenwirkung zur Untersuchung der Leistungsaufnahme der Grafikkarten auch noch die Analysen ihrer jeweiligen Temperaturentwicklung und der damit verbundenen Geräuschentwicklung ihrer Kühllösungen.
Bevor wir jedoch genauer auf unsere Methoden und das Test-Setup eingehen, schnell alle fünf Karten noch einmal im tabellarischen Überblick:
GPU | Nvidia GeForce GTX 1070 Founders Edition |
MSI GeForce GTX 1070 Gaming X 8G |
Nvidia GeForce GTX 1080 Founders Edition |
MSI GeForce GTX 1080 Gaming X 8G |
MSI GeForce GTX 980 Ti Lightning 6GB |
---|---|---|---|---|---|
SMs | 15 | 15 | 20 | 20 | |
CUDA-Kerne | 1920 | 1920 | 2560 | 2560 | 2816 |
Basistakt | 1506 MHz | 1607 MHz | 1607 MHz | 1709 MHz | 1203 MHz |
GPU-Boost-Takt | 1683 MHz | 1797 MHz | 1733 MHz | 1848 MHz | 1304 MHz |
GFLOPs (Basistakt) | 5783 | 6171 | 8228 | 8750 | 6775 |
Textur-Einheiten | 120 | 120 | 160 | 160 | 176 |
Textur-Füllrate | 180.7 GT/s | 192.8 GT/s | 257,1 GT/s | 273,4 GT/s | 211,7 GT/s |
Speichergröße | 8 GByte | 8 GByte | 8 GByte | 8 GByte | 6 GByte |
Speicherbandbreite | 256 GByte/s | 259,5 GByte/s | 320 GByte/s | 323,6 GByte/s | 340,6 GByte/s |
Speichertakt | 2002 MHz | 2027 MHz | 2502 MHz | 2528 MHz | 1774 MHz |
ROPs | 64 | 64 | 64 | 64 | 96 |
L2-Cache | 2 MByte | 2 MByte | 2 MByte | 2 MByte | 3 MByte |
TDP | 150 Watt | >190 Watt | 180 Watt | >200 Watt | >280 Watt |
Transistoren | 7,2 Mrd. | 7,2 Mrd. | 7,2 Mrd. | 7,2 Mrd. | 8 Mrd. |
Die-Größe | 314 mm² | 314 mm² | 314 mm² | 314 mm² | 601 mm² |
Fertigunsprozess | 16nm | 16nm | 16nm | 16nm | 28nm |
Methodik und Benchmark-Auswahl
Um möglichst realitätsnah zu bleiben, betreiben wir diesmal alle Grafikkarten in einem geschlossenen Gehäuse (Nanoxia Deep Silence 5), dessen serienmäßige Front- und Hecklüfter wir auf niedrigster respektive mittlerer Stellung laufen lassen. Die Messung der Leistungsaufnahme erfolgt analog zu dem üblichen Vorgehen, auch wenn die Positionierung der Stromzangenadapter und Spannungstastköpfe diesmal nicht ganz einfach war (nachzulesen in unserem Grundlagenartikel Grundlagen GPUs: Leistungsaufnahme, Netzteilkonflikte & andere Mythen).
Leistungsaufnahme | |
---|---|
Messverfahren: |
berührungslose Gleichstrommessung am PCIe-Slot (Riser-Card) berührungslose Gleichstrommessung an der externen PCIe-Stromversorgung direkte Spannungsmessung am Netzteil |
Messgeräte: |
2x Rohde & Schwarz HMO 3054 (500 MHz Mehrkanal-Oszillograph mit Speicherfunktion) 4x Rohde & Schwarz HZO50, Stromzangenadapter (1 mA bis 30 A, 100 KHz, DC) 4x Rohde & Schwarz HZ355, Tastteiler (10:1, 500 MHz) 1x Rohde & Schwarz HMC 8012 (Digitalmultimeter mit Speicherfunktion) 1x Optris PI640, Infrarotkamera + PI Connect |
Das nächste Problem betraf die Benchmark-Auswahl. Aufgrund der sehr aufwändigen und umfangreichen Messreihen mussten wir uns auf einen einzelnen Benchmark festlegen – und selbst das bedeutete am Ende noch fast sechs volle Arbeitstage. Um wirklich repräsentativ zu bleiben, haben wir nach vielen Plausibilitätstests im Vorfeld auf Metro Last Light in der Ultra-HD Auflösung zurückgegriffen. Wir vermeiden damit eine CPU-Limitierung, umgehen ein mögliches Speicher-Limit und können die Grafikkarten doch vollends auslasten. Somit kommt die Leistungsaufnahme fast schon dem Worst-Case nahe, ohne jedoch gleichzeitig den Boost allzusehr zum Abriegeln und Heruntertakten zu zwingen.
Als Testsystem nutzen wir diesmal unsere im obengenannten Gehäuse eingebaute Workstation von Happyware, diesmal jedoch mit einem auf 4,5 GHz übertakteten Intel Core i7-6700K samt AiO-Kompaktwasserkühlung bestückt, was zu keiner Zeit die Messergebnisse negativ beeinflussen konnte.
Happyware Crossover Workstation | |
---|---|
Testsystem: |
Core i7-6700K @4,5 GHz 2x 8 GByte DDR4 @3400 Asus P10 WS 2x Samsung SM863 (3D V-NAND) Seagate Constellation Server-HDD Windows 10 Enterprise (TH2, alle Updates) |
Treiber: |
GeForce 368.39 |
So ausgerüstet stürzten wir uns in ein nahezu einwöchiges Abenteuer – mit den Pascal-Geschwistern und dem guten alten Onkel Maxwell als Reisebegleiter.
Kommentieren