Grafikkarten Praxis Testberichte VGA

Vega Undervolting – Heilsbringer, Voodoo oder nutzlos? Selbstversuch im Langzeit-Setting

Für die ersten Messungen habe ich den Unigine Valley Benchmark herangezogen und die Kamerafahrt angehalten. Dies gewährleistete mir eine gleichbleibende Last, was für  Vergleichsmessungen unabdingbar ist. Konkrete Benchmarks folgen im späteren Verlauf. Zunächst wollte ich mit der gleichbleibenden Last messen, wie sich das Verringern der GPU-Spannung auf den Takt, die Performance und die Leistungsaufnahme auswirkt. Für die ersten beiden Messungen habe ich die Presets „Ausgewogen“ bzw. „Stromsparen“ im AMD Treiber ausgewählt, danach habe ich im Wattman schrittweise die Spannung des P7-States um 25 mV verringert und die entsprechenden Werte tabellarisch festgehalten.

Wem der Wattman zu unübersichtlich ist, der kann auch mit dem OverdriveNtool…

… oder dem HBM Tweak Tool arbeiten.

Bei den Messungen entstand folgende Tabelle:

V set mV
V read mV
Clock MHz
FPS ASIC W
System W Setting
1200 1144 1615 123 264 502 Ausgewogen = Werkseinstellung
1200 1038 1514 118 199 410 Stromsparmodus = -25% Powertarget
1175 1125 1625 125 252 483 Manuell -25 mV
1150 1100 1623 125 240 465 Manuell -50 mV
1125 1081 1619 124 228 448 Manuell -75 mV
1100 1056 1612 124 214 430 Manuell -100 mV
Egal wie weit ich die Spannung nun noch verringert habe, ohne auch die anderen Werte zu ändern geht die tatsächlich anliegende Spannung nicht weiter runter als 1056 mV. Um die Spannung noch weiter zu senken, könnte man jetzt das Power Limit heruntersetzen, was aber nicht zielführend wäre (Erklärung folgt). Die Karte sollte für die Messung nicht durch das Power Limit, sondern durch die angelegte Spannung limitiert werden. Dafür mussten letztendlich auch die niedrigeren Power States angepasst werden.
1025 988 1601 123 194 405  
975 938 1511 120 156 349  

An dieser Stelle habe ich aufgehört die Spannungen zu verringern, weil bei höherer Last und weiter fallender Spannung der Takt zu weit gesenkt werden müsste, um einen stabilen Betrieb zu gewährleisten. Das Ziel war ja am Ende des Tages trotz reduzierter Leistungsaufnahme noch eine ausreichende Performance zu erhalten. Die an der Steckdose gemessene Energieeinsparung von fast 150 W war bereits enorm und der Serienmäßige Kühler der Nitro+ wäre jetzt wohl schon in der Lage die Karte nahezu lautlos zu kühlen. In Anbetracht der nur minimal verringerten FPS ist das schon eine beachtliche Steigerung der Effizienz und nun wollte ich noch der Behauptung nachgehen, dass die Grafikkarten durch Undervolting sogar schneller werden.

Bringt Undervolting mehr Performance?

Da die Last des Valley-Benchmarks zu gering ist und dementsprechend der Boost generell sehr hoch ausfällt, habe ich für den nächsten Test den deutlich anspruchsvolleren Superposition Benchmark (1080p Extreme) eingesetzt. Der Mythos besagt: Durch das verringern der Spannung taktet sich die GPU höher, da sie nicht mehr so schnell in ihr Temperatur- und Powerlimit läuft. Stimmt das? Wieder habe ich eine gleichbleibende Szene erzeugt und schrittweise die Spannung verringert.

V set mV
Clock MHz
ASIC W  
1200 1484 264  
1150 1511 265  
1100 1594 256  
1025 1577 211 Untere P-States modifiziert
975 1514 183 Untere P-States modifiziert

Ergebnis: Es stimmt – die Karte taktet bei verringerter Spannung tatsächlich signifikant höher. Aber wie man der Tabelle entnehmen kann, lässt sich dieses Spiel aber nicht beliebig fortführen. Eine gewisse Spannung muss anliegen, dass der Chip stabil seinen Takt halten kann. Wie hoch die Spannung für einen gewissen Takt sein muss, hängt von der Güte des gegenständlichen Chips ab. Ich vermute, dass diese Güte stark schwankt und AMD deshalb generell eine hohe Spannung angelegt hat, um auf allen produzierten Chips einen stabilen Betrieb beim angestrebten Takt zu gewährleisten. Natürlich ist das reine Spekulation meinerseits – anders kann ich mir die werksseitig so hoch angesetzte Spannung jedoch nicht erklären.

Optimierung

Nach weiteren Messungen hat sich herausgestellt, dass der Chip meiner getesteten Karte seinen „Sweetspot“ bei etwa 1500MHz besitzt. Das bedeutet, dass die Kombination aus Performance und Leistungsaufnahme in diesem Bereich am meisten Sinn für die Verwendung als Gaming-Grafikkarte ergibt. Um diesen zu erreichen, musste für P7 ein Zieltakt von 1597 MHz bei einer Spannung von 975 mV eingestellt werden. Dieses Setting habe ich seit über 10 Monaten im Einsatz und es ist bei keinem Spiel zu Instabilität oder Treiberabstürzen gekommen. Zwar zieht die Karte mit den Einstellungen über 100 Watt weniger aus der Steckdose, es gehen allerdings im schlimmsten Fall aber auch bis zu 100 MHz Kerntakt verloren.

Damit durch den verringerten Takt nicht zu viel Performance verloren geht, musste an einer anderen Stelle noch etwas optimiert werden und hier kam auch das ungewöhnliche Speichersystem der Karte zum Tragen. Wer sich bisher nicht mit dem Tuning von AMD Karten auseinandergesetzt hat, wird beim lesen dieses Artikels schon festgestellt haben, dass man beim Tunen von Radeon-Karten sehr viele Freiheiten hat und nahezu jeden Parameter selbst justieren kann. Das trifft auch auf den HBM2 Speicher zu. Es ist mit frei zugänglichen Tools möglich, jeden nur erdenklichen Wert zu manipulieren – sogar bis hinunter zu die einzelnen Timings.

Vega lebt von ihrem hohen Speicherdurchsatz und das Übertakten des HBMs bringt im Verhältnis gesehen mehr Leistungszuwachs als das Übertakten der GPU selbst. Leider ist der Speicher nicht unbedingt für seine hohe Taktfreude bekannt – 50 bis 100 MHz mehr sind aber erfahrungsgemäß bei den meisten Karten möglich. Zusätzlich kann durch das Verschärfen der Speichertimings ein weiterer messbarer Performancezuwachs erzielt werden. Speichertuning ist allerdings ein sehr komplexes Thema und ausführliche Erklärungen würden sowohl den Rahmen dieses Artikels als auch meiner Kompetenz sprengen. Deshalb werde ich darauf verzichten und stattdessen meine finalen Settings für 24/7 („Eco“), leichtes OC und maximales OC zeigen und messen, wie sie sich auf die Leistung und den Verbrauch auswirken.

Finales 24/7-Setting (1500MHz GPU / 1000MHz HBM @ tREF 19500)

Finales OC-Setting (1600MHz GPU / 1045MHz HBM @ tREF 23400)

             

Max OC-Setting (1700+MHz GPU / 1075MHz HBM @ tREF 31200)