Für die ersten Messungen habe ich den Unigine Valley Benchmark herangezogen und die Kamerafahrt angehalten. Dies gewährleistete mir eine gleichbleibende Last, was für Vergleichsmessungen unabdingbar ist. Konkrete Benchmarks folgen im späteren Verlauf. Zunächst wollte ich mit der gleichbleibenden Last messen, wie sich das Verringern der GPU-Spannung auf den Takt, die Performance und die Leistungsaufnahme auswirkt. Für die ersten beiden Messungen habe ich die Presets „Ausgewogen“ bzw. „Stromsparen“ im AMD Treiber ausgewählt, danach habe ich im Wattman schrittweise die Spannung des P7-States um 25 mV verringert und die entsprechenden Werte tabellarisch festgehalten.
Wem der Wattman zu unübersichtlich ist, der kann auch mit dem OverdriveNtool…
… oder dem HBM Tweak Tool arbeiten.
Bei den Messungen entstand folgende Tabelle:
V set mV |
V read mV |
Clock MHz |
FPS | ASIC W |
System W | Setting |
1200 | 1144 | 1615 | 123 | 264 | 502 | Ausgewogen = Werkseinstellung |
1200 | 1038 | 1514 | 118 | 199 | 410 | Stromsparmodus = -25% Powertarget |
1175 | 1125 | 1625 | 125 | 252 | 483 | Manuell -25 mV |
1150 | 1100 | 1623 | 125 | 240 | 465 | Manuell -50 mV |
1125 | 1081 | 1619 | 124 | 228 | 448 | Manuell -75 mV |
1100 | 1056 | 1612 | 124 | 214 | 430 | Manuell -100 mV |
Egal wie weit ich die Spannung nun noch verringert habe, ohne auch die anderen Werte zu ändern geht die tatsächlich anliegende Spannung nicht weiter runter als 1056 mV. Um die Spannung noch weiter zu senken, könnte man jetzt das Power Limit heruntersetzen, was aber nicht zielführend wäre (Erklärung folgt). Die Karte sollte für die Messung nicht durch das Power Limit, sondern durch die angelegte Spannung limitiert werden. Dafür mussten letztendlich auch die niedrigeren Power States angepasst werden. | ||||||
1025 | 988 | 1601 | 123 | 194 | 405 | |
975 | 938 | 1511 | 120 | 156 | 349 |
An dieser Stelle habe ich aufgehört die Spannungen zu verringern, weil bei höherer Last und weiter fallender Spannung der Takt zu weit gesenkt werden müsste, um einen stabilen Betrieb zu gewährleisten. Das Ziel war ja am Ende des Tages trotz reduzierter Leistungsaufnahme noch eine ausreichende Performance zu erhalten. Die an der Steckdose gemessene Energieeinsparung von fast 150 W war bereits enorm und der Serienmäßige Kühler der Nitro+ wäre jetzt wohl schon in der Lage die Karte nahezu lautlos zu kühlen. In Anbetracht der nur minimal verringerten FPS ist das schon eine beachtliche Steigerung der Effizienz und nun wollte ich noch der Behauptung nachgehen, dass die Grafikkarten durch Undervolting sogar schneller werden.
Bringt Undervolting mehr Performance?
Da die Last des Valley-Benchmarks zu gering ist und dementsprechend der Boost generell sehr hoch ausfällt, habe ich für den nächsten Test den deutlich anspruchsvolleren Superposition Benchmark (1080p Extreme) eingesetzt. Der Mythos besagt: Durch das verringern der Spannung taktet sich die GPU höher, da sie nicht mehr so schnell in ihr Temperatur- und Powerlimit läuft. Stimmt das? Wieder habe ich eine gleichbleibende Szene erzeugt und schrittweise die Spannung verringert.
V set mV |
Clock MHz |
ASIC W | |
1200 | 1484 | 264 | |
1150 | 1511 | 265 | |
1100 | 1594 | 256 | |
1025 | 1577 | 211 | Untere P-States modifiziert |
975 | 1514 | 183 | Untere P-States modifiziert |
Ergebnis: Es stimmt – die Karte taktet bei verringerter Spannung tatsächlich signifikant höher. Aber wie man der Tabelle entnehmen kann, lässt sich dieses Spiel aber nicht beliebig fortführen. Eine gewisse Spannung muss anliegen, dass der Chip stabil seinen Takt halten kann. Wie hoch die Spannung für einen gewissen Takt sein muss, hängt von der Güte des gegenständlichen Chips ab. Ich vermute, dass diese Güte stark schwankt und AMD deshalb generell eine hohe Spannung angelegt hat, um auf allen produzierten Chips einen stabilen Betrieb beim angestrebten Takt zu gewährleisten. Natürlich ist das reine Spekulation meinerseits – anders kann ich mir die werksseitig so hoch angesetzte Spannung jedoch nicht erklären.
Optimierung
Nach weiteren Messungen hat sich herausgestellt, dass der Chip meiner getesteten Karte seinen „Sweetspot“ bei etwa 1500MHz besitzt. Das bedeutet, dass die Kombination aus Performance und Leistungsaufnahme in diesem Bereich am meisten Sinn für die Verwendung als Gaming-Grafikkarte ergibt. Um diesen zu erreichen, musste für P7 ein Zieltakt von 1597 MHz bei einer Spannung von 975 mV eingestellt werden. Dieses Setting habe ich seit über 10 Monaten im Einsatz und es ist bei keinem Spiel zu Instabilität oder Treiberabstürzen gekommen. Zwar zieht die Karte mit den Einstellungen über 100 Watt weniger aus der Steckdose, es gehen allerdings im schlimmsten Fall aber auch bis zu 100 MHz Kerntakt verloren.
Damit durch den verringerten Takt nicht zu viel Performance verloren geht, musste an einer anderen Stelle noch etwas optimiert werden und hier kam auch das ungewöhnliche Speichersystem der Karte zum Tragen. Wer sich bisher nicht mit dem Tuning von AMD Karten auseinandergesetzt hat, wird beim lesen dieses Artikels schon festgestellt haben, dass man beim Tunen von Radeon-Karten sehr viele Freiheiten hat und nahezu jeden Parameter selbst justieren kann. Das trifft auch auf den HBM2 Speicher zu. Es ist mit frei zugänglichen Tools möglich, jeden nur erdenklichen Wert zu manipulieren – sogar bis hinunter zu die einzelnen Timings.
Vega lebt von ihrem hohen Speicherdurchsatz und das Übertakten des HBMs bringt im Verhältnis gesehen mehr Leistungszuwachs als das Übertakten der GPU selbst. Leider ist der Speicher nicht unbedingt für seine hohe Taktfreude bekannt – 50 bis 100 MHz mehr sind aber erfahrungsgemäß bei den meisten Karten möglich. Zusätzlich kann durch das Verschärfen der Speichertimings ein weiterer messbarer Performancezuwachs erzielt werden. Speichertuning ist allerdings ein sehr komplexes Thema und ausführliche Erklärungen würden sowohl den Rahmen dieses Artikels als auch meiner Kompetenz sprengen. Deshalb werde ich darauf verzichten und stattdessen meine finalen Settings für 24/7 („Eco“), leichtes OC und maximales OC zeigen und messen, wie sie sich auf die Leistung und den Verbrauch auswirken.
Finales 24/7-Setting (1500MHz GPU / 1000MHz HBM @ tREF 19500)
Finales OC-Setting (1600MHz GPU / 1045MHz HBM @ tREF 23400)
Max OC-Setting (1700+MHz GPU / 1075MHz HBM @ tREF 31200)
Kommentieren