Gaming • Grafikkarten • Praxis • Testberichte • VGA

Leistungsaufnahme der GeForce RTX 4090 richtig limitieren: MSI Afterburner vs. Adapter oder beides?

11. Januar 2024 06:00

Was macht das harte Power Limit?

Ich hatte das Ganze ja in Bezug auf NVIDIAs Boost unlängst schon einmal in einem ausführlicheren Artikel. Aber es passt hier so gut rein, dass ich es noch einmal kurz zusammenfasse. Denn die Aufgabe der sogenannten Telemetrie ist es ja, die maximale Grafikperformance bei möglichst minimaler Leistungsaufnahme und der entstehenden Nebenwirkungen wie z.B. die Abwärme zu erreichen und die ganzen Überwachungsdaten dafür heranzuziehen. Das Hauptanliegen besteht darin, die Kernspannung der GPU in Echtzeit möglichst so anzupassen, dass nur so viel Leistung zugeführt wird, wie man für die aktuelle Auslastung der GPU und das Erreichen der optimalen Taktrate auch wirklich benötigt. Andererseits sorgen Dinge wie die Power Limits dafür, diesem Mechanismus auch echte Obergrenzen zu setzen. Genau diese beiden Aufgaben müssen wir für das bessere Verständnis wirklich trennen!

Kommen wir deshalb zunächst zu unserer harten Limitierung über die eingangsseitigen Power Limits (Firmware, Adapter-Varianten). Die Firmware schätzt in sehr kurzen Intervallen ständig den Energieverbrauch (quasi in Echtzeit), fragt gleichzeitig die ganzen Sensoren sowie die GPU-Vorhersage ab und bezieht dazu auch die Telemetrie-Daten des Spannungsreglers und der Eingangsüberwachung (Shunts, Bild unten) mit ein. Diese Werte werden an das vorprogrammierten DPM (digitales Power-Management), also den Arbitrator (Mittler) gesendet. Dieser Regelkomplex kennt auch die Power-, thermischen und Stromstärken-Limits der GPU (BIOS, Treiber), die er aus den jeweiligen Registern auslesen kann. Wenn auch nur eine der Eingangsgrößen überschritten wird, in diesem Falle sind es dann die maximalen Ströme, kann der Mittler Spannung oder Takt zurücknehmen. Was dann die Leistungsaufnahme begrenzt, wie in unserem Fall!

Überwachung der 12V-Rail auf einer GeForce RTX 4070 mittels Shunts

Die Software-Begrenzung nutzt die VFE

Was macht die Software beim Afterburner nun anders? Um es einmal gebrauchsfertig zu formulieren: Es wurden ja in der Firmware die einzelnen Boost-Steps samt Vorgabespannung hinterlegt, wobei der Takt der untersten Boost-Stufe durch einen sogenannten Offset verschoben bzw. festgelegt wird und sich der Rest dann aus den Berechnungen des Arbitrators (Mittlers) ergibt. Bei AMD legt man die Taktraten und Spannungen für einige vorgegebene DPM-States fest, was deutlich ungenauer (granulärer) ist, aber am Ende so ähnlich funktioniert.

Das Nachteilige an so einer öffentlich sichtbaren (und mit geeigneter Software auch anpassbarer) „Frequenz-/Spannungskurve“ ist, dass man sie eigentlich gar nicht so einfach pauschal festlegen kann. Das, was der Endanwender in Wirklichkeit nur modifizieren kann, ist eine gewisse partielle Verschiebung auf der Basis von zuvor errechneten, individuellen Grenz- und Richtwerten eines jeden einzelnen Chips unter den aktuellen Bedingungen! Hier kommt nun die sogenannte VFE ( Voltage Frequency Engine) ins Spiel, die einen flexiblen Rahmen bietet, um die Beziehung zwischen den Taktfrequenzen zu spezifizieren bzw. zu bewerten, die normalerweise eine Funktion von Spannung, Speedo und Temperatur ist. Oder um es kurz auf den Punkt zu bringen: Die ermittelte Spannung für jeden dieser Frequenzpunkte einer solchen Kurve ist eigentlich eine Funktion des Speedos der GPU, der durch das „Continuous Virtual Binning“ bestimmt wird. Beim Herabsetzen des Power Limits über den Afterburner wird ebenfalls in die VFE eingegriffen.

Die Hauptfunktion der VFE besteht also darin, die Spannung und Frequenz der Prozessoren dynamisch anzupassen, um die Leistung und Energieeffizienz zu optimieren. Die VFE arbeitet eng mit der PMU (Power Management Unit) zusammen, um die richtigen Spannungs- und Frequenzwerte für verschiedene Betriebszustände und Lastbedingungen zu liefern. Die VFE ist für die Anpassung der Spannung und Frequenz verantwortlich, während Speedo die PVT-Variationen überwacht und die notwendigen Informationen für die VFE liefert, um die richtigen Anpassungen vorzunehmen.

In der PMU-Laufzeitphase (siehe Telemetrie-Schema am Anfang der Seite) nimmt der Perf-Task dann z.B. alle 200 ms (programmierbar) u.a. Stichproben der GPU-Temperatur. Wenn die Temperatur einen (programmierbaren) Hysterese-Wert überschreitet, wird die V/F-Kurve erneut ausgewertet, indem die entsprechende VFE-Gleichung gelöst und die AVFS-Hardware neu programmiert wird. Und diesen netten Loop wiederholt die Karte so lange, bis wir den Rechner wieder brav ausschalten. Nur dass wir hier manuell gar nichts ändern können, außer dem Setzen der Prozentzahl im Afterburner.

Zusammenfassung und Fazit

Interessanterweise lässt sich eine 500-Watt-Karte mit dem Afterburner besser bei 300 Watt betreiben als eine 450-Watt-Karte, zumindest was die Varianzen und die Frame Times betrifft. Ansonsten würde ich nicht versuchen, den Hard-Cut einfach mittels eines Adapters zu lösen, sondern stets per Software die gesamte Telemetrie samt VFE mit ins Boot zu holen. Das regelt am Schluss doch genauer und kommt dem Sinn der gesamten Lösung bis hin zum „Continuous Virtual Binning“, dessen Spielraum ohne engere Hard-Limits deutlich größer ausfällt, eher entgegen.

Ja, es kann auch zum leichten Überschreiten des „Requested Power Limits“ kommen, aber das macht ja nichts, solange man trotz allem in ungefähren Rahmen bleibt. Der heutige Artikel beruht übrigens au^f einem Zufallsfund, der mir beim Benchmarken quasi vor die Füße gefallen ist. Danke dafür an Mafia II und das Abschalten eines Netzteils. Man lernt nie aus. Weiterführende Lektüre zum Thema findet Ihr auch hier:

Das „Geheimnis“ hinter NVIDIAs ausgefeilter Telemetrie: die Rolle von Buckets, Speedo und Continuous Virtual Binning (CVB)

Pages:

180 Antworten

Zeige alle Kommentare an

Kommentar

Lade neue Kommentare

Casi030

Urgestein

11,923 Kommentare 2,339 Likes

#1 Jan 11, 2024

Wie ist das Verhalten wenn man über den Takt drosselt etwas unterhalb des eingestellten PowerLimits?

Antwort Gefällt mir

Saschman73

Veteran

471 Kommentare 274 Likes

#2 Jan 11, 2024

:sneaky:

View image at the forums

Antwort Gefällt mir

Igor Wallossek

10,228 Kommentare 18,934 Likes

#3 Jan 11, 2024

Takt lohnt nicht. Die VRE regelt das besser, dann lieber einen Framezahlbegrenzer.

Antwort 1 Like

Tronado

Urgestein

3,779 Kommentare 1,976 Likes

#4 Jan 11, 2024

Takt ist ziemlich unabhängig vom PL, man kann (je nach Chip und Kühlergüte) durchaus auf 80% PL runtersetzen und immer noch 140 MHz übertakten.

Antwort 1 Like

Tronado

Urgestein

3,779 Kommentare 1,976 Likes

#5 Jan 11, 2024

Framelimit ist immer gut, wenn es geht. PL auch kein Problem, kaum weniger fps bei 75-80% PL.

Antwort 1 Like

big-maec

Urgestein

856 Kommentare 506 Likes

#6 Jan 11, 2024

Das mache ich in der Regel öfters, wenn ich merke, dass die Karte in Spielen unnötig hochheizt. Mache das meist so, weil ich auch etwas zu faul bin, mich damit auseinanderzusetzen, die Karte anders zu limitieren.

Antwort 1 Like

*andi*

Neuling

5 Kommentare 5 Likes

#7 Jan 11, 2024

Die Spikes finde ich immer noch brutal. Ich frage mich ob man das nicht mit einer Kombination aus Spulen und Kondensatoren deutlich glätten könnte. Nur fehlt mit das Wissen für die korrekte Auslegung sowie auch die Möglichkeit zu messen ob es was bringen würde... Und ich habe die Befürchtung das dass Netzteil aus dem Takt kommt wenn eine zu große Induktive/Kapazitive Last anliegt.

Antwort Gefällt mir

Tronado

Urgestein

3,779 Kommentare 1,976 Likes

#8 Jan 11, 2024

Was hast du denn für ein Netzteil? Alle guten, nicht zu alten NT ab 850W (Corsair/Seasonic/Be Quiet!) haben mit den auf 450W begrenzten Karten keine Probleme.

Antwort Gefällt mir

PCIE Express 6.9

Mitglied

27 Kommentare 11 Likes

#9 Jan 11, 2024

Ich hab meine 3080ti auch auf 850mV mittels Afterburner undervolted damit sich mein Netzteil nicht abschält.
Das Powerlimit hab ich zwar zusätzlich auf 300 Watt begrenzt aber gefühlt hat das nie wirklich geholfen.
Ohne Spikes liefen auch 450 Watt einwandfrei in einem Benchmark.
Aber beim Zocken sind die Spikes je nach Game schon extrem.

Antwort 2 Likes

Rizoma

Veteran

173 Kommentare 140 Likes

#10 Jan 11, 2024

Das sind schon heftige spitzen, was hat man für welche wenn sie karte mit 600w läuft? Dann hat man doch spitzen die über der 12VHPWR Spezifikation liegen die sind zwar nur sehr kurz aber häufig. Das wäre dann doch bei 600w dauerbetrieb und nicht optimal verarbeiteten Stecker sicherlich die ursache nr. 1 für geschmort Stecker.

Antwort Gefällt mir

MD_Enigma

Mitglied

76 Kommentare 39 Likes

#11 Jan 11, 2024

Ich verstehe die versteifung auf den Afterburner nicht. Kann man doch per command line machen und ist bei jedem NVidia Treiber automatisch installiert.
nvidia-smi -pl 300

Antwort 3 Likes

grimm

Urgestein

3,098 Kommentare 2,043 Likes

#12 Jan 11, 2024

ich habe bei 6900XT sowie bei der aktuellen 4080 sowohl mit UV als auch mit Framelimiter experimentiert. Am Ende hat der FL immer "gewonnen", einfach, weil die Karte sich nehmen kann, was sie braucht, die Lösung für jedes Spiel taugt und keine Feinjustierung braucht und es nie Ruckler gab.

Antwort 3 Likes

Starfox555

Urgestein

1,484 Kommentare 750 Likes

#13 Jan 11, 2024

Wie waren die Temperaturen an den Kontaktflächen des
bei der Limitierung durch den After Burner ?

Antwort Gefällt mir

Igor Wallossek

10,228 Kommentare 18,934 Likes

#14 Jan 11, 2024

Die Kontakte waren nie heißer als die Platine. Die ist ja nachgewiesenermaßen richtig heiß.

Antwort Gefällt mir

Igor Wallossek

10,228 Kommentare 18,934 Likes

#15 Jan 11, 2024

Ich schrieb ja nicht umsonst NVAPI, nur wird die Masse das nicht frickeln wollen. :D

Antwort Gefällt mir

Starfox555

Urgestein

1,484 Kommentare 750 Likes

#16 Jan 11, 2024

Und um wieviel Kelvin lag die Differenz der Platinen Temperatur zwischen "nativer Spannungsversorgung", Software-, bzw. Hardware-Limitierung?

Antwort Gefällt mir

arcDaniel

Urgestein

1,624 Kommentare 889 Likes

#17 Jan 11, 2024

Also, wie soll ich diese Aussage verstehen?

Wenn ich bei meiner 4080 die Spannungs/Taktkurve anpassen, bekomme ich bei 0,945V einen Takt von 2640mhz, dabei liegt der Verbrauch bei um die 225W mit Ausreißer um die 240W.

Nun wenn sich hier keine Optimierung lohnt... einfach auf 240W begrenzen, bekomme ich gemessen und spürbar in Spielen weniger Leistung. Im Bench werden dann die 2640mhz nicht mal mehr erreicht. Mit einem Frame-Limit bleibt auch da die Karte durstiger.

Wäre es so einfach würde ich wieder mehr Linux nutzen, es gibt aber da im Moment noch keine Möglichkeit die Spannungs/Taktkurve anzupassen...

Antwort 1 Like

Starfox555

Urgestein

1,484 Kommentare 750 Likes

#18 Jan 11, 2024

View image at the forums

CoreCtrl / CoreCtrl · GitLab

Profile based system control utility

View image at the forums

gitlab.com

Antwort Gefällt mir

arcDaniel

Urgestein

1,624 Kommentare 889 Likes

#19 Jan 11, 2024

Nützliches Tool, als ich noch eine AMD-GPU hatte.....

Antwort Gefällt mir

Alle Kommentare lesen unter igor´sLAB Community →

Danke für die Spende

Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kannst Du per PayPal spenden.

SHARKOON SGK50 S3 Mechanical Keyboard im Vergleichstest – Günstige 75% Tastatur mit Open-Source Firmware und angenehmem, variablen Sound

NiPoGi AK1 Plus Mini-PC im Test – Kurioses Inneres, Intel N97 und vielleicht ein Raspberry Pi Ersatz

About the author

View All Posts

Igor Wallossek

Chefredakteur und Namensgeber von igor'sLAB als inhaltlichem Nachfolger von Tom's Hardware Deutschland, deren Lizenz im Juni 2019 zurückgegeben wurde, um den qualitativen Ansprüchen der Webinhalte und Herausforderungen der neuen Medien wie z.B. YouTube mit einem eigenen Kanal besser gerecht werden zu können.

Computer-Nerd seit 1983, Audio-Freak seit 1979 und seit über 50 Jahren so ziemlich offen für alles, was einen Stecker oder einen Akku hat.

Folge Igor auf:
YouTube Facebook Instagram Twitter