Total Board Power (TBP) vs. real power consumption and the inadequacy of software tools vs. real measurements

NVIDIA does everything right, actually…

NVIDIA’s monitoring is done on the board at the respective 12-volt rails, i.e. at the respective external PCIe sockets (Aux) and the motherboard slot (PEG) BEFORE the respective consumers are supplied. This task is done, similar to my already shown measurement setup, with so-called shunts in the input area just before the filtering directly at the respective rails. The very low impedance longitudinal resistors (shunts) used produce a small voltage drop, which is made possible by two voltage taps (before and after the resistor). The approx. 1.5 to 5 watts (depending on the flowing currents) that occur here do not yet fall into the TBP budget (power limit) of the graphics card.

The whole thing is then calculated with a suitable monitoring chip, which can usually monitor up to four channels. The voltage difference can be used to infer the flowing current and, together with the output voltage downstream of the shunt, even the power consumption in watts (W). So the whole thing is basically nothing else than my already shown measurement setup and thus also valid for the TOTAL card!

Now let’s look at the graphics card as a scheme. We see here as “Current Sense” the two places where the currents (and voltages) are sensed and where then in the “Power Monitor” the data is generated for the firmware to meet the power budget. We can see in the yellow highlighted area that both the GPU and the memory and all other consumers including their voltage converters (and their losses), as well as the losses of all components and even the board are included. Thus, NVIDIA understands Total Board Power (TBP) as the power consumption of the entire graphics card including fans and RGB gadgets!

The firmware (and of course Boost) can now ensure that this maximum value is never exceeded for a longer period of time and that the default value is maintained again in a larger interval. All these values can be read out and used quite easily via the NVAPI (programmer interface). Here you can also see which maximum or minimum value is permissible or has just been set. Programs like MSI Afterburner also orient themselves on these values when it comes to the start and end values of the slider for the power target to be selected. In the worst case, the set power target is equal to the max power limit stored in the firmware and you can no longer increase anything manually.

Why performance drops sharply with hot cards

We know the effect that with fully warmed up NVIDIA cards (especially with poor cooling) the clock (and thus the performance) drops more than it is observed with mostly AMD graphics cards. This, in turn, is due to the way NVIDIA manages its very restrictive power budget. People usually blame the lack of the highest boost steps on warmed-up cards on the GPU and leakage currents, but this is only part of the truth. The smallest, mind you, because the greatest losses are incurred by the hot voltage transformers!

Many people are not particularly aware of the fact that voltage converters have to be cooled as well as possible. But the losses that occur here are enormous! If a normal regulation with Smart Power Stages (SPS) or DrMOS for NVVDD/MSVDD (i.e. the GPU) usually works with an efficiency of 85% and higher when the card is cold, this efficiency drops to as low as 80% if the voltage converters get hot. The more efficient and higher-quality these components are, the smaller this effect is. With a discrete low and high side consisting of single MOSFETs as well as separate gate drivers, some cards do not even reach 80% in cold state and this value can then even drop below 75%! All the power that is lost here and already converted into heat is lost to the GPU later. This also applies to all other components that generate power dissipation, no matter where they are located on the board.

It’s no coincidence that Nvidia has moved away from the so-called phase doubling, where the up to eight real phases that such a PWM controller can provide are virtually doubled by means of so-called doubler chips by simply driving the newly generated phase out of phase. In the meantime, however, there are also PWM controllers that allow parallel and thus in-phase operation of several voltage transformer circuits. In the following picture we see on the left a highly integrated Smart Power Stage (SPS) with integrated high-side and low-side, as well as gate driver and Schottky diode. On the right, we see two discrete phases, each with a MOSFET on the high side (Q681 and Q684) and a parallel pair on the low side (Q686+Q685 and Q683+Q682), as well as an external gate driver (U630 and U631)


However, since capacitors alone are not sufficient to achieve a high-quality and ripple-free voltage at the end of the PWM nodes (see also the operation of a switching power supply), the output of the voltage converter circuit is terminated with an LC element (coil + capacitor). These coils, which store and then release the briefly charged energy, have both electrical and inductive resistance, which pushes efficiency down yet again. Sounds like an unsolvable problem, and by the way, it is, because you can’t endlessly increase the cross-sections of the windings to at least lower the ohmic resistance. Especially since the inductance remains. In the picture below we see a typical coil for the GPU phase on the left and one with higher inductance for the memory on the right. Although lower values are now being used again for this purpose as well.


In addition, of course, there are synchronization and balancing problems, the more phases you condense in this way. In the meantime, however, PWM controllers are capable of intelligently controlling the utilization and use of phases at low and partial loads. But how does all this affect the GPU itself? For example, a card that consumes a total of 350 watts of power (example of a GeForce RTX 3090 FE) can effectively use 230 watts of it when cold. If the efficiency of all installed voltage transformers drops sharply due to extreme heating, that’s still 200 to 210 watts that remain!

Readout via software is possible and plausible

The good side of NVIDIA’s control and limitation mania is the fact that you can read the performance limitation and monitoring values quite easily and accurately via software. The very rough intervals do not allow any statements about load peaks, but if you log over a long period of time, the result is hardly different from what I can measure as a long-term value with much more elaborate technology in the same length of time. The results of the current MSI Afterburner, GPU-Z and HWInfo can therefore be trusted. more on this later.

657 Antworten


Lade neue Kommentare



1,915 Kommentare 899 Likes

Soviel mehr hätte ich jetzt net erwartet.

Ansonsten mal schön zu sehen, wieviel mehr Watt die heisse Graka ggü. der Kalten verbraucht.
Da lohnt es sich bestimmt ab nem Punkt X gar net mehr so richtig, noch mehr W drauf zu braten.
(mal abgesehen davon, das ne Air6900 bei 95°C - Hotspot oder gar niedriger schon langsamer wird, dito NV
auch bei einigen Grakas den GPU-takt runterstept; ... sofern net vorher der Vram schon zu heiss war)

Außerdem gut, das die 3,3V mit erwähnt wurden, was manche Reviewer gerne unterschlagen.

Antwort 2 Likes

Igor Wallossek


11,253 Kommentare 21,328 Likes

Hund-Schwanz-Prinzip. Richtig.

Antwort 3 Likes



1,915 Kommentare 899 Likes

Das beste Bsp. Hierzu war bisher hier das Review zum UVen bei der 6800 von Gurdi. (oder das 300W-Review zur Ti letztens)
Ohne großen Leistungsverlust (fps) wurden 40W asic bzw. 20% bei der 6800 gespart!
(da war bestimmt das "kalt" halten sinnvoll)

Antwort 3 Likes

Klicke zum Ausklappem


144 Kommentare 138 Likes

Solange ich noch am Durchtesten des Systems bin hab ich immer nen einfaches Energiemeßgerät an der Kiste hängen.

Schon erstaunlich wieviel W man mit ein bisschen Undervolten und Übertakten ohne Leistungsverlust an Grafikkarten so Einsparen kann.

Antwort 1 Like



34 Kommentare 29 Likes

Danke dir Igor für die immer wieder sehr interessanten, tiefergehenden und sehr technischen Artikel. Schön zu sehen das du nicht einfach immer nur "nachplapperst" sondern den Sachen tatsächlich auf den Grund gehst und auch mal den Finger in die Wunde legst, wenn es sein muss!

Antwort 6 Likes



156 Kommentare 63 Likes

Super Beitrag, auch für elektrotechnische Laien eine plausible Erklärung, Danke dafür Igor !

Antwort 1 Like



3,290 Kommentare 2,220 Likes

Der Aufbau sieht extrem aufwändig aus - Danke für den ausführlichen Test!

Antwort Gefällt mir



11,923 Kommentare 2,340 Likes

Du hast aber nicht zufälligerweise Screens von HWINFO64 gemacht von NVIDIA und AMD um die Daten mal zu vergleichen?
Was Ich z.b. nicht verstehe ist wenn ich im AMD Treiber PPT 300Watt einstelle,dann zieht die GPU um 225Watt und der Rest zieht 75Watt damit es die 300Watt sind.Was verbaucht jetzt noch mal rund 30% mehr?

Antwort 1 Like

Martin Gut


8,247 Kommentare 3,924 Likes

Endlich verstehe ich, wie unterschiedlich die Hersteller die Leistungsaufnahme messen. Da ich noch keine AMD-Grafikkarte hatte, habe ich mich noch nicht so genau damit befasst.

Um die GPU immer mit einer bestimmten Leistung laufen zu lassen, macht die Messung von AMD natürlich Sinn. Für die Überwachung der Spannungswandler und der ganzen Leistungsaufnahme bringt das natürlich wenig.

Nun übertakte ich meine Nvidia-Grafikkarte, indem ich die Lüfter über das Mainboard versorge. Dann bekommt die GPU schon ein paar Watt mehr. Interessante Denkweise. 😉

Antwort 1 Like

Igor Wallossek


11,253 Kommentare 21,328 Likes

Du hast den Artikel nicht gelesen. Bei AMD stellst Du NIEMALS die gesamte Karte ein. Und wenn Du 300 Watt fürs Power Target vorgibst, dann müssen die gar nicht reale 300 Watt TGP am Stecker sein, weil Du im Wattman die TDC ja nicht mit anheben kannst und die Spannungsbegrenzung für eine Leistungsbegrenzung sorgt. Das ist schon etwas komplexer und AMD ist alles außer Chip und Speicher schnurzegal.

HWinfo liest NVIDIA auch richtig aus, nur AMD ist halt komplett beschnitten, weil das nur ein paar DCR-Werte sind. Da kann HWInfo nichts dafür. Die Werte decken sich mit denen von GPU-Z und dem Afterburner, weil alle die gleiche API nutzen. AMD kann man icht komplett auslesen. Nur hochrechnen, wenn man die Komponenten genau kennt. Über die gemessenen Temps und die Datenblattkurven der SPS kommt man schon recht ordentlich voran, wenn man die restlichen Verluste noch mit ausrechnen kann. Ich kann das, aber der Normalanwender nicht. Der muss dann grob schätzen, was fast immer schief geht.

Antwort 2 Likes



1,370 Kommentare 900 Likes

Schöner Artikel, bei AMD brauch man schon ein digitales Netzteil um valide Werte zu berechnen von der TBP. Die Karten unterscheiden sich da teils gravierend. Meine 6800XT LC brauch schon 40-50 Watt extra trotz sehr guter Kühlung, die 6800 dagegen ist deutlich genügsamer mit 20-30Watt.

@Igor Wallossek Wie misst eine NV Karte den PEG? Sitzen da auch nochmal Shunts?

Antwort Gefällt mir

Igor Wallossek


11,253 Kommentare 21,328 Likes

Ja, das steht sogar im Artikel. Schau mal aufs Schema, den Bereich habe ich sogar eingezeichnet und beschrieben. Current Sense :)
Bei der abgebildeten Karte ist der Shunt auf der Rückseite.

Digitale Netzeile sind aber auch nur Schätzeisen, denn die Auflösung ist wirklich mies. Dann lieber das Teil von Elmor. Allen gemeinsam ist aber, dass man die 3.3 Volt nicht bekommt. :D

Antwort 1 Like



1,370 Kommentare 900 Likes

Die 3,3V kann ich ohne Probleme messen am Netzteil. Das Digifanless ist dabei auch recht genau, hast du sogar selbst gesagt (und hast es auch selbst verwendet wenn ich mich recht erinnere)

View image at the forums

Antwort Gefällt mir



2,230 Kommentare 867 Likes

Ich finde diese Werte bis auf 3 Stellen hinterm Komma immer wieder amüsant. Ich wäre sehr überascht, wenn so ein Netzteil das tatsächlich so genau messen kann, dass die 3te Stelle hinterm Komma noch ernsthaft aussagekräftig ist.

Ich lasse mich da gerne natürlich gerne positiv überraschen, bin da ber trotzdem eher pessimistisch.

Antwort 1 Like



663 Kommentare 375 Likes

@ Herr Wallossek
Schöner und sehr interessanter Artikel, vielen Dank. Fühle mich etwas in die 90er versetzt, als ich noch in der Elektrotechnik tätig war.

Bezgl. GPU Spannungen in Tools auslesen, bei Ampere z.B. soll es die Möglichkeit geben, die 'echte' NVVDD auszulesen, also die real anliegende Spannung der GPU, welche nicht mit der 'gewünschten' GPU Spannung (der Takt-Spannung-Kurve) übereinstimmen muss, welche die gängigen Tools anzeigen. Diese 'echte' NVVDD habe ich bisher nur in Ampere Tools gesehen. Ist für mich mittlerweile bei OC/UV ein wichtiger Punkt, genau wie GPU Clock vs. GPU Effective Clock, der einem etwas mehr darüber erzählen möchte/könnte, in welchen Betriebszuständen (Spannung vs. Clock) sich die GPU wohler fühlt, als in anderen Bereichen (Stichwort Sweet Spot(s)). Gibt es dazu Informationen, über welche Sie reden dürfen?

@ Martin G
Ja genau, der PWM Wert für die Lüfterdrehzahl wird von der GPU auch ausgegeben, wenn kein Lüfter angeschlossen ist. Diesen Wert kann man dann per Software (z.B. FanControl) auf Lüfter kopieren resp. synchronisieren, welche anderswo (z.B. am Mainboard) angeschlossen sind. Wenn man es Software-unabhängig machen möchte, kann man ein Spezial-Kabel machen und das originale PWM Signal Hardware-seitig vom GPU Fan Stecker abzapfen, Energieversorgung über das Mainboard.

@ Deridex
Dito, habe deshalb alle Nachkommastellen in HWInfo ausgeschaltet, ausser dort, wo sie wirklich im relevanten Wertebereich liegen. Gibt zudem ein aufgeräumteres, weniger 'nervöses' Monitoring.

Antwort Gefällt mir

Klicke zum Ausklappem
Martin Gut


8,247 Kommentare 3,924 Likes

Ich habe meine Lüfterregelung auf der Grundlage von Openhardwaremonitor selbst programmiert. Damit kann ich CPU- und GPU-Temperatur auslesen und die Lüfter so regeln, wie ich es haben möchte. Die Grafikkartenlüfter habe ich durch einen 14 cm-Silentlüfter ersetzt. Die Grafikkarte hat die Lüfter immer pulsierend laufen gelassen, was echt nervig war. Dazu hat der CPU-Lüfter bei jeder kurzen Lastspitze hörbar aufgedreht. Nun habe ich es so geglättet, dass die Lüfter eine etwa Minute brauchen bis sie sich angepasst haben. So lange braucht es so oder so, bis sich die Kühler richtig erwärmt haben und auch die Wärme abgeben können.

Dadurch ist mein PC praktisch lautlos geworden. Es hat einiges gebraucht, bis ich zu der Lösung gekommen bin. Aber es hat mir einfach keine Ruhe gelassen (wörtich gemeint), bis es richtig funktioniert hat.

Antwort 4 Likes



353 Kommentare 148 Likes

Naja, wie funktionieren denn die digitalen Netzteile? Ich habe ein etwas älteres Corsair AXi 760, das misst meiner Meinung nach viel Mist. Laut Netzteil braucht mein Rechner (R5 2600, B450 Pro4, 2x8GB Balistix 3200er DDR4, R9 Nano, Kingston A2000 512GB und Crucial P1 1TB) im Leerlauf um die 180W, mehrere Leistungsmessgeräte attestieren um die 50W. Das ist schon ne massive Differenz. Unter Volllast kommen ich etwas über 300W, da stimmt das Netzteil dann auch relativ ordentlich mit den Messgeräten überein.
Oder anders ausgedrückt: Die Netzteile helfen auch nur, wenn sie korrekt messen. ;)
@Igor Wallossek : Wie ist das eigentlich bei den Netzteilen? Da wird vermutlich in der Regel über Shunts gemessen, oder? Sorry für etwas OffTopic, aber irgendwie passt das doch auch halbwegs zum Thema.

Antwort Gefällt mir



1,370 Kommentare 900 Likes

Das Digifanless wirft sehr akkurate Messwerte aus, da gibts nichts dran zu bemängeln. Das ersetzt natürlich keine professionelle Messung, aber es ist der einzig gangbare Weg die TBP einer Radeon selbst zu messen und wenn man weiß wie, geht dass auch bis auf 5 Watt genau.

Antwort 2 Likes



663 Kommentare 375 Likes

@ Martin G
Top aktuelles Thema und Garantie für interessante Gespräche, hier aber wohl off-topic...

Antwort Gefällt mir

