Bei AMD liegt der Fall leider komplett anders, da muss ich jetzt doch etwas weiter ausholen. AMD lässt per Software lediglich die Auswertung der sogenannten TGP (Total Graphics Power) zu. Dieser Wert ist die Summe aus GPU (VDDC_GFX), Speicher (MVDD), Speicher-Controller (VDDCI) und SoC (VDD_SOC). Der Speicher-Controller ist bei AMD etwas tricky. Bei AMD gab es auf der Radeon VII noch zwei Sourcen, nämlich VDDRC für den HBM und VDDCI, auf den Vega-Karten und Navi nur noch MVDD und VDDCI. VDDCI ist übrigens reichlich speziell, aber leistungsmäßig kein großer Posten, obwohl wichtig.
Diese Spannung dient bei AMD nämlich dem GPU-internen Pegelübergang zwischen dem GPU- und dem Speichersignal, ist also quasi so etwas wie die Spannung zwischen dem Speicher und dem GPU-Kern auf dem I/O-Bus. Und wo hängt dann bei AMD der Speichercontroller? An beiden! Der Controller bezieht die Versorgung nämlich aus beiden Sourcen, was sich in diesem Fall nicht mehr sauber auftrennen lässt. Da man aber den Speichercontroller als Teil der GPU betrachtet, ist die Einbeziehung in die TGP nur folgerichtig.
Das Schema für die TGP-relevanten Bereiche zeigt, dass außer der GPU und dem Speicher wirklich NICHTS weiter mit einbezogen wird. Die Angaben von AMD beziehen sich also rein auf die GPU und den Speicher, EXKLUSIVE aller weiteren Verluste, auch die der Spannungswandler! Das zeigt sich auch darin, dass die Leistungsaufnahme heißer AMD Grafikkarten deutlicher ansteigen kann, ohne dass gleich die Performance komplett in den Keller geht.
DCR – AMDs Ersatzlösung für ein echtes Monitoring der Rails
Da auf den AMD-Karten auch keine Shunts und Monitoring-Chips verbaut sind, muss sich die Firmware die Daten anders beschaffen. Hierfür nutzt man Daten, über die alle Grafikkarten verfügen. So verwendet man ersatzweise einfach die Werte der Ströme, welche alle relevanten Spannungswandler ja sowieso liefern. Das geschieht am Ausgang der Phasen, also NACH allen anfallenden Verlusten. Um die Balance der Phasen abzusichern und um die einzelnen Regelkreise auch kontrollieren zu können, benötigt man ein spezielles Verfahren. Das Schlagwort heißt DCR (Direct Current Resistance). Und nun verstehen wir auch, dass diese nur lokal erhobenen Daten unvollständig sind, weil sie noch nicht mal die Lüfter mit einbeziehen, geschweige denn die anderen verbauten elektronischen Verbraucher und Platinenverluste.
Doch wie geht das mit der DCR? So weist jedes Bauelement diesbezüglich ganz bestimmte Charakteristika auf und um es einmal abzukürzen: Die DCR ist die Basis, um Temperaturen und Ströme zu kalkulieren oder zu messen. Doch wie erfährt der Controller nun genau, welche Ströme in welchem Regelkreis fließen? Das Monitoring kann unterschiedlich sein, denn es gibt – wen wundert es – verschiedene Methoden dafür. So liest man bei mir oft etwas von Smart Power Stages (SPS) und IMON (Strom). IMON ist ja genau das, was die sogenannte MOSFET DCR liefert und was wir so dringend brauchen!
Das Bild oben zeigt das typische Layout mit den intelligenten SPS, die für jeden einzelnen Regelkreis mit IMON den Wert für die Stromstärke (current) liefern, den man für das perfekte Balancing, also das Gleichgewicht zwischen den Phasen, so dringend braucht. Wie die SPS diesen Wert ermitteln? Es werden die Drain-Ströme der MOSFETS in Echtzeit gemessen und diese Werte sind zudem auch extrem genau (im Beispiel oben 5 μA/A Signal). Mittlerweile nutzen die leistungsstärkeren AMD- und vor allem auch NVIDIA-Karten die MOSFET DCR.
Diese sehr kostenintensive Lösung ersetzt die deutlich günstigere Inductor DCR, also eine Strommessung über den induktiven Widerstand der jeweiligen Filterspulen im Ausgangsbereich. So eine Lösung verwenden AMD und Nvidia zum Beispiel für preiswerte Karten (Symbolbild unten), wo es etwas gemächlicher beim Stromfluss zugeht. Die Genauigkeit dieser Lösung ist allerdings deutlich geringer und wird zusätzlich noch durch Schwankungen der Bauelemente-Güte sehr stark beeinflusst. Zu große Toleranzen können also schnell auch einmal die komplette Balance kippen!
Die Qualität der Spulen ist immer so eine Geschichte für sich und es erklärt auch, warum es immer wieder zu Problemen und Ungenauigkeiten kommt. AMD hat jahrelang auf diese Inductor DCR gesetzt, die aber nicht mehr als eine grobe Schätzung ist und vor allem bei höheren Temperaturen zunehmend ungenauer wird. Erst die Radeon VII nutzt (dafür umso teurere) SPS von International Rectifier und somit auch erstmalig vollumfänglich MOSFET DCR für die wichtigen Spannungsregelkreise. Das alles hat zwar nur indirekt mit den Spannungswandlerverlusten zu tun, hilft aber dem Controller bei der optimalen Ansteuerung und Überwachung der Phasen. Damit lassen sich Überlasten und Hotspots vermeiden oder reduzieren und am Ende profitiert davon natürlich auch die Effizienz. Und natürlich freut sich auch die Auslese-Software, weil die TGP genauer erfasst werden kann.
Das Auslesen per Software ist unmöglich und nicht plausibel
Die TGP liegt bei großen Grafikkarten teilweise sogar über 100 Watt unterhalb der tatsächlichen Gesamt-Leistungsaufnahme so einer Karte! Wer das dann aus der Software für bare Münze nimmt, betrügt sich leider selbst. Oft auch, ohne es zu wissen. Und wenn man dann die Diskussionen in den Foren so liest, wie effizient die jeweilige Radeon denn sei, dann weiß ich auch, warum ich den heutigen Artikel geschrieben habe. Den Beweis bleibe ich Euch auch nicht schuldig, einmal müsst Ihr noch weiterblättern.
657 Antworten
Kommentar
Lade neue Kommentare
Urgestein
1
Urgestein
Veteran
Mitglied
Veteran
Urgestein
Urgestein
Urgestein
1
Urgestein
1
Urgestein
Urgestein
Urgestein
Urgestein
Veteran
Urgestein
Urgestein
Alle Kommentare lesen unter igor´sLAB Community →