NVIDIA GeForce RTX 3080 und RTX 3090 und die Crashs - Warum die Kondensatoren so wichtig sind und was eigentlich dahinter steckt | Seite 2

Von den Spannungswandlern fließt nun der Strom bis zur GPU, wobei man hier noch die zusätzliche Induktivität der Leiterbahnen berücksichtigen muss. Betrachtet man nun noch die ganzen hohen Frequenzen (und die in der Folge auch entstehenden Frequenz-Gemische), also z.B. den verbleibenden HF-Müll der Spannungswandler und die sehr schnell wechselnden Lasten (auf die Boost wiederum ja auch mit Spannungsanpassungen reagiert), dann ist die anliegende Versorgungsspannung alles andere als stabil und glatt. Womit wir wieder am Anfang angelangt wären. Um für einen bestimmten Takt auch die benötigte Spannung zu erhalten, benötigt man eine Glättung und auch Pufferung. Und zwar so nah wie möglich an der GPU. Genau deshalb sitzen die Kondensatoren, um die es jetzt geht, ja auch direkt auf der Rückseite der Platine unter dem BGA mit dem Chip. Und genau da wird es interessant!

Es ist übrigens falsch, dass die hohen Taktraten der GPU von z.B. 2 GHz oder mehr unterhalb der GPU noch auf der Platine nachweisbar wären. Wie viele Taktzyklen so eine GPU pro Sekunde durchläuft, hat mit dem Problem nur indirekt zu tun. Allerdings hatten wir ja schon den Zusammenhang von Taktrate und Spannung, sowie der Telemetrie und den Regelgeschwindigkeiten. Nachweisbar sind hier Regelvorgänge im dreistelligen KHz-Bereich, wo z.B. Spannungen und Frequenzen den Änderungen unterliegen. Diese Änderungen schlagen übrigens auch rückwärts wieder bis zu den Spannungswandlern und den 12-Volt Versorgungs-Schienen durch.

Der Arbitrator setzt für einen stabilen Betrieb natürlich stets voraus, dass für jeden Boost-Takt, der freigegeben wird, auch wirklich die passende Spannung anliegt. Folgen die Lastwechsel jedoch sehr schnell hintereinander, kann es unterhalb der GPU zu Spannungseinbrüchen kommen, wenn nicht noch einmal zweckmäßig gepuffert wird. Schlägt das fehl, spricht man von sogenannten Voltage-Drops. Wenn diese nur sehr kurz auftreten, dann stürtzt nicht gleich der ganze Rechner ab oder die GPU freezt, sondern es beginnt zunächst mit leichten Rechen- bzw. Bildfehlern bis hin zum kompletten Ausfall ganzer Zyklen. Dann crasht nur das jeweilige Programm (Spiel) und man landet erst einmal wieder auf dem Desktop.

Was unterscheidet MLCC und SP-CAP bzw. POS-CAP?

Viele der elektrischen Daten sind für die nachfolgende Betrachtung eher unwichtig. Solange die Komponenten innerhalb der vorgegebenen Spezifikationen betrieben werden, interessieren da noch nicht einmal primär die Temperaturen, Widerstände und sonstige Parameter. Was hier wirklich zählt, sind einerseits die Geschwindigkeit der Ladung bzw. Entladung, sowie die Menge dessen, was überhaupt gespeichert werden kann (Kapazität). Dass Ingenieure die ganzen Polymer-Kondensatoren (egal welcher genauen Bauart) auch gern pauschal nur als POS-CAP bezeichnen (und eben nicht nur die von Panasonic), liegt einfach auch in der Art der Verbreitung dieser Komponenten begründet und auch daran, dass man sie bei den Entwicklern gern flapsig als Piece-Of-Shit CAP tituliert. Was genau auf den Platinen als Polymer-Kondensator verbaut wurde, spielt für die Wirkungsweise übrigens auch keine primäre Rolle, denn das Prinzip ist bei jeder Variante stets das Gleiche.

Das nachfolgende Bild zeigt die Mischbestückung der Founders-Edition für die Versorgung der Kernspannung (NVVDD). Wir sehen zwei Polymer-Kondensatoren und eine Gruppe aus mehrschichtigen Keramik-Kondensatoren (MLCC). Den Unterschied zwischen den Typen kann man übrigens anhand von Eimern ganz nett umschreiben. Der Polymer-Kondensator besitzt die höhere Kapazität. Es ist also der größere Eimer, dessen Fassungsvermögen höher ist, dessen Befüllen und Entleeren jedoch auch deutlich länger dauert. Die Gruppe aus MLCC ist wie viele kleine Eimer, die man schneller füllen und leeren kann. Man benötigt aber mehrere Exemplare, die gleichzeitig arbeiten, um dieselbe Menge Wasser speichern und freigeben zu können.

Und was hat das nun mit dem GPU-Takt zu tun? Primär erst einmal nichts, denn den merkt man hier unten ja gar nicht. Deshalb habe ich ja bei der Erklärung auch den Umweg über die Telemetrie gesucht! Aber: je höher die Taktfrequenz der GPU ausfällt und damit auch die benötigte Spannung ist, umso eher wird von Boost auch wieder gegengesteuert und geregelt. Je näher man also der hinterlegten Grenze kommt, umso häufiger werden die Korrekturen und auch Lastwechsel. Je kürzer die Intervalle werden, umso schneller muss man puffern können. Genau da aber kommen nun die kleinen MLCC-Eimer ins Spiel, von denen ich ja bereits schrieb, dass sie im hochfrequenten Bereich einfach besser, weil flinker sind.

Die MLCC sind also faktisch die Feinmotoriker und Sprinter bei Pufferung und Filterung, die trägen und eher schwerfälligen Solids sind dann die Lastenträger fürs Grobe. Fehlen die MLCC, wird es bei sehr schnellen Wechseln kritisch, weil die Versorgungsspannung gleich für mehrere Zyklen unter den benötigten Wert einbrechen kann. Allerdings kommt hier auch die Chipgüte mit ins Spiel, da ja in der Firmware nur Richtwerte hinterlegt wurden. Viele GPUs sind von der Güte her deutlich besser, so dass sie eigentlich sogar deutlich weniger Spannung bräuchten, um noch stabil arbeiten zu können.

Man käme übrigens auch ganz ohne Solid aus, solange die Kapazität der MLCC-Gruppen für die Pufferung ausreicht. Hier ist natürlich auch die Qualität der vorgeschalteten Spannungswandler und Spulen bzw. Kondensatoren, sowie die Führung der Leiterbahnen wichtig. Ganz ohne MLCC geht es aber eigentlich nicht und nur bedingt. Warum das so ist? Da kommen wiederum die Güte einer GPU und das Binning ins Spiel.

Fazit und Schlussbemerkung

Besitzer von Karten, die trotz sechs Solids noch richtig stabil laufen, haben also eigentlich alles der sehr guten Chipgüte zu verdanken. Besitzer von Karten mit MLCC, bei denen es trotzdem zu Fehlern kommt, dürfen sich über eine GPU ärgern, die noch nicht einmal durchgängig mit der hinterlegten Spannungs-/Frequenzkurve klarkommt. Genau das ist jetzt der Punkt, wo die Boardpartner mangels passender Treiber bei den ersten Karten gar nichts testen konnte. Hier sind sicher viele Karten in Umlauf gegangen, die nicht als OC-Karten tauglich gewesen wären.

Dass NVIDIA die Versorgungsspannungen der GPU auf NVVDD und MSVDD aufgeteilt hat zeigt aber auch, dass man sich dort der Problematik durchaus bewusst ist. Das ich bei der MSVDD deutlich weniger Änderungen feststellen konnte und diese auch unabhängig von der NVVDD erzeugt wird, sollte man auch mit einer zweckmäßig bestückten MLCC-Gruppe noch locker hinkommen. mehr MLCC schadet also nicht, wenn der Rest des Layouts diese Interpretation auch erlaubt. Ganz ohne wird aber langsam und träge.

Ich hoffe, es war nicht zu kompliziert, auch wenn jetzt sicher wieder einige glauben, ich hätte es wiederum viel zu stark vereinfacht. Doch ich bin weder die Igorpedia, noch die höhere Lehranstalt für angehende Layouter und Platinendesigner. Es geht einzig und allein ums Prinzip und das Verständnis dessen, was hier gerade mit diesen Karten passiert (wenn es denn passiert).

Pages: