Grafikkarten Grundlagenartikel Praxis Testberichte VGA

GDDR6 Speichertemperaturen verständlich erklärt und nachgemessen – macht AMD alles richtig? | Grundlagen

Messung von Tboard an der Platinen-Rückseite

Über die Tropikalisierung habe ich ja bereits gesprochen, so dass ich die Messwerte auch als verlässlich einstufen würde. Trotz des guten Equipments würde ich auch hier mit ca. 1 Grad Toleranz rechnen, mehr aber auch nicht. Zum Einsatz kommt Furmark, den ich 30 Minuten laufen lasse, bis ich final messe. Die Raumtemperatur liegt bei 22 °C, der Aufbau ist diesmal offen, weil ich eine konstante Umgebungstemperatur benötige. Man sieht auf der Platine sehr gut den Unterschied zwischen den Speichermodulen, die sich auf der Seite zwischen GPU und VRMs befinden und denen an der Oberseite der Platine, die bereits etwas kühler agieren und nicht negativ von den Wechselwirkungen der anderen heißen Bereiche bzw. der Leiterbahnen aus Kupfer beeinflusst werden.

Diese Messung zeigt dann auch deutlich, warum man sich Kupfer für die drei hier rechts deutlich kühler agierenden Speichermodule auch schenken kann. Aluminium tut es an dieser Stelle ebenfalls gut genug, kostet aber deutlich weniger. Ich habe also an der heißesten Stelle an der Platine knapp 65 °C unterhalb des Speichers messen können und es wird interessant sein zu sehen, was dann auf der Oberseite passiert. Im Übrigen habe ich den Temperaturverlauf mit der zur Kamera passenden Software Pixconnect von Optris ebenfalls aufgezeichnet, um diese Daten bei der nächsten Grafik mit einbauen zu können

Messung von Tcase auf der Speicheroberseite und Ermittlung von Tjunction im Speicher

Jetzt kommt zusätzlich der Logger zum Einsatz, der die Typ-K-Sensoren in 1-s-Intervallen erfasst, sowie GPU-Z.  Ich verwende für die Kurven, da AMD ja auch nur das heißeste Modul betrachtet, die höchsten der für Tcase gemessenen Werte und die korrespondierenden Daten der Messung von Tboard mit der Infrarot-Kamera. Das Ergebnis ist nicht überraschend, wenn man weiß, wie die einzelnen Temperaturwiderstände der Schichten ausfallen, aber der Normalanwender wird jetzt durchaus staunen.

Außerdem muss ich mich selbst ebenfalls etwas korrigieren, da die Werte für Tjunction bei intensiverer Betrachtung durchaus plausibel scheinen, wenn man die hohe Wärmedichte durch den eher winzigen Chip im Inneren des großen Packages berücksichtigt. Doch bevor ich jetzt meine finalen Schlüsse ziehe, wollen wir uns den Kurvenverlauf aller Temperaturen einmal im Detail ansehen:

Nach dem Aufheizen bleibt ab Minute 13 alles konstant, man kann also jeweils von der finalen Temperatur ausgehen, die sich auch nach 30 Minuten nicht mehr ändern. Um den Verlauf besser erkennen zu können, ist im Diagramm auch nach der 15. Minute Schluss. Das Innere der GPU meldet ca. 53 °C, die Platinen-Unterseite ist mit ca. 58 °C deutlich heißer. Und was passiert nun mit den Speichermodulen? Das heißeste (Modul #2 auf dem IR-Bild) befindet sich in Spannungswandler-Nähe und bringt es auf eine Tboard von ca. 65 °C, eine Tcase (einschließlich der erklärten Offsets) von ca. 69 °C und eine Tjunction im Inneren von 84 °C. Damit ergibt sich ein Delta von 15 Grad zwischen Chip und Moduloberseite sowie von 19 Grad zur Platinen-Unterseite bei dieser sehr guten Luftkühlung und ohne Backplate-Kühlung für den Speicher.

Frühere Experimente mit einem Wasserblock und vielen Backplate-Belegungs-Varianten haben noch weitere interessante Einflüsse aufzeigen können. Kühlt man nur den Speicher rückseitig nun mit einem guten Pad zwischen der Backplate und der Platine, sinkt Tboard noch einmal um weitere 4 Grad, was auch Tjunction um 1 bis 2 Grad sinken lässt. Bei der Wasserkühlung ist Tcase zudem deutlich niedriger als Tboard, was eine rückseitige Kühlung um so interessanter machen könnte.

Verschiedene Tests mit unterschiedlichen Pad-Materialien haben zudem ergeben, dass eine großflächige Belegung mit sehr gutem, durchgehenden Kontakt und der Aufnahme von höheren Bauelementen und Lötpunkten in das Pad-Material mit Hilfe spezieller Ultra-Soft-Pads (siehe oben) besser performt, als nominell (von der Wärmeleitfähigkeit her) bessere Pads, die aber starrer ausfallen und die zudem zum Ausbluten des Silikons neigen. Nvidia hat als erster größerer Grafikkartenhersteller zuerst auf diese Pads gesetzt, zu Recht übrigens.

Zusammenfassung und Fazit

Dass Speichermodule im Inneren deutlich heißer werden können, als es die Außenfläche auf der Moduloberseite des Packages oder die Unterseite der Platine vermuten lassen, ist kein Geheimnis. Wobei mir das Delta von 15 Grad zur Oberfläche des Packages trotzdem noch relativ hoch erscheint. Setzt man jetzt für GDDR6 die gleiche Tjunction von 100 °C an wie für den GDDR5, wäre bei einer Oberflächentemperatur von ca. 85 °C bereits Schluss mit lustig. Doch auch so ein hoher Wert ist noch kein Grund zur voreiligen Panik, wenn man die Zusammenhänge aller Temperaturen versteht.

Was bedeutet das für mich? Da die aufgeklebten Heatsinks in meinem Test auch nicht der Weisheit letzter Schluss sind, wohl aber für diesen Testaufbau völlig ausreichen, eine Wasserkühlung jedoch deutlich niedrigere Delta-Werte erreicht und dann sogar die Rückseite der Platine wärmer wird als das Package oben, muss ich wohl in Zukunft bei meinen Grafikkartentests eine weitere Messung und Betrachtung hinzufügen, um sicher von Tboard auf Tcase schließen zu können. Und ich habe mir am Ende das Gegenteil dessen bewiesen, das ich guten Glaubens auch öffentlich vertreten habe. Schön, wenn man es dann wenigstens selbst tut, somit fällt auch die Einsicht leichter. 🙂

Fakt ist aber auch, dass die ausgelesene Tjunction durchaus stimmen könnte, wenn man es als reinen Worst-Case-Wert betrachtet, der explizit die Temperaturspitze im Inneren des heißesten alles Speichermodule erfasst und sonst nichts. Kühlt man nämlich dieses särker und lässt den Rest unverändert, sucht sich die Firmware den nächsten Hotspot. Ergo sollte man also Tjunction durchaus ernstnehmen, denn abzüglich aller Toleranzwerte scheint das Ergebnis zwar oft sehr hoch, aber eben auch einigermaßen plausibel.

Bedauerlicherweise halten sich AMD und auch die Boardpartner eher bedeckt, wenn es um die exakte Verwendung dieses Wertes für die Regelung der Performance (Herunterthrotteln) oder Sicherheits-Features wie Abschaltvorgänge geht, aber so ganz für umsonst wird man sich die Mühe sicher auch nicht gemacht haben. Ob Nvidia ähnliche Werte intern ausliest und verwendet, ließ sich bis jetzt auch nicht verlässlich herausbekommen. Bei den offenliegenden Sensordaten findet man jedenfalls aktuell nichts. Wenn es was Neues gibt, erfahrt Ihr es natürlich mit als Erste, versprochen.

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kannst Du per PayPal spenden.

About the author

Igor Wallossek

Chefredakteur und Namensgeber von igor'sLAB als inhaltlichem Nachfolger von Tom's Hardware Deutschland, deren Lizenz im Juni 2019 zurückgegeben wurde, um den qualitativen Ansprüchen der Webinhalte und Herausforderungen der neuen Medien wie z.B. YouTube mit einem eigenen Kanal besser gerecht werden zu können.

Computer-Nerd seit 1983, Audio-Freak seit 1979 und seit über 50 Jahren so ziemlich offen für alles, was einen Stecker oder einen Akku hat.

Folge Igor auf:
YouTube   Facebook    Instagram Twitter

Werbung

Werbung