Wenn man eher flapsig schreibt, bei der RX Vega wäre alles ein wenig anders, dann liegt man gar nicht einmal so falsch. Neben der interessanten Technologie rund um den Interposer und den verwendeten HBM2-Speicher stellen sich natürlich auch neue technologische Herausforderungen in den Weg, über die ich ja bereits letztes Jahr in meinem Artikel “Verwirrung um drei verschiedene Packages bei der Radeon RX Vega von AMD” sehr ausführlich berichtet hatte. Dass einen aber nun genau dieses Thema in anderer Form noch einmal einholt, hat mich dann doch etwas überrascht.
Doch immer schön der Reihe nach. Bei der Analyse von nunmehr 18 Radeon RX Vega (manche Modelle hatte ich sogar mehrfach, auch zu Nachtests), sind mir nämlich einige Dinge aufgefallen, die ich so ähnlich auch bereits im Vorfeld mit verschiedenen Industriekontakten besprechen konnten. So waren die richtige Auswahl und Auftragemethode der Wärmeleitpaste und die Verschraubung der Kühler samt Anpressdruck eigentlich immer ein Thema, auch die Viskosität der verwendeten Pasten.
Die Crux mit dem ominösen Hotspot
Da es oft zu Problemen und unerklärlichen Abstürzen durch punktuelle Hitzestaus kam, haben ich viele der Karten zerlegt und wieder zusammengeschraubt, gemessen, verglichen, die Verschraubungsreihenfolge geändert und diverse Methoden zum Auftragen der Wärmeleitpaste getestet. Einschließlich der verwendeten Menge übrigens, denn auch dies wird noch eine große Rolle spielen. Doch beginnen wir zunächst mit einem Fehlerbild, um das Problem zu verdeutlichen.
Die Lüftersteuerung aller Karten reagiert primär auf den Wert, den man auch aus dem Wattman und z.B. GPU-Z als GPU-Temperatur kennt. Doch ich hatte mehrere Karten, die trotz augenscheinlich guter (weil niedriger) GPU-Temperaturwerte (teilweise sogar im Idle beim Fan-Stopp) durch Notabschaltungen glänzten. Doch wo liegt eigentlich die Ursache für dieses Phänomen? Dazu habe ich einmal die Messwerte einer solchen Karte in einem Diagramm festgehalten.
Es existiert neben der GPU- und HBM2-Temperatur ja noch ein Sensorwert für den ominösen “Hotspot”, wo immer man den auch suchen muss. Ich vermute, es ist ein Messpunkt zwischen dem Interposer und dem Package, mehr in Richtung der beiden HBM2 Stacks. Durch die spezielle Montage der Packages entsteht ja ein sogenannter Underfill, der Interposer liegt also durchaus sogar etwas hohl. Wenn dann nicht der Anpressdruck an allen Stellen optimal vorhanden ist, kann es zu partiellen Überhitzungen kommen, die von der GPU-Temperatur nur indirekt reflektiert werden.
In der oben stehenden Grafik konnte ich bis zu 106°C am Hotspot messen, im Stresstest sogar bis zu 110°C und der gefürchteten Notabschaltung. Diese kann einen sogar im Idle ereilen, da die Lüfter bei einigen Custom-Karten erst gar nicht anspringen. Manche Hersteller haben, weil die Fertigungstoleranzen zu hoch waren, den Fan-Stopp in experimentellen Beta-BIOSen wieder aufgehoben und so wenigestens Symptomheilung praktiziert. Eine echte Lösung ist so etwas natürlich auch nicht.
Das nachfolgende Bild einer industriell gefertigten Karte zeigt, wie eine eigentlich homogene Schicht “aufreißen” kann und einige Bereiche faktisch auch keinen richtigen Kontakt mehr zum Kühler bekommen, obwohl sowohl die Menge, als auch die Art der Wärmeleitpaste (Aufbringung beim Kühler-OEM) eigentlich völlig in Ordnung sind (wer sich erinnert, wir hatten bereits unlängst einen kurzen Test dazu). Hier spielen dann Faktoren wie die Reinheit von Oberflächen, aber eben auch der Faktor Mensch bei der Endmontage eine entscheidende Rolle.
Das optimale Auftragen der richtigen Paste
Bei der RX Vega setzt man in der Industrie, auch aufgrund der sehr unterschiedlichen Packages und dem Underfill-Problem, auf eher viskosere Pasten mit einer deutlich dickeren Schicht und höhere Anpressdrücke, um die überflüssige Paste seitlich herauszupressen und um die Höhenunterschiede besser ausgleichen zu können. Ich habe mit vielen Pasten experimentiert, von dünnflüssig bis sehr viskos und bin am Ende genau dort gelandet, wo auch die Hersteller ihr Glück versucht haben.
Man sollte einen vollflächigen und komplett deckenden Aufstrich mit einer eher viskosen Paste realisieren. Das ist nicht ganz einfach, weil sich zähe Paste nicht ganz so einfach gleichmäßig und ohne wieder aufzureißen verteilen lässt. Komplett zupampen sollte man das Ganze allerdings auch nicht. Was jedoch wirklich hilft, ist das Erwärmen der Paste auf mindestens 50°C. Dann flutscht selbst die störrischste Paste wie ein williges Fohlen. Wer günstig dabei sein will, nimmt die Gelid GC Extreme. Wer mehr Kohle abdrücken will (für vielleicht ein Kelvin niedrigere Temperaturen), der darf auch die Kryonaut von Thermal Grizzly benutzen. Beide Pasten sind in etwa gleich viskos.
Der nächste Schritt ist nun nicht minder wichtig! Das PCB wird beim Zusammenbau von oben möglichst waagerecht auf den Kühler gelegt und man sollte ein Verkanten und vorzeitiges Berühren mit einzelnen Ecken oder Flächen tunlichst vermeiden. Außerdem darf auch noch kein Druck ausgeübt werden, das Festschrauben kommt erst noch und hat es ebenfalls in sich. Normalerweise werden die Schrauben im Werk diagonal über Kreuz in einem Vorgang festgezogen. Ein Drehmoment-Aufsatz der Schrauber sorgt dabei für den richtigen Anpressdruck.
Nicht so bei der RX Vega. Die Montage wird im Werk bei den meisten Firmen inzwischen in mehreren Schritten erledigt. Betrachten wir dazu das Bild unten, denn genau dies kann jeder Anwender, der selbst mal am Kühler werkelt, ganz einfach nachvollziehen. Die GPU liegt auf dem Package vertikal betrachtet oben, der HBM2 samt des Hotspots eher unten. Genau deshalb zieht man zunächst die beiden oberen Schrauben (Gelb) alternierend an, bis man einen leichten Widerstand spürt. Danach wiederholt man das Ganze alternierend jeweils für die beiden unteren Schrauben (Violett)
Erst danach werden die beiden oberen Schrauben alternierend handfest angezogen, dann analog dazu erst die beiden unteren Schrauben. Ich baue die Karten anschließend immer erst einmal ein und absolviere einen kurzen Aufwärmprozess bis maximal 65 oder 70°C. Nun wird der PC zwangsabgeschaltet (um die Kühler nicht nachlaufen zu lassen) und die vier Schrauben werden in obiger Reihenfolge auch final richtig fest angezogen (allerdings nicht mit Gewalt überdrehen!). Windows 10 kann so einen Auschaltvorgang durchaus ab und man hat ein optimales Ergebnis.
Das Ergebnis ist nun wirklich frappierend, denn das unten stehende Diagramm zeigt die gleiche Karte, nur eben mit anderer Montage! Die Lüfter drehen deutlich niedriger (daher auch die leicht höheren GPU-Temperaturen), der Takt liegt ca. 80 MHz höher und der Hotspot liegt mit seinen 78°C fast 20°C unter dem zuerst gemessenen Horror-Wert! Auch im Stresstest wird die 80er-Marke nicht überschritten, so dass es dann schon 30°C Unterschied sind. Kleine Paste, große Wirkung!
Zusammenfassung und Fazit
Wenn Ihr Euch selbst einen Gefallen tun wollt, vergesst bitte die Klecks-, Strich- und X-Methoden bei der RX Vega. Das riesige, zerklüftete Package und die sehr unterschiedliche Technologie mit dem Interposer verlangt nach einer deutlich differenzierteren Lösung. Das, was ich hier und heute beschrieben habe, hat sich mittlerweile bewährt, denn einige der Hersteller sind diesen Vorschlägen für die Reihenfolge der Verschraubung bereits gefolgt. Und dies sicher nicht deswegen, weil es mal eine willkommene Abwechslung für die Fließband-Mitarbeiter(innen) wäre. Die RMA-Abteilungen werden es in jedem Fall danken. 😉
Kommentieren