Grafikkarten Testberichte VGA

RDNA3 und vereinzelt viel zu hohe Hotspot-Temperaturen auf den AMD Radeon RX 7900 XT(X) – Ursachenforschung

Die Befestigung des Heatsinks ist durchaus fragwürdig

Da AMD mit vier durchgesteckten Gewindehülsen und einem Spannkreuz arbeitet, kann man die Schrauben so fest anziehen, wie man will – das Drehmoment wird sich ab einem gewissen Moment nicht mehr ändern. Da jedoch alle Hülsen gleich lang sind (und damit auch das Drehmoment an allen Schrauben stets identisch ausfällt), funktioniert so etwas auch nur, wenn der Heatsink darunter wirklich absolut plan ist. Falls nicht, differieren nämlich die Anpressdrücke extrem, auch bei identisch festgezogenen Schrauben! Genau das mit der geraden Auflage aber war bei meinem Exemplar nicht der Fall. Das könnte dann auch erklären, warum in einigen Fällen ein Austausch der Wärmeleitpaste quasi gar nichts bringt und das Temperaturgefälle zwischen GPU-Temperatur und Hotspot identisch bleibt.

Im Vergleich zu NVIDIA, wo der Kühlerblock samt Vapor-Chamber und deren Heatsink vom Rest des Platinen-Mountings unabhängig und flexibel bleibt, setzt AMD statt auf einen lockeren Einsatz leider auf ein nahezu monolithisches Konstrukt. Der Heatsink kann sich also nicht noch unabhängig vom Rest des Aufbaus eventuellen Spaltmaßen und Ungenauigkeiten anpassen, sondern ist fest fixiert. Solange die horizontale Ausrichtung in allen Ebenen parallel und plan zur GPU erfolgt, ist daran auch nichts auszusetzen. Wenn…

Legt man nun die Platine drauf, dann sieht man, dass die Hülse sogar noch deutlich übersteht! Zusammen mit den Limitierungen des Federkreuzes kann jede der vier Schrauben also nur bis zu einem identischen und limitierten Wert fest angeschraubt werden. Wenn der Heatsink oder die GPU (oder sogar beides) nicht wirklich plan sind und auch noch Höhendifferenzen an allen möglichen Punkten aufweisen, dann ist der resultierende Anpressdruck natürlich an allen Stellen sehr unterschiedlich. Das merken wir uns einmal, denn jetzt wird gemessen!

GPU vs. Heatsink – da passt nichts zusammen

Die GPU ist leicht konvex, was nicht weiter schlimm ist. Ganz gerade wird man das eh nie hinbekommen und wer sich an die „Buckelwale“ bei NVIDIAs ersten Samsung-GPUs und meine Analysen erinnert, der weiß natürlich, was ich damit meine. Damals war es wohl die unzweckmäßig ausgeführte Laminierung der GPU-Platine (Mangel der Original-Folie), die leicht schrumpfte und sogar noch den Die mit verzog. Die hier gemessenen Werte sind im Gegensatz dazu noch echt verträglich. Die gemessenen 0,07 mm Unterschied zwischen Rand (Chiplets) und Mitte (GFX) sind nichts, was man nicht mit einem guten Gap-Filler locker ausgleichen könnte. Zumal diese Differenzen an allen Ecken fast identisch ausfallen. Die GPU scheidet also als ungleichmäßige Oberflächen-Zerstörerin erst einmal aus.

Womit wir wieder beim Heatsink angekommen wären. Diesmal habe ich die maximale Auflösung des Scanners genutzt, was leider auch zwei Tage für diesen kleinen Ausschnitt gekostet hat. Aber es hat sich wirklich gelohnt. Betrachten wir auch hier einmal die Höhenunterschiede. Von Links nach Rechts, also längsseitig zur GPU sehen wir jeweils außen und mittig einen leichten Anstieg von 0.04 mm. Der Heatsink steht also nicht ganz im gleichen Winkel zur GPU, sondern definiert eine leicht schiefe Ebene. Darüber hinaus ist er zwischen den schmalen Seiten hin auch noch unterschiedlich gewölbt.

Einzeln betrachtet, sind auch das normale und durchaus auch einigermaßen hinnehmbare Toleranzen. Legt man jedoch die „schiefe“ und in sich noch einmal leicht gebogene Ebene auf die ohnehin schon konvexe Fläche der GPU, dann landet man bei bis zu 0,11 mm Differenz. das ist schon eher hässlich aber auch noch nichts, was man nicht mit einer guten Paste irgendwie kompensieren könnte. Aber wenn man sich das Mounting betrachtet, dann nützt die beste Paste eigentlich nichts, wenn der Anpressdruck partiell nicht ausreicht, weil die Verschraubung nicht mehr hergibt.

 

Zusammenfassung und Fazit

Innerhalb solcher Toleranzbereiche ist es sicher möglich, die Stopper zu umgehen, passende Schrauben mit größeren Köpfen zu verwenden und die überstehenden Hülsen mittels höherer Unterlegscheiben zu neutralisieren, so dass man beim Verschrauben mit neuer, guter Paste den Anpressdruck besser dosieren kann. Da ich nicht AMD bin und auch die maximal zulässigen Werte nicht kenne, lasse ich hier aus Sicherheitsgründen mal ein Fragezeichen im Raum stehen. Hohl liegende Chipflächen mit Kraft krumm zu biegen, nur damit sie sich dem schiefen und in sich gewölbten Heatsink anpassen, ist sicher mit einem gewissen Risiko verbunden. Das aber ist etwas, was ich keinem meiner Leser unverantwortlich aufbürden möchte. Das muss dann jeder für sich selbst entscheiden.

Allerdings konnte ich mit einer passenden Wärmeleitpaste (Alphacool Apex B-Stock, also die festere), jeweils zwei Unterlegscheiben pro Hülse und passenden Schrauben anstelle des Spannkreuzes auch den bei mir aufgetretenen Hotspot sogar noch im Vergleich zur „normalen“ Karte auf ein leicht darunter liegendes Delta von 15 bis 17 Kelvin absenken, was mittels einfachem Pastentausch so nicht geklappt hat. Das nehme ich für mich persönlich als Fazit mit und weise trotzdem noch einmal explizit auf des Vorwort auf Seite Eins hin. Es war bei meiner Karte der nachvollziehbare und auch messbare Grund, er muss es aber bei anderen Karten nicht zwingend sein. Es kann auch direkt an der Chamber und möglichen Produktions- bzw. Konstruktionsfehlern liegen, da ist das letzte Wort mit Sicherheit noch nicht gesprochen. Nur braucht man dafür sehr viel mehr Zeit und Samples.

Es ist sicher auch gut vorstellbar, dass einzelne der in der GPU platzierten Sensoren Unfug messen und die Telemetrie solche Ausreißer nicht abfängt (Plausibilitätstest). Das wäre denn ja auch per Firmware-Update durch AMD gut lösbar. Dagegen spricht aber (zumindest bei mir) der heutige Versuch, wo nach der Neumontage ohne Spannkreuz plötzlich auch wieder die Temperaturen der sechs Chiplets annährend gleich hoch ausfielen, wo es vorher immerhin noch bis zu 8 Kelvin Unterschied waren und meine Karte sogar besser performte als das Original ohne Hotspot-Problem. Es ist auf alle Fälle ratsam, eine Stellungnahme von AMD abzuwarten. Ich für meinen Teil habe mein Problem zumindest lösen können.

Den leichten Unterschied zwischen vertikaler und horizontaler Montage hatte ich übrigens auch mit der „reparierten“ Karte und zwei weiteren, eher unverdächtigen Modellen, was man eindeutig der Vapor-Chamber und Kühlerkonstruktion als solcher anlasten könnte. Das hatte aber meines Erachtens nichts direkt mit dem Hotspot zu tun, weshalb es eigentlich ein anderes Thema ist. Falls jemand mit seiner RX 7900 XT(X) herumexperimentiert oder noch Probleme findet, würde ich mich über eine Kontaktaufnahme sehr freuen. Inzwischen warte ich erst einmal, was das Schwarmwissen und AMD noch so alles ans Tageslicht bringen (oder auch nicht).

 

371 Antworten

Kommentar

Lade neue Kommentare

LurkingInShadows

Urgestein

1,348 Kommentare 551 Likes

@Igor Wallossek :
1) Crowdfunding für LASER?

2) Sehe ich das auf S.1 richtig, dass das PCB um 0,11 verzogen ist? (0,34 re.o. und 0,23 zweiter Wert von re.u.); Ist das der Wert den du auf S.2 anführst, oder nur durch diesen entstanden?

3) Was geben die Werte in den Klammern bei der Heatsinkvermessung an?

4) S.2, 4.Absatz unter der Heatsinkgrafik (=3.Absatz im Fazit), 1.Satz
"Sensoren" gehört vor "in der GPU", oder?

Antwort 3 Likes

Not_A_Nerd

Mitglied

49 Kommentare 45 Likes
Igor Wallossek

1

10,200 Kommentare 18,824 Likes

Es geht NICHT um die 110 Grad oder ein Throttling (das ist ja dann nur die für den letzten DAU auch sichtbare kausale Folge), sondern das Delta an sich, das da nicht hingehört. Da ist es nur die Frage der TBP, wie hoch die Hotpot Temperatur dann am Ende ausfällt. Das steht auch so im Artikel. Da steht zudem auch drin, dass ich das seit zwei Wochen verfolge, also lange bevor TH US was dazu schrieb oder das durch die Medien ging. Nur dauern richtige Messungen halt etwas länger.

Der Artikel zeigt nämlich auch, warum ein normales Repaste meist nichts bringt. Und warum ich KEINE fremden Karten genutzt habe. Meine XT hat das gleiche Problem und wenn ich die TBP erhöhe, komme ich auch deutlich höher in Richtung Ü100. Es ist hier ein belegbares ein Heatsink-Problem. wo der Hotspot um stellenweise über 30 K runtergebracht werden konnte. Richtig verteilter und dosierter Anpressdruck FTW.

2.) Nein. Das ergibt sich aus den 0.07 an der GPU und den 0.04 am Heatsink, da sich dieser ja nicht anpassen lässt und beide Flächen konkav sind.
3.) Eine Länge und die Differenzen der Achsen (X,Z,Y), wobei der letzte Wert in den Klammern die Höhendifferenz ist
4.) Gefixt, da fehlte ein Wort :D

Der Delta-Vergleich steht im Intro und im Fazit. Das hohe Delta weist auf einen miesen, ungleichmäßigen Kontakt hin. Das konnte man bei den alten Karten durch meine Methode mit der WLP locker korrigieren. Hier aber liegt der Fall anders, weil die Vapor-Chamber schief angeschliffen wurde und zudem noch mittig verbeult ist. Das sieht man sogar schon gegen das Licht mit bloßem Auge. Das ist aus meiner Sicht ein klarer Sachmangel und so eine Karte gehört kommentarlos ausgetauscht.

Antwort 8 Likes

Klicke zum Ausklappem
P
Pokerclock

Veteran

434 Kommentare 369 Likes

@Igor Wallossek

Falls Interesse besteht, könnte ich eine XTX leihweise zur Verfügung stellen. Unverbastelt, rund 20h betrieben bislang. Sie ist aber m.E. unauffällig. https://extreme.pcgameshardware.de/...atur-ab-diese-sei-normal.628522/post-11189099

Ich könnte mich auch mal darum bemühen ein 110er-Hotspot-Modell zu besorgen.

Antwort 1 Like

Igor Wallossek

1

10,200 Kommentare 18,824 Likes

Wenn, brauche ich eine unverbastelte heiße Karte :)
Eine gute XTX habe ich ja ;)

Antwort Gefällt mir

O
Ozzy

Veteran

225 Kommentare 137 Likes

Guter Artikel, Igor, wie immer.
Ich frage mich langsam ehrlich, gibt es bei den beiden Herstellern, naja, sogar auch bei Intel, die hatten im Graka Bereich ja auch so ihre Probleme, keine echten, guten Ingenieure mehr?
Ist der Zeitdruck zu groß geworden, um ordentlich zu entwickeln und zu testen?
Oder haben die nur noch günstige, junge Entwickler, denen einfach die Erfahrung eines Igors fehlt?
Erst die Grünen mit dem Stecker, jetzt dieses Problem.
Schreckt mich komplett ab, mir was neues zu holen. Ist mittlerweile wie bei Spielen, kann man erst nach ein paar Monaten Updates spielen.
Ist bei einem Hardwareproblem irgendwie doof ;)
Guten Rutsch, Igor.
Dir und deiner Familie alles beste fürs neue Jahr.
Auch an den Rest hier im Forum.
Kommt gut und gesund rein und durch.
Grüße

Antwort 5 Likes

DMHas

Mitglied

40 Kommentare 8 Likes

Interessanter Artikel! Wenn der Originalkühler von so "schlechter Qualität" ist, bin ich gespannt, wie sich die Custom-Designs der Hersteller bei diesem Thema schlagen werden. Ebenfalls interessant wären Erfahrungen mit Wasserkühlblöcken. @Igor Wallossek: ist in dieser Richtung etwas geplant?

Antwort Gefällt mir

Igor Wallossek

1

10,200 Kommentare 18,824 Likes

Typische Man-in-the-Midle-Story. Das war schon bei den FuryX und den fiependen Pumpen das Problem. AMD beauftragt PC Partner, die beauftragen Coolermaster, die beauftragen AVC, die beauftragen noch weitere Zulieferer usw.... Da ist ein seriöses Qualitätsmanagement fast unmöglich. Am Ende war es der Verguss samt Blasen im Harz. :D

Die XFX und die Sapphire haben bisher keine Auffälligkeiten. Die Kühler sind jedoch auch richtig plan. Wasserblock wird man sehen müssen, wann was kommt. Gescannt ist die Karte ja.

Antwort 7 Likes

Megaone

Urgestein

1,746 Kommentare 1,645 Likes

Erstmal Danke an dich Igor für den Test. Sowas findet man nur bei dir. Eine kleine Spende für den Laser ist gerade raus (y).

Sätze wie:"Ich für meinen Teil habe mein Problem zumindest lösen können.." machen mir immer Angst.

Wieviele können das denn?

Der Durchschnittsdepp (und davon bin auch nicht so arg weit entfernt ) scheitert doch schon daran, die Temperaturen seiner Karte auszulesen, respektive weiss nichtmal, das es sowas wie einen Hotspot überhaupt gibt.

Von Tom`s Hardware lesen und Texte übersetzen ist der weiter entfernt, wie eine Kuh vom eierlegen.

Von daher ist das mit "keine Sorgen machen" der völlig falsche Ansatz.

Da kann man schon darüber nachdenken, wieviel Leute so eine Trümmerlotte im Rechner haben und sich fragen, wieso im Sommer die Leistung einbricht.

Das gleiche gilt natürlich auch für NVIDIA mit Ihrer Kabellotterie.

Offenkundig ist es von den die Herrschaften zuviel verlangt, gut geteste Produkte zu einem Preis, der für viele einem Monatslohn entspricht, auf den Markt zu bringen.

Da ist raffen, Dollars zählen und die Marktingmaschine auf Touren bringen wohl deutlich einfacher. Wenn ich mir diesen Müll, der sich ja nicht nur auf Grafikkarten beschränkt so anschaue, verstehe ich Leute, die sich ein einfaches Notebook und zum zocken eine Playstation kaufen, immer mehr.

Bin mal gespannt wie Firmen wie Gigabyte oder diverse andere auf einen RMA Wunsch reagieren. Bei meiner 3090 hies es letztens noch O-Ton.

"Das gehört so."

Throtteln ist völlig normal, sonst wäre es ja nicht eingebaut und diene dem Schutz der Karte und Throtteln wäre kein Mangel! Und wen interessiere es schon, was irgendeine Internetseite so von sich gibt.

Ich kam mir vor wie in dieser alten SWR3 Radiocomedyserie: " Das Kaufhaus des Grauens ".

Antwort 7 Likes

Klicke zum Ausklappem
a
andr_gin

Mitglied

69 Kommentare 37 Likes

Das Problem an der Sache ist nicht das throttling. Das sollte ja nur in Extremfällen passieren.
Das Hauptproboem ist, dass die Lüfterkurven an der Hotspot Temperatur hängen und diese dann kurz vor dem throttlen auf 100% hochdrehen.

So Kommentare von AMD, dass das alles innerhalb der Spezifikation ist können sie sich echt sparen. Als Konsument kann ich die Karte 14 Tage ohne Angabe von Gründen zum Händler zurück schicken bzw. innerhalb von 2 Jahren als Gewährleistungsfall eine Reparatur/Austausch verlangen. Den Rest darf sich dann Digital River mit AMD ausmachen.

Antwort 2 Likes

G
Guest

Super Analyse zu dem Thema! Das Erste was ich dazu finde und sich, im Rahmen der Möglichkeiten, damit auseinander setzt.

Ich habe mit meiner XTX (Powercolor MBA)keine Temp. Probleme, aber ich habe die Schrauben mal nachgezogen, die vier vom GPU-Kreuz waren unverschämt lose! die drumrum nur minimal besser!

Versiegelt war bei der Karte gar nichts, weder der übliche kleine Siegelaufkleber, noch sonst was. Auch fehlte dieser kleine Aufkleber, der "früher" mal bei der Endkontrolle aufgeklebt wurde... Vielleicht tracken die Hersteller das aber nun über Seriennummern... k.A..

Ich habe den EKWB Waterblock bestellt und werde dann beim Umbau nochmal vorher und nachher 3DMark anwerfen und mit GPU-Z und HWInfo paar Screenshots erstellen...
Das Ding soll Ende Januar kommen.

@Igor Wallossek Wenn interesse besteht, könnte ich den XTX-MBA Kühler mal als Leihgabe nach erfolgreichem Umbau zur Verfügung stellen, wenns was nützt....

Antwort 3 Likes

Gurdi

Urgestein

1,370 Kommentare 900 Likes

Das Delta kann ich bestätigen, 15-20 Kelvin, ein Repaste auf meiner Aorus bringt ein ähnliches Delta hervor bei Referenz TBP. Das scheint also derzeit so der optimale Zustand zu sein.

Antwort Gefällt mir

O
Ozzy

Veteran

225 Kommentare 137 Likes

Und die lernen nix draus?
Man man, in so großen Konzernen wird einem alles vorgegeben, was man sagen darf, anziehen darf, annehmen darf usw.
Aber sowas bekommen die nicht auf die Reihe?

Antwort 3 Likes

Megaone

Urgestein

1,746 Kommentare 1,645 Likes

Bist du dir da so sicher? Das mag ja jetzt alles so sein, aber wie sieht es im Sommer bei 35 Grad oder mehr aus. Da war ja meine Wakü schon an Ihren Grenzen.

Verlangen kannst du viel. Das Spiel heist aber im Zweifelsfall: " Wer will was von wem." In der Regel funktionieren die Rechtsabteilungen von großen Unternehmen besser als kleine Kanzleien. Und wieviel Kunden sind schon so Konfliktfreudig. Gebellt wird immer viel, gerade in den Foren. Beissen tun die wenigsten. Wobei ich damit explizit nicht dich meine.

Oder auf die Kunden abwälzen. Die meisten müssen sich ja in der Regel erstmal mit dem Hersteller der Customs amüsieren.

Antwort Gefällt mir

G
Guest

@Ozzy Ich arbeite in einem recht großen Unternehmen, und ich kann aus erster Hand, als Sumpfmitarbeiter bestätigen, wenn dir ein Problem auffällt, und du zu oft sagst, "Leute, da ist ein Problem, das und das wäre die Lösung".... bist du für "die da oben" das Problem!
Weil das eigene Unternehmen ist ja immer (frei nach "Postal") die "überflieger-company" - Man ist perfekt! ... und Probleme und Fehler machen nur die Anderen!
Das beobachte ich nun schon eine Weile... und bekomme das auch von anderen Unternehmen so zugetragen... und das international!
Das wird bei AMD,Intel,nVidia nicht anders sein!

Leider!

Antwort 14 Likes

*
***

Veteran

496 Kommentare 312 Likes

Von was sprichst Du eigentlich?

Man kann einiges in der eigenen Firma steuern, aber auch da arbeiten nur Menschen und die machen Fehler. Wenn Du andere Firmen mit etwas beauftragst, kannst Du zwar Bedingungen in den Vetrag schreiben und die Firma eventuell auch wegen Vertragsbruch belangen, wenn die Bedingungen nicht eingehalten werden - aber erst hinterher. VERMEIDEN wirst Du die Fehler nicht können. Du kannst schließlich nicht jede einzelne produzierte Karte komplett prüfen bevor sie ausgeliefert wird.

An irgendeiner Stelle ist es immer eine Sache des Vertrauens und des Risikomanagement.

Übrigens: Je mehr man in der eigenen Firma produziert, desto teurer wird es (weil man sich nicht spezialisieren kann). Deswegen werden solche Dinge outgesourced. Wenn Du darauf bestehst, dass Du als Firma über alles die Kontrolle behältst, musst Du dafür einen Preis zahlen. Und, falls Dir das nicht klar sein sollte, der einzige der diesen Preis bezahlen muss, ist am Ende der Kunde. Wer denn sonst? Der Kunde ist die einzige Geldquelle!

Antwort Gefällt mir

Megaone

Urgestein

1,746 Kommentare 1,645 Likes

Naja, die Frage ist ja nicht, das Fehler passieren, sondern wie damit am Ende umgegangen wird. Was natürlich sicher erstmal abzuwarten bleibt.

Aber merken hätte man das im Vorfeld eigentlich können und müssen.

PS:
Bevor ich es im Eifer des Gefechtes vergesse.

Allen eine guten Rutsch und ein schönes und gesundes 2023. (y)

Antwort 5 Likes

RedF

Urgestein

4,665 Kommentare 2,553 Likes

So kenne ich das auch -_- . War auch schon in der entwiklung tätig, an den ingenieuren liegt es eher nicht.
Die bekommen bauchschmerzen was dann an Produkt verkauft wird weil das Produkt zu tode gespart wird.

Antwort 6 Likes

LurkingInShadows

Urgestein

1,348 Kommentare 551 Likes

Das mit dem Firmenübergreifendem QA ist so eine Sache....

Zulieferer macht im besten Fall Stichproben beim Ein- und/oder Ausgang, der nächste genauso..... Finde da mal nen Fehler der nicht in >80% (Hausnummer) der Produkte auftritt.

Antwort 4 Likes

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kannst Du per PayPal spenden.

About the author

Igor Wallossek

Chefredakteur und Namensgeber von igor'sLAB als inhaltlichem Nachfolger von Tom's Hardware Deutschland, deren Lizenz im Juni 2019 zurückgegeben wurde, um den qualitativen Ansprüchen der Webinhalte und Herausforderungen der neuen Medien wie z.B. YouTube mit einem eigenen Kanal besser gerecht werden zu können.

Computer-Nerd seit 1983, Audio-Freak seit 1979 und seit über 50 Jahren so ziemlich offen für alles, was einen Stecker oder einen Akku hat.

Folge Igor auf:
YouTube   Facebook    Instagram Twitter

Werbung

Werbung