GPUs Graphics Reviews

RDNA3 and too high hotspot temperatures on some AMD Radeon RX 7900 XT(X) – Cause research

The attachment of the heatsink is quite questionable

Since AMD works with four threaded sleeves and a clamping cross, you can tighten the screws as much as you want – the torque will not change after a certain moment. However, since all sleeves are the same length (and thus the torque on all screws is always identical), something like this only works if the heatsink underneath is really absolutely flat. If not, the contact pressures differ extremely, even with identically tightened screws! Exactly that with the straight support, however, was not the case with my copy. This could then also explain why in some cases replacing the thermal paste does virtually nothing and the temperature gradient between GPU temperature and hotspot remains identical.

Compared to NVIDIA, where the cooler block including vapor chamber and its heatsink remains independent and flexible from the rest of the board mounting, AMD unfortunately relies on an almost monolithic construct instead of a loose insert. This means that the heatsink cannot adjust to any gaps or inaccuracies independently of the rest of the structure, but is firmly fixed. As long as the horizontal alignment is parallel and flat to the GPU in all planes, there is nothing wrong with it. When…

If you now put the board on it, you can see that the sleeve even still clearly protrudes! Together with the limitations of the spring cross, each of the four screws can therefore only be screwed on tightly up to an identical and limited value. If the heatsink or the GPU (or even both) are not really flat and also have height differences at all possible points, then the resulting contact pressure is naturally very different at all points. We’ll keep that in mind for once, because now we’re measuring!

GPU vs. heatsink – nothing fits together there

The GPU is slightly convex, which is not a big deal. You will never get it completely straight anyway, and those who remember the “humpback whales” in NVIDIA’s first Samsung GPUs and my analyses will of course know what I mean by that. At that time, it was probably the inappropriately executed lamination of the GPU board (shortcoming of the original foil), which shrank slightly and even warped the die along with it. In contrast, the values measured here are still really tolerable. The measured 0.07 mm difference between edge (chiplets) and center (GFX) is nothing that couldn’t be easily compensated with a good gap filler. Especially since these differences turn out to be almost identical at all corners. Thus, the GPU is ruled out as an uneven surface destroyer for now.

Which brings us back to the heatsink. This time I used the maximum resolution of the scanner, which unfortunately also took two days for this small crop, but it was really worth it. Let’s take a look at the height differences here as well. From left to right, i.e. lengthwise to the GPU, we see a slight increase of 0.04 mm on the outside and in the center. Thus, the heatsink is not quite at the same angle to the GPU, but defines a slightly inclined plane. In addition, it is also curved differently between the narrow sides.

Considered individually, these are also normal and quite acceptable tolerances. However, if you put the “inclined” and once again slightly curved plane on the already convex surface of the GPU, you end up with a difference of up to 0.11 mm. that is rather ugly but also still nothing that you could not somehow compensate with a good paste. But if you look at the mounting, then the best paste is actually useless if the contact pressure is partially insufficient because the screw connection does not provide more.

Summary and conclusion

Within such tolerance ranges, it is certainly possible to bypass the stoppers, use suitable screws with larger heads and neutralize the protruding sleeves by means of higher washers, so that when screwing with new, good paste, the contact pressure can be better dosed. Since I’m not AMD and also don’t know the maximum permissible values, I’ll leave a question mark here for safety reasons. Bending hollow chip surfaces with force just to make them fit the crooked and curved heatsink is certainly associated with a certain risk. This, however, is not something I want to impose irresponsibly on any of my readers. Everyone must then decide for themselves.

However, with a suitable thermal paste (Alphacool Apex B-Stock, so the firmer), two washers per hole and suitable screws instead of the clamping cross, I could also lower the hotspot that occurred with me even compared to the “normal” card to a slightly lower delta of 15 to 17 Kelvin, which has not worked by simply changing the paste. I take this for me personally as a conclusion and still explicitly refer to the preface on page one. It was the comprehensible and also measurable reason for my card, but it does not necessarily have to be for other cards. It can also be directly due to the chamber and possible production or construction errors, the last word is certainly not yet spoken. But you need much more time and samples for that.

It is certainly also conceivable that individual sensors in the GPU measure mischief and the telemetry does not catch such outliers (plausibility test). This could also be solved by AMD via a firmware update. However, today’s test speaks against this (at least for me), where the temperatures of the six chiplets suddenly turned out to be almost the same again after the reassembly without the clamping cross, where there was still up to 8 Kelvin difference before and my card even performed better than the original without the hotspot problem. In any case, it is advisable to wait for a statement from AMD. I for one have at least been able to solve my problem.

By the way, I also had the slight difference between vertical and horizontal mounting with the “repaired” card and two other, rather unsuspicious models, which could clearly be blamed on the vapor chamber and cooler design as such. But I don’t think that had anything directly to do with the hotspot, which is why it’s actually a different topic. If anyone is experimenting around with their RX 7900 XT(X) or still finding problems, I would be very happy to hear from you. In the meantime, I’ll wait and see what the swarm knowledge and AMD bring to light (or not).

 

 

371 Antworten

Kommentar

Lade neue Kommentare

LurkingInShadows

Urgestein

1,372 Kommentare 572 Likes

@Igor Wallossek :
1) Crowdfunding für LASER?

2) Sehe ich das auf S.1 richtig, dass das PCB um 0,11 verzogen ist? (0,34 re.o. und 0,23 zweiter Wert von re.u.); Ist das der Wert den du auf S.2 anführst, oder nur durch diesen entstanden?

3) Was geben die Werte in den Klammern bei der Heatsinkvermessung an?

4) S.2, 4.Absatz unter der Heatsinkgrafik (=3.Absatz im Fazit), 1.Satz
"Sensoren" gehört vor "in der GPU", oder?

Antwort 3 Likes

Not_A_Nerd

Mitglied

49 Kommentare 45 Likes
Igor Wallossek

1

10,314 Kommentare 19,113 Likes

Es geht NICHT um die 110 Grad oder ein Throttling (das ist ja dann nur die für den letzten DAU auch sichtbare kausale Folge), sondern das Delta an sich, das da nicht hingehört. Da ist es nur die Frage der TBP, wie hoch die Hotpot Temperatur dann am Ende ausfällt. Das steht auch so im Artikel. Da steht zudem auch drin, dass ich das seit zwei Wochen verfolge, also lange bevor TH US was dazu schrieb oder das durch die Medien ging. Nur dauern richtige Messungen halt etwas länger.

Der Artikel zeigt nämlich auch, warum ein normales Repaste meist nichts bringt. Und warum ich KEINE fremden Karten genutzt habe. Meine XT hat das gleiche Problem und wenn ich die TBP erhöhe, komme ich auch deutlich höher in Richtung Ü100. Es ist hier ein belegbares ein Heatsink-Problem. wo der Hotspot um stellenweise über 30 K runtergebracht werden konnte. Richtig verteilter und dosierter Anpressdruck FTW.

2.) Nein. Das ergibt sich aus den 0.07 an der GPU und den 0.04 am Heatsink, da sich dieser ja nicht anpassen lässt und beide Flächen konkav sind.
3.) Eine Länge und die Differenzen der Achsen (X,Z,Y), wobei der letzte Wert in den Klammern die Höhendifferenz ist
4.) Gefixt, da fehlte ein Wort :D

Der Delta-Vergleich steht im Intro und im Fazit. Das hohe Delta weist auf einen miesen, ungleichmäßigen Kontakt hin. Das konnte man bei den alten Karten durch meine Methode mit der WLP locker korrigieren. Hier aber liegt der Fall anders, weil die Vapor-Chamber schief angeschliffen wurde und zudem noch mittig verbeult ist. Das sieht man sogar schon gegen das Licht mit bloßem Auge. Das ist aus meiner Sicht ein klarer Sachmangel und so eine Karte gehört kommentarlos ausgetauscht.

Antwort 8 Likes

Klicke zum Ausklappem
P
Pokerclock

Veteran

463 Kommentare 388 Likes

@Igor Wallossek

Falls Interesse besteht, könnte ich eine XTX leihweise zur Verfügung stellen. Unverbastelt, rund 20h betrieben bislang. Sie ist aber m.E. unauffällig. https://extreme.pcgameshardware.de/...atur-ab-diese-sei-normal.628522/post-11189099

Ich könnte mich auch mal darum bemühen ein 110er-Hotspot-Modell zu besorgen.

Antwort 1 Like

Igor Wallossek

1

10,314 Kommentare 19,113 Likes

Wenn, brauche ich eine unverbastelte heiße Karte :)
Eine gute XTX habe ich ja ;)

Antwort Gefällt mir

O
Ozzy

Veteran

225 Kommentare 137 Likes

Guter Artikel, Igor, wie immer.
Ich frage mich langsam ehrlich, gibt es bei den beiden Herstellern, naja, sogar auch bei Intel, die hatten im Graka Bereich ja auch so ihre Probleme, keine echten, guten Ingenieure mehr?
Ist der Zeitdruck zu groß geworden, um ordentlich zu entwickeln und zu testen?
Oder haben die nur noch günstige, junge Entwickler, denen einfach die Erfahrung eines Igors fehlt?
Erst die Grünen mit dem Stecker, jetzt dieses Problem.
Schreckt mich komplett ab, mir was neues zu holen. Ist mittlerweile wie bei Spielen, kann man erst nach ein paar Monaten Updates spielen.
Ist bei einem Hardwareproblem irgendwie doof ;)
Guten Rutsch, Igor.
Dir und deiner Familie alles beste fürs neue Jahr.
Auch an den Rest hier im Forum.
Kommt gut und gesund rein und durch.
Grüße

Antwort 5 Likes

DMHas

Mitglied

44 Kommentare 9 Likes

Interessanter Artikel! Wenn der Originalkühler von so "schlechter Qualität" ist, bin ich gespannt, wie sich die Custom-Designs der Hersteller bei diesem Thema schlagen werden. Ebenfalls interessant wären Erfahrungen mit Wasserkühlblöcken. @Igor Wallossek: ist in dieser Richtung etwas geplant?

Antwort Gefällt mir

Igor Wallossek

1

10,314 Kommentare 19,113 Likes

Typische Man-in-the-Midle-Story. Das war schon bei den FuryX und den fiependen Pumpen das Problem. AMD beauftragt PC Partner, die beauftragen Coolermaster, die beauftragen AVC, die beauftragen noch weitere Zulieferer usw.... Da ist ein seriöses Qualitätsmanagement fast unmöglich. Am Ende war es der Verguss samt Blasen im Harz. :D

Die XFX und die Sapphire haben bisher keine Auffälligkeiten. Die Kühler sind jedoch auch richtig plan. Wasserblock wird man sehen müssen, wann was kommt. Gescannt ist die Karte ja.

Antwort 7 Likes

Megaone

Urgestein

1,765 Kommentare 1,664 Likes

Erstmal Danke an dich Igor für den Test. Sowas findet man nur bei dir. Eine kleine Spende für den Laser ist gerade raus (y).

Sätze wie:"Ich für meinen Teil habe mein Problem zumindest lösen können.." machen mir immer Angst.

Wieviele können das denn?

Der Durchschnittsdepp (und davon bin auch nicht so arg weit entfernt ) scheitert doch schon daran, die Temperaturen seiner Karte auszulesen, respektive weiss nichtmal, das es sowas wie einen Hotspot überhaupt gibt.

Von Tom`s Hardware lesen und Texte übersetzen ist der weiter entfernt, wie eine Kuh vom eierlegen.

Von daher ist das mit "keine Sorgen machen" der völlig falsche Ansatz.

Da kann man schon darüber nachdenken, wieviel Leute so eine Trümmerlotte im Rechner haben und sich fragen, wieso im Sommer die Leistung einbricht.

Das gleiche gilt natürlich auch für NVIDIA mit Ihrer Kabellotterie.

Offenkundig ist es von den die Herrschaften zuviel verlangt, gut geteste Produkte zu einem Preis, der für viele einem Monatslohn entspricht, auf den Markt zu bringen.

Da ist raffen, Dollars zählen und die Marktingmaschine auf Touren bringen wohl deutlich einfacher. Wenn ich mir diesen Müll, der sich ja nicht nur auf Grafikkarten beschränkt so anschaue, verstehe ich Leute, die sich ein einfaches Notebook und zum zocken eine Playstation kaufen, immer mehr.

Bin mal gespannt wie Firmen wie Gigabyte oder diverse andere auf einen RMA Wunsch reagieren. Bei meiner 3090 hies es letztens noch O-Ton.

"Das gehört so."

Throtteln ist völlig normal, sonst wäre es ja nicht eingebaut und diene dem Schutz der Karte und Throtteln wäre kein Mangel! Und wen interessiere es schon, was irgendeine Internetseite so von sich gibt.

Ich kam mir vor wie in dieser alten SWR3 Radiocomedyserie: " Das Kaufhaus des Grauens ".

Antwort 7 Likes

Klicke zum Ausklappem
a
andr_gin

Mitglied

72 Kommentare 37 Likes

Das Problem an der Sache ist nicht das throttling. Das sollte ja nur in Extremfällen passieren.
Das Hauptproboem ist, dass die Lüfterkurven an der Hotspot Temperatur hängen und diese dann kurz vor dem throttlen auf 100% hochdrehen.

So Kommentare von AMD, dass das alles innerhalb der Spezifikation ist können sie sich echt sparen. Als Konsument kann ich die Karte 14 Tage ohne Angabe von Gründen zum Händler zurück schicken bzw. innerhalb von 2 Jahren als Gewährleistungsfall eine Reparatur/Austausch verlangen. Den Rest darf sich dann Digital River mit AMD ausmachen.

Antwort 2 Likes

G
Guest

Super Analyse zu dem Thema! Das Erste was ich dazu finde und sich, im Rahmen der Möglichkeiten, damit auseinander setzt.

Ich habe mit meiner XTX (Powercolor MBA)keine Temp. Probleme, aber ich habe die Schrauben mal nachgezogen, die vier vom GPU-Kreuz waren unverschämt lose! die drumrum nur minimal besser!

Versiegelt war bei der Karte gar nichts, weder der übliche kleine Siegelaufkleber, noch sonst was. Auch fehlte dieser kleine Aufkleber, der "früher" mal bei der Endkontrolle aufgeklebt wurde... Vielleicht tracken die Hersteller das aber nun über Seriennummern... k.A..

Ich habe den EKWB Waterblock bestellt und werde dann beim Umbau nochmal vorher und nachher 3DMark anwerfen und mit GPU-Z und HWInfo paar Screenshots erstellen...
Das Ding soll Ende Januar kommen.

@Igor Wallossek Wenn interesse besteht, könnte ich den XTX-MBA Kühler mal als Leihgabe nach erfolgreichem Umbau zur Verfügung stellen, wenns was nützt....

Antwort 3 Likes

Gurdi

Urgestein

1,370 Kommentare 900 Likes

Das Delta kann ich bestätigen, 15-20 Kelvin, ein Repaste auf meiner Aorus bringt ein ähnliches Delta hervor bei Referenz TBP. Das scheint also derzeit so der optimale Zustand zu sein.

Antwort Gefällt mir

O
Ozzy

Veteran

225 Kommentare 137 Likes

Und die lernen nix draus?
Man man, in so großen Konzernen wird einem alles vorgegeben, was man sagen darf, anziehen darf, annehmen darf usw.
Aber sowas bekommen die nicht auf die Reihe?

Antwort 3 Likes

Megaone

Urgestein

1,765 Kommentare 1,664 Likes

Bist du dir da so sicher? Das mag ja jetzt alles so sein, aber wie sieht es im Sommer bei 35 Grad oder mehr aus. Da war ja meine Wakü schon an Ihren Grenzen.

Verlangen kannst du viel. Das Spiel heist aber im Zweifelsfall: " Wer will was von wem." In der Regel funktionieren die Rechtsabteilungen von großen Unternehmen besser als kleine Kanzleien. Und wieviel Kunden sind schon so Konfliktfreudig. Gebellt wird immer viel, gerade in den Foren. Beissen tun die wenigsten. Wobei ich damit explizit nicht dich meine.

Oder auf die Kunden abwälzen. Die meisten müssen sich ja in der Regel erstmal mit dem Hersteller der Customs amüsieren.

Antwort Gefällt mir

G
Guest

@Ozzy Ich arbeite in einem recht großen Unternehmen, und ich kann aus erster Hand, als Sumpfmitarbeiter bestätigen, wenn dir ein Problem auffällt, und du zu oft sagst, "Leute, da ist ein Problem, das und das wäre die Lösung".... bist du für "die da oben" das Problem!
Weil das eigene Unternehmen ist ja immer (frei nach "Postal") die "überflieger-company" - Man ist perfekt! ... und Probleme und Fehler machen nur die Anderen!
Das beobachte ich nun schon eine Weile... und bekomme das auch von anderen Unternehmen so zugetragen... und das international!
Das wird bei AMD,Intel,nVidia nicht anders sein!

Leider!

Antwort 14 Likes

*
***

Veteran

496 Kommentare 312 Likes

Von was sprichst Du eigentlich?

Man kann einiges in der eigenen Firma steuern, aber auch da arbeiten nur Menschen und die machen Fehler. Wenn Du andere Firmen mit etwas beauftragst, kannst Du zwar Bedingungen in den Vetrag schreiben und die Firma eventuell auch wegen Vertragsbruch belangen, wenn die Bedingungen nicht eingehalten werden - aber erst hinterher. VERMEIDEN wirst Du die Fehler nicht können. Du kannst schließlich nicht jede einzelne produzierte Karte komplett prüfen bevor sie ausgeliefert wird.

An irgendeiner Stelle ist es immer eine Sache des Vertrauens und des Risikomanagement.

Übrigens: Je mehr man in der eigenen Firma produziert, desto teurer wird es (weil man sich nicht spezialisieren kann). Deswegen werden solche Dinge outgesourced. Wenn Du darauf bestehst, dass Du als Firma über alles die Kontrolle behältst, musst Du dafür einen Preis zahlen. Und, falls Dir das nicht klar sein sollte, der einzige der diesen Preis bezahlen muss, ist am Ende der Kunde. Wer denn sonst? Der Kunde ist die einzige Geldquelle!

Antwort Gefällt mir

Megaone

Urgestein

1,765 Kommentare 1,664 Likes

Naja, die Frage ist ja nicht, das Fehler passieren, sondern wie damit am Ende umgegangen wird. Was natürlich sicher erstmal abzuwarten bleibt.

Aber merken hätte man das im Vorfeld eigentlich können und müssen.

PS:
Bevor ich es im Eifer des Gefechtes vergesse.

Allen eine guten Rutsch und ein schönes und gesundes 2023. (y)

Antwort 5 Likes

RedF

Urgestein

4,746 Kommentare 2,628 Likes

So kenne ich das auch -_- . War auch schon in der entwiklung tätig, an den ingenieuren liegt es eher nicht.
Die bekommen bauchschmerzen was dann an Produkt verkauft wird weil das Produkt zu tode gespart wird.

Antwort 6 Likes

LurkingInShadows

Urgestein

1,372 Kommentare 572 Likes

Das mit dem Firmenübergreifendem QA ist so eine Sache....

Zulieferer macht im besten Fall Stichproben beim Ein- und/oder Ausgang, der nächste genauso..... Finde da mal nen Fehler der nicht in >80% (Hausnummer) der Produkte auftritt.

Antwort 4 Likes

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kannst Du per PayPal spenden.

About the author

Igor Wallossek

Editor-in-chief and name-giver of igor'sLAB as the content successor of Tom's Hardware Germany, whose license was returned in June 2019 in order to better meet the qualitative demands of web content and challenges of new media such as YouTube with its own channel.

Computer nerd since 1983, audio freak since 1979 and pretty much open to anything with a plug or battery for over 50 years.

Follow Igor:
YouTube Facebook Instagram Twitter

Werbung

Werbung