Grafikkarten Testberichte VGA

RDNA3 und vereinzelt viel zu hohe Hotspot-Temperaturen auf den AMD Radeon RX 7900 XT(X) – Ursachenforschung

Man kann natürlich über BIOS-Probleme bei der geänderten Telemetrie der neuen RDNA3-Karten, vereinzelte Thermal-Sensoren im vermeintlichen Amok-Modus oder auch handfeste mechanische Probleme trefflich diskutieren, am Ende ist wohl derzeit nur AMD in der Lage, eine umfassende und ehrliche Antwort zu geben. Aber man kann durchaus auch als Außenstehender nach Gründen suchen und sich dem „Issue“ von verschiedenen Seiten annähern. Da uns die Firmware aus vielerlei Gründen versperrt bleibt, habe ich per „Try & Error“ und zeitintensiven 3D-Scans versucht, zumindest mögliche mechanische Probleme zu finden. Denn bisher konzentrieren sich die Probleme ja allein auf die Referenzkarten von AMD, egal ob nun direkt aus dem AMD-Shop, oder aber umgelabelt durch die Boardpartner. Denn der Hersteller ist bei all diesen Karten PC Partner im Auftrag von AMD. Das erste Statement von AMD sagt leider noch nichts Konkretes aus, also wird man abwarten müssen.

Wichtiges Vorwort

Der heutige Artikel basiert leider auf nur einer einzigen Karte (RX 7900 XT Referenz) aus meinem eigenen Bestand, die einen etwas höheren Hotspot (bis zu 45 Kelvin im vertikalen und 38 Kelvin als Delta im horizontalen Aufbau) als der Rest der getestet Karten aufwies (dort bis zu 19 Kelvin als Delta im Furmark). Bei einer XTX wäre dies sicher auch noch höher ausgefallen, aber ich wollte nur eine Karte testen, die ich zuvor auch selbst als Erster zerlegt (und dokumentiert) habe. Angebote, auch andere betroffene Karten zu analysieren, habe ich nicht nur aus Zeitgründen verworfen. Denn leider waren alle Exemplare bereits grundlegend durch die Käufer „verbastelt“, also schon einmal demontiert und mit neuer Wärmeleitpaste versehen worden. Damit kann man jedoch nicht mehr sinnvoll und plausibel arbeiten. 

Fakt ist leider auch, dass das Ersetzen der verwendeten Wärmeleitpaste (Phase Changer) in den mir bekannten Fällen unter Umständen nur wenig Abhilfe schafft (nämlich wenn der Rest der Bedingungen nicht stimmt), in anderen Fällen im Internet angeblich aber schon. Das wiederum hat mich dazu geführt, den Heatsink und damit auch die Vapor-Chamber einmal genauer zu untersuchen. Einer der Gründe, warum ich bisher nichts zum Thema geschrieben habe, war natürlich auch die nötige Auszeit, die ich meiner Familie und mir über die Feiertage nach einem Jahr mal gegönnt habe. Damit erhebe ich mit diesem Artikel natürlich auch keinen Anspruch auf Allgemeingültigkeit, denn es ist ja nur ein rein exemplarischer Test. Das Ergebnis zeigt jedoch sehr gut, dass die gewählte Bauweise und eine eher schlechte Verarbeitung in Einzelfällen zu genau diesem Hotspot-Problem führen können und man durchaus die passenden Schlüsse ziehen kann.

Erfassung der Platinen- und Kühler-Daten

Was aber nicht heißt, dass ich gar nichts gemacht habe. Oder besser: Ich habe etwas machen lassen. Zum Beispiel die Platinen und Kühler in meinem 3D-Scanner erfasst, was mich insgesamt bisher satte 12 Tage gekostet hat, denn ich habe diesmal mit höchstmöglicher Auflösung gescannt. Da kann man zwischenzeitlich auch schon einmal ein verlängertes Wochenende „blau“ machen. Bis zum nächsten Wechsel im 3D-Scanner. Das Hotspot-Problem war mir nicht neu und ich habe bereits mit den Messungen angefangen, bevor die Welle durch die Netzwerke schwappte. Trotzdem bin ich leider erst jetzt fertig geworden.

Das Bild oben zeigt etwas, das ich sogar in mehreren Fällen (jedoch mehr oder weniger stark ausgeprägt) beobachten konnte, weil ich jede Karte, die ich zerlege, beim Bearbeiten mit Bildern sehr genau dokumentiere. Genau genommen kann man dem Foto nämlich bereits zwei interessante Informationen entnehmen. Erstens ist es die Verwendung eines sogenannten Phase Changers, also eines speziellen Materials anstelle einer mehr oder weniger viskosen Paste. Man erkennt das an der Entstehung kleiner Luftbläschen und natürlich an der sehr harten Konsistenz, der glänzenden Oberfläche und der Farbe. Zweitens sind es die Abdrücke selbst, die auf sehr schlechte Spaltmaße schließen lassen, aber dazu komme ich noch. Fakt ist, dass man solche Pads eigentlich nur nimmt, wenn man sich der Oberflächenproblematik durchaus bewusst ist.

 

Da ich selbst sehr viel mit solchen Materialien experimentiert habe, habe ich natürlich auch gewisse Erfahrungen damit. Diese Materialien sind analog zu einem dünnen Pad sehr einfach zu applizieren, benötigen aber einen sogenannten Burn-In. Der erfolgt bei den von mir bevorzugten Pads (Boyd) bereits ab ca. 52 °C und man kann, um sicher zu gehen, das auch bis 60 °C erhöhen. Da nämlich wird das Material dünnflüssig, um später beim Abkühlen irreversibel auszuhärten. Die Wärmeleitfähigkeit ist vergleichsweise gering, also schlechter als die guter Pasten. Warum man nicht auf die früher verwendeten, deutlich besseren schwarzen Graphit-Pads gesetzt hat, weiß wohl nur AMD allein. Und es ist ein gewisser Fehlerfaktor, den man auch mit einbeziehen muss. Vor allem dann, wenn wir uns auf der nächsten Seite die Detail-Scans betrachten werden.

Und nun vergleichen wir einmal bitte beide Bilder. Der Abdruck ist auf beiden Bildern nämlich nahezu deckungsgleich! Wer hier aufmerksam hinsieht, der wird zudem auch ohne 3D-Scan schon vermuten können, was ich später in den einzelnen Höhen-Ebenen noch zeitaufwändig gemessen habe. Ich will das an dieser Stelle jedoch noch einmal betonen: es erklärt nur mögliche, mechanisch bedingte Probleme, keine potentiell vorhandenen elektrischen! Und so kann es durchaus auch sein, dass hier der eine oder andere Faktor auch noch unglücklich mit unseren aufgezeigten Problemen zusammentreffen könnte.

Es ist auch mir aufgefallen, dass die betroffene Karte (aber nicht alle) im vertikal eingebauten Zustand etwas besser performte und der Wechsel der Wärmeleitpaste auf eine sehr gute „normale“ Paste das Delta kaum veränderte, trotz insgesamt niedrigerer Temperaturen. Der Hotspot blieb also ähnlich stark ausgeprägt, nur eben anders und nicht mehr ganz so hoch als Absolutwert. Das Reduzieren der TBP brachte auch nur bedingt Abhilfe und das Delta blieb auch dann noch annähernd gleich.

Womit sich die Aufgabe regelrecht aufdrängte, einmal den Kühler von einer unauffälligen Karte zusammen mit der Platine der betroffenen Karte zu kombinieren! Warum hat das eigentlich bisher keiner getestet? Auch wenn es aufgrund der Verfügbarkeit nur einer Karte mit einem Hotspot-Problem eine rein exemplarische Aussage sein kann: das Problem trat im Über-Kreuz-Test nur mit dem Kühler der ursprünglich betroffenen Karte auf! Das heißt, der Hotspot war in meinem Fall rein Kühler-abhängig. Da sich Platinen nach mehreren Erwärmungs- und Abkühlungsphasen mehr oder weniger irreversibel verformen und dieser „Abdruck“ faktisch auf Ewigkeiten erhalten bleibt, habe ich die gesamte Platine zunächst erst einmal komplett eingescannt (was ca. 5 Tage dauert, da ich nicht Krösus bin und nicht auf schnellere Laser-Technik setzen kann).

Was man jedoch auch auf einem in der Horizontal-Ebene weniger hoch aufgelösten Scan bereits sehr gut erkennen kann (die vertikale Auflösung ist ja immer maximal): Wir sehen, dass sich die Platine um den Bereich der GPU deutlich verzogen hat. Das sind natürlich noch keine wirklich katastrophalen Werte, aber es ist eine nähere Untersuchung durchaus wert, denn dafür muss es ja Gründe geben. Genau diese möchte ich Euch auch nicht vorenthalten. also bitte einmal umblättern.

371 Antworten

Kommentar

Lade neue Kommentare

LurkingInShadows

Urgestein

1,348 Kommentare 551 Likes

@Igor Wallossek :
1) Crowdfunding für LASER?

2) Sehe ich das auf S.1 richtig, dass das PCB um 0,11 verzogen ist? (0,34 re.o. und 0,23 zweiter Wert von re.u.); Ist das der Wert den du auf S.2 anführst, oder nur durch diesen entstanden?

3) Was geben die Werte in den Klammern bei der Heatsinkvermessung an?

4) S.2, 4.Absatz unter der Heatsinkgrafik (=3.Absatz im Fazit), 1.Satz
"Sensoren" gehört vor "in der GPU", oder?

Antwort 3 Likes

Not_A_Nerd

Mitglied

49 Kommentare 45 Likes
Igor Wallossek

1

10,193 Kommentare 18,806 Likes

Es geht NICHT um die 110 Grad oder ein Throttling (das ist ja dann nur die für den letzten DAU auch sichtbare kausale Folge), sondern das Delta an sich, das da nicht hingehört. Da ist es nur die Frage der TBP, wie hoch die Hotpot Temperatur dann am Ende ausfällt. Das steht auch so im Artikel. Da steht zudem auch drin, dass ich das seit zwei Wochen verfolge, also lange bevor TH US was dazu schrieb oder das durch die Medien ging. Nur dauern richtige Messungen halt etwas länger.

Der Artikel zeigt nämlich auch, warum ein normales Repaste meist nichts bringt. Und warum ich KEINE fremden Karten genutzt habe. Meine XT hat das gleiche Problem und wenn ich die TBP erhöhe, komme ich auch deutlich höher in Richtung Ü100. Es ist hier ein belegbares ein Heatsink-Problem. wo der Hotspot um stellenweise über 30 K runtergebracht werden konnte. Richtig verteilter und dosierter Anpressdruck FTW.

2.) Nein. Das ergibt sich aus den 0.07 an der GPU und den 0.04 am Heatsink, da sich dieser ja nicht anpassen lässt und beide Flächen konkav sind.
3.) Eine Länge und die Differenzen der Achsen (X,Z,Y), wobei der letzte Wert in den Klammern die Höhendifferenz ist
4.) Gefixt, da fehlte ein Wort :D

Der Delta-Vergleich steht im Intro und im Fazit. Das hohe Delta weist auf einen miesen, ungleichmäßigen Kontakt hin. Das konnte man bei den alten Karten durch meine Methode mit der WLP locker korrigieren. Hier aber liegt der Fall anders, weil die Vapor-Chamber schief angeschliffen wurde und zudem noch mittig verbeult ist. Das sieht man sogar schon gegen das Licht mit bloßem Auge. Das ist aus meiner Sicht ein klarer Sachmangel und so eine Karte gehört kommentarlos ausgetauscht.

Antwort 8 Likes

Klicke zum Ausklappem
P
Pokerclock

Veteran

429 Kommentare 367 Likes

@Igor Wallossek

Falls Interesse besteht, könnte ich eine XTX leihweise zur Verfügung stellen. Unverbastelt, rund 20h betrieben bislang. Sie ist aber m.E. unauffällig. https://extreme.pcgameshardware.de/...atur-ab-diese-sei-normal.628522/post-11189099

Ich könnte mich auch mal darum bemühen ein 110er-Hotspot-Modell zu besorgen.

Antwort 1 Like

Igor Wallossek

1

10,193 Kommentare 18,806 Likes

Wenn, brauche ich eine unverbastelte heiße Karte :)
Eine gute XTX habe ich ja ;)

Antwort Gefällt mir

O
Ozzy

Veteran

225 Kommentare 137 Likes

Guter Artikel, Igor, wie immer.
Ich frage mich langsam ehrlich, gibt es bei den beiden Herstellern, naja, sogar auch bei Intel, die hatten im Graka Bereich ja auch so ihre Probleme, keine echten, guten Ingenieure mehr?
Ist der Zeitdruck zu groß geworden, um ordentlich zu entwickeln und zu testen?
Oder haben die nur noch günstige, junge Entwickler, denen einfach die Erfahrung eines Igors fehlt?
Erst die Grünen mit dem Stecker, jetzt dieses Problem.
Schreckt mich komplett ab, mir was neues zu holen. Ist mittlerweile wie bei Spielen, kann man erst nach ein paar Monaten Updates spielen.
Ist bei einem Hardwareproblem irgendwie doof ;)
Guten Rutsch, Igor.
Dir und deiner Familie alles beste fürs neue Jahr.
Auch an den Rest hier im Forum.
Kommt gut und gesund rein und durch.
Grüße

Antwort 5 Likes

DMHas

Mitglied

39 Kommentare 7 Likes

Interessanter Artikel! Wenn der Originalkühler von so "schlechter Qualität" ist, bin ich gespannt, wie sich die Custom-Designs der Hersteller bei diesem Thema schlagen werden. Ebenfalls interessant wären Erfahrungen mit Wasserkühlblöcken. @Igor Wallossek: ist in dieser Richtung etwas geplant?

Antwort Gefällt mir

Igor Wallossek

1

10,193 Kommentare 18,806 Likes

Typische Man-in-the-Midle-Story. Das war schon bei den FuryX und den fiependen Pumpen das Problem. AMD beauftragt PC Partner, die beauftragen Coolermaster, die beauftragen AVC, die beauftragen noch weitere Zulieferer usw.... Da ist ein seriöses Qualitätsmanagement fast unmöglich. Am Ende war es der Verguss samt Blasen im Harz. :D

Die XFX und die Sapphire haben bisher keine Auffälligkeiten. Die Kühler sind jedoch auch richtig plan. Wasserblock wird man sehen müssen, wann was kommt. Gescannt ist die Karte ja.

Antwort 7 Likes

Megaone

Urgestein

1,746 Kommentare 1,645 Likes

Erstmal Danke an dich Igor für den Test. Sowas findet man nur bei dir. Eine kleine Spende für den Laser ist gerade raus (y).

Sätze wie:"Ich für meinen Teil habe mein Problem zumindest lösen können.." machen mir immer Angst.

Wieviele können das denn?

Der Durchschnittsdepp (und davon bin auch nicht so arg weit entfernt ) scheitert doch schon daran, die Temperaturen seiner Karte auszulesen, respektive weiss nichtmal, das es sowas wie einen Hotspot überhaupt gibt.

Von Tom`s Hardware lesen und Texte übersetzen ist der weiter entfernt, wie eine Kuh vom eierlegen.

Von daher ist das mit "keine Sorgen machen" der völlig falsche Ansatz.

Da kann man schon darüber nachdenken, wieviel Leute so eine Trümmerlotte im Rechner haben und sich fragen, wieso im Sommer die Leistung einbricht.

Das gleiche gilt natürlich auch für NVIDIA mit Ihrer Kabellotterie.

Offenkundig ist es von den die Herrschaften zuviel verlangt, gut geteste Produkte zu einem Preis, der für viele einem Monatslohn entspricht, auf den Markt zu bringen.

Da ist raffen, Dollars zählen und die Marktingmaschine auf Touren bringen wohl deutlich einfacher. Wenn ich mir diesen Müll, der sich ja nicht nur auf Grafikkarten beschränkt so anschaue, verstehe ich Leute, die sich ein einfaches Notebook und zum zocken eine Playstation kaufen, immer mehr.

Bin mal gespannt wie Firmen wie Gigabyte oder diverse andere auf einen RMA Wunsch reagieren. Bei meiner 3090 hies es letztens noch O-Ton.

"Das gehört so."

Throtteln ist völlig normal, sonst wäre es ja nicht eingebaut und diene dem Schutz der Karte und Throtteln wäre kein Mangel! Und wen interessiere es schon, was irgendeine Internetseite so von sich gibt.

Ich kam mir vor wie in dieser alten SWR3 Radiocomedyserie: " Das Kaufhaus des Grauens ".

Antwort 7 Likes

Klicke zum Ausklappem
a
andr_gin

Mitglied

69 Kommentare 37 Likes

Das Problem an der Sache ist nicht das throttling. Das sollte ja nur in Extremfällen passieren.
Das Hauptproboem ist, dass die Lüfterkurven an der Hotspot Temperatur hängen und diese dann kurz vor dem throttlen auf 100% hochdrehen.

So Kommentare von AMD, dass das alles innerhalb der Spezifikation ist können sie sich echt sparen. Als Konsument kann ich die Karte 14 Tage ohne Angabe von Gründen zum Händler zurück schicken bzw. innerhalb von 2 Jahren als Gewährleistungsfall eine Reparatur/Austausch verlangen. Den Rest darf sich dann Digital River mit AMD ausmachen.

Antwort 2 Likes

G
Guest

Super Analyse zu dem Thema! Das Erste was ich dazu finde und sich, im Rahmen der Möglichkeiten, damit auseinander setzt.

Ich habe mit meiner XTX (Powercolor MBA)keine Temp. Probleme, aber ich habe die Schrauben mal nachgezogen, die vier vom GPU-Kreuz waren unverschämt lose! die drumrum nur minimal besser!

Versiegelt war bei der Karte gar nichts, weder der übliche kleine Siegelaufkleber, noch sonst was. Auch fehlte dieser kleine Aufkleber, der "früher" mal bei der Endkontrolle aufgeklebt wurde... Vielleicht tracken die Hersteller das aber nun über Seriennummern... k.A..

Ich habe den EKWB Waterblock bestellt und werde dann beim Umbau nochmal vorher und nachher 3DMark anwerfen und mit GPU-Z und HWInfo paar Screenshots erstellen...
Das Ding soll Ende Januar kommen.

@Igor Wallossek Wenn interesse besteht, könnte ich den XTX-MBA Kühler mal als Leihgabe nach erfolgreichem Umbau zur Verfügung stellen, wenns was nützt....

Antwort 3 Likes

Gurdi

Urgestein

1,370 Kommentare 900 Likes

Das Delta kann ich bestätigen, 15-20 Kelvin, ein Repaste auf meiner Aorus bringt ein ähnliches Delta hervor bei Referenz TBP. Das scheint also derzeit so der optimale Zustand zu sein.

Antwort Gefällt mir

O
Ozzy

Veteran

225 Kommentare 137 Likes

Und die lernen nix draus?
Man man, in so großen Konzernen wird einem alles vorgegeben, was man sagen darf, anziehen darf, annehmen darf usw.
Aber sowas bekommen die nicht auf die Reihe?

Antwort 3 Likes

Megaone

Urgestein

1,746 Kommentare 1,645 Likes

Bist du dir da so sicher? Das mag ja jetzt alles so sein, aber wie sieht es im Sommer bei 35 Grad oder mehr aus. Da war ja meine Wakü schon an Ihren Grenzen.

Verlangen kannst du viel. Das Spiel heist aber im Zweifelsfall: " Wer will was von wem." In der Regel funktionieren die Rechtsabteilungen von großen Unternehmen besser als kleine Kanzleien. Und wieviel Kunden sind schon so Konfliktfreudig. Gebellt wird immer viel, gerade in den Foren. Beissen tun die wenigsten. Wobei ich damit explizit nicht dich meine.

Oder auf die Kunden abwälzen. Die meisten müssen sich ja in der Regel erstmal mit dem Hersteller der Customs amüsieren.

Antwort Gefällt mir

G
Guest

@Ozzy Ich arbeite in einem recht großen Unternehmen, und ich kann aus erster Hand, als Sumpfmitarbeiter bestätigen, wenn dir ein Problem auffällt, und du zu oft sagst, "Leute, da ist ein Problem, das und das wäre die Lösung".... bist du für "die da oben" das Problem!
Weil das eigene Unternehmen ist ja immer (frei nach "Postal") die "überflieger-company" - Man ist perfekt! ... und Probleme und Fehler machen nur die Anderen!
Das beobachte ich nun schon eine Weile... und bekomme das auch von anderen Unternehmen so zugetragen... und das international!
Das wird bei AMD,Intel,nVidia nicht anders sein!

Leider!

Antwort 14 Likes

*
***

Veteran

496 Kommentare 312 Likes

Von was sprichst Du eigentlich?

Man kann einiges in der eigenen Firma steuern, aber auch da arbeiten nur Menschen und die machen Fehler. Wenn Du andere Firmen mit etwas beauftragst, kannst Du zwar Bedingungen in den Vetrag schreiben und die Firma eventuell auch wegen Vertragsbruch belangen, wenn die Bedingungen nicht eingehalten werden - aber erst hinterher. VERMEIDEN wirst Du die Fehler nicht können. Du kannst schließlich nicht jede einzelne produzierte Karte komplett prüfen bevor sie ausgeliefert wird.

An irgendeiner Stelle ist es immer eine Sache des Vertrauens und des Risikomanagement.

Übrigens: Je mehr man in der eigenen Firma produziert, desto teurer wird es (weil man sich nicht spezialisieren kann). Deswegen werden solche Dinge outgesourced. Wenn Du darauf bestehst, dass Du als Firma über alles die Kontrolle behältst, musst Du dafür einen Preis zahlen. Und, falls Dir das nicht klar sein sollte, der einzige der diesen Preis bezahlen muss, ist am Ende der Kunde. Wer denn sonst? Der Kunde ist die einzige Geldquelle!

Antwort Gefällt mir

Megaone

Urgestein

1,746 Kommentare 1,645 Likes

Naja, die Frage ist ja nicht, das Fehler passieren, sondern wie damit am Ende umgegangen wird. Was natürlich sicher erstmal abzuwarten bleibt.

Aber merken hätte man das im Vorfeld eigentlich können und müssen.

PS:
Bevor ich es im Eifer des Gefechtes vergesse.

Allen eine guten Rutsch und ein schönes und gesundes 2023. (y)

Antwort 5 Likes

RedF

Urgestein

4,663 Kommentare 2,552 Likes

So kenne ich das auch -_- . War auch schon in der entwiklung tätig, an den ingenieuren liegt es eher nicht.
Die bekommen bauchschmerzen was dann an Produkt verkauft wird weil das Produkt zu tode gespart wird.

Antwort 6 Likes

LurkingInShadows

Urgestein

1,348 Kommentare 551 Likes

Das mit dem Firmenübergreifendem QA ist so eine Sache....

Zulieferer macht im besten Fall Stichproben beim Ein- und/oder Ausgang, der nächste genauso..... Finde da mal nen Fehler der nicht in >80% (Hausnummer) der Produkte auftritt.

Antwort 4 Likes

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kannst Du per PayPal spenden.

About the author

Igor Wallossek

Chefredakteur und Namensgeber von igor'sLAB als inhaltlichem Nachfolger von Tom's Hardware Deutschland, deren Lizenz im Juni 2019 zurückgegeben wurde, um den qualitativen Ansprüchen der Webinhalte und Herausforderungen der neuen Medien wie z.B. YouTube mit einem eigenen Kanal besser gerecht werden zu können.

Computer-Nerd seit 1983, Audio-Freak seit 1979 und seit über 50 Jahren so ziemlich offen für alles, was einen Stecker oder einen Akku hat.

Folge Igor auf:
YouTube   Facebook    Instagram Twitter

Werbung

Werbung