RDNA3 und vereinzelt viel zu hohe Hotspot-Temperaturen auf den AMD Radeon RX 7900 XT(X) – Ursachenforschung

Redaktion

Artikel-Butler
Mitarbeiter
Mitglied seit
Aug 6, 2018
Beiträge
1.820
Bewertungspunkte
8.825
Punkte
1
Standort
Redaktion
Man kann natürlich über BIOS-Probleme bei der geänderten Telemetrie der neuen RDNA3-Karten, vereinzelte Thermal-Sensoren im vermeintlichen Amok-Modus oder auch handfeste mechanische Probleme trefflich diskutieren, am Ende ist wohl derzeit nur AMD in der Lage, eine umfassende und ehrliche Antwort zu geben. Aber man kann durchaus auch als Außenstehender nach Gründen suchen und sich dem „Issue“ (read full article...)
 
@Igor Wallossek :
1) Crowdfunding für LASER?

2) Sehe ich das auf S.1 richtig, dass das PCB um 0,11 verzogen ist? (0,34 re.o. und 0,23 zweiter Wert von re.u.); Ist das der Wert den du auf S.2 anführst, oder nur durch diesen entstanden?

3) Was geben die Werte in den Klammern bei der Heatsinkvermessung an?

4) S.2, 4.Absatz unter der Heatsinkgrafik (=3.Absatz im Fazit), 1.Satz
Es ist sicher auch gut vorstellbar, dass einzelne der in der GPU Sensoren Unfug messen und die Telemetrie solche Ausreißer nicht abfängt (Plausibilitätstest).
"Sensoren" gehört vor "in der GPU", oder?
 
Es geht NICHT um die 110 Grad oder ein Throttling (das ist ja dann nur die für den letzten DAU auch sichtbare kausale Folge), sondern das Delta an sich, das da nicht hingehört. Da ist es nur die Frage der TBP, wie hoch die Hotpot Temperatur dann am Ende ausfällt. Das steht auch so im Artikel. Da steht zudem auch drin, dass ich das seit zwei Wochen verfolge, also lange bevor TH US was dazu schrieb oder das durch die Medien ging. Nur dauern richtige Messungen halt etwas länger.

Der Artikel zeigt nämlich auch, warum ein normales Repaste meist nichts bringt. Und warum ich KEINE fremden Karten genutzt habe. Meine XT hat das gleiche Problem und wenn ich die TBP erhöhe, komme ich auch deutlich höher in Richtung Ü100. Es ist hier ein belegbares ein Heatsink-Problem. wo der Hotspot um stellenweise über 30 K runtergebracht werden konnte. Richtig verteilter und dosierter Anpressdruck FTW.

2) Sehe ich das auf S.1 richtig, dass das PCB um 0,11 verzogen ist? (0,34 re.o. und 0,23 zweiter Wert von re.u.); Ist das der Wert den du auf S.2 anführst, oder nur durch diesen entstanden?

3) Was geben die Werte in den Klammern bei der Heatsinkvermessung an?

4) S.2, 4.Absatz unter der Heatsinkgrafik (=3.Absatz im Fazit), 1.Satz
"Sensoren" gehört vor "in der GPU", oder?

2.) Nein. Das ergibt sich aus den 0.07 an der GPU und den 0.04 am Heatsink, da sich dieser ja nicht anpassen lässt und beide Flächen konkav sind.
3.) Eine Länge und die Differenzen der Achsen (X,Z,Y), wobei der letzte Wert in den Klammern die Höhendifferenz ist
4.) Gefixt, da fehlte ein Wort :D


Was mir fehlte waren die Temperaturen der 7900XT vor den "Anpassungen".
Große Delta Werte gab und gibt es ja auch bei RX5000 und 6000 und sogar RTX3000. Solange die hierdurch nicht throttling haben und Leistung einbüßen sowie stabil laufen, sehe ich es erstmal kein gravierendes Problem bei den XTs. Ursachen wird das Ganze sicherlich haben. Ob es nur den einen Faktor gibt oder mehrere Ursachen ist schwierig nachvollziehbar denke Ich, auch ob die Betroffenen Karten das EINE Problem haben oder mehrere kleine Faktoren die Situation je Karte forcieren.
Der Delta-Vergleich steht im Intro und im Fazit. Das hohe Delta weist auf einen miesen, ungleichmäßigen Kontakt hin. Das konnte man bei den alten Karten durch meine Methode mit der WLP locker korrigieren. Hier aber liegt der Fall anders, weil die Vapor-Chamber schief angeschliffen wurde und zudem noch mittig verbeult ist. Das sieht man sogar schon gegen das Licht mit bloßem Auge. Das ist aus meiner Sicht ein klarer Sachmangel und so eine Karte gehört kommentarlos ausgetauscht.
 
Zuletzt bearbeitet :
Wenn, brauche ich eine unverbastelte heiße Karte :)
Eine gute XTX habe ich ja ;)
 
Guter Artikel, Igor, wie immer.
Ich frage mich langsam ehrlich, gibt es bei den beiden Herstellern, naja, sogar auch bei Intel, die hatten im Graka Bereich ja auch so ihre Probleme, keine echten, guten Ingenieure mehr?
Ist der Zeitdruck zu groß geworden, um ordentlich zu entwickeln und zu testen?
Oder haben die nur noch günstige, junge Entwickler, denen einfach die Erfahrung eines Igors fehlt?
Erst die Grünen mit dem Stecker, jetzt dieses Problem.
Schreckt mich komplett ab, mir was neues zu holen. Ist mittlerweile wie bei Spielen, kann man erst nach ein paar Monaten Updates spielen.
Ist bei einem Hardwareproblem irgendwie doof ;)
Guten Rutsch, Igor.
Dir und deiner Familie alles beste fürs neue Jahr.
Auch an den Rest hier im Forum.
Kommt gut und gesund rein und durch.
Grüße
 
Interessanter Artikel! Wenn der Originalkühler von so "schlechter Qualität" ist, bin ich gespannt, wie sich die Custom-Designs der Hersteller bei diesem Thema schlagen werden. Ebenfalls interessant wären Erfahrungen mit Wasserkühlblöcken. @Igor Wallossek: ist in dieser Richtung etwas geplant?
 
Zuletzt bearbeitet :
Ich frage mich langsam ehrlich, gibt es bei den beiden Herstellern, naja, sogar auch bei Intel, die hatten im Graka Bereich ja auch so ihre Probleme, keine echten, guten Ingenieure mehr?
Ist der Zeitdruck zu groß geworden, um ordentlich zu entwickeln und zu testen?
Typische Man-in-the-Midle-Story. Das war schon bei den FuryX und den fiependen Pumpen das Problem. AMD beauftragt PC Partner, die beauftragen Coolermaster, die beauftragen AVC, die beauftragen noch weitere Zulieferer usw.... Da ist ein seriöses Qualitätsmanagement fast unmöglich. Am Ende war es der Verguss samt Blasen im Harz. :D

Interessanter Artikel! Wenn der Originalkühler von so "schlechter Qualität" ist, bin ich gespannt, wie sich die Custom-Designs der Hersteller bei diesem Thema schlagen werden. Ebenfalls interessant wären Erfahrungen mit Wasserkühlblöcken. @Igor Wallossek: ist dieser Richtung etwas geplant?
Die XFX und die Sapphire haben bisher keine Auffälligkeiten. Die Kühler sind jedoch auch richtig plan. Wasserblock wird man sehen müssen, wann was kommt. Gescannt ist die Karte ja.
 
Erstmal Danke an dich Igor für den Test. Sowas findet man nur bei dir. Eine kleine Spende für den Laser ist gerade raus (y).

Sätze wie:"Ich für meinen Teil habe mein Problem zumindest lösen können.." machen mir immer Angst.

Wieviele können das denn?

Der Durchschnittsdepp (und davon bin auch nicht so arg weit entfernt ) scheitert doch schon daran, die Temperaturen seiner Karte auszulesen, respektive weiss nichtmal, das es sowas wie einen Hotspot überhaupt gibt.

Von Tom`s Hardware lesen und Texte übersetzen ist der weiter entfernt, wie eine Kuh vom eierlegen.

Von daher ist das mit "keine Sorgen machen" der völlig falsche Ansatz.

Da kann man schon darüber nachdenken, wieviel Leute so eine Trümmerlotte im Rechner haben und sich fragen, wieso im Sommer die Leistung einbricht.

Das gleiche gilt natürlich auch für NVIDIA mit Ihrer Kabellotterie.

Offenkundig ist es von den die Herrschaften zuviel verlangt, gut geteste Produkte zu einem Preis, der für viele einem Monatslohn entspricht, auf den Markt zu bringen.

Da ist raffen, Dollars zählen und die Marktingmaschine auf Touren bringen wohl deutlich einfacher. Wenn ich mir diesen Müll, der sich ja nicht nur auf Grafikkarten beschränkt so anschaue, verstehe ich Leute, die sich ein einfaches Notebook und zum zocken eine Playstation kaufen, immer mehr.

Bin mal gespannt wie Firmen wie Gigabyte oder diverse andere auf einen RMA Wunsch reagieren. Bei meiner 3090 hies es letztens noch O-Ton.

"Das gehört so."

Throtteln ist völlig normal, sonst wäre es ja nicht eingebaut und diene dem Schutz der Karte und Throtteln wäre kein Mangel! Und wen interessiere es schon, was irgendeine Internetseite so von sich gibt.

Ich kam mir vor wie in dieser alten SWR3 Radiocomedyserie: " Das Kaufhaus des Grauens ".
 
Zuletzt bearbeitet :
Große Delta Werte gab und gibt es ja auch bei RX5000 und 6000 und sogar RTX3000. Solange die hierdurch nicht throttling haben und Leistung einbüßen sowie stabil laufen, sehe ich es erstmal kein gravierendes Problem bei den XTs.
Das Problem an der Sache ist nicht das throttling. Das sollte ja nur in Extremfällen passieren.
Das Hauptproboem ist, dass die Lüfterkurven an der Hotspot Temperatur hängen und diese dann kurz vor dem throttlen auf 100% hochdrehen.

So Kommentare von AMD, dass das alles innerhalb der Spezifikation ist können sie sich echt sparen. Als Konsument kann ich die Karte 14 Tage ohne Angabe von Gründen zum Händler zurück schicken bzw. innerhalb von 2 Jahren als Gewährleistungsfall eine Reparatur/Austausch verlangen. Den Rest darf sich dann Digital River mit AMD ausmachen.
 
Super Analyse zu dem Thema! Das Erste was ich dazu finde und sich, im Rahmen der Möglichkeiten, damit auseinander setzt.

Ich habe mit meiner XTX (Powercolor MBA)keine Temp. Probleme, aber ich habe die Schrauben mal nachgezogen, die vier vom GPU-Kreuz waren unverschämt lose! die drumrum nur minimal besser!

Versiegelt war bei der Karte gar nichts, weder der übliche kleine Siegelaufkleber, noch sonst was. Auch fehlte dieser kleine Aufkleber, der "früher" mal bei der Endkontrolle aufgeklebt wurde... Vielleicht tracken die Hersteller das aber nun über Seriennummern... k.A..

Ich habe den EKWB Waterblock bestellt und werde dann beim Umbau nochmal vorher und nachher 3DMark anwerfen und mit GPU-Z und HWInfo paar Screenshots erstellen...
Das Ding soll Ende Januar kommen.

@Igor Wallossek Wenn interesse besteht, könnte ich den XTX-MBA Kühler mal als Leihgabe nach erfolgreichem Umbau zur Verfügung stellen, wenns was nützt....
 
Das Delta kann ich bestätigen, 15-20 Kelvin, ein Repaste auf meiner Aorus bringt ein ähnliches Delta hervor bei Referenz TBP. Das scheint also derzeit so der optimale Zustand zu sein.
 
Das Problem an der Sache ist nicht das throttling. Das sollte ja nur in Extremfällen passieren.
Das Hauptproboem ist, dass die Lüfterkurven an der Hotspot Temperatur hängen und diese dann kurz vor dem throttlen auf 100% hochdrehen.
Bist du dir da so sicher? Das mag ja jetzt alles so sein, aber wie sieht es im Sommer bei 35 Grad oder mehr aus. Da war ja meine Wakü schon an Ihren Grenzen.

So Kommentare von AMD, dass das alles innerhalb der Spezifikation ist können sie sich echt sparen. Als Konsument kann ich die Karte 14 Tage ohne Angabe von Gründen zum Händler zurück schicken bzw. innerhalb von 2 Jahren als Gewährleistungsfall eine Reparatur/Austausch verlangen.
Verlangen kannst du viel. Das Spiel heist aber im Zweifelsfall: " Wer will was von wem." In der Regel funktionieren die Rechtsabteilungen von großen Unternehmen besser als kleine Kanzleien. Und wieviel Kunden sind schon so Konfliktfreudig. Gebellt wird immer viel, gerade in den Foren. Beissen tun die wenigsten. Wobei ich damit explizit nicht dich meine.


Den Rest darf sich dann Digital River mit AMD ausmachen.

Oder auf die Kunden abwälzen. Die meisten müssen sich ja in der Regel erstmal mit dem Hersteller der Customs amüsieren.
 
@Ozzy Ich arbeite in einem recht großen Unternehmen, und ich kann aus erster Hand, als Sumpfmitarbeiter bestätigen, wenn dir ein Problem auffällt, und du zu oft sagst, "Leute, da ist ein Problem, das und das wäre die Lösung".... bist du für "die da oben" das Problem!
Weil das eigene Unternehmen ist ja immer (frei nach "Postal") die "überflieger-company" - Man ist perfekt! ... und Probleme und Fehler machen nur die Anderen!
Das beobachte ich nun schon eine Weile... und bekomme das auch von anderen Unternehmen so zugetragen... und das international!
Das wird bei AMD,Intel,nVidia nicht anders sein!

Leider!
 
Und die lernen nix draus?
Man man, in so großen Konzernen wird einem alles vorgegeben, was man sagen darf, anziehen darf, annehmen darf usw.
Aber sowas bekommen die nicht auf die Reihe?
Von was sprichst Du eigentlich?

Man kann einiges in der eigenen Firma steuern, aber auch da arbeiten nur Menschen und die machen Fehler. Wenn Du andere Firmen mit etwas beauftragst, kannst Du zwar Bedingungen in den Vetrag schreiben und die Firma eventuell auch wegen Vertragsbruch belangen, wenn die Bedingungen nicht eingehalten werden - aber erst hinterher. VERMEIDEN wirst Du die Fehler nicht können. Du kannst schließlich nicht jede einzelne produzierte Karte komplett prüfen bevor sie ausgeliefert wird.

An irgendeiner Stelle ist es immer eine Sache des Vertrauens und des Risikomanagement.

Übrigens: Je mehr man in der eigenen Firma produziert, desto teurer wird es (weil man sich nicht spezialisieren kann). Deswegen werden solche Dinge outgesourced. Wenn Du darauf bestehst, dass Du als Firma über alles die Kontrolle behältst, musst Du dafür einen Preis zahlen. Und, falls Dir das nicht klar sein sollte, der einzige der diesen Preis bezahlen muss, ist am Ende der Kunde. Wer denn sonst? Der Kunde ist die einzige Geldquelle!
 
Von was sprichst Du eigentlich?

Man kann einiges in der eigenen Firma steuern, aber auch da arbeiten nur Menschen und die machen Fehler. Wenn Du andere Firmen mit etwas beauftragst, kannst Du zwar Bedingungen in den Vetrag schreiben und die Firma eventuell auch wegen Vertragsbruch belangen, wenn die Bedingungen nicht eingehalten werden - aber erst hinterher. VERMEIDEN wirst Du die Fehler nicht können. Du kannst schließlich nicht jede einzelne produzierte Karte komplett prüfen bevor sie ausgeliefert wird.

An irgendeiner Stelle ist es immer eine Sache des Vertrauens und des Risikomanagement.

Übrigens: Je mehr man in der eigenen Firma produziert, desto teurer wird es (weil man sich nicht spezialisieren kann). Deswegen werden solche Dinge outgesourced. Wenn Du darauf bestehst, dass Du als Firma über alles die Kontrolle behältst, musst Du dafür einen Preis zahlen. Und, falls Dir das nicht klar sein sollte, der einzige der diesen Preis bezahlen muss, ist am Ende der Kunde. Wer denn sonst? Der Kunde ist die einzige Geldquelle!
Naja, die Frage ist ja nicht, das Fehler passieren, sondern wie damit am Ende umgegangen wird. Was natürlich sicher erstmal abzuwarten bleibt.

Aber merken hätte man das im Vorfeld eigentlich können und müssen.

PS:
Bevor ich es im Eifer des Gefechtes vergesse.

Allen eine guten Rutsch und ein schönes und gesundes 2023. (y)
 
@Ozzy Ich arbeite in einem recht großen Unternehmen, und ich kann aus erster Hand, als Sumpfmitarbeiter bestätigen, wenn dir ein Problem auffällt, und du zu oft sagst, "Leute, da ist ein Problem, das und das wäre die Lösung".... bist du für "die da oben" das Problem!
Weil das eigene Unternehmen ist ja immer (frei nach "Postal") die "überflieger-company" - Man ist perfekt! ... und Probleme und Fehler machen nur die Anderen!
Das beobachte ich nun schon eine Weile... und bekomme das auch von anderen Unternehmen so zugetragen... und das international!
Das wird bei AMD,Intel,nVidia nicht anders sein!

Leider!
So kenne ich das auch -_- . War auch schon in der entwiklung tätig, an den ingenieuren liegt es eher nicht.
Die bekommen bauchschmerzen was dann an Produkt verkauft wird weil das Produkt zu tode gespart wird.
 
Oben Unten