GPU-Reparaturdienst meldet eine plötzliche Welle defekter Radeon RX 6900/6800-GPUs

AMD Jesus glaubt an AMD/Kunden Fehler
Er denkt das der 22.12.1 Treiber installiert wurde...
Dieser ist aber nur für die 7000er Serie, und sollte sich eigentlich nicht installieren lassen (AMD Fehler das es doch geht?)
Er hat wohl deswegen auch Anfragen bekommen. Darüber das Leute massive Fehler haben seit Installation des Treibers.
Und da stellte sich wohl herraus, das sie den Treiber bei der 6000 Serie benutzen.
 
Zuletzt bearbeitet :
Im Übrigen halte ich z.B., die auf der RX 6900XT Referenz verbauten DrMOS von Infineon für fragwürdig, was die Langzeitkonstanz betrifft. Die Teile krepieren auch in anderen Geräten ganz gern mal nach eingen Monaten oder Jahren im Einsatz. Die verbaut mittlerweile auch keiner mehr freiwillig. :D

Anhang anzeigen 22958

Die Dinger finden sich ja auch auf der RX 6800XT Referenz. Als TDA21472 nutzt man den pro Phase als Smart Power Stage, der maximal 70A liefern kann. Er enthält einen synchronen Buck-Gate-Treiber-IC in einem Co-Package mit Schottky-Diode sowie die High-Side- und Low-Side-MOSFETs. Ich hatte schon welche, die gingen zwar noch, aber das Package war bereits "aufgeblüht". Von da bis zum Knall ist es dann auch nicht mehr sonderlich weit.

Es kann durchaus auch ein Zufall sein, dass die zeitlichen Abstände vom Auflöten bis zum Verrecken solcher Komponenten eher zufällig mit dem Treiberdatum zusammenfallen. Die betroffenen Karten sollte man mal nach Kaufdatum sortieren.
Nur als Theorie zur Frage, warum viele der kaputten Karten erst mit dem neuesten Treiber den Geist aufgegeben haben: kann doch gut sein, daß es eben schon vorher nicht mehr so stabil lief. Mein Instinkt wäre dann auch "Treiber Updaten", denn vielleicht geht's dann wieder ohne Probleme. Wenn die Karte dann aber endgültig kaputt geht, passiert das eben mit dem neuen Treiber. Belegen kann ich die Theorie natürlich auch nicht.
 
Das müsste dann die Treiberversion 22.11.2 vom 30.11.2022 sein, oder? Ich habe bisher keine Probleme festgestellt. Nicht dass das wieder irgendein Spiel im Ladebildschirm verursacht hat, wie seinerzeit bei New World.

8.12. steht da.
So ein Die bekommt man nur mechanisch kaputt oder sprengt es mit direkt 220V , Wafer erfahren in der Fertigung mehrfach über 500°C und halten das problemlos aus.
 
Risse im Chip sehen absolut nicht nach Treiberproblemen aus.
Ich denke da eher an Spannungen im Material.
Bei vielen Materialien treten Probleme auch erst Monate, wenn nicht sogar Jahre später erst auf.
Und das auf einmal 60 Karten betroffen sind, heißt für mich das es da wohl eine zumindestens teildefekte Charge geben muss.
Wenn Spannungen im Wafer sind, fliegt der beim nächsten Annealing in der Produktion auseinander. Wenn die Wafer letztlich bumpend sind und über den Tester gelaufen sind, müssen die Bumps (Kontaktlötkügelchen) nochmals erhitzt werden, damit die Druckstellen der Messnadeln ausgeheilt werden, spätestens da macht es knack.
 
Nochmal, nur bei einem einzelnen Exemplar der 48 wissen wir, dass ein mechanischer Schaden sichtbar ist. Man sollte davon Abstand halten, davon auf die anderen 47 Karten zu schließen.
 

Anhänge

  • Einmal mit Profis.png
    Einmal mit Profis.png
    421,4 KB · Aufrufe : 17
AMD Jesus glaubt an AMD/Kunden Fehler
Er denkt das der 22.12.1 Treiber installiert wurde...
Dieser ist aber nur für die 7000er Serie, und sollte sich eigentlich nicht installieren lassen (AMD Fehler das es doch geht?)
Er hat wohl deswegen auch Anfragen bekommen. Darüber das Leute massive Fehler haben seit Installation des Treibers.
Und da stellte sich wohl herraus, das sie den Treiber bei der 6000 Serie benutzen.

Das hört sich sehr plausibel, mal sehen was @Igor Wallossek dazu sagt...

vielleicht gelingt es ihm dem Fall nach zu stellen?
 
IM HWLuxx hat ein Besitzer einer der 48 Karten geschrieben, dass er lediglich im Adrenalin auf "Update" gedrückt hat.

Nach dem nächsten Boot war die Karte tot.
 
IM HWLuxx hat ein Besitzer einer der 48 Karten geschrieben, dass er lediglich im Adrenalin auf "Update" gedrückt hat.

Nach dem nächsten Boot war die Karte tot.

Jetzt scheint sich langsam der Kreis zu schließen.
Es scheint ein schwerwiegender Softwarefehler vor zu liegen, AMD sollte da langsam mal aktiv werden!
 
Der Redakteur Herr Schilling aus dem Luxx hat Antwort von Krisfix bekommen:

"Man will weitere Tests durchführen. AMD hat sich auch schon mit ihnen in Verbindung gesetzt und man hat darum gebeten weitere Karten zur Verfügung gestellt zu bekommen, mit denen man weitere Tests machen möchte."

Sieht so aus als ob AMD selber die Sache schon untersucht "weitere Karten zur Verfügung gestellt zu bekommen"
man hat demnach bereits defekte karte zur Verfügung!
 
Also das mit dem falschen Treiber für die 6000er klingt seeeeehr plausibel. Wenn man mal davon ausgeht, dass es am Treiber liegt. Der eine Dude meint zwar die Updatefunktion benutzt zu haben, aber kann ja sein, dass es in Wirklichkeit doch eine manuelle Installation war. Im Zweifel für den Angeklagten.

Zunächsteinmal wird es dann seinen Grund gehabt haben, warum die 2-3 letzten Treiberveröffentlichungen nur für die 7000er war. Möglicherweise weil die Treiberentwickler von einer Inkompatiblität wussten. Die Entwickler werden das nicht explizit bei den 6000ern ausprobiert haben - oder schon, aber es führte nicht zum Sofortausfall. Als Entwickler hat man das oft im Urin und wenn es die Projektplanung zum Zeitpunkt des Entdeckens nicht zulässt, dann verschiebt man auch mal größere Baustellen in die Zukunft und lässt, wie in diesem Fall, die neuen Treiber eben nur für die eine bestimmte Modelreihe zu, bei der aktuell der Schuh am meisten drückt.

Tja... ob die das nun ausprobiert haben oder nicht.. was denen jetzt den Arsch gerettet hätte, wäre die Installation bei der falschen Hardware garnicht erst zuzulassen. Da kannste nicht mal dem einen Dude einen Vorwurf machen. Hände hoch, wer das nicht auch schon probiert hat 🤚

Das wäre wirklich bitter. Weier :rolleyes:

Edit: ich hatte hier im Forum vor ein paar Wochen/Monaten mal gemeint, dass ich keine Treiberprobleme hätte. Ich bin schon sehr zufrieden damit. Das Importieren funktioniert nicht perfekt, aber ein zweites mal Importieren reicht meistens. Es nervt natürlich, dass egal bei welchen Absturz oder was auch immer, immer dieser scheiß Treiber resettet wird. Wer kommt nur auf so einen Blödsinn .... gut, wenn man es mit zu vielen Daus zutun hat, dann muss man halt unbequeme Wege gehen. Ich kann es ja irgendwie nachvollziehen. Das einzige was mich aktuell plagt ist das Problem mit ruckelnden Videos bei YouTube (UHD bei 60 FPS), dass zwischenzeitlich beim Chrome und Firefox gefixed wurde, aber beim Waterfox noch besteht. Ob das jetzt dem Treiber zuzuschreiben ist, weiß ich nicht. Aber das bisher gute Gefühl und die Zufriedenheit mit AMDs Produkten leidet bei mir.
 
Zuletzt bearbeitet :
Wenn ich eine 6000er mit dem aktuellen Treiber der 7000er laufen lasse, dann wird die Karte deutlich langsamer. Aber sie läuft. Kein höherer Verbrauch, alles ist irgendwie plausibel, nur eben nicht so performant.

Dumm ist, dass der neue Treiber auch mit einer 6000er im System installierbar ist und dass auch ein zuvor mit der 7000er Karte instalierter Treiber beim Wechsel auf die 6000er weiterhin läuft und die Karte erkannt wird. Das hat NVIDIA besser im Griff, denn was nicht in der Liste steht, läuft dort nicht. Punkt.

Das Treiber Team in Toronto hat den neuen Treiber komplett verdongelt, um alle Modifikationen auszuschließen. Das hat man sich bei NVIDIA abgeguckt und es ist der Grund, warum auch die SPPT nicht mehr funktionieren. Ich kann mir maximal vorstellen, dass das bescheuerte neue System mit volatilen Einträgen mit den alten Karten nicht kompatibel ist bw. dort Settings falsch sind. Da man aber nicht mehr an die Werte kommt, weil AMD die Allgemeinheit ausgeschlossen hat, kann man das auch nicht reproduzieren. :(
 
@Igor Wallossek

Lt einem der betroffenen User (von den 48 Karten) hat er den Treiber mit der Update Funktion von Adrenalin selbst aktualisiert. Wenn das stimmt, muss die SW zumindest eine Zeit lang den falschen Treiber für RDNA2 ausgeliefert haben.
 
Also ich würde es ja ausprobieren, aber auf den Schaden soll weder der Händler noch AMD sitzen bleiben 😕

Edit: @Igor Wallossek vllt. unterscheiden sich die Treiber bzgl. Windows 10 und Windows 11. Im Zweifel muss da auch zwischen dem Treiber für 7900XT und der XTX unterschieden werden.

Edit2: und heute kam auch ein neuer Treiber raus. Mir juckt es ja schon in den Fingern ^^
 
Der Redakteur Herr Schilling aus dem Luxx hat Antwort von Krisfix bekommen:

"Man will weitere Tests durchführen. AMD hat sich auch schon mit ihnen in Verbindung gesetzt und man hat darum gebeten weitere Karten zur Verfügung gestellt zu bekommen, mit denen man weitere Tests machen möchte."

Sieht so aus als ob AMD selber die Sache schon untersucht "weitere Karten zur Verfügung gestellt zu bekommen"
man hat demnach bereits defekte karte zur Verfügung!

Warum postest Du nur die Hälfte ??

Das gehört auch noch dazu:

Ich hätte jetzt allerdings gedacht das AMD darum bittet die vermeintlich defekten Karten zu bekommen, um sie sich genauer anzuschauen. Das ist aber offenbar nicht der Fall. Weitere Informationen will man bekanntgeben, sobald man diese vorliegen hat.
 
Fakt ist - diese Treiber-Scheiße ist irre. Allerdings zeigt der mit bei der 6950XT an, dass der Treiber aktuell sei. Da kommt nichts mehr automatisch nach, was nicht dürfte

Edit:
AMD scheint mittlerweile gemerkt zu haben, dass da was nicht passt und hat die alten Karten jetzt aus dem downloabaren Treiber der 7900 ausgesperrt. Der ältere 7900er und der Pressetreiber gehen aber noch mit den 6900ern zu nutzen. AMD hatte ja im Vorfeld des Launches EXPLIZIT darum gebeten, den neuen Treiber NICHT für die älteren Karten zu nutzen. Ergo muss man gewusst haben, dass es trotzdem ging. :D
 
Zuletzt bearbeitet :
Was für ein Chaos :rolleyes:
Man kann nur hoffen, dass AMD mal wieder einen Normalzustand erreicht und raus aus dem Chaos kommt.
 
Oben Unten