GPU-Reparaturdienst meldet eine plötzliche Welle defekter Radeon RX 6900/6800-GPUs

Redaktion

Artikel-Butler
Mitarbeiter
Mitglied seit
Aug 6, 2018
Beiträge
1.821
Bewertungspunkte
8.833
Punkte
1
Standort
Redaktion
KrisFix, ein professioneller Grafikkarten-Reparaturdienst, behauptet, dass von 60 Radeon RX 6900/6800-Karten, die kürzlich an den Dienst geschickt wurden, 48 denselben Defekt hatten. Ein Defekt, der sie nicht mehr reparierbar macht. Alle 48 gemeldeten Fälle traten allein in den letzten drei Wochen auf. KrisFix, der in einem Video um mehr Informationen aus der GPU-Gemeinschaft bittet, sagt, (read full article...)
 
Ich verfolge den Kanal von KrisFix, der macht eine unglaubliche Arbeit !
Mein Sohn hat im Dezember eine RX 6950 XT bekommen (Saphhire Nitro +), wir werden sehen, ob sich da was zeigt.
 
Bei den Karten finde ich es nicht ungewöhnlich, das aktuelle Treiber installiert wurden.
Sind ja keine onboard Teile wo der Treiber aus dem letzten Jahrhundert läuft, weil der Nutzer ahnungslos ist.
 
Das müsste dann die Treiberversion 22.11.2 vom 30.11.2022 sein, oder? Ich habe bisher keine Probleme festgestellt. Nicht dass das wieder irgendein Spiel im Ladebildschirm verursacht hat, wie seinerzeit bei New World.

 
Verfolge die Videos auch mit großem Interesse, halte den Zusammenhang zur Treiberversion allerdings auch für etwas weit hergeholt. idR fährt man eine solche Karte immer mit der aktuell verfügbaren Software, für welche in den vermutlich allermeisten Fällen auch ein Hinweis zur Verfügbarkeit aufpoppen wird. In jedem Fall eine seltsame Geschichte.
 
Hier muss man tatsächlich sehr vorsichtig sein um nicht irgendeine Story vom Zaun zu brechen die wieder medial ausgeschlachtet wird, wo noch keine Handfesten Beweise hinterstehen und sich das ganze am Ende als Luftnummer erweist. Nur weil AMD Grafikkarten im Moment einen Negativhype haben der Klicks generiert muss das nicht für jede Story gelten.
Thema angeblich deaktivierter Shader Perfetch wo man ebenfalls etwas auf Reddit und Twitter entstehen lassen wollte was dann für den Urheber der Story zum Boomerang wurde.
 
Ich verfolge den Kanal von KrisFix, der macht eine unglaubliche Arbeit !
Mein Sohn hat im Dezember eine RX 6950 XT bekommen (Saphhire Nitro +), wir werden sehen, ob sich da was zeigt.
Ich hab die nitro + als 6800 xt seit zwei Jahren im Dienst. Bis jetzt keine Probleme, läuft leise, kühl und schnell wie am ersten Tag. Dein Sohn sollte eigentlich keine Probleme bekommen mit der Sapphire wäre mein Bauchgefühl.
 
Gerissenen Chip hat ich auch schon mit der HD4770 @1GHz und FurMark......Leider hatte die Wasserpumpe nen wackler,ist ausgefallen und ich hab noch ne Chip Temperatur von 113°C gesehen,danach war der Bildschirm Schwarz.
Würd mich nicht wundern wenn es im Treiber minimale Änderungen gab und die Leute fröhlich weiter mit dem MPT geheizt haben.Jetzt müssen sie erst mal wieder mit Gas heizen.....
 
Risse im Chip sehen absolut nicht nach Treiberproblemen aus.
Ich denke da eher an Spannungen im Material.
Bei vielen Materialien treten Probleme auch erst Monate, wenn nicht sogar Jahre später erst auf.
Und das auf einmal 60 Karten betroffen sind, heißt für mich das es da wohl eine zumindestens teildefekte Charge geben muss.
 
Risse im Chip sehen absolut nicht nach Treiberproblemen aus.
Ich denke da eher an Spannungen im Material.
Bei vielen Materialien treten Probleme auch erst Monate, wenn nicht sogar Jahre später erst auf.
Und das auf einmal 60 Karten betroffen sind, heißt für mich das es da wohl eine zumindestens teildefekte Charge geben muss.
Ist jetzt TSMC auch mal an der Reihe, mit Shitstorm. Zurzeit wird alles immer verrückter oder bilde ich mir das nur ein?
 
Ist jetzt TSMC auch mal an der Reihe, mit Shitstorm. Zurzeit wird alles immer verrückter oder bilde ich mir das nur ein?
Du hast TSMC ins Spiel gebracht nicht ich.
Und es kann so viele Ursachen haben.
Ich denke auch nicht das es am Chipfertiger liegt.
Eher wie etwas verbaut wurde. Sprich Endfertiger oder eine der vorherigen Lieferketten.
Wie gesagt.. so ein Problem baut sich oftmals sehr langsam auf. Materialermüdung kann verschiedene Ursachen haben.
Ich denke den Grund jetzt noch herauszufinden wird echt schwierig. Und solange nicht jetzt plötzlich noch viel mehr Karten auf der Bildfläche erscheinen, wird sich auch kaum jemand die Mühe machen nach der Ursache zu suchen.
Dann wird es halt ein paar RMA´s geben, wenn überhaupt.
Und das war es dann.
 
Ich staune, das das als Riss bezeichnet wird. Hier ist doch der Die komplett zerbrochen und hat sich vom Package gelöst. Schon komisch.
Und warum sendet man eine relativ neue Karte an einen Reparaturdienst? Wie lang ist eigentlich die Garantiezeit auf die im AMD-Shop gekauften 6000er-Karten?
 
Wenn Du aber nicht Erstkäufer bist, haste ein Problem bzw. wendest dich an einem Reparaturdienst. ;)
 
Ja und da kommt auch schon das nächste Problem zum Vorschein.
Du hast die Karte gebraucht gekauft.
Dz weißt nicht, was der Vorbesitzer damit angestellt hat.
Vlt war es eine Karte zum generieren von Kryptowährungen.
Diese Karten werden in der Regel ganz schön geschunden.. und wenn sie fast Schrott sind.. verkauft.
Das würde dann vlt auch die Menge der Karten erklären.
Ein Kryptominer betreibt in aller Regel ja nicht nur eine Karte, sondern ein ganzes Paket davon aufeinmal.
 
Wenn Du aber nicht Erstkäufer bist, haste ein Problem bzw. wendest dich an einem Reparaturdienst. ;)
Dann haette ich aber noch groeßere Fragezeichen ueber meinem Kopf schweben...

Ich frage mich eher:

Wie ist das ueberhaupt passiert?
Hat jemand an der Karte herumgeschraubt?
Kam jemand auf die Idee, den Rechner bei Eiseskaelte anzuwerfen/ bzw. wurde der Karte in irgendeiner Form ein Temperaturschock verpasst?
 
Meine 6900XT FE ist Mitte Dezember ausgefallen. Treiber sind immer aktuell. Auch diesmal. Die RGB und Lüfter gehen. Es gibt aber kein Video Output und das Mainboard zeigt einen VGA Fehler an. Wurde nie besonders belastet oder Ähnliches. Die einzige Besonderheit war das der Rechner teilweise in meinem Büro 12 Grad Celsius ausgesetzt gewesen ist. AMD hat eine Kostenerstattung angeboten da sie keinen Ersatz liefern können. Die defekte Karte haben sie bisher nicht zurück haben wollen. Aber der Refund läuft noch und ist noch nicht abgeschlossen.
 
Die Negativschlagzeilen um AMD wollen einfach nicht abreißen. Mich würde interessieren ob auch Custom-Modelle davon betroffen sind. Wenn nicht, könnte der Kühler wieder mal das Problem sein? Vielleicht zu hoher Anpressdruck?
 
Ja und da kommt auch schon das nächste Problem zum Vorschein.
Du hast die Karte gebraucht gekauft.
Dz weißt nicht, was der Vorbesitzer damit angestellt hat.
Vlt war es eine Karte zum generieren von Kryptowährungen.
Diese Karten werden in der Regel ganz schön geschunden.. und wenn sie fast Schrott sind.. verkauft.
Das würde dann vlt auch die Menge der Karten erklären.
Ein Kryptominer betreibt in aller Regel ja nicht nur eine Karte, sondern ein ganzes Paket davon aufeinmal.
Sry aber das ist kompletter Bullshit!
Miningkarten werden in der Regel undervoltet und der Grafikchip an sich wird so gut wie gar nicht wirklich belastet!
Das was bei Miningkarten belastet wird, ist in der Regel der RAM!
Die Karten bekommen zudem meist auch ein energieoptimiertes Mining BIOS um vor allem den Stromverbrauch zu senken.
Zudem gab es auch schon einige Tester die sich Miningkarten besorgt haben und dann die Karten nochmal auf Herz und Nieren testeten. NV sowie AMD Karten und es wurden keine Auffälligkeiten gesehen.
 
Wenn Du aber nicht Erstkäufer bist, haste ein Problem bzw. wendest dich an einem Reparaturdienst. ;)

Bei den allermeisten Herstellern kann man in der Regel die Garantie übertragen und generell ist die Gewährleistung sowieso nicht an den Erstkäufer gebunden! Man kann also zumindest die Gewährleistung in Anspruch nehmen und muss nicht zu Reparaturdiensten!
Es ist sogar bei fast jedem Hersteller erlaubt das man die WLP und die Pads austauscht und auch die Montage auf WAKÜ ist meist kein Problem!
Die Karte muss meistens nur zurückgebaut werden und der Defekt darf nicht durch den Umbau usw. entstanden sein.
 
Also, nachdem ich mit einigen Größen der Medienlandschaft und Firmen gechattet habe:

Ich würde die Cracks und das mit dem Treiber erst einmal trennen. Wer sich meinen Test mit konkav auf konkav am Beispiel der 7900XT angesehen hat, der kann auch erahnen, dass hier die Buckelwal-GPUs vielleicht zu höhen mechanischen Spannungen ausgesetzt waren, vor allem beim Abkühlen. Beim nächsten Aufheizen ist dann einfach Ende Gelände. Dann aber war der Anpressdruck partiell zu hoch und/oder ungleichmäßig.

Der Treiber, falls er höhere Temperaturen erzeugt, wäre dann aber maximal der Katalysator und kausale Folge, nicht aber die Ursache. Ich habe bisher, so wie einige R&D auch, nichts herausfinden oder messen können.
 
Oben Unten