Frage Ein Unglück kommt selten allein - GPU defekt?

ArcusX

Urgestein
Mitglied seit
Okt 23, 2019
Beiträge
884
Bewertungspunkte
511
Punkte
94
Ahoi beste Gemeinde der Computerkunst,

ich habe zwar wenig Hoffnung, aber nachfragen kostet ja erstmal ausser ein wenig eurer geschätzten Lebenszeit und auch meiner natürlich erstmal nichts.

Mein Rechner zeigt seit ein paar Tagen, genau seit dem Biosupgrade, ein seltsames Verhalten. Erst in einigen wenigen, jetzt in immer mehr Spielen treten Textur und Grafikfehler auf und das Spiel stürzt ab.

Beispiele hierfür sind zB Deus Ex Human Revolution, Frostpunk, Battletech und Remnant from the Ashes. Gerade letztere haben zuvor einwandfrei funktioniert. Bei Legion TD 2 geht der Rechner sogar aus. Ich habe daraufhin erstmal die Temperaturen kontrolliert (Aquasuite schreibt die Temperaturen im 5 Sekunden intervall) und zum Zeitpunkt des Absturzes haben CPU (Tctl/Tdie) und GPUcore vollkommen unbedenkliche Temperaturen im 60° Bereich. Die Wassertemperatur war zu dem Zeitpunkt bei 38,8° bei einer Zimmertemperatur von 27°

Ich habe daraufhin die CPU Primzahlen rechnen lassen. 1h ohne Probleme.

Die GPU habe ich in Furmark einfach mal getestet, ich habe mir 3DMark nie gekauft. Im GPU Stresstest zu Anfang keine Probleme, wenn ich jedoch das Antialiasing auf 8x stelle, kann ich nach kürzerer Zeit erste Grafikfehler sehen. Wenn ich das dann weiterlaufen lasse, schaltet sich der Rechner aus. Bild schwarz, Mausbeleuchtung und Num Lock LED geht ein paar mal an und aus und ich kann den Rechner dann per I/O Taste einfach ausschalten.

Was wirklich richtig heiss wird ist die M2 SSD, auch wenn kaum Schreibvorgänge stattfinden. Also im Windows idle ohne dass da großartig etwas geschieht hat die laut HWInfo64 57°

Maßnahmen:
- Treiber deinstalliert und neuesten Legacytreiber installiert
- Treiber mit DDU entfernt und neuesten Legacytreiber installiert
- CMOS Reset
- Bios auf das vor dem Biosupdate funktionierende zurückgesetzt
- CPU auf 65W TDP gedrosselt
- Gehäuse geöffnet und mit Zimmerventilator zwangsbelüftet
- Pumpengeschwindigkeit erhöht
- RAM auf 2666 MHz, Infinity Fabric Clock auf 1333

Reihenfolge der obigen Stichpunkte muss nicht korrekt sein.

Leider alles ohne Erfolg.

Im 2D Betrieb läuft alles problemlos.

Eingesetzte Hardware:

Ryzen 9 5900x
MSI r9 290x
MSI B550 Tomahawnk
32GB Crucial Ballistix 3600
Gigabyte Aorus 2TB m.2 SSD PCI 4.0
Enermax Revolution 87+ 850W

Wasserkühlung über Mo-Ra3

Vielleicht hat jemand eine Idee oder Plan wie man hier zielgerichtet vorgehen kann. Könnte bei der GPU die Kühlung des vRAM oder eines sonstigen Bauteils abseits des Prozessors vesagen?
 
Zuletzt bearbeitet :
Hört sich für mich nach kaputtem RAM der Grafikkarte an. Du kannst versuchen, das RAM runterzutakten, wenn die Fehler dann weg sind, weißt du Bescheid.
 
Neinneinnein, Du musst was angenehmeres vorschlagen ;) Ok probiere ich mittels afterburner? mal aus. Ich melde mich gleich.
 
Es sieht danach aus. Ich habe die Frequenz auf von 1250MHz auf 1000 MHz abgesenkt und Furmark läuft seit 15 Minuten stabil.

Update: Nein das ist es scheinbar auch nicht, oder die Absenkung reicht noch nicht.
 
Zuletzt bearbeitet :
Ja, weiter absenken, wenn das nicht hilft, dann könnte es natürlich auch etwas anderes sein. Schafft du es, ein Foto von den Grafikfehlern zu machen?
 
Fehler (2).jpg
Beginnt immer nach einigen Minuten. Flackert, und wird dann immer mehr. Wenn ich das Spiel nicht mit alt+f4 schliesse, dann meldet sich AMD, dass der Treiber abgestürzt sei. Immerhin geht der Rechner im Moment bei 800MHz auch nach rund 12 minuten im Furmark nicht aus.
 
Das sieht mir jetzt nicht nach den typischen Anzeichen für kaputtes RAM auf der Grafikkarte aus.
 
Das wäre ja vielleicht ein kleiner Hoffnungsschimmer. Ich habe aber leider den Eindruck, dass wenn ich die Grafikeinstellungen reduziere, die Spiele länger stabil laufen..
 
Ich bin überfragt, was das sein könnte... Sieht das in anderen Spielen auch so aus oder anders?

Vllt. mal Kühler runter, alles schön sauber machen, repasten und Kühler wieder druff?
 
Sieht in jedem Spiel so aus. Kühlerdemontag hatte ich auch dran gedacht, aber da die Temperaturen des Prozessors in Ordnung waren, müssten es ja dann Speichersteine oder ähnliches sein. Dafür werde ich dann Pads brauchen, denke ich. Ich habe da einen aquacomputer Kryographics Hawaii full cover drauf.

Darauf habe ich ja so gar keine Lust ;)
 
Das kann ich verstehen. Vllt hat ja noch jemand anderes eine gute Idee.
 
Naja ich werde aquacomputer schonmal anschreiben, welche Pads ich da im Zweifelsfall brauche. Einen Winter muss sie noch überleben :)
Erstes kleines positives Fazit: Benchmark lief ohne Probleme bei 800MHz durch und auch Frostpunkt lieft für ne halbe Stunde ohne Fehler.
 
Zuletzt bearbeitet :
In Zusammenhang Grafikfehler zwar unwichtig, aber da es im Startpost angesprochen wurde dennoch als Info:

57°C ist für eine m.2 SSD nicht "wirklich richtig heiss",
sondern absolute Wohlfühltemperatur und genau richtig.
Die Dinger wollen/sollen warm sein wenn sie genutzt werden.
Dafür aber kühl lagern im Sinne langzeit-Datenspeicherung, aber wer nimmt dafür schon solch einen Datenträger.
 
Das habe ich schon öfter erlebt/gehört, dass nach WaKü-Umbau eine Zeit lang alles gut geht und dann Speicher oder VRMs zu heiß werden und Probleme machern. Kannst du an der Platine zum Testen mal für Durchzug sorgen? Zur Not einen Lüfter mit Tape an der Backplate befestigen, bringt manchmal schon etwas. Furmark würde ich komplett sein lassen, das sind keine normalen GPU-Bedingungen und Temperaturen.
 
Diese Fehlermeldung kann auftreten wenn ein Spiel/Anwendung abstürzt und die Grafikhardware verantwortlich ist. Gibt es auch beim UV.
Ansonsten falls möglich direkt einen Lüfter oder mehrere durch pusten lassen an der GPU.
 
Der Arbeitsspeicher verursacht auch gern die Fehlermeldung.......
Welches Mainboard ist denn verbaut?
 
Vermutlich hat die Karte es auch einfach nur hinter sich, die R9 290x hat ja schon ein paar Jährchen auf dem Buckel.
 
Ich würde den zeitlichen Zusammenhang mit dem BIOS update nicht ganz abschreiben.
Neuere AGESA Versionen können durchaus Probleme mit "veralteten" Grafikkarten hervorrufen, Stichwort UEFI/secure boot.
Im Luxx bin ich da grad neulich zufällig über einen Thread gestolpert, und dachte selbst "da soll man drauf kommen".
Wurde aber von einem offiziellen MSI Account bestätigt.

Bist Du sicher, daß Du im Zusammenhang mit dem "backflash" des BIOS alles bedacht und korrekt durchgeführt hast?
 
@Tronado Also ich habe das Gehäuse geöffnet und mit einem 40cm Zimmerverntilator zwangsbelüftet. da dürfte an Luft kein Mangel herrschen
@Casi030 MSI Tomahawk b550. Ich setzte es mal oben mit dazu

Im Gehäuse selber sorgen 2 120mm einblasend und 1 120mm ausblasend für Luft. Ich habe in der Aquasuite auch alle möglichen Sensoren auf dem Mainboard mit abgegriffen. VRM MOS 36°, CPU Sockel 35°, PCIe 34°, PCH 36°, System 38° bei geschlossenem Gehäuse.

@meilodasreh Ich bin genau so vorgegangen wie beim "normalen" flashen über den USB Port USB Flash.
 
Zuletzt bearbeitet :
Oben Unten