Frage Von Driver-Timeouts, Blackscreens und der absoluten Verzweiflung [RX 6900 XT]

FLipMode2k6

Mitglied
Mitglied seit
Apr 16, 2022
Beiträge
45
Bewertungspunkte
8
Punkte
8
Ich weiss garnicht genau wo ich anfangen soll, mitte letzten Jahres habe ich es dann auch mal geschafft eine RX 6900 XT Reference auf der AMD Seite abzugreifen. An sich eine echt gute Karte, jedoch wurde ich leider schon recht Früh, also eine Stunde nach dem initialen Einbau der Karte mit einem Driver-Timeout während dem Zocken begrüßt. Da es hier um Cyberpunk 2077 ging, und die Treiber wohl auch noch Recht neu waren, dachte ich mir erst nichts weiter dabei, doch das war erst der Beginn eines anhaltenden Martyriums.

Seitdem habe ich:
-Windows neu aufgesetzt
-BIOS geupdated
-Treiber neu installiert (WQHD und experimental ausprobiert)
-Nichtssagende Errorlogs ausgelesen (Die mir im Endeffekt sagen, dass meine Karte rausgezogen wurde)
-Die Verkabelung überprüft (richtige ports am Netzteil genommen und gecheckt, dass es 2 separate Kabel für die beiden 8 pins sind)
-SAM an und aus
-XMP an und aus
-Diverse Stresstests und Benchmarks laufen lassen (alle Einwandfrei)
-Diverse Spiele ausprobiert (davon war lediglich Elden Ring interessant, da es nach dem ersten Absturz praktisch reproduzierbar 10-20 sekunden nach dem Start (ingame, nicht Hauptmenü) abstürzt bis ich einen Rechner Neustart durchführe.)

Mein Setup:
ROG STRIX B550-E Gaming
5800X @ Stock
32GB Crucial Ballistix @ 3600Mhz
RX 6900 XT Reference
2x 7200RPM HDDs
1x SSD
1x M2 SSD
Bequiet Straight Power 11 850W Gold
Bequet Pure Base DX500

Temperaturen sind soweit ganz gut, auf meinem 5800x ist Grizzly Paste und ein Dark Rock Pro 4 verbaut, die 80° knackt er aber trotzdem bei 100% Auslastung (die er beim Zocken aber ja eh nicht erreicht).
meine GPU habe ich die Fancurve angepasst, sodass Sie nie über 75° heiss wird (85°->55% RPM).

In einem anderen Forum sagte man mir, dass die Karte Pro Lane bis zu 29a benötigt wobei meine PSU nur 26a schafft, leider konnte ich auch mit Ohm nicht erklären, wie diese 29a zustande kommen sollen, selbst mit Leistungsspitzen, aber vielleicht hat hier jemand mehr Ahnung.

Generell hänge ich immer wieder am Netzteil, jeder zählt immer Watt und macht daran fest, ob ein Netzteil ausreicht oder nicht, aber niemand spricht über mehr als das, deshalb hänge ich da etwas in der Luft. Igor selbst hatte darüber gesprochen, dass die Leistungsspitzen im 1-5 MS Bereich Probleme machen können, wenn die CPU auch gleichzeitig spiked und naja, der 5800x hat ja schon nen ordentlichen TDP.

fürn RMA ist es jetzt wohl schon zu spät, da ich locker über die 6 Monate bin, sollte ich mal versuchen die CPU/GPU zu undervolten ? Falls ja, hat da jemand eine gute Anleitung ? Ansonsten überlege ich mir auch noch das Straight Power 1000W zum Test zu kaufen, einfach weil es mir leichter fällt irgendeinem komischen Typen auf Reddit zu glauben als mir einzugestehen, dass ich 1000€ in den Sand gesetzt habe.

Ich bin wirklich am Verzweifeln und bin für jegliche Hilfestellung unendlich dankbar <3
 
Hallo FLipMode2k6
jeder zählt immer Watt und macht daran fest, ob ein Netzteil ausreicht oder nicht, aber niemand spricht über mehr als das, deshalb hänge ich da etwas in der Luft.
Leider ist es so, dass Watt zählen bei den aktuellen Grafikkarten und CPUs nicht alles ist. Auch wenn ein Netzteil rechnerisch ausreichen sollte, kann es durch die hohen Lastspitzen zur Abschaltung des Netzteils oder zur Instabilität der Grafikkarte, des RAMs, der CPU oder des Mainboards kommen. Bei Igors Tests sind mit 850 Watt alle Grafikkarten gelaufen. Einmal musste er aber auch ein 1200 Watt-Netzteil austauschen. Das Problem liegt nicht bei der Maximalleistung sondern bei der Sprunghaftigkeit der Last, die die Sicherheitsschaltungen des Netzteils auslösen können.

Auch wenn das aus genannten Gründen nur theoretisch ist, rechnen wir die nötigen Ampere und Watt für die Karte mal durch. AMD gibt die 6900XT mit 300 Watt an und empfiehlt ein 850 Watt-Netzteil.
- über den PCIe-Slot des Mainboards beziehen die Grafikkarten maximal 66 Watt.
- Das Netzteil liefert auf 12V3 und 12V4 je 26 A x 12 V = 312 Watt
Wenn man 2 Kabel an die Anschlüsse PCIe 1 und PCIe 3 anschliesst, kann man also 2 x 312 Watt plus 6 Watt über das Mainboard beziehen.
66 + 2 x 312 = 690 Watt

Oder rechnen wir es in Ampere:
- 300 Watt / 12 V = 25 A
- 5.5 A liefert das Mainboard
- 25 A - 5.5 A = 19.5 A
- 19.5 A / 2 Lanes = 9.75 A pro Lane am Netzteil

Auch wenn die Karte bei Spitzen 100 bis 150 Watt mehr zieht, kommt man bei weitem nicht an die Spezifikationen dieses Netzteils heran. Dafür müsste man schon beide 8-Pin an der Grafikkarte über ein Y-Kabel an einem ungeeigneten Anschluss am Netzteil anhängen, so dass nur eine Rail genutzt wird.

Die Netzteilschiene, an der die CPU hängt, liefert maximal 21 A x 12 V = 261 Watt. Das reicht für eine CPU mit 105 Watt auch gut aus.

Die Maximalleistung ist also kein Problem, aber die Grafikkarte kann für das Netzteil trotzdem zu nervös sein.

Wie heissen die Fehlermeldungen genau, die du bekommst? Treiber neu gestartet? Läuft der PC dann nach ein paar Sekunden weiter oder stürzt der PC ab und startet neu? Wenn es nur Fehlermeldungen des Grafikkartentreibers sind, läuft vermutlich nur die Grafikkarte instabil. Es kann dann natürlich immer noch an der Stromversorgung liegen, aber wenigstens könnte man dann RAM, CPU und Mainboard ausschliessen.
 
Hallo FLipMode2k6

Leider ist es so, dass Watt zählen bei den aktuellen Grafikkarten und CPUs nicht alles ist. Auch wenn ein Netzteil rechnerisch ausreichen sollte, kann es durch die hohen Lastspitzen zur Abschaltung des Netzteils oder zur Instabilität der Grafikkarte, des RAMs, der CPU oder des Mainboards kommen. Bei Igors Tests sind mit 850 Watt alle Grafikkarten gelaufen. Einmal musste er aber auch ein 1200 Watt-Netzteil austauschen. Das Problem liegt nicht bei der Maximalleistung sondern bei der Sprunghaftigkeit der Last, die die Sicherheitsschaltungen des Netzteils auslösen können.

Auch wenn das aus genannten Gründen nur theoretisch ist, rechnen wir die nötigen Ampere und Watt für die Karte mal durch. AMD gibt die 6900XT mit 300 Watt an und empfiehlt ein 850 Watt-Netzteil.
- über den PCIe-Slot des Mainboards beziehen die Grafikkarten maximal 66 Watt.
- Das Netzteil liefert auf 12V3 und 12V4 je 26 A x 12 V = 312 Watt
Wenn man 2 Kabel an die Anschlüsse PCIe 1 und PCIe 3 anschliesst, kann man also 2 x 312 Watt plus 6 Watt über das Mainboard beziehen.
66 + 2 x 312 = 690 Watt

Oder rechnen wir es in Ampere:
- 300 Watt / 12 V = 25 A
- 5.5 A liefert das Mainboard
- 25 A - 5.5 A = 19.5 A
- 19.5 A / 2 Lanes = 9.75 A pro Lane am Netzteil

Auch wenn die Karte bei Spitzen 100 bis 150 Watt mehr zieht, kommt man bei weitem nicht an die Spezifikationen dieses Netzteils heran. Dafür müsste man schon beide 8-Pin an der Grafikkarte über ein Y-Kabel an einem ungeeigneten Anschluss am Netzteil anhängen, so dass nur eine Rail genutzt wird.

Die Netzteilschiene, an der die CPU hängt, liefert maximal 21 A x 12 V = 261 Watt. Das reicht für eine CPU mit 105 Watt auch gut aus.

Die Maximalleistung ist also kein Problem, aber die Grafikkarte kann für das Netzteil trotzdem zu nervös sein.

Wie heissen die Fehlermeldungen genau, die du bekommst? Treiber neu gestartet? Läuft der PC dann nach ein paar Sekunden weiter oder stürzt der PC ab und startet neu? Wenn es nur Fehlermeldungen des Grafikkartentreibers sind, läuft vermutlich nur die Grafikkarte instabil. Es kann dann natürlich immer noch an der Stromversorgung liegen, aber wenigstens könnte man dann RAM, CPU und Mainboard ausschliessen.
Danke dir erstmal für die ausführliche Erklärung, jetzt blicke ich da auch besser durch :>
Theoretisch könnte ich doch aber über MSI Afterburner diese Spitzen eliminieren oder zumindest senken oder ? Würde auch erstmal Leistungstechnisch zurücktreten zu Testzwecken :D

Also erst gibt es ein Standbild auf meinen beiden Monitoren für mehrere Sekunden (~5s) dann ein kurzes Schwarzes Bild gefolgt von der AMD Meldung, dass ein Treiber-Timeout aufgetreten ist. ab und zu gibt es zeitgleich noch eine Meldung vom Spiel. Bei UE Spielen kommt immer die Meldung, "dxgi_error_device_removed". Das Spiel muss dann i.d.r. per task manager abgeschossen werden.

Windows Eventlog gibt das von sich:
1. Der Anzeigetreiber "amdwddmg" reagiert nicht mehr und wurde wiederhergestellt.

2. Für ein Zeigegerät fehlen Informationen zum Monitor, mit dem es verbunden ist.

3.
Name der fehlerhaften Anwendung: Radeonsoftware.exe, Version: 10.1.2.1916, Zeitstempel: 0x62293e13
Name des fehlerhaften Moduls: KERNELBASE.dll, Version: 10.0.19041.1645, Zeitstempel: 0x630193b4
Ausnahmecode: 0xc0000602
Fehleroffset: 0x000000000010b362
ID des fehlerhaften Prozesses: 0x864
Startzeit der fehlerhaften Anwendung: 0x01d850b8dda2518b
Pfad der fehlerhaften Anwendung: C:\Program Files\AMD\CNext\CNext\Radeonsoftware.exe
Pfad des fehlerhaften Moduls: C:\WINDOWS\System32\KERNELBASE.dll
Berichtskennung: 4059aef1-80f7-4b57-9428-e77cd98072d0
Vollständiger Name des fehlerhaften Pakets:
Anwendungs-ID, die relativ zum fehlerhaften Paket ist:
 
War bei den Stresstests auch Linpack bei?

Wenn nicht,dann mal laufen lassen:
Anklicken und Eingeben:
2
4
50
Enter
y
y
n
Enter
Laufen lassen bis fertig oder Fehler kommen.
 
Die Fehlermeldungen bestätigen meine Vermutung, dass es die Grafikkarte betrifft. Die Grafikkarte bemerkt, dass sie nicht ganz stabil läuft. Dann versucht sie das Problem zu lösen, indem sie den Treiber neu lädt und die Grafikkarte neu startet.
- "dbgi_...", DX steht für Direct X, also die Grafikschnittstelle zu Programmierung der Grafikkarte
- "amdwddmg", AMD ist Grafikkartenhersteller
- "C:\Program Files\AMD\CNext\CNext\Radeonsoftware.exe", AMD, Radeon ist die Grafikkartenserie

Hinweise auf andere Probleme sehe ich in dem Fehlerbild nicht. Also beschränkt sich die Fehlersuche auf die Grafikkarte, den Grafikkartentreiber und das Netzteil. den Treiber hast du ja bereits aktualisiert. Mehr kann man da nicht machen.

Man kann die CPU und die Grafikkarte etwas untertakten. Es funktioniert bei beiden ungefähr gleich. Man muss einfach die Prozessorspannung in kleinen Schritten absenken. Bis -0.08 bis -0.1 V geht bei den meisten Prozessoren. Wenn es danach instabil läuft, stellt man es wieder etwas höher. Ob es etwas bringt ist aber nicht gesagt. Wenn beispielsweise im Leerlauf plötzlich etwas Leistung benötigt wird, boosten die Prozessoren sofort auf den maximalen Takt. Da kann es auch helfen, andere Limiten wie Powerlimit oder maximalen Takt etwas zu senken.

Grundsätzlich sollte es aber nicht nötig sein, die Prozessoren zu limitieren. Die Grafikkarte sollte mit Standardeinstellungen ja funktionieren. man könnte auch einmal versuchen, ein anderes Netzteil anzuhängen oder die Grafikkarte in einem anderen PC einstecken. Dann sieht man, ob es eher an der Stromversorgung liegt oder ob die Grafikkarte nicht funktioniert wie sie soll.
 
Hinweise auf andere Probleme sehe ich in dem Fehlerbild nicht. Also beschränkt sich die Fehlersuche auf die Grafikkarte, den Grafikkartentreiber und das Netzteil. den Treiber hast du ja bereits aktualisiert. Mehr kann man da nicht machen.
Doch das wichtigste,der Ram/Speichercontroller lässt den Treiber gern Abstürzen,sollte man nicht vergessen.
 
Keinen afterburner verwenden! Nicht nötig.

Nutzt du das MPT?

Die genannten Fehlermeldungen hab ich noch nie gehört, komisch ...

Mal Screen shots von Hwinfo den GPU Teil vielleicht ein paar Minuten während ein Spiel läuft, damit man Mal sehen kann, was bei der Grafikarte so eingestellt ist?
 
War bei den Stresstests auch Linpack bei?

Wenn nicht,dann mal laufen lassen:
Anklicken und Eingeben:
2
4
50
Enter
y
y
n
Enter
Laufen lassen bis fertig oder Fehler kommen.
So sieht HWMonitor nach 20 Cycles aus, 50 muss ich morgen machen, sieht aber soweit erstmal gut aus.
1650155288703.png
 
Keinen afterburner verwenden! Nicht nötig.

Nutzt du das MPT?

Die genannten Fehlermeldungen hab ich noch nie gehört, komisch ...

Mal Screen shots von Hwinfo den GPU Teil vielleicht ein paar Minuten während ein Spiel läuft, damit man Mal sehen kann, was bei der Grafikarte so eingestellt ist?
Das HWinfo Window direkt beim Standbild, ungefähr 15 Sekunden nachdem ich bei Ghostwire Tokyo ingame war, die obere Meldung ist die selbe wie immer, die untere ist halt Engine/Spielabhängig.

Edit: Habe noch ein Screenshot angehängt, gerade habe ich das Phänomen, dass das Spiel nach wenigen Sekunden immer wieder abstürzt bis ich meinen Rechner neustarte.
 

Anhänge

  • 20220417_024947.jpg
    20220417_024947.jpg
    5,3 MB · Aufrufe : 23
  • 20220417_025030.jpg
    20220417_025030.jpg
    3,7 MB · Aufrufe : 21
  • 20220417_030140.jpg
    20220417_030140.jpg
    5,2 MB · Aufrufe : 21
Zuletzt bearbeitet :
Zuletzt bearbeitet :
Dann stell den Ramtakt mal von Hand auf 3200MHz runter damit du mal ohne Übertaktung testest ob sich der Treiber dann immer noch meldet.



Auch mal einen Screen mit ZenTimings.
Anhang anzeigen 18621
Also gerade habe ich im Gegensatz zu vorher locker 1,5 Stunden gezockt ohne Probleme mit dem RAM auf 3200Mhz (hab mich im BIOS am Preset bedient). Ich bin mir sicher, dass ich es aber auch anfänglich (also vor einem Jahr) schon mit 3200mhz probiert habe, möchte also noch keine Entwarnung geben :D
 
Dein HWinfo ist veraltet, aber das machts Kraut nicht fett. Mich interessieren aber die Sensoren der GPU, nicht der ganze Overview. Was ich sehen wollte waren Spannungen, Watt und Temperaturen. Aber ich glaub eh primär nicht an den Defekt der Grafikkarte, also skippen wir das mal.
Ich denke auch eher an instabilen RAM oder CPU als erstes, weil man das viel leister instabil hinbekommt.

Schau mal in deine Windows Ereignisanzeige und suche nach (Fehler und ID) WHEA 18, WHEA 19. 19er kommen vom RAM, 18er eher CPU.
Dein grober Weg wäre, RAM stabil bekommen, CPU stabil haben oder bekommen und wenn das alles passt, schaust du dir die GPU an.

Beim 850W Netzteil sähe ich mal keine Zweifel, es sei denn, dieses wäre 10 Jahre als und total ausgelutscht. Man kann mit ner 6900XT ein 850er schon mal ausschalten, aber nicht, wenn man das MPT nicht kennt (nagut, mit dem AB würds wohl auch ggf. irgendwie gehen).

Und ja, schieß und mal nen Screenshot (wenn geht, kein Handy Foto) vom Zen Timings deines ursprünglichen RAM Settings, ist wie Kaffeesatzlesen - da sieht man oft schon, wo die Sache stinkt. Deine f4-3600c16-16gvkc sind vermutlich kein b-die, da weiß ich jetzt auf Anhieb auch nicht, welche Timings da tun.
 
Auch wenn ich RAM und CPU nicht ganz ausschliesse, sehe ich hier keinen Hinweis auf Probleme beim RAM. Ja, der RAM arbeitet mit der Grafikkarte zusammen und kann dadurch auch dort Fehler auslösen. Wenn die Grafikkarte falsche Daten aus dem RAM bekommt, hat sie auch ein Problem.

Die Fehlermeldungen und die Hänger von ein paar Sekunden deuten für mich aber eindeutig auf die Grafikkarte. RAM- oder CPU-Probleme äussern sich meist in Abstürzen und Neustarts mit oder ohne Bluescreen. Somit verstehe ich nicht, warum man sich nur um den RAM kümmern soll, wenn das Fehlerbild deutlich in eine andere Richtung weist.
 
f4-3600c16-16gvkc habe 16-19-19-39 klingt nach Hynix CJR.
 
Falls du wieder mit dem Takt hoch willst stell die tRP von hand auf 21.
 
Mal ne ganz dumme Frage / Schuss ins Blaue (bzw. Rote): du hast mehrere Monitore dran? Passiert das auch, wenn Du es mal mit nur einem probierst?
 
Auch wenn ich RAM und CPU nicht ganz ausschliesse, sehe ich hier keinen Hinweis auf Probleme beim RAM. Ja, der RAM arbeitet mit der Grafikkarte zusammen und kann dadurch auch dort Fehler auslösen. Wenn die Grafikkarte falsche Daten aus dem RAM bekommt, hat sie auch ein Problem.

Die Fehlermeldungen und die Hänger von ein paar Sekunden deuten für mich aber eindeutig auf die Grafikkarte. RAM- oder CPU-Probleme äussern sich meist in Abstürzen und Neustarts mit oder ohne Bluescreen. Somit verstehe ich nicht, warum man sich nur um den RAM kümmern soll, wenn das Fehlerbild deutlich in eine andere Richtung weist.
Die schnellen Fehler sorgen nicht immer für Abstürze und BS,hab es so auch mal ein paar Tage laufen lassen,der Treiber war der einzige der sich gern mal resettet hatte.Die Bios Version 2423 scheint irgend wie nicht 100% OK zu sein,was je nach CPU mehr oder weniger ins Gewicht fällt.
Wenn Linpack bei Ihm schon 20 Runs lief kann es durchaus sein das der Fehler nicht so gravierend ist,aber durchaus da sein kann wenn man richtig Testet.
unknown_2022.02.04-16.06.png

Besonders mit Absenkung der SOC Spannung kann man den Fehler schon nach Hinten verschieben.
Ich habs auch schon sporadisch hin bekommen das es Heute lief und am nächsten Tag nicht mehr.
Normaler weise sollte mittlerweile min ein neues Bios draußen sein,vielleicht hilft das.
unknown_2022.02.12-13.08.png
 
Zum Ram auslesen:

Nach dem Starten auf Read Klicken.
Screen dann zusammen mit ZenTimings.
Ramdaten.JPG


HWinfo64 sollte wie im Video aus sehen.Alles sichtbar machen/aufklappen,besonders CPU Takt Effektiv,Temperaturen,Taktraten,Spannungen....Zeig alles was geht.
Solltest weiter hin Probleme haben,die Leistungsgrenze wie im Video zu sehen mal auf -10 stellen.
 
Zuletzt bearbeitet :
Nur zur Sicherheit: Die beiden Stromkabel der Karte sind an PCIe1 + 3 dran?
Wen keine andere Idee mehr bleibt testweise mal umbauen auf ein Kabel an PCIe2
Wurde mal das Powerlimit der Grafikkarte runtergestzt?
Auto-OC im Radeontreiber mal benutzt?
Irgendwelches Auto-OC im Mainboardbios aktiviert oder nicht deaktiviert?
Warum steht im ersten Beitrag was von Ballistix RAM und dann ist plötzlich mittelmäßiger Gskill drin ?
 
Oben Unten