Frage Ryzen 9 5950X crash mit Prozessor-APIC-ID14 / WHEA-Logger 18

Status
Nicht offen für weitere Antworten.

Hellsingexe

Mitglied
Mitglied seit
Nov 20, 2020
Beiträge
35
Bewertungspunkte
12
Punkte
8
AMD Ryzen 9 5950X

Fehlerbild im Windows Event-Log:
Schwerwiegender Hardwarefehler.
Prozessor-APIC-ID: 14

EventLogSystem-Win8.1Pro.PNG

-> Der Fehler tritt zufällig während des Betriebs auf und ist unabhängig von Lastsituation und Temperatur.
-> Der Fehler führt zum sofortigen Crash des Systems.

=====================================================================

Verwendestes System:
Mainboard: ASUS Crosshair VIII Hero (Wi-Fi)
CPU Kühler: Fractal Design S36 Blackout
RAM: G.Skill F4-4000C18Q-128GTRG
GPU: Inno3D iChill Black 2080 Ti
PSU: Bequiet Dark Power Pro 11 1000Watt

Getetstete Mainbaords:
ASUS Crosshair VIII Hero (Wi-Fi) Mit allen verfügbaren BIOS Versionen die Ryzen 5xxx unterstützen:
Version 2311 -> Gleicher Fehler
Version 2402 beta -> Gleicher Fehler
Version 2502 -> Gleicher Fehler
Version 2702 -> Gleicher Fehler

Gigabyte B550 AORUS ELITE (rev. 1.0) Mit allen verfügbaren BIOS Versionen die Ryzen 5xxx unterstützen:
F10 -> Gleicher Fehler
F11i -> Gleicher Fehler
F11k -> Gleicher Fehler

Getestete Varianten:
-BIOS ALLES auf DEFAULT Settings (Jeweils für alle BIOS Versionen des ASUS und Gigabyte Boards)
-Windows 10 Pro 64Bit 20H2
-Windows 10 Pro 64Bit 1909
-Windows 8.1 Pro 64 Bit
-Linux Mint 20
-Ubuntu 20.04

-Windows im Höchleistungsmodus
-Aktuelle AMD Chipsatz Treiber installiert (2.10.13.408)
-LLC auf Level 3, und 4 fixiert
-PBO deaktiviert
-SMT deaktiviert
-DF Cstates auf "Disable" (Global C-state Control)
-GPU Getauscht gegen eine GTX 970 und eine GTX 560Ti -> Gleicher Fehler
-PSU getauscht gegen ein Seasonic Focus Gold 850 Watt -> Gleicher Fehler

Getestete RAM Kits:
G.Skill F4-4000C18Q-128GTRG
4 Riegel mit 3600MHz -> Gleicher Fehler
2 Riegel mit 2666MHz -> Gleicher Fehler
1 Riegel mit 2666MHz -> Gleicher Fehler

G.Skill F4-3600C17Q-64GTZR
4 Riegel mit 3600MHz -> Gleicher Fehler
2 Riegel mit 2133MHz -> Gleicher Fehler
1 Riegel mit 2133MHz -> Gleicher Fehler
1 Riegel mit 2133MHz und 18 / 22 / 22 / 42 Timings -> Gleicher Fehler
 
Zuletzt bearbeitet :
Lösung
Update von mir:
Der neue Austausch 5950X läuft jetzt seit 24 Stunden ohne Probleme
Sowohl unter Last als auch stundenlang im Idle

Hab ihn mal 5 Stunden ohne jegliche Last vor sich hin laufen lassen

-> Update vom 19.12.
CPU läuft nach wie vor Fehlerfrei, Rechner lief testweise 24 Stunden im Idle, 24 Stunden unter Last, 24 Stunden unter Mischlasten

-> Update vom 22.12
CPU läuft weitere 72 Stunden absolut fehlerfrei, egal welche Last und welches Verhalten

Keinerlei Fehler im Eventlog, problemloser Startvorgang

RAM Profil ist das XMP der neuen G.Skill Royal:
14 / 15 / 15 / 35 bei 1,45Volt und 3600MHz DRAM / 1800MHz FCLK

BIOS Version vom Crosshair VIII:
3003 mit AMD AM4 AGESA V2 PI 1.1.0.0 Patch C

-> Würde an der Stelle mal ganz frech...
ich hatte die Soc Voltage auch schon fix auf 1.00 und 1.05 eingestellt. Hat nichts gebracht. Auch die Ram Voltage hatte ich schon von 1.25 - 1.45 hoch fix eingestellt und durchgetestet.

Natürlich habe ich neben den Bios defaults (die Einstellungen die dabei bei Ram und Voltages gemacht werden siehst du in meinen Screens) für den Ram auch die DOCP wie es ja bei Amd heisst eingstellt (in dem Fall 3000 Mhz für die Crucial und 3800 Mhz für die Gskill jeweils mit den Herstellertimings aus dem DOCP/Xmp, bei beiden Einstellungen lief Karhu problemlos 10000% und mehr, und das ist mindestens gleich gut um Ram auf Stabilität zu testen wie Memtest, denn das hat bei meinen 3800/1900 settings für meinen 3700X schon Fehler ausgespuckt wo Memtest immer noch seelenruhig ohne Fehler weiterlief.

All diese verschiedenen Settings und Einstellungen haben nicht geholfen die Idle Reboots abzustellen. Und da das alles ohnehin schon mächtig zeitaufwendig durchzutesten war, habe ich dann nicht noch einzelne Ram Settings verändert, da es mir ohnehin nichts gebracht hätte. Denn wenn weder die bios defaults noch die Ram Hersteller defaults inklusive fixer Voltages für SOC, Ram, Pll und Cpu was am Problem ändern, sehe ich nicht wie es einzelne Timings tun sollten.

Dazu wurden alle Auto Optimizer von Amd (pbo, core boost, curve optimizer usw.) abgeschalten, ebenso die CF - States disabeld und Power idle auf typical gestellt.

Alles ohne Erfolg der Fehler ist geblieben und das System hat sich im Idle nach Lust und Laune neu gestartet, mal nach 20 Minuten, mal nach 3 Stunden.

Dasselbe Board mit demselben Speicher, derselben ssd, demselben Netzteil, derselben Graka lief nach dem Umstecken auf den 2600X wieder komplett problemlos.


Danke auch das du versuchst mir mit noch ein paar Einstellungsvorschlägen zu helfen, aber ich kann sie leider nicht mehr testen, da die Cpu nun bereits auf dem Weg zur RMA ist, aber vielleicht hilft es Leuten die das Problem eventuell noch bekommen werden und dann vielleicht auf diesen Thread stoßen.

Denn sogut wie wir hier kennen sich sicher nur wenige % der User aus und selbst für mich war es schwierig das alles zumindest soweit einzugrenzen.

der 0815 User hat viel Geld ausgegeben für neue Hardware und sitzt dann vor nem Pc der sich nicht unter Last wo man es erwarten würde durch zuviel OC verabschiedet sondern ganz im Gegenteil, wenn er nichts zu tun hat und mit keinerlei Vorwarnung oder brauchbarem Log.

Ich möchte nicht wissen wieviele noch unferfahrene Benutzer, die eben nicht wissen wo und was man im Bios alles einstellen kann, und wie man testen muß um so ein Problem einzugrenzen auf ihren Kosten sitzenbleiben bzw mit dem Händler rumstreiten müßen, weil sie nicht wissen was genau los ist.

Dafür bräuchte es eben Tests im großen Stil mit entsprechendem Werkzeug und Hintergrundwissen, das ein normaler Benutzer und sei er noch so erfahren und versiert, einfach nicht haben kann.

Ich gebe auf jeden Fall Bescheid wenn ich dann mal ne Austausch Cpu aus der Rma hoffentlich erhalte, ob es was gebracht hat oder nicht.
 
Schon mit bekommen?

Klar ohne CPU kann man nix Testen.
Oder in den vorherigen Link rein geschaut?
Was war mit der Bios Einstellung?
201208195740-jpg.8369
 
Aber es beantwortete nicht die Frage warum dein IF schwankte UND ich glaub vergessen , warum die CPU nicht so weit runter Taktet?!
 
Zuletzt bearbeitet :
Toitoitoi. Ich quäle gerade meinen 5800X mit Karhu (in der Tat besser für Lasttests) und Prime SmallFFTs parallel.

Mein billo Kingston HyperX 3600er RAM lüppt immerhin bisher klaglos mit seinem XMP-Profil. Karhu ist gerade bei fast 4.000%.
 
Toitoitoi. Ich quäle gerade meinen 5800X mit Karhu (in der Tat besser für Lasttests) und Prime SmallFFTs parallel.

Mein billo Kingston HyperX 3600er RAM lüppt immerhin bisher klaglos mit seinem XMP-Profil. Karhu ist gerade bei fast 4.000%.
Ramtest/Speichercontroller...solltest eigentlich ohne eine weitere Last laufen lassen.
Würdest du nach deinem Test auch mal mit Memtest Testen ,ABER die Ramspannung dabei um 25mV senken?
Wie Ich Mentest laufen lasse solltest ja wissen oder?
 
Hat einer von euch den Cinebench R23 mit dem Ryzen 9 5950X gemacht? Ich bin bei meinen Recherchen auf die Vermutung gestoßen, dass von Abstürzen betroffene CPUs schlechtere Werte erreichen. Mein erster 5950X brachte im Multicore 25.500 Punkte und Single Core 1.591 Punkte, der neue 5950X Multicore 25.300 Punkte und Singlecore 1.589 Punkte. "Normale" 5950X sollten Multicore zwischen 26.000 und 29.000 Punkte sowie Singlecore ca. 1.650 Punkte bringen. Hat einer von euch dazu irgendwelche Erkenntnisse?

Multicore waren es sogar nur 24400, Singlecore 1578.

Das Timespy Ergebnis ist aber wieder ganz gut und überdurchschnittlich für 5950X/6800XT.


edit: gerade noch mal mit dem anderen RAM nachgemessen der aktuell auf schlechteren Timings läuft - da sind es nicht einmal mehr 24.000 Punkte :p
 
Zuletzt bearbeitet :
Das schon gelesen?
Lösung ist scheinbar die Grafikkarte......Der mal ne Feste Anbindung zuweisen......
 
Die Grafikkarte ist davor schon problemlos mit einem 3900X gelaufen. Ausserdem postet das System bei einem FCLK über 1.800MHz nicht mehr, und wird mit sinkendem FCLK tendenziell stabiler (wenn auch nicht zu 100%) - das deutet auch eher auf ein Problem mit der CPU hin.
Wenn man sich im MSI Forum umsieht, gibt es dort täglich zig Meldungen mit dem Reboot-Problem bei Zen 3, überwiegend mit dem 5900X und dem 5950X - unwahrscheinlich, dass da überall defekte Grafikkarten im Spiel sind, so wie in dem Link von Dir scheinbar der Fall war.
 
Aber es beantwortete nicht die Frage warum dein IF schwankte UND ich glaub vergessen , warum die CPU nicht so weit runter Taktet?!
der Screenshot wurde gemacht als das System komplett Stock war( also load bios defaults und pbo, core boost, core optimizer, global cf stats usw alles auf disabled also wird es daran gelegen sein. Ich hab bei der Masse an Tests leider nicht mehr im Kopf wann genau welcher Wert in Hwinfo angezeigt wurde. Ich glaube mich aber zu erinnern das mit Pbo auf Auto auch der IF fix auf 1200 Mhz war. Hast du eine Vermutung warum der Wert hier so schwanken könnte ?

Gegentesten kann ich das nun mangels Cpu leider (wobei ich eher zu Gott sei Dank tendiere o_O) nicht mehr

Nichts desto trotz in beiden Fällen war der Fehler inklusive Reboot vorhanden.

Begüzlich der Grafikkarte, das scheint in dem Fall geholfen zu haben, ich hab es aber wie gesagt mit 2 unterschiedlichen Grakas 1080ti/1070 probiert die jeweils beide in Ihren System bereits über Jahre problemlos liefen (einmal im aktuellen System die 1080ti wo zuvor der 3700x 2 Jahre problemlos damit lief) und die1070 siet gut 4 Jahren und davon seit 2 im System mit dem 2600X

und wie ccr schrieb es wäreein Wunder wenn nach dem Wechsel auf die neuen Cpus nun plötzlich überall die Boards, der Ram oder die Grakas kaputt wären, die wahrscheinlichste Lösung ist einfach die Cpu.

Ich habe ja jetzt schon Angst wenn mir der Händler wirklich zeitnah einen Austausch 5900X beschaffen kann, ob der Mist dann wieder gleich weiter geht, denn mir kommt auch vor das sich die Probleme mit den neuen Cpus in den einschlägigen Foren häufen. Wer weiß wieviel da noch betroffen sie die gar nicht wissen was überhaupt los ist und warum der Pc nicht läuft.

@ccr
wenn in deinem Fall die Fehler und reboots erst bei fclk über 1800 anfangen und mit sinkendem fclk weniger werden, besteht zumindest die Hoffnung das das ganze wirklich mit einem Agesa Update behoben werden kann.

ich hab die Fehler leider eben auch komplett Stock mit If 1200 gehabt.
 
Multicore waren es sogar nur 24400, Singlecore 1578.

Das Timespy Ergebnis ist aber wieder ganz gut und überdurchschnittlich für 5950X/6800XT.


edit: gerade noch mal mit dem anderen RAM nachgemessen der aktuell auf schlechteren Timings läuft - da sind es nicht einmal mehr 24.000 Punkte :p
Das klingt nicht gut. Hier mal zum Vergleich von Nutzern gemeldete Ergebnisse:

Bei CPU-monkey kann man deren Testwert auch nachlesen. Die Werte liegen in aller Regel höher als bei dir und mir...
 
Das schon gelesen?
Lösung ist scheinbar die Grafikkarte......Der mal ne Feste Anbindung zuweisen......
Problem besteht bei mir mit beiden getesteten Karten:
Asus ROG Strix RX 5700XT und AMD RX 6900XT (Referenzdesign)

Könntest du mir dennoch kurz sagen, wie ich der Grafikkarte eine feste Anbindung zuweisen? Ich würde es gern ausprobieren.
 
@ccr
wenn in deinem Fall die Fehler und reboots erst bei fclk über 1800 anfangen und mit sinkendem fclk weniger werden, besteht zumindest die Hoffnung das das ganze wirklich mit einem Agesa Update behoben werden kann.

ich hab die Fehler leider eben auch komplett Stock mit If 1200 gehabt.

Damit da kein Mißverständnis auftritt:

FCLK > 1800: kein Post
FCLK 1800: Reboots in unregelmäßigen Abständen von Minuten bis Stunden mit dem Crucial Ballistix Max, und alle paar Minuten mit dem G.Skill Trident Z
FCLK < 1800: Reboots werden beim G.Skill seltener, beim Crucial gefühlt auch (aber dort ist es schwerer einzuschätzen, weil die Reboots auch bei 1800 oft erst nach Stunden auftreten)


Ich habe jetzt auch alle 4 kompatiblen BIOS durchprobiert:
AGESA 1.0.8.1: Post mit 1800, aber crasht meist schon vor der Windows-Anmeldung
AGESA 1.1.1.0 Patch C: kein Post mit 1800
Beta mit Fix für höheren FCLK und neuestes Beta mit SAM: siehe die Beschreibung oben

Es gibt also tatsächlich Unterschiede zwischen den BIOS Versionen, die auf unterschiedlichen AGESA Versionen basieren. Ich bekomme aber mit keiner davon ein einigermaßen stabiles System zusammen.
 
@ccr
wie schaut es aus wenn du im Bios alles auf Stock (defaults) laufen lässt und zusätzlich pbo, core boost, curve optimizer, global cf state deaktivierst - also dann mit If 1200 Ram 2400 - hast du dann noch reboots ?

und was für mich interessant wäre weil ich es jetzt leider nicht mehr testen kann - wie verhält sich dann bei dir der Fclk - schwankt der auch auf auto oder ist der bei dir dann auch bei diesen Einstellungen fix ?
 
Ich schreib jetzt einfach in die Runde.

Wenn der Speichercontroller übertaktet wird muss auch die SoC Spannung angepasst werden.
Dazu auch ProcODT zwischen 60 und 40ohm Testen.
Ramspannung wird bei Mir nie angehoben , ehr gesenkt das nicht Jeder Ram damit klar kommt.
Dann wird der Ram auch Asynchron getestet um zu sehen ob er Überhaut mit Takt und Timings XY läuft.

Ich hab 1 Default Profil was Probleme macht aber NUR als Fehler 41 Ausspuckt,alle anderen Profile sind angepasst.
Default hab ich eben mal geladen und unter Windows nach 2-3min wie auch im Bios ne Abschaltung gehabt.
Hatte noch keine Zeit zum Testen bis jetzt.....
Gerade ein paar Dinge umgestellt und jetzt seit rund 15min Ruhe,muss ich die Tage aber noch beobachten.
Umgestellt wurde Spread Spectrum,von Auto auf Deaktiviert , was ich immer aus stelle.



Zur Grafikkarte.
Bei meinem ASUS ist es hier zu finden.
 
@netterman: Ja, auch dann habe ich Reboots. Laut Ryzen Master ist der FCLK stabil.


edit:
Und die Sache wird gerade noch viel trauriger, die Schreibperformance auf meinen SSDs ist komplett im Keller. Als Beispiel die 980 Pro: der oberste Benchmark ist vom 5950X, die unteren Werte sind vom 3900X, das Mainboard war das selbe. :( :( :(

benchmark 980 pro.JPG
 
Zuletzt bearbeitet :
@Casi030: Danke für die Erläuterung!! Mit der Einstellung der Grafikkarte werde ich es gleich morgen früh probieren. Da ich auch ein Asusboard hab, dürfte das ganz leicht zu finden sein. Es wäre ja der Hammer, wenn es daran liegen würde.

Kleine Frage nebenbei. Wie verhalten sich eure CPUs mit der Temperatur im BIOS? Der Ryzen 5950X pendelt sich bei mir selbst im BIOS ganz zügig bei 46-50 Grad ein. Der vorherige Rxzen 3900X lief dort kühler. Könnte das auch ein Anzeichen für einen problematische CPU sein?
 
Zuletzt bearbeitet :
Meiner läuft im BIOS mit ca. 40 Grad. Ich denke nicht, dass der 3900X davor kühler war.
 
amd Chipsatz Treiber ist aktuell bei euch?
 
@Casi030: Danke für die Erläuterung!! Mit der Einstellung der Grafikkarte werde ich es gleich morgen früh probieren. Da ich auch ein Asusboard hab, dürfte das gsnz leicht zu finden sein. Es wäre ja der Hammer, wenn es daran liegen würde.

Kleine Frage nebenbei. Wie verhalten sich eure CPUs mit der Temperatur im BIOS der Ryzen 5950X pendelt sich bei mir selbst im BIOS ganz zügig bei 46-50 Grad ein. Der vorherige Rxzen 3900X lief dort Kühler. Könnte das auch ein Anzeichen für einen problematische CPU sein?
Auch mal Spread Spectrum Testen.
 
Status
Nicht offen für weitere Antworten.
Oben Unten