Frage Ryzen 9 5950X crash mit Prozessor-APIC-ID14 / WHEA-Logger 18

Status
Nicht offen für weitere Antworten.

Hellsingexe

Mitglied
Mitglied seit
Nov 20, 2020
Beiträge
35
Bewertungspunkte
12
Punkte
8
AMD Ryzen 9 5950X

Fehlerbild im Windows Event-Log:
Schwerwiegender Hardwarefehler.
Prozessor-APIC-ID: 14

EventLogSystem-Win8.1Pro.PNG

-> Der Fehler tritt zufällig während des Betriebs auf und ist unabhängig von Lastsituation und Temperatur.
-> Der Fehler führt zum sofortigen Crash des Systems.

=====================================================================

Verwendestes System:
Mainboard: ASUS Crosshair VIII Hero (Wi-Fi)
CPU Kühler: Fractal Design S36 Blackout
RAM: G.Skill F4-4000C18Q-128GTRG
GPU: Inno3D iChill Black 2080 Ti
PSU: Bequiet Dark Power Pro 11 1000Watt

Getetstete Mainbaords:
ASUS Crosshair VIII Hero (Wi-Fi) Mit allen verfügbaren BIOS Versionen die Ryzen 5xxx unterstützen:
Version 2311 -> Gleicher Fehler
Version 2402 beta -> Gleicher Fehler
Version 2502 -> Gleicher Fehler
Version 2702 -> Gleicher Fehler

Gigabyte B550 AORUS ELITE (rev. 1.0) Mit allen verfügbaren BIOS Versionen die Ryzen 5xxx unterstützen:
F10 -> Gleicher Fehler
F11i -> Gleicher Fehler
F11k -> Gleicher Fehler

Getestete Varianten:
-BIOS ALLES auf DEFAULT Settings (Jeweils für alle BIOS Versionen des ASUS und Gigabyte Boards)
-Windows 10 Pro 64Bit 20H2
-Windows 10 Pro 64Bit 1909
-Windows 8.1 Pro 64 Bit
-Linux Mint 20
-Ubuntu 20.04

-Windows im Höchleistungsmodus
-Aktuelle AMD Chipsatz Treiber installiert (2.10.13.408)
-LLC auf Level 3, und 4 fixiert
-PBO deaktiviert
-SMT deaktiviert
-DF Cstates auf "Disable" (Global C-state Control)
-GPU Getauscht gegen eine GTX 970 und eine GTX 560Ti -> Gleicher Fehler
-PSU getauscht gegen ein Seasonic Focus Gold 850 Watt -> Gleicher Fehler

Getestete RAM Kits:
G.Skill F4-4000C18Q-128GTRG
4 Riegel mit 3600MHz -> Gleicher Fehler
2 Riegel mit 2666MHz -> Gleicher Fehler
1 Riegel mit 2666MHz -> Gleicher Fehler

G.Skill F4-3600C17Q-64GTZR
4 Riegel mit 3600MHz -> Gleicher Fehler
2 Riegel mit 2133MHz -> Gleicher Fehler
1 Riegel mit 2133MHz -> Gleicher Fehler
1 Riegel mit 2133MHz und 18 / 22 / 22 / 42 Timings -> Gleicher Fehler
 
Zuletzt bearbeitet :
Lösung
Update von mir:
Der neue Austausch 5950X läuft jetzt seit 24 Stunden ohne Probleme
Sowohl unter Last als auch stundenlang im Idle

Hab ihn mal 5 Stunden ohne jegliche Last vor sich hin laufen lassen

-> Update vom 19.12.
CPU läuft nach wie vor Fehlerfrei, Rechner lief testweise 24 Stunden im Idle, 24 Stunden unter Last, 24 Stunden unter Mischlasten

-> Update vom 22.12
CPU läuft weitere 72 Stunden absolut fehlerfrei, egal welche Last und welches Verhalten

Keinerlei Fehler im Eventlog, problemloser Startvorgang

RAM Profil ist das XMP der neuen G.Skill Royal:
14 / 15 / 15 / 35 bei 1,45Volt und 3600MHz DRAM / 1800MHz FCLK

BIOS Version vom Crosshair VIII:
3003 mit AMD AM4 AGESA V2 PI 1.1.0.0 Patch C

-> Würde an der Stelle mal ganz frech...
@Casi030
Bei mir war es auch unter Mischlast, bei Treiber Installationen, USB Stick anstecken, Website öffnen, etc
Ganz alltägliche Dinge eben

Im Thread hatte sich auch schon jemand mit Fertig PC gemeldet, gleiches Problem
Ok da könnt noch der Ram hinzu kommen wenn er nicht einfach aus geht.
Den Fertigrechner hatte ich überlesen......
Ich muß gestehen ich hab keine Lust mehr aktuell,hab Heute noch Sachen getestet.......
Alle Profile die ich von Hand eingestellt habe laufen,nur Default nicht,ich finde die " Sau" aber auch nicht......
 
@Gurdi
Ja, habe extra ein neues Gigabyte Board bestellt gehabt um zu sehen wie es damit ist. Egal welches BIOS, gleiches Fehlerbild.
Steht alles oben im Fehler beschrieben von mir drin "Spoiler aufklappen"

@Casi030
Definitiv nein, kein RAM Fehler. Wohlgemerkt hatte ich auch inzwischen 3 verschiedene RAM Kits hier die alle gleiches Verhalten gezeigt haben.
 
Zuletzt bearbeitet :
Das Problem scheint beim IF zu liegen im zusammenspiel mit dem SOC.
 
Gigabyte AORUS ELITE Mit allen verfügbaren BIOS Versionen die Ryzen 5xxx unterstützen:
F10 -> Gleicher Fehler
F11i -> Gleicher Fehler
F11k -> Gleicher Fehler
Warum Version F11???

F31o ist die neuste.
 
Wenn man den Thread betracht könnte man meinen das gefühlt jede 2. CPU irgendwelche Probleme macht.
Wäre ich doch bei meinem 10900k geblieben.........:(

Ich hab jetzt mal probehalber meine 3080 Strix an 3 x Stromanschlüssen angeschlossen.
Vorher waren es 3 aber 1 Kabel für 2 Anschlüsse gesplittet.
Würde aber trotzdem die Abstürze im Idle nicht erklären.

@HerrRossi

Denk ich mir auch. Kann nicht sein das die Leute Betatester spielen müssen für die Boardhersteller und AMD.
Viele schicken vielleicht auch nicht zurück weil sie angst haben mehrere Wochen ohne Rechner da zu stehen.
Zur Not tuts auch ein 80 € AM4 für den übergang denke ich.
Der 10900k ist laut RMA Quote fast 3-4x häufiger von Problemen betroffen, aber das sind sowieso alles nur Indikatoren^^ Ich meine wir lesen hier ja alle im Forum zu Problemen, da denkt man natürlich häufiger darüber nach : )


Ich habe eben auf 3x120=360mm Wasserkühlung umgestellt, was sich ganz gut traf.

Rückmeldung von AMD, weiteres Vorgehen RMA:
Denn AMD hat sich gemeldet (auf deutsch und englisch zu gleich in einer Mail). Ich musste 3 Sachen liefern:
1. Bild des installierten CPUs auf dem Mainboard ohne Kühler/Lüfter (sag ja, trifft sich gerade gut)
2. Rechnung des Orginalhändlers (in meinem Fall also Mindfactory)
3. Details zu unternommenen Lösungsansätzen oder Resultate die einen defekten Prozessor nahelegen (Kernel ID41 bei mir, Absturz ohne Last, direkter Neustart wie beim Drücken des Reset-Knopfes)

Alles drei ist natürlich extrem einfach zu besorgen, ich schicke es gleich ab.
 
So ich bin wieder WHEA frei. Ich raff grad nicht wie das auf einmal auftreten konnte, mein System war bis vor kurzem stabil. Ich hab zwar meine letzten Undervolts nicht mehr validiert gehabt, aber es lief ja nicht mal mehr Stock sobald ich Prime angeschmissen hab war nach mehr oder minder kurzer Zeit essig.
 
Ich traue noch gar nicht, mich zu freuen. Aber es sieht so aus, als ob die neue CPU tatsächlich stabil ist. Zumindest läuft sie ohne Eingriff ins BIOS jetzt schon seit einigen Stunden stabil, was die alte CPU nicht getan hat. Ich werde das noch weiter beobachten, aber möglicherweise gibt es da wirklich sehr viele Gurken (ich persönlich kenne 3 Leute mit 5900/5950X, und alle 3 haben Probleme - nur beim Freund mit dem 5800X läuft alles rund).
 
Also nach allen Recherchen und Kontakten sind das defekte CPUs, die die niedrige Spannung im Idle nicht abkönnen. Davon gibt es nicht wenige, ich würde mich da auf keine RMA Quote irgendeiner Webseite verlassen. Die liegt definitiv höher.

Ich bin mir fast sicher, dass AMD an sämtliche Partner etc. was rausgehauen hat, damit hier niemand offiziell darüber berichtet. Wie sonst soll man sich das noch erklären? Glaube ich nicht daran. Die werden das schleichend fixen durch neue Produktionen, beim Bios/Agesa passiert da genau Null. Austausch und hoffen oder vorübergehend 5600x/5800x.

Ich kenne niemanden, der mit einer 5600x/5800x genau diese Probleme hat. Wenn es Probleme gab, lag es an etwas anderem.
 
Also nach allen Recherchen und Kontakten sind das defekte CPUs, die die niedrige Spannung im Idle nicht abkönnen. Davon gibt es nicht wenige, ich würde mich da auf keine RMA Quote irgendeiner Webseite verlassen. Die liegt definitiv höher.

Ich bin mir fast sicher, dass AMD an sämtliche Partner etc. was rausgehauen hat, damit hier niemand offiziell darüber berichtet. Wie sonst soll man sich das noch erklären? Glaube ich nicht daran. Die werden das schleichend fixen durch neue Produktionen, beim Bios/Agesa passiert da genau Null. Austausch und hoffen oder vorübergehend 5600x/5800x.

Ich kenne niemanden, der mit einer 5600x/5800x genau diese Probleme hat. Wenn es Probleme gab, lag es an etwas anderem.
Kann nicht sein, sonst hätte ich es ja nicht behebn können. Ich sehe auch einschneidende Änderungen im neuen Bios.
 
@Casi030
ID41 hatte ich kein einziges mal, nur Prozessor-APIC-ID14 / WHEA-Logger 18

-> So ist es im Fehler oben ja auch beschrieben
 
Zuletzt bearbeitet :
Kann nicht sein, sonst hätte ich es ja nicht behebn können. Ich sehe auch einschneidende Änderungen im neuen Bios.

Nein dann war es eventuell noch etwas anderes, es ist immer noch nicht 100% stabil oder man hat das Problem nicht gelöst sondern umgangen.

Es gibt diese Problematik mit vielen 5900x/5950x einfach. Da sind viel zu viele unterschiedliche Boards, Biose, Ram Kits und was weiß ich noch betroffen. Bei gleicher Hardware hilft ein CPU Tausch damit es plötzlich stabil werden kann.

Es gibt hier extreme Fertigungsschwankungen, das ist ein Fakt. Die können die niedrigen Spannungen nicht ab.
 
@Casi030
ID41 hatte ich kein einziges mal, nur Prozessor-APIC-ID14 / WHEA-Logger 18
Hast du dein Gigaboard in Betrieb, dann könnten wir bei dir mal mein Bugfixing ausprobieren.

Es gibt hier extreme Fertigungsschwankungen, das ist ein Fakt. Die können die niedrigen Spannungen nicht ab.
Blödsinn, im Idle crasht doch kein Kern. Das liegt am aufwachen, wahrscheinlich peakt dabei der Takt sehr hoch.
 
@Gurdi
Nein, das lief nur zum testen. Ich habe den defekten 5950X ja auch schon lang weggeschickt und einen RMA erhalten (Der auch schon weiterverkauft wurde)

Mein System läuft mit dem oben beschriebenen ASUS Crosshair VIII Hero und einem neu gekauften 5950X von Alternate welcher seit über einer Woche perfekt läuft (Wie in Lösung beschrieben)
 
Ich hab gestern mal den MSI Afterburner runtergeschmissen und hatte bis jetzt keine WHEA Fehler mehr ^^
Die Graka war nicht übertaktet, ich hatte den Afterburner nur wegen den HW Overlay am laufen.....
 
Ich kann bestätigen, dass meine neue CPU stabil läuft. Sie läuft jetzt auch problemlos mit RAM auf 3800MHz und FCLK auf 1900MHz (CB23: 29k Punkte :) ) - die alte konnte mit FCLK über 1800 nicht einmal posten.
Nächstes Ziel - FCLK 2000 :D

Ich würde daher empfehlen, nicht zu viel Zeit mit einer spinnenden CPU zu verbringen, und auf ein neues BIOS zu hoffen, sondern einen Tausch zu probieren.
Da meine CPUs von der Seriennummer ganz knapp zusammen liegen, ist auch nicht von generell defekten Batches auszugehen.
 
Auch bei mir gab es keinen Absturz mehr. Momentan läuft der RAM auf 3200 MHz und FCLK auf 1600 MHz (Vollbestückung mit 128 GB - war nicht notwendig, wollte ich aber haben ;) ). Ich werde mich dann morgen mal daran versuchen, ob die CPU auch einen höheren RAM-Takt schluckt.

Auch von mir die klare Empfehlung: CPU bei Problemen per RMA oder Widerruf zurückgehen lassen und es mit einer neuen probieren, notfalls auch mehrmals.
 
Status
Nicht offen für weitere Antworten.
Oben Unten