Frage Ryzen 9 5950X crash mit Prozessor-APIC-ID14 / WHEA-Logger 18

Status
Nicht offen für weitere Antworten.

Hellsingexe

Mitglied
Mitglied seit
Nov 20, 2020
Beiträge
35
Bewertungspunkte
12
Punkte
8
AMD Ryzen 9 5950X

Fehlerbild im Windows Event-Log:
Schwerwiegender Hardwarefehler.
Prozessor-APIC-ID: 14

EventLogSystem-Win8.1Pro.PNG

-> Der Fehler tritt zufällig während des Betriebs auf und ist unabhängig von Lastsituation und Temperatur.
-> Der Fehler führt zum sofortigen Crash des Systems.

=====================================================================

Verwendestes System:
Mainboard: ASUS Crosshair VIII Hero (Wi-Fi)
CPU Kühler: Fractal Design S36 Blackout
RAM: G.Skill F4-4000C18Q-128GTRG
GPU: Inno3D iChill Black 2080 Ti
PSU: Bequiet Dark Power Pro 11 1000Watt

Getetstete Mainbaords:
ASUS Crosshair VIII Hero (Wi-Fi) Mit allen verfügbaren BIOS Versionen die Ryzen 5xxx unterstützen:
Version 2311 -> Gleicher Fehler
Version 2402 beta -> Gleicher Fehler
Version 2502 -> Gleicher Fehler
Version 2702 -> Gleicher Fehler

Gigabyte B550 AORUS ELITE (rev. 1.0) Mit allen verfügbaren BIOS Versionen die Ryzen 5xxx unterstützen:
F10 -> Gleicher Fehler
F11i -> Gleicher Fehler
F11k -> Gleicher Fehler

Getestete Varianten:
-BIOS ALLES auf DEFAULT Settings (Jeweils für alle BIOS Versionen des ASUS und Gigabyte Boards)
-Windows 10 Pro 64Bit 20H2
-Windows 10 Pro 64Bit 1909
-Windows 8.1 Pro 64 Bit
-Linux Mint 20
-Ubuntu 20.04

-Windows im Höchleistungsmodus
-Aktuelle AMD Chipsatz Treiber installiert (2.10.13.408)
-LLC auf Level 3, und 4 fixiert
-PBO deaktiviert
-SMT deaktiviert
-DF Cstates auf "Disable" (Global C-state Control)
-GPU Getauscht gegen eine GTX 970 und eine GTX 560Ti -> Gleicher Fehler
-PSU getauscht gegen ein Seasonic Focus Gold 850 Watt -> Gleicher Fehler

Getestete RAM Kits:
G.Skill F4-4000C18Q-128GTRG
4 Riegel mit 3600MHz -> Gleicher Fehler
2 Riegel mit 2666MHz -> Gleicher Fehler
1 Riegel mit 2666MHz -> Gleicher Fehler

G.Skill F4-3600C17Q-64GTZR
4 Riegel mit 3600MHz -> Gleicher Fehler
2 Riegel mit 2133MHz -> Gleicher Fehler
1 Riegel mit 2133MHz -> Gleicher Fehler
1 Riegel mit 2133MHz und 18 / 22 / 22 / 42 Timings -> Gleicher Fehler
 
Zuletzt bearbeitet :
Lösung
Update von mir:
Der neue Austausch 5950X läuft jetzt seit 24 Stunden ohne Probleme
Sowohl unter Last als auch stundenlang im Idle

Hab ihn mal 5 Stunden ohne jegliche Last vor sich hin laufen lassen

-> Update vom 19.12.
CPU läuft nach wie vor Fehlerfrei, Rechner lief testweise 24 Stunden im Idle, 24 Stunden unter Last, 24 Stunden unter Mischlasten

-> Update vom 22.12
CPU läuft weitere 72 Stunden absolut fehlerfrei, egal welche Last und welches Verhalten

Keinerlei Fehler im Eventlog, problemloser Startvorgang

RAM Profil ist das XMP der neuen G.Skill Royal:
14 / 15 / 15 / 35 bei 1,45Volt und 3600MHz DRAM / 1800MHz FCLK

BIOS Version vom Crosshair VIII:
3003 mit AMD AM4 AGESA V2 PI 1.1.0.0 Patch C

-> Würde an der Stelle mal ganz frech...
Damit mal versuchen
Aber ohne HWINFO64 und CineBench R23 für wenigstens 10min kann man eh nix sagen.
 
Witzig: Hab grad nach n bisschen Recherche mal 'Core Performance Boost' von Auto auf Disabled gestellt. Jetzt bootet Ubuntu.....
Hatt es auch noch mit zusätzlichem PBO auf enabled und deaktiverter global c-state control probiert, dann hatte ich zumindest nen ladebalken bei Ubuntu, aber mit anschließendem crash.

Aber, was bedeutet diese Erkenntnis? Hat die CPU trotzdem einen weg? 5 Tage lief sie ja mit dem 2402 Bios @ mostly stock settings (nur DOCP) problemlos durch.
Update: Nach bissl weiterer rumprobieren, erneutem CMOS clear und 'Core Performance Boost' -> Disabled, bootet er nun wiederum nicht mehr ubuntu, friert ein mit Errorcode "CC". Eig selbe settings wie vor ca. ner stunde.
Der code steht nichtmal im Handbuch!
 
leuchtet ne Q_LED unter dem Error Code CC?
 
ich wundere mich schon irgendwo, daß scheinbar immer mehr Leute von den Problemen betroffen sind und trotzdem hört man von einschlägigen Redaktionen oder Testern irgendwie rein gar nichts zu der Thematik ?

@Igor Wallossek
könntest du da nicht mal ein bisschen in der Richtung nachforschen, da wäre glaube ich sehr vielen Leuten geholfen, wenn da mal ne "offizielle" Anfrage aus berufenen Munde an Amd bzw die Mainboard Hersteller ginge.

ich hab meine Probleme zwar an den technischen Support von Amd und auch Asus gemeldet, aber bis jetzt ausser den üblichen Standardfloskeln (wir werden uns umgehend melden usw. bla bla) nach nun 9 Tagen immer noch keinerlei Antwort erhalten :(

ich habe aber irgendwie auch nichts anderes erwartet, da hätte eine Anfrage von Igor einfach wesentlich mehr Gewicht.
 
ich wundere mich schon irgendwo, daß scheinbar immer mehr Leute von den Problemen betroffen sind und trotzdem hört man von einschlägigen Redaktionen oder Testern irgendwie rein gar nichts zu der Thematik ?

@Igor Wallossek
könntest du da nicht mal ein bisschen in der Richtung nachforschen, da wäre glaube ich sehr vielen Leuten geholfen, wenn da mal ne "offizielle" Anfrage aus berufenen Munde an Amd bzw die Mainboard Hersteller ginge.

ich hab meine Probleme zwar an den technischen Support von Amd und auch Asus gemeldet, aber bis jetzt ausser den üblichen Standardfloskeln (wir werden uns umgehend melden usw. bla bla) nach nun 9 Tagen immer noch keinerlei Antwort erhalten :(

ich habe aber irgendwie auch nichts anderes erwartet, da hätte eine Anfrage von Igor einfach wesentlich mehr Gewicht.
glaubst du wirklich, nachdem der fred nun seit einem monat läuft, sich @Igor Wallossek wirklich in die AMD-Nesseln setzen wird?
 
nachdem er zb auch bei Nvidia mit den Poscaps durchaus kritisch gegenüber dem Hersteller investigativ unterwegs war, würde ich ihm das auch gegenüber Amd zutrauen bzw mir eigentlich erwarten.

Aber da ich Igor leider nicht persönlich kenne, vielleicht irre ich mich da auch :unsure:
 
Igor hatte ne Defekte CPU,danach war ruhe und es gab keine Probleme mehr wenn ich mich recht erinnere.
Warum soll sich also Igor dann um irgend welche Probleme kümmern die irgend einer hat aus irgend welchen Gründen?!
 
weil es eben nicht nur einen zu Betreffen scheint, weil "real Tests for real Enthusiasts" vielleicht nicht nur ne hohle Phrase ist, oder weil es ganz einfach ein netter Zug wäre.

aber wenn man natürlich nach der Einstellung lebt, nur dann zu helfen, wenn es einen selbst betrifft dann hast du natürlich recht.

schön ist aber das der Großteil nicht nach dem Motto lebt, wie man es ja auch an vielen Reaktionen und Beiträgen hier im Thread sieht.
 
Und was soll er AMD schreiben wenn ER selber diesen Fehler nicht Reproduzieren kann?

SORRY wenn Ich mal wieder deutlicher werde,aber man kann sich nicht um Jeden möchtegern kümmern der meint er könnte alles.
90% haben nicht mal das Grundwissen wie die heutige HW überhaupt funktioniert und arbeitet.

Die Einzige Möglichkeit wäre solche Rechner nem Experten zu schicken um den Fehler zu Analysieren um dann gezielt diesen zu Melden....
 
Das Problem ist leider weit verbreitet. Als Einzelfälle kann man das kaum noch bezeichnen.

Ich hab mich mit Mindfactory für die zweite CPU auf einen Widerruf und Neubestellung einer dritten CPU (wieder Ryzen 9 5950X) geeinigt. Ich hoffe, dass das Problem dann gelöst ist.
 
ich habe nicht das Gefühl, dass sich einer hier im Thread, der Probleme hatte als Möchtegern, der meint alles zu können präsentiert hat.

ganz im Gegenteil, viele die sich hier tummeln, kennen sich doch sehr gut mit ihrer Hardware aus, aber die meisten von uns haben nun mal kein Labor zuhause um das Problem genauer zu analysieren.

Ganz im Gegensatz zu zb Igor der eben viel weitreichendere Möglichkeiten hat um das Problem zu analysieren und zudem ganz andere Kontakte um da auch mal hinter den Kulissen nachzufragen

und jemand der Bereit ist sein nicht funktionierendes System entsprechend zur eingehenden Analyse zu Verfügung zu stellen wird man sicher finden, ich wäre zb sofort dazu bereit gewesen, aber leider befindet sich meine Cpu halt schon auf dem Weg zur RMA beim Händler
 
Nur wie werden die Probleme den Angegangen?!
So gut wie keiner liefert Daten vom System im Idle,unter Last,Memtest unter Windows und und und.Wenn sich die Leute auskennen würden ,warum wird dann nix geliefert?!
Wenn sich die Leute aus kennen würden....warum stellen sie dann immer recht ......Fragen wenn ein Überwachung doch die Antwort liefert.......
Ich frage so gut wie gar nicht mehr wie noch vor 10 Jahren ob die Leute die HW denn überhaupt richtig eingebaut haben.....
Für all das braucht man Igors Labor nicht,das kann Jeder von zuhause aus machen wenn er denn Ahnung davon hat....
 
Ich kann hier nur für mich sprechen, aber mein System lief bis zum Ausbau mit einem 3700X knappe 2 Jahre problemlos. Da gab es keinerlei Reboots, weder unter Last noch unter Idle. Alles was ich dann gemacht habe war Bios auf Stock und den 3700X aus und den 5900X einzubauen.

Dazu habe ich Windows neu installiert und dann habe ich mit dem Testen (cinebench, Prime usw) begonnen unter Last alles in Ordnung keinerlei Auffälligkeiten festzustellen, aber im Idle immer wieder Reboots und die entsprechenden Whea Fehler.

Dann habe ich angefangen alle Komponenten mit denen aus dem problemlos laufenden Zweitsystem bestehend aus 2600X , 1070 und Crucial anstatt Gskill Ram druchzutauschen. Letztendlich habe ich vom Mainboard angefangen bis zu Ram, Grafikkarte; Netzteil und sogar SSD alles in zweifacher Ausführung gegengetestet.

Geholfen hat alles nichts, die Reboots im Idle mit dem 5900X sind geblieben, während alle verwendeten Komponenten mit dem 2600X (den 3700X habe ich leider nicht mehr) problemlos und ohne irgendeinen Reboot unter Last oder im Idle funktionierten.

Ich hab auf beiden Systemen mit beiden Cpus stundenlang Memtest laufen lassen nur mit dem Ergebniss das es keinerlei Fehlermeldungen gibt.

Dazu alle Bios Einstellungen in allen Variationen durchgetestet, dabei den Ram und den IF immer auf Standardeinstellungen belassen, geholfen hat das alles nichts. Die Reboots beim 5900X sind im Idle weiterhin vorhanden.

ich kann dir gerne die Screenshots der Whea Fehler, die Logs von HWinfo während der Cinebench Runs bzw Prime Runs, sowie von Karhu Ramtest anhängen nur bringen wird das recht wenig, da der Fehler nur im Idle auftritt und es da bis auf die Whea Fehleranzeige in der Windows Ereignisanzeige nichts an Logs gibt, die man verwerten könnte.

Sowas kann man eben nur noch mit einem Labor und entsprechender Spezialausrüstung genauer untersuchen, denn ich bin nun mal kein CPU Designer oder jemand, der sich tief mit Troubleshooting von Softwarefehlern oder dem Debuggen von Software/Fehlern/Abstürzen auskennt

Aber wenn du einen guten Tipp für mich hast, wie ich solche ein Probleme, wie die andauerden Abstürzen im Idle noch besser eingrenzen und untersuchen kann, dann bitte immer her damit, da wären dir viele, die vielleicht in Zukunft auch noch von demselben Fehler geplagt werden sicher sehr dankbar.
Einschliesslich mir, denn wer weiß ob der 5900X den ich hoffentlich im Austausch erhalte, nicht auch wieder Probleme macht und ich dann erneut auf Fehlersuche gehen muss.
 
Ich kann hier nur für mich sprechen, aber mein System lief bis zum Ausbau mit einem 3700X knappe 2 Jahre problemlos. Da gab es keinerlei Reboots, weder unter Last noch unter Idle. Alles was ich dann gemacht habe war Bios auf Stock und den 3700X aus und den 5900X einzubauen.

Dazu habe ich Windows neu installiert und dann habe ich mit dem Testen (cinebench, Prime usw) begonnen unter Last alles in Ordnung keinerlei Auffälligkeiten festzustellen, aber im Idle immer wieder Reboots und die entsprechenden Whea Fehler.

Dann habe ich angefangen alle Komponenten mit denen aus dem problemlos laufenden Zweitsystem bestehend aus 2600X , 1070 und Crucial anstatt Gskill Ram druchzutauschen. Letztendlich habe ich vom Mainboard angefangen bis zu Ram, Grafikkarte; Netzteil und sogar SSD alles in zweifacher Ausführung gegengetestet.

Geholfen hat alles nichts, die Reboots im Idle mit dem 5900X sind geblieben, während alle verwendeten Komponenten mit dem 2600X (den 3700X habe ich leider nicht mehr) problemlos und ohne irgendeinen Reboot unter Last oder im Idle funktionierten.

Ich hab auf beiden Systemen mit beiden Cpus stundenlang Memtest laufen lassen nur mit dem Ergebniss das es keinerlei Fehlermeldungen gibt.

Dazu alle Bios Einstellungen in allen Variationen durchgetestet, dabei den Ram und den IF immer auf Standardeinstellungen belassen, geholfen hat das alles nichts. Die Reboots beim 5900X sind im Idle weiterhin vorhanden.

ich kann dir gerne die Screenshots der Whea Fehler, die Logs von HWinfo während der Cinebench Runs bzw Prime Runs, sowie von Karhu Ramtest anhängen nur bringen wird das recht wenig, da der Fehler nur im Idle auftritt und es da bis auf die Whea Fehleranzeige in der Windows Ereignisanzeige nichts an Logs gibt, die man verwerten könnte.

Sowas kann man eben nur noch mit einem Labor und entsprechender Spezialausrüstung genauer untersuchen, denn ich bin nun mal kein CPU Designer oder jemand, der sich tief mit Troubleshooting von Softwarefehlern oder dem Debuggen von Software/Fehlern/Abstürzen auskennt

Aber wenn du einen guten Tipp für mich hast, wie ich solche ein Probleme, wie die andauerden Abstürzen im Idle noch besser eingrenzen und untersuchen kann, dann bitte immer her damit, da wären dir viele, die vielleicht in Zukunft auch noch von demselben Fehler geplagt werden sicher sehr dankbar.
Einschliesslich mir, denn wer weiß ob der 5900X den ich hoffentlich im Austausch erhalte, nicht auch wieder Probleme macht und ich dann erneut auf Fehlersuche gehen muss.
Hattest schon mal irgend wo was geschrieben?
System,was schon getestet wurde mit Screens.......

Die einzige Test CPU die mich interessiert ist der 5950X wegen 4 Phasen vs 16 Kerne....Möglich das ich auch solch ein Problem finden würde.....
Aber zu Teuer,da sind Möbel und Autos gerad wichtiger.

Hattest den Thread schon mal gelesen?
 
das meiste steht hier im Thread und nochmal selbst wenn wir alle hier die Betroffen sind, zig Screens vom System, von den Bios Einstellungen, von den Bench Runs, von Hwinfo, von den Whea Fehler posten. Es wird nichts nützen weil der Reboot und Fehler einfach abrupt auftritt. Man sieht nicht, wie sonst oft, einen Kern unter Last irgendwo aussteigen, es wird kein Dump file angelegt usw.

Alles was man merkt und sieht ist der Reboot und Loggen kann man einzig den Whea Fehler in der Ereignisanzeige von Windows und von dem Fehler hat der TE ohnehin mehrere Screens hier gepostet, das sieht bei mir nicht anders aus. Einzig die Prozessor Apic Id die den Fehler auslöst ändert sich fast jedesmal.

Da gibt es nichts was man mit normalen Mitteln ohne sehr gute Kenntnisse in Mircotechnologie bzw Chip Design und entsprechneder Speziallausrüstung (die auch in der Lage ist zb im unter Millisekunden Bereich Lastwechsel genau aufzuzeichen usw.) weiter eingrenzen und untersuchen kann, darum sind ja auch alle Betroffenen so machtlos.

umso wichtiger wäre es das sich jemand mit entsprechender Ausrüstung und Erfahrung des Themas mal annimmt...

naja wie gesagt meine Cpu ist auf dem Weg zur Rma - schön ist halt auch das ich nun min 3-4 Wochen ohne Cpu und Hauptrechner dasitze. Wenn es nicht im Haushalt noch nen Zweitrechner bzw. zumindest nen Laptop gbäe wäre das noch etwas unschöner.
 
Zu Reboot im Idle fallen mir vor allem Strosparmodi, Netzteil und USB-Geräte ein. Haben deine Netzteile mindestens Standard ATX 2.4, so dass sie die Stromsparmodi c6/c7 unterstützen? Diese Stromsparmodi kannst du im BIOS auch mal deaktivieren. Manchmal passiert so was, wenn ein USB-Gerät den PC aufruft, wenn dieser in einem Stromsparmodus ist und der PC nicht richtig bereit ist aufgeweckt zu werden. Im BIOS kann man abschalten, dass der PC über USB aufgerufen werden kann und im Windows kann man mit den Energieeinstellungen pröbeln. Ob es was bringt, kann ich auch nicht sagen.
 
das meiste steht hier im Thread und nochmal selbst wenn wir alle hier die Betroffen sind, zig Screens vom System, von den Bios Einstellungen, von den Bench Runs, von Hwinfo, von den Whea Fehler posten. Es wird nichts nützen weil der Reboot und Fehler einfach abrupt auftritt. Man sieht nicht, wie sonst oft, einen Kern unter Last irgendwo aussteigen, es wird kein Dump file angelegt usw.

Alles was man merkt und sieht ist der Reboot und Loggen kann man einzig den Whea Fehler in der Ereignisanzeige von Windows und von dem Fehler hat der TE ohnehin mehrere Screens hier gepostet, das sieht bei mir nicht anders aus. Einzig die Prozessor Apic Id die den Fehler auslöst ändert sich fast jedesmal.

Da gibt es nichts was man mit normalen Mitteln ohne sehr gute Kenntnisse in Mircotechnologie bzw Chip Design und entsprechneder Speziallausrüstung (die auch in der Lage ist zb im unter Millisekunden Bereich Lastwechsel genau aufzuzeichen usw.) weiter eingrenzen und untersuchen kann, darum sind ja auch alle Betroffenen so machtlos.

umso wichtiger wäre es das sich jemand mit entsprechender Ausrüstung und Erfahrung des Themas mal annimmt...

naja wie gesagt meine Cpu ist auf dem Weg zur Rma - schön ist halt auch das ich nun min 3-4 Wochen ohne Cpu und Hauptrechner dasitze. Wenn es nicht im Haushalt noch nen Zweitrechner bzw. zumindest nen Laptop gbäe wäre das noch etwas unschöner.
Ich sehe hier geschriebene Rameinstellungen aber keine HWINFO64 Daten oder Memtest unter Windows.....
 
info.jpgScreenshot (11).png
Screenshot (29).png

so bitte dann bin ich ja mal gespannt auf die Expertise :) Screen vom Karhu Ramtest kann ich dir keider keine bieten, weil ich keine gemacht habe. Aber der Test ist bis über 10000% ohne Fehler durchgelaufen und die Ramtimings siehst du ja im ersten Screen.



@Martin Gut
danke aber alles schon probiert und eingestellt im Bios, hat alles nichts genützt. Netzteile sind beides BQ beide sind C6/7 fähig.
 
Da Karhu kostet hab ichs noch nicht getestet wie gut oder schlecht es ist.

Was auffällt ist das deine SOC Spannung absackt,ich bin mir jetzt nicht 100% sicher ,aber ich mein ab 0,95V startet mein Rechner z.b. nicht mehr egal mit welchem Ramtakt.
Wenn der jetzt in Windows auf diesen Wert absackt durch ne kurze last......Fraglich.
SOC also mal Fest auf 1,00V-1,05V Testen.
Warum sackt dein IF ab?!
Ramspannung auch mal fest auf 1,3V auch bei dem geringen Takt.
Timings würd ich auch ändern.
Zum Testen von Oben nach Unten:
16
16
16
16
32 ergeben sich aus 2x16
64 ergeben sich aus 2x32
Cmd auf T2?
Auto oder T1 Testen.
Die restlichen Timings auf Auto lassen.

Ich lade immer XMP 3200MHz und stelle von dort alles ein.
Auch Teste ich den Ram wenn ich z.b. 1,35V haben will auf 1,325V zum Testen.
2020.12.13-21.10.jpg
 
Status
Nicht offen für weitere Antworten.
Oben Unten