Frage Ryzen 9 5950X crash mit Prozessor-APIC-ID14 / WHEA-Logger 18

Status
Nicht offen für weitere Antworten.

Hellsingexe

Mitglied
Mitglied seit
Nov 20, 2020
Beiträge
35
Bewertungspunkte
12
Punkte
8
AMD Ryzen 9 5950X

Fehlerbild im Windows Event-Log:
Schwerwiegender Hardwarefehler.
Prozessor-APIC-ID: 14

EventLogSystem-Win8.1Pro.PNG

-> Der Fehler tritt zufällig während des Betriebs auf und ist unabhängig von Lastsituation und Temperatur.
-> Der Fehler führt zum sofortigen Crash des Systems.

=====================================================================

Verwendestes System:
Mainboard: ASUS Crosshair VIII Hero (Wi-Fi)
CPU Kühler: Fractal Design S36 Blackout
RAM: G.Skill F4-4000C18Q-128GTRG
GPU: Inno3D iChill Black 2080 Ti
PSU: Bequiet Dark Power Pro 11 1000Watt

Getetstete Mainbaords:
ASUS Crosshair VIII Hero (Wi-Fi) Mit allen verfügbaren BIOS Versionen die Ryzen 5xxx unterstützen:
Version 2311 -> Gleicher Fehler
Version 2402 beta -> Gleicher Fehler
Version 2502 -> Gleicher Fehler
Version 2702 -> Gleicher Fehler

Gigabyte B550 AORUS ELITE (rev. 1.0) Mit allen verfügbaren BIOS Versionen die Ryzen 5xxx unterstützen:
F10 -> Gleicher Fehler
F11i -> Gleicher Fehler
F11k -> Gleicher Fehler

Getestete Varianten:
-BIOS ALLES auf DEFAULT Settings (Jeweils für alle BIOS Versionen des ASUS und Gigabyte Boards)
-Windows 10 Pro 64Bit 20H2
-Windows 10 Pro 64Bit 1909
-Windows 8.1 Pro 64 Bit
-Linux Mint 20
-Ubuntu 20.04

-Windows im Höchleistungsmodus
-Aktuelle AMD Chipsatz Treiber installiert (2.10.13.408)
-LLC auf Level 3, und 4 fixiert
-PBO deaktiviert
-SMT deaktiviert
-DF Cstates auf "Disable" (Global C-state Control)
-GPU Getauscht gegen eine GTX 970 und eine GTX 560Ti -> Gleicher Fehler
-PSU getauscht gegen ein Seasonic Focus Gold 850 Watt -> Gleicher Fehler

Getestete RAM Kits:
G.Skill F4-4000C18Q-128GTRG
4 Riegel mit 3600MHz -> Gleicher Fehler
2 Riegel mit 2666MHz -> Gleicher Fehler
1 Riegel mit 2666MHz -> Gleicher Fehler

G.Skill F4-3600C17Q-64GTZR
4 Riegel mit 3600MHz -> Gleicher Fehler
2 Riegel mit 2133MHz -> Gleicher Fehler
1 Riegel mit 2133MHz -> Gleicher Fehler
1 Riegel mit 2133MHz und 18 / 22 / 22 / 42 Timings -> Gleicher Fehler
 
Zuletzt bearbeitet :
Lösung
Update von mir:
Der neue Austausch 5950X läuft jetzt seit 24 Stunden ohne Probleme
Sowohl unter Last als auch stundenlang im Idle

Hab ihn mal 5 Stunden ohne jegliche Last vor sich hin laufen lassen

-> Update vom 19.12.
CPU läuft nach wie vor Fehlerfrei, Rechner lief testweise 24 Stunden im Idle, 24 Stunden unter Last, 24 Stunden unter Mischlasten

-> Update vom 22.12
CPU läuft weitere 72 Stunden absolut fehlerfrei, egal welche Last und welches Verhalten

Keinerlei Fehler im Eventlog, problemloser Startvorgang

RAM Profil ist das XMP der neuen G.Skill Royal:
14 / 15 / 15 / 35 bei 1,45Volt und 3600MHz DRAM / 1800MHz FCLK

BIOS Version vom Crosshair VIII:
3003 mit AMD AM4 AGESA V2 PI 1.1.0.0 Patch C

-> Würde an der Stelle mal ganz frech...
Weil du schreibst bei den Neueren,meine sind ja recht neu und auch nur E-Die.;)
Ging doch erst Mitte des Jahres richtig los mit den B-Dies, warte Mal noch bisschen - Samsung B-Dies gibt's ja schließlich auch noch.

Wenn's 16Gb Dimms gewesen wären hätte ich gesagt sei doch froh - mehr Performance mit deinem Ryzen... Bei nem 8Gb Dimm ist das natürlich irrelevant.
 
Ging doch erst Mitte des Jahres richtig los mit den B-Dies, warte Mal noch bisschen - Samsung B-Dies gibt's ja schließlich auch noch.

Wenn's 16Gb Dimms gewesen wären hätte ich gesagt sei doch froh - mehr Performance mit deinem Ryzen... Bei nem 8Gb Dimm ist das natürlich irrelevant.
Ich hab nur Samsung E-Die , aber alle 16GB G.Skill Kits die ich hier habe sind schlechter und schwieriger Stab zu bekommen als Crucial.
Nächstes Jahr wird es noch mal ein Crucial 32GB RGB Kit geben wegen DR.
Ich hab schon so viel getestet, da kommt bei mir nur noch ASUS und Crucial rein,das läuft wenigstens auch wenn man @Default das Idle Abschalten hat,wobei das Bios jetzt auch 1 Jahr alt ist aber es liefert alles was ich brauche, somit wird auch nicht mehr Experimentiert.
 
Achte gerade bei den RGB Kits auf Micron E-Die wenn du DualRank haben möchtest.

Nahezu sämtliche RGB Kits die ich dieses Jahr bisher verbaut habe sind B-Dies und somit Singlerank gewesen.

Save DualRank sind momentan eigentlich nur die normalen Ballistix (BL2K16G36C16U4B ; BL2K16G36C16U4W ; BL2K16G36C16U4R) - aber auch da ist es nur eine Frage der Zeit bis Crucial auf B-Die umstellt.

Die BL2K16G36C16U4BL ; BL2K16G36C16U4WL ; BL2K16G36C16U4RL Kits (Sprich die RGB Varianten der oben genannten) die ich dieses Jahr verbaut habe hatten - mit Ausnahme von einem (!) einzigen bereits Micron B-Dies.

LG
Marti
 
Es kommen nur diese in frage.
 
Achtung: im Herbst sind erstmals Micron E-Die mit 16Gbit Chips aufgetaucht, d.h. die sind dann (wie schon die Micron B-Dies) bis 16GB als Single Rank bestückt. Crucial bewirbt das nicht, und es gibt derzeit auch keine Unterscheidung bei den Produktnummern - d.h. man erfährt erst beim Auspacken, ob man noch Dual Rank oder schon Single Rank erwischt hat.

Wenn ich das richtig überblicke, gibt es daher bei 16GB Riegeln nur mehr bei Samsung B-Dies garantiert Dual Rank, während man bei Micron (egal ob B- oder jetzt auch E-Die) zu 32GB greifen muß.
Alternativ kann man natürlich auch 4x Single Rank RAM verbauen, das ist theoretisch sogar noch eine Spur schneller als 2x Dual Rank, allerdings packen nicht alle Boards und Memory Controller bei Vollbestückung auch hohe Taktraten.
 
Meines Wissens gibt es gar keine Samsung B-Die 16GB Sticks?
 
Richtig, die 2x 16Gb Sticks mit 3200CL14 und 3600CL16 haben idr B-Die von Samsung drauf und sind DualRanked.

Was man auch noch nehmen kann, wenn man unbedingt DR möchte sind z.b. Kits mit Hynix CJR. Auf Amazon gibts da mit 100% DualRank Garantie z.b. die Kits von "Timetec" - die verwende ich mitunter sehr gerne weil die nen hervorragendes P/L Verhältnis haben, keine unnötigen Heatspreader (wenn man möchte kann man selbst welche verbauen) und auch ganz sicher Hynix CJR drauf sind die gar nicht mal so schlecht gehen.

Habe ich derzeit beim Schwager auf einer Ryzen 3000 Plattform mit 3600 CL16 Timings @1,35V am laufen, ohne Heatspreader in einem DAN A4.
 
Update:

Neben NVIDIA (manuell) konnte ich nun auch sofortige Abstürze mit mit dem MSI Afterbruner und auch dem MSI DragonCenter provozieren. Afterburner während des Betriebes und Dragon Center während der Installation (ähnlich dem Nvidia Treiber). --> WHEA (Ereignis 18) / APIC-ID: 10 und demzufolge natürlich Kernel-Power Ereignis 14

Ansonsten läuft er aber im Idle, bei Spielen oder Benchmarks ( - da war bis jetzt noch absolut nichts.)

Um einen besseren Vergleich zu haben, habe ich einen weiteren 5950x von Alternate geordert ( - sollte Dienstag ankommen). Ist dieser anders/besser im Verhalten oder Leistung geht der andere zurück an die Mindfactory.

Bericht folgt.
 
Ich glaub ich hab die Lösung bei mir gefunden.
Vorher lief mein 5950x mit den 32 GB DDR 3600 mit 1800 FCLK.
Hab jetzt mal auf 3200 mhz also 1600 FCLK gestellt und die WHEA Reboots scheinen weg zu sein.
Hoffe das Agesa Patch D das ganze Problem löst.
Was ich gleich mal probiere ist die VSOC auf 1,1 Volt anzuheben.
 
Vsoc ist bei mir mittlerweile nicht mehr unter 1,125V - mich hatte zuerst die hohe Vsoc unter Autosettings gewundert, da ich beim Ryzen 3700X bei 1,035V war habe ich es entsprechend beim 5600X zu Anfang auf 1,05V gesetzt gehabt... Damit habe ich allerdings diverse USB Fehler bis hin zu Ausfällen derselben (betrifft Soundkarte, Maus und Tastatur, fängt mit laggs derselben an und geht bis hin zu Totalausfall). Jetzt bei 1,125V keinerlei Fehler mehr - Auto geht das Board bis 1,185V hoch.
 
Ich glaub ich hab die Lösung bei mir gefunden.
Vorher lief mein 5950x mit den 32 GB DDR 3600 mit 1800 FCLK.
Hab jetzt mal auf 3200 mhz also 1600 FCLK gestellt und die WHEA Reboots scheinen weg zu sein.
Hoffe das Agesa Patch D das ganze Problem löst.
Was ich gleich mal probiere ist die VSOC auf 1,1 Volt anzuheben.
Das hatte bei mir selbst ohne XMP mit 2666 MHz nicht funktioniert. Mit einer neuen CPU läuft der RAM nun auf 3600 MHz, FCLK mit 1800 MHz und das bei Vollbestückung 4x 32 GB = 128 GB.
Ich drück dir dennoch die Daumen!
 
Zuletzt bearbeitet :
Das hatte bei mir selbst ohne XMP mit 2666 MHz nicht funktioniert. Mit einer neuen CPU läuft der RAM nun auf 3600 MHz, FCLK mit 1800 MHz und das bei Vollbestückung 4x 32 GB = 128 GB.
Ich drück dir dennoch die Daumen!
Auch mit den richtigen Timings? Ich brachte den ja auch mit 3600 Mhz / 1800 zum laufen aber nur mit extrem hohen Timings (22). DOCP Profil = keine Chance. Hoffe da auch mit der zweiten CPU nun einen Direktvergleich zu haben. Fakt ist aber weiter für mich, im Default MUSS alles laufen....ALLES ( - rumdoktorn zur vermeintlichen Stabilität ist grober Unfug).

P.S. Wie schon weiter vorn angedeutet, denke ich eine CPU zu haben, die grenzwertig ist zu eurem Verhalten. Also eig. mit default inkl. RAM alles abkann und nur bei speziellen Dingen wie NVIDIA/MSI (manuell) den Dienst verweigert oder alles was OC ist (weil die CPU eben doch nur mäßig ist).
 
Auch mit den richtigen Timings? Ich brachte den ja auch mit 3600 Mhz / 1800 zum laufen aber nur mit extrem hohen Timings (22). DOCP Profil = keine Chance.
Mit den Timings aus dem XMP/DOCP-Profil: 18-22-22-42

Ich hab diesen RAM:

Ich überlege seit gestern, ob ich auf das gleiche Kit mit 4000 MHz aufrüste. Aber wahrscheinlich macht die CPU das bei Vollbestückung nicht mit.
Momentan ist mit den Ryzen 5000 wohl eh noch nix zu machen über 3800 MHz. So zumindest das Ergebnis meiner Recherche.
 
@Amtswalter - zu dem RAM Thema --> Mehr FPS durch RAM? Was bringen Takt & Latenz in Games? - YouTube - habe auch festgestellt das bessere Timings effektiver sind, zum größten Teil (aus Gamer Sicht). Daher betreib ich meinen G.Skill inzwischen mit 16 / 18 / 18 / 38 bei 3200 Mhz. Als nächstes versuche ich 15 / 15 / 15 / 35 @3200 Mhz

@ All

Ich hab´s gelöst (Nvidia / MSI etc.).......und es war banal. Brauch die zweite CPU nicht mehr ( - jetzt muss ich mich wahrscheinlich bei der Mindfactory entschuldigen^^ ) :-D Jetzt fällt mir nichts mehr ein für einen erfolgreichen Absturz^^

Ich hatte zwar die neuste Bios Version geupdatet - ASUS (3001) - aber die Chipsatztreiber (bzw. alle Boardtreiber) von der mitgelieferten CD (das Board hatte orig. die 2802, Auslieferungszustand). Nun ja, eben mal aus langeweile alle aktuellen Versionen zum Board von der Asus HP installiert ( - LAN, Chipsatz, Sound etc.) und Schwupps........rennt das alles. Gleich dreimal manuell NVIDIA installiert und MSI tools flutschten auch dahin. Dragon Center hab ich nun im Einsatz. So Banal........und das Testergebnis des 3DMark ist sofort 283 Punkte höher (genau 100 entfallen auf die Grafikleistung und 183 auf die CPU Leistung). Und ich habe da eine höhere, zweistellige Testreihe losgelassen über die letzten Tage und heute :-D

P.S. Ich hatte auch irgendwie Zweifel......alles andere ging stundenlang, Idle Betrieb, MEMtest, Cinebench, 3dMark, alle meine Spiele (z.B. BF V gestern 4 Std. - voll aufgedreht, da schwitzt alles), Anwendungen......konnte doch eig. nicht sein, dass nur Nvidia und MSI hängt. Aber was so ein aktueller Treiber (oder vlt. alle zusammen - weiß ich jetzt nicht da nicht einzeln getestet) ausmachen kann^^

Stand:

- Der Rechner läuft stabil mit Bios default in Version 3001 ( - kein OC oder irgendwelche manuellen Einstellungen - einfach out of the box, außer geänderten RAM Einstellungen aber die sind so von mir gewollt), auch unter Windows keinerlei AMD Software im Einsatz zum tunen.
- den neusten (alle) Treiber von der ASUS HP für das Board ROG Strix x570 Gaming-E
- Windows 10 Pro neuste Version mit allen Updates ( - laufen aber auch einige legacy Programme drunter, also das klappt auch)
- Virtualisierung / oracle virtual box mit 6 VM´s (stabil)
- Alles was zur RTX Karte gehört an Software nun völlig ohne Probleme - läuft :)
- WD black sn850 nvme ssd Pcie 4.0x4 --> Software von WD nun auch etwas klickfreudiger, d.h. nach meinem Eindruck stabiler.
- USB Anschlüsse gleichzeitig geflutet (Cam, externe Festplatten, Sticks usw.) - läuft auch stabiler (vorher etwas lahm mit einigen "Hängern")
- RAM siehe oben
 
Zuletzt bearbeitet :
Btw. das beinahe identische i9 10900k System (default) meines Bekannten (Board Serie, RTX Karte, CPU Kühler, RAM/Einstellungen - nur NVME ist eine andere) hat beim 3dMark bei der CPU Leistung 1451 Pkt. weniger als mein 5950x und bei der Grafikleistung sind es 228 Pkt. weniger als bei meinem System. Der i9 geht auf 100 Grad und meiner auf 89 bei dem Bench. Der AMD rennt schon^^ (sag ich als alter INTEL-User.......)
 
Bei mir immer noch das Gleiche. Sporadisch; schwer reproduzierbar. Insgesamt 10x aufgetreten, vom 21.12. bis heute

2x VMware (2 VMs jeweils 4 CPUs beim Windows Update)
7x Cinebench R20 (Single) (hohe Anzahl aufgrund der häufigeren Versuche)
1x Windows Login Screen nach dem Hochfahren (kein Auto-Login bei mir)

A fatal hardware error has occurred.

Reported by component: Processor Core
Error Source: Machine Check Exception
Error Type: Cache Hierarchy Error
Processor APIC ID: 10

Immer APIC ID 10. Gehe vom 11. Kern aus, da die Zählweise wohl bei Null anfängt.
Habe auch versucht, alle Kerne ausser 2 (1 aus CCD 0 und 1 aus CCD 1) mit dem Ryzen Master (andere Zählweise) zu "parken". Dabei habe auch die Kerne um den 11. herum mal geparkt um unterschiedliche Zählweisen auszuschließen. Trotzdem ist es mir nicht gelungen den Fehler absichtlich herbeizuführen. Es scheint also nicht um den Kern im Generellen zu gehen. Es muss ein entsprechendes Lastszenario vorliegen, was die Reproduktion nochmals erschwert.

Beim RAM habe ich auch das andere XMP Profil mal ausprobiert. Ändert aber nichts am Fehlerbild.
 
Status
Nicht offen für weitere Antworten.
Oben Unten