Frage Ryzen 9 5950X crash mit Prozessor-APIC-ID14 / WHEA-Logger 18

Status
Nicht offen für weitere Antworten.

Hellsingexe

Mitglied
Mitglied seit
Nov 20, 2020
Beiträge
35
Bewertungspunkte
12
Punkte
8
AMD Ryzen 9 5950X

Fehlerbild im Windows Event-Log:
Schwerwiegender Hardwarefehler.
Prozessor-APIC-ID: 14

EventLogSystem-Win8.1Pro.PNG

-> Der Fehler tritt zufällig während des Betriebs auf und ist unabhängig von Lastsituation und Temperatur.
-> Der Fehler führt zum sofortigen Crash des Systems.

=====================================================================

Verwendestes System:
Mainboard: ASUS Crosshair VIII Hero (Wi-Fi)
CPU Kühler: Fractal Design S36 Blackout
RAM: G.Skill F4-4000C18Q-128GTRG
GPU: Inno3D iChill Black 2080 Ti
PSU: Bequiet Dark Power Pro 11 1000Watt

Getetstete Mainbaords:
ASUS Crosshair VIII Hero (Wi-Fi) Mit allen verfügbaren BIOS Versionen die Ryzen 5xxx unterstützen:
Version 2311 -> Gleicher Fehler
Version 2402 beta -> Gleicher Fehler
Version 2502 -> Gleicher Fehler
Version 2702 -> Gleicher Fehler

Gigabyte B550 AORUS ELITE (rev. 1.0) Mit allen verfügbaren BIOS Versionen die Ryzen 5xxx unterstützen:
F10 -> Gleicher Fehler
F11i -> Gleicher Fehler
F11k -> Gleicher Fehler

Getestete Varianten:
-BIOS ALLES auf DEFAULT Settings (Jeweils für alle BIOS Versionen des ASUS und Gigabyte Boards)
-Windows 10 Pro 64Bit 20H2
-Windows 10 Pro 64Bit 1909
-Windows 8.1 Pro 64 Bit
-Linux Mint 20
-Ubuntu 20.04

-Windows im Höchleistungsmodus
-Aktuelle AMD Chipsatz Treiber installiert (2.10.13.408)
-LLC auf Level 3, und 4 fixiert
-PBO deaktiviert
-SMT deaktiviert
-DF Cstates auf "Disable" (Global C-state Control)
-GPU Getauscht gegen eine GTX 970 und eine GTX 560Ti -> Gleicher Fehler
-PSU getauscht gegen ein Seasonic Focus Gold 850 Watt -> Gleicher Fehler

Getestete RAM Kits:
G.Skill F4-4000C18Q-128GTRG
4 Riegel mit 3600MHz -> Gleicher Fehler
2 Riegel mit 2666MHz -> Gleicher Fehler
1 Riegel mit 2666MHz -> Gleicher Fehler

G.Skill F4-3600C17Q-64GTZR
4 Riegel mit 3600MHz -> Gleicher Fehler
2 Riegel mit 2133MHz -> Gleicher Fehler
1 Riegel mit 2133MHz -> Gleicher Fehler
1 Riegel mit 2133MHz und 18 / 22 / 22 / 42 Timings -> Gleicher Fehler
 
Zuletzt bearbeitet :
Lösung
Update von mir:
Der neue Austausch 5950X läuft jetzt seit 24 Stunden ohne Probleme
Sowohl unter Last als auch stundenlang im Idle

Hab ihn mal 5 Stunden ohne jegliche Last vor sich hin laufen lassen

-> Update vom 19.12.
CPU läuft nach wie vor Fehlerfrei, Rechner lief testweise 24 Stunden im Idle, 24 Stunden unter Last, 24 Stunden unter Mischlasten

-> Update vom 22.12
CPU läuft weitere 72 Stunden absolut fehlerfrei, egal welche Last und welches Verhalten

Keinerlei Fehler im Eventlog, problemloser Startvorgang

RAM Profil ist das XMP der neuen G.Skill Royal:
14 / 15 / 15 / 35 bei 1,45Volt und 3600MHz DRAM / 1800MHz FCLK

BIOS Version vom Crosshair VIII:
3003 mit AMD AM4 AGESA V2 PI 1.1.0.0 Patch C

-> Würde an der Stelle mal ganz frech...
Das alles bringt nix wenn Curve Optimizer All-Core nicht auf +7 steht?!
Wo stehst denn alles Ein?
 
Das alles bringt nix wenn Curve Optimizer All-Core nicht auf +7 steht?!
Wo stehst denn alles Ein?
Ja genau. Ich kann keinen Unterschied erkennen zwischen PBO deaktiviert und PBO manuell mit PPT 142W, TDC 95A, EDC 140A, 1x scalar, 0MHz offset, Thermal Limit default, und Curve Optimizer deaktiviert. Ich vermute auch, dass da kein (wesentlicher) Unterschied besteht.

Wenn ich dann den Curve Optimizer All-Core Stufe um Stufe erhöhe, merkt man deutlich, wie das System mit jeder Stufe stabiler wird (+0 führt innerhalb von wenigen Minuten garantiert zum Crash, +3 dauert schon 15-45 Minuten bis zum Crash, +5 mehrere Stunden, +7 ist bis jetzt noch nie gecrasht.)
 
Vielleicht kannst Du ja mal mein Skript oben mit Cinebench R20 laufen lassen und sehen, ob er das 2-3 Stunden überlebt. Wenn ja, dann gibt es Hoffnung, dass das bei Dir wirklich ausreicht. Allerdings ist es völlig absurd C-States zu deaktivieren nur um zu verhindern, dass CPB zu hoch boostet.

Gute Idee mit dem Skript und vielen Dank dafür (y)
Werde ich morgen damit mal testen.
 
Zu früh gefreut.......alles fertig und der Reboot kommt mit dem Nvidia Treiber bzw. dessen Installation :-( Mindfactory.........werde morgen gleich mal das Gold Level ausnutzen. Einstellungen sind alle default und das neuste Bios (3003) is drauf.
 
Ja genau. Ich kann keinen Unterschied erkennen zwischen PBO deaktiviert und PBO manuell mit PPT 142W, TDC 95A, EDC 140A, 1x scalar, 0MHz offset, Thermal Limit default, und Curve Optimizer deaktiviert. Ich vermute auch, dass da kein (wesentlicher) Unterschied besteht.

Wenn ich dann den Curve Optimizer All-Core Stufe um Stufe erhöhe, merkt man deutlich, wie das System mit jeder Stufe stabiler wird (+0 führt innerhalb von wenigen Minuten garantiert zum Crash, +3 dauert schon 15-45 Minuten bis zum Crash, +5 mehrere Stunden, +7 ist bis jetzt noch nie gecrasht.)
Aber wo stellst es ein,hier oder bei Erweitert....?
 
Aber wo stellst es ein,hier oder bei Erweitert....?
Beim meinem MSI B550 Tomahawk (auf 7C91vA51 beta, AGESA 1.1.0.0) ist das unter Settings->Advanced->AMD Overclocking->Precision Boost Overdrive->Curve Optimizer. Hier ein Bild von videocardz.com:
MSI-Curve-Optimizer-5900X-B450-Tomahawk-1.jpg
 
Du musst in den AMD OC Bereich, nur dort ist der Curved.
 
Bei +7 boostet der schnellste Core im Cinebench20 Single-Core jetzt nur noch auf 4.9GHz (vorher bis zu 5.1GHz)

Das dürfte auch das Problem sein. Bei wenig Last ("idle") bringt die kleinste Aktivität die Kerne voll zum Boosten, und nicht jede CPU dürfte diese hohen Takte auch tatsächlich verkraften. Beschränkt man den Boost künstlich durch diverse BIOS Einstellungen, wird die CPU (fast) stabil. Am Einfachsten ist das natürlich über deaktivieren des Core Precision Boost, aber dann ist die CPU eine lahme Ente. Eleganter ist es da, die Leistung manuell über den Multi festzulegen - damit kann man die Multicore-Leistung zumindest erhalten (oder sogar leicht steigern), beschränkt aber die Singlecore-Leistung drastisch.

Nach fast 2 Wochen herumbastelei bin ich aber der Meinung, dass letztendlich nur ein Tausch der CPU hilft. Falls da überhaupt ein BIOS-Update kommt, dann nur eines, das die Leistung eben von vornherein schon auf "sichere" Levels beschränken wird. Aber wer will das, bei CPUs die auf der Straße derzeit 900 Euro aufwärts kosten?

Ich habe auch noch nicht gehört, dass jemand eine solche zickige CPU auf einen FCLK über 1800 gebracht hat - was ja auch schade ist, denn laut AMD sollte 1900 der neue Standard sein, und mit Glück selbst 2000MHz erreichbar sein. Natürlich kann man sagen, dass einen das nicht tangiert, weil man ohnehin nur langsamen RAM verbaut hat - aber dann sind wir wieder bei der 900 Euro CPU, die halt schon das liefern soll, was der Hersteller verspricht.
 
Nach fast 2 Wochen herumbastelei bin ich aber der Meinung, dass letztendlich nur ein Tausch der CPU hilft. Falls da überhaupt ein BIOS-Update kommt, dann nur eines, das die Leistung eben von vornherein schon auf "sichere" Levels beschränken wird. Aber wer will das, bei CPUs die auf der Straße derzeit 900 Euro aufwärts kosten?
Sehe ich ganz genauso. Es ist eine Frechheit ohnegleichen, insbesondere, da es so häufig auftritt.
 
So, noch mal ein Update von mir. Inzwischen läuft er.

Was hat geholfen --> Es musste tatsächlich die brandaktuelle Windows 10 Pro Version her ( - sonst Treiberfehler bzw. standhafte Weigerung der Installation - teilweise mit falscher Windowsversion quittiert, aber nur auf diesem System), dann zunächst alle Asus und Windowsupdates, danach den NVIDIA Geforce Experience drauf und automatisch suchen/installieren lassen ( - das ging am Anfang auch nicht mit der älteren Windows Pro 10 Version). Manuell geht´s nach wie vor nicht ( - warum auch immer).......

Hab nun grad den aktuellen 3D Mark durchlaufen lassen, System/Graka auf Stock bzw. default mit RAM @3600 Mhz ergibt im Standardtest immerhin 17489 Punkte ( - das i9 10900er System mit gleicher Graka/RAM vom Bekannten macht hier 16 513 Punkte). Stellenweise laufen Kerne mit 5 Ghz laut Protokoll. Jetzt lade ich erstmal die ganzen Spiele und dann geht´s weiter. Rechner läuft jetzt seit paar Stunden und bis auf die Nvidia Sache gab´s keine Probleme/Neustarts/Abstürze. Aber der Rechner ist auch noch jung^^ :-D (im Eventlog tummelt sich aber ein WHEA APIC-ID 10 - fällt zeitlich auf die NVIDIA Geschichte)

P.S. Aufgrund der Leistung sehe ich hier aber so gar keine Notwendigkeit irgendwelche Einstellungen vorzunehmen ( - es sind auch keine AMD Tools installiert) um am Ende 5 FPS mehr rauszukitzeln. Default rennt der Kamerad eigentlich TOP (aus Gamersicht)!

System:

Noctua NH-U12A
RYZEN 9 5950X
Asus ROG STRIX X570-E-Gaming
G.Skill 2x 16 GB 3600 Mhz (F4-3600C17D-32GTZ)
WD_BLACK SN850 1 TB NVMe SSD PCIe 4.0
MSI RTX 3080 Suprim X
Netzteil Corsair 1000w ( - muss noch getauscht werden.......)
 
Zuletzt bearbeitet :
Nach fast 2 Wochen herumbastelei bin ich aber der Meinung, dass letztendlich nur ein Tausch der CPU hilft. Falls da überhaupt ein BIOS-Update kommt, dann nur eines, das die Leistung eben von vornherein schon auf "sichere" Levels beschränken wird. Aber wer will das, bei CPUs die auf der Straße derzeit 900 Euro aufwärts kosten?

Ich habe auch noch nicht gehört, dass jemand eine solche zickige CPU auf einen FCLK über 1800 gebracht hat - was ja auch schade ist, denn laut AMD sollte 1900 der neue Standard sein, und mit Glück selbst 2000MHz erreichbar sein. Natürlich kann man sagen, dass einen das nicht tangiert, weil man ohnehin nur langsamen RAM verbaut hat - aber dann sind wir wieder bei der 900 Euro CPU, die halt schon das liefern soll, was der Hersteller verspricht.

Ja so ist es. Wahnsinn wie viele Leute da auf ein neues Bios etc. warten. Wird nichts bringen. Die Anzahl solcher CPUs ist schon besorgniserregend.
Und dann soll AMD das ganze in der Presse nicht unterdrücken? Niemand berichtet offiziell darüber :) Es gibt keine Probleme :)

Noch schlimmer die Leute die dazwischen schreiben "jetzt hab ichs", "glaub es geht jetzt".. BLABLA. Das Problem wurde höchstens umgangen, die CPU bleibt trotzdem "defekt".. wieso kapieren die das nicht.
 
Ich bin auch der Meinung, dass ein Prozessortausch / Systemaufbau mit einem Chipsatz, der seit eineinhalb Jahren auf dem Markt ist, sowie einer CPU in der zwischenzeitlich 3. Iteration, ein Selbstläufer sein sollte, insbesondere, wenn man sich die dafür aufgerufenen Preise anschaut. Aber je länger ich in dem Fred lese umso mehr muss ich mir bei meinem System wie vom Herrn gesalbt vorkommen.
Deckel auf 3950 raus, 5950 rein, nochmal 64 GB dazu gesteckt, Wakü wieder drauf, einschalten und fertig.
Das hatte ich bislang als normal angenommen - ist aber wohl nicht so.
 
Ich bin auch der Meinung, dass ein Prozessortausch / Systemaufbau mit einem Chipsatz, der seit eineinhalb Jahren auf dem Markt ist, sowie einer CPU in der zwischenzeitlich 3. Iteration, ein Selbstläufer sein sollte, insbesondere, wenn man sich die dafür aufgerufenen Preise anschaut. Aber je länger ich in dem Fred lese umso mehr muss ich mir bei meinem System wie vom Herrn gesalbt vorkommen.
Deckel auf 3950 raus, 5950 rein, nochmal 64 GB dazu gesteckt, Wakü wieder drauf, einschalten und fertig.
Das hatte ich bislang als normal angenommen - ist aber wohl nicht so.
hallo Alkbert
könntest du vielleich noch etwas mehr über dein system und im speziellen die BIOSversion berichten?
läuft es im idle wie auch unter (spiele-)last stabil?
danke
 
Die meisten laufen doch auch wie sie sollen... Kp was hier einzelne reindichten.

Gigabyte haut neue Firmware raus;

"Update AMD AGESA ComboV2 1.1.0.0 D
Performance optimized on Ryzen 5000 series processors
Add Re-size bar option for AMD Smart Access Memory support
Improve connection stability for USB 2.0 ports of USB hub
Improve system stability"

Keine Probleme mehr in meinen Fällen mit entsprechenden Boards - bleibt ein realer Problemfall aus 7. Wow....
 
hallo Alkbert
könntest du vielleich noch etwas mehr über dein system und im speziellen die BIOSversion berichten?
läuft es im idle wie auch unter (spiele-)last stabil?
danke

- AsRock x570 Extreme 4 (Bios 3.31)
- 128 GB Mushkin redline 3600 (läuft aber auf 3200, 18 22-22-42, und JAAA es gibt Schnelleres)
- AMD 5950x (Enermax Aquafusion 240)
- ASUS TUF OC 2080 (die "Ur-Version")
- 3x HDD (2x 3GB und 1x 4 GB)
- 2x NVME (Intel 600er mit 2 TB und (Windows) Corsair force mp 500 mit 1 TB
- 1x SATA SSD mit 1 TB (Crucial BX 500)
- Netzteil (unter Vorbehalt, sitze gerade an der Bürokiste) Be Quiet BN295 Pure 11
- Gehäuse ist ein Enermax Ostrog
- Soundblaster Z (PCIe) - ich liebe dieses Ding !
- Philips BDM4350 UC, 4K
- Maus Razer Naga left Handed und Creative Vanguard K08

ansonsten hängen noch Scanner (HP, via VUE Scan) , Drucker (Brother, Canon Pixma), Fingerprint (Windows Hello, Elan), die Valve Index und sonst noch Zeugs dran.
Also das Ding ist vollgestopft und hätte allen Grund für Kompatibilitätsprobleme.

Windows 10 pro H2 mit allen Updates drauf.
Musste die AsRock Utilities (musste den OC Tuner neu installieren, lief nicht mehr nach dem Prozessor / Bios Update)
Last ist egal, Benchmark (Firestrike usw, Rendern (Pinnacle und Magix Studio), Office, nix machen und einfach eingeschaltet stehenlassen) da hängt nix, da stürzt nix ab und läßt sich auch problemlos aus dem Energiesparmodus aufwecken.

Achso, weil das ein Thema war: HWInfo macht bei mir keine Crashs, lasse ich gelegentlich mitlaufen um GPU und CPU Temperatur sowie die SB Temperatur zu loggen. Der Chipsatz wird bei mir zwischen 65 und 75 °C heiß
 
Nachtrag:

Ich habe letzte Nacht ein bischen rumgestochert, umherauszufinden was mein 5950x bzw. System eig. so genau nicht mag.

Ergebnis --> RAM

Stellt man alles auf Default (also RAM 3200 Mhz) läuft er mit den vorgegeben Timings Hersteller bzw. auch etwas schärfer ( - in jedem Betriebszustand). Stellt man ihn auf 3600 Mhz ( - seine bis zu Angabe) geht das nur wenn man die CAS Latenz von 17 auf 22 setzt ( - und es hängt nur an diesem einen Wert). Geht man mit DOCP (CAS 17) ran, kommen willkürliche Abstürze sobald Last entsteht (no way).

Jetzt ist er im Idle seit drei Stunden, mit RAM Manuell bei 3200 Mhz und CAS 17, da ist alles in Ordnung. In der Nacht beim spielen bzw. unter hoher Last ist es bei diesem Wert auch ok. Das Ganze funktioniert auch bei 3600 Mhz (manuell eingestellt) aber dann eben nur mit CAS 22!

Schon interessant. Zumindest läuft das System innherhalb seiner Spezifikationen/Angaben.

P.S. Der oben erwähnte Intel i9 10900k des Bekannten läuft inzwischen auch nur mit RAM-Takt 2933 Mhz ( - als nächstes wird aber wieder 3200 probiert), da sonst weder iRacing noch Assetto Corsa Competizione laufen ( - stürzen sonst nach ner Weile ab, bei Ram Takt 3600 Mhz ( - der Ram ist jedoch mit 4200 Mhz spezifiziert)). Der Intel tut sich nicht so schwer mit Abstürzen im Windows-/Desktopbetrieb (bei 3600 Mhz) aber sobald es dann an die Spiele geht --> Feierabend (mit den hohen RAM Einstellungen). Übrigens geht auch da kein XMP Profil.......da ist sofort Ruhe.......da geht er gleich wieder ins Bios oder Windows schmiert direkt ab. Tja......
 
Hatte früher fast nur Mushkin Speicher, die Marke ist aber irgendwie etwas aus der Mode gekommen (sind Hynix Chips drauf, soweit ich weiß)
 
Status
Nicht offen für weitere Antworten.
Oben Unten