Frage Ryzen 9 5950X crash mit Prozessor-APIC-ID14 / WHEA-Logger 18

Status
Nicht offen für weitere Antworten.

Hellsingexe

Mitglied
Mitglied seit
Nov 20, 2020
Beiträge
35
Bewertungspunkte
12
Punkte
8
AMD Ryzen 9 5950X

Fehlerbild im Windows Event-Log:
Schwerwiegender Hardwarefehler.
Prozessor-APIC-ID: 14

EventLogSystem-Win8.1Pro.PNG

-> Der Fehler tritt zufällig während des Betriebs auf und ist unabhängig von Lastsituation und Temperatur.
-> Der Fehler führt zum sofortigen Crash des Systems.

=====================================================================

Verwendestes System:
Mainboard: ASUS Crosshair VIII Hero (Wi-Fi)
CPU Kühler: Fractal Design S36 Blackout
RAM: G.Skill F4-4000C18Q-128GTRG
GPU: Inno3D iChill Black 2080 Ti
PSU: Bequiet Dark Power Pro 11 1000Watt

Getetstete Mainbaords:
ASUS Crosshair VIII Hero (Wi-Fi) Mit allen verfügbaren BIOS Versionen die Ryzen 5xxx unterstützen:
Version 2311 -> Gleicher Fehler
Version 2402 beta -> Gleicher Fehler
Version 2502 -> Gleicher Fehler
Version 2702 -> Gleicher Fehler

Gigabyte B550 AORUS ELITE (rev. 1.0) Mit allen verfügbaren BIOS Versionen die Ryzen 5xxx unterstützen:
F10 -> Gleicher Fehler
F11i -> Gleicher Fehler
F11k -> Gleicher Fehler

Getestete Varianten:
-BIOS ALLES auf DEFAULT Settings (Jeweils für alle BIOS Versionen des ASUS und Gigabyte Boards)
-Windows 10 Pro 64Bit 20H2
-Windows 10 Pro 64Bit 1909
-Windows 8.1 Pro 64 Bit
-Linux Mint 20
-Ubuntu 20.04

-Windows im Höchleistungsmodus
-Aktuelle AMD Chipsatz Treiber installiert (2.10.13.408)
-LLC auf Level 3, und 4 fixiert
-PBO deaktiviert
-SMT deaktiviert
-DF Cstates auf "Disable" (Global C-state Control)
-GPU Getauscht gegen eine GTX 970 und eine GTX 560Ti -> Gleicher Fehler
-PSU getauscht gegen ein Seasonic Focus Gold 850 Watt -> Gleicher Fehler

Getestete RAM Kits:
G.Skill F4-4000C18Q-128GTRG
4 Riegel mit 3600MHz -> Gleicher Fehler
2 Riegel mit 2666MHz -> Gleicher Fehler
1 Riegel mit 2666MHz -> Gleicher Fehler

G.Skill F4-3600C17Q-64GTZR
4 Riegel mit 3600MHz -> Gleicher Fehler
2 Riegel mit 2133MHz -> Gleicher Fehler
1 Riegel mit 2133MHz -> Gleicher Fehler
1 Riegel mit 2133MHz und 18 / 22 / 22 / 42 Timings -> Gleicher Fehler
 
Zuletzt bearbeitet :
Lösung
Update von mir:
Der neue Austausch 5950X läuft jetzt seit 24 Stunden ohne Probleme
Sowohl unter Last als auch stundenlang im Idle

Hab ihn mal 5 Stunden ohne jegliche Last vor sich hin laufen lassen

-> Update vom 19.12.
CPU läuft nach wie vor Fehlerfrei, Rechner lief testweise 24 Stunden im Idle, 24 Stunden unter Last, 24 Stunden unter Mischlasten

-> Update vom 22.12
CPU läuft weitere 72 Stunden absolut fehlerfrei, egal welche Last und welches Verhalten

Keinerlei Fehler im Eventlog, problemloser Startvorgang

RAM Profil ist das XMP der neuen G.Skill Royal:
14 / 15 / 15 / 35 bei 1,45Volt und 3600MHz DRAM / 1800MHz FCLK

BIOS Version vom Crosshair VIII:
3003 mit AMD AM4 AGESA V2 PI 1.1.0.0 Patch C

-> Würde an der Stelle mal ganz frech...
@Dark_Knight: es gibt eine mittlerweile doch mehrfach erprobte Lösung: CPU tauschen.

Klar, wir basteln alle gerne an unseren Systemen rum, und letztendlich wird da ja auch der persönliche Ehrgeiz geweckt, so eine zickige CPU doch noch irgendwie stabil zu bekommen.
Aber die traurige Wahrheit ist: es ist kein Thema des AGESA, und kein Thema des BIOS, auch keines von Treibern oder RAM Riegeln - steckt man nämlich eine andere CPU ins System, läuft plötzlich alles "out of the box", genau so wie es sein soll.
Das war bei mir so, und das war bei einigen anderen hier im Thread so.

Mag sein, dass AMD und die Boardhersteller sich noch was einfallen lassen, um auch diese Gurken mit Tricks irgendwie stabil zu bekommen, wenn der RMA-Druck zu groß wird. Das ändert aber nichts daran, dass heute schon die Mehrzahl der Zen 3 Prozessoren absolut problemlos läuft, und jene Modelle, die das nicht tun, eben Gurken sind, mit denen man sich nicht unnötig herumärgern sollte. Es sind ja hauptsächlich 5900X und 5950X betroffen, seltener auch 5800X, und da reden wir ja von Straßenpreisen die derzeit bis zu 1000 Euro raufgehen. Da will man keine CPU dritter Wahl, die "out of the box" nicht stabil läuft.
Auch jemand, der Spaß daran hat, wochenlang an Timings, Spannungen und sonstigen Einstellungen zu tüfteln, hätte mit einer ordentlichen CPU mehr Freude - die dann nämlich schön übertaktet und optimiert laufen würde, und nicht gerade mal irgendwie ein paar Stunden nicht abstürzt.

Im Übrigen gibt es mittlerweile das vierte(!) AGESA für Zen 3, und zwei zwischenzeitliche Patches. Da muß man schon sehr optimistisch sein, wenn man glaubt, dass da mit dem nächsten AGESA dann endlich alles gut wird. AMD hätte da mittlerweile viel Zeit und Gelegenheit gehabt, die Probleme anzugehen.
 
Vor allem braucht man, wenn man denn wollen würde.. und in der Glaskugel einen Zen3-Refresh oder ähnliches noch kommen sieht. DIESE aktuellen CPUS niemandem gebraucht verkaufen, weil man nur Stress und Scherereien damit hat...
Sorry, aber auch nach einer weiteren Nacht darüber schlafens, bleibt bei mir nur Enttäuschung!
Wenn die Austusch-CPU heute auch nicht läuft geht die in Storno und ich besorg mir die eine 3900XT die dürften stabiler vorselektiert sein.
Wie soll sich denn so eine CPU, die dann heute vielleicht doch zufällig mal out-of-the-box läuft über die Zeit verhalten? Läuft die in nem Jahr noch? Auch wenn Alterungs-&Verschleißerscheinungen eigentlich kein Problem bei einer CPU sind, obgleich sie vorhanden sind, aber wenn die so sehr auf Kante gestrickt sind? Vertrauen will da bei mir grad keins mehr aufkommen...
 
Also bei mir lief der RAM mit Stock Settings bei seinem nativen Takt 2100Mhz out of the Box stabil. Die Probleme waren erst mit dem XMP Profil bei 3600Mhz aufgetreten. Bei mir(!) ist jetzt die Lösung, nur einen Spannungswert anzuheben, damit läuft der PC mit vollem RAM Takt jetzt seit 48h stabil.
Ehrlich gesagt, weiß ich nicht, ob ich mir jetzt noch den Stress mit einer RMA antun soll. Ich habe ein relativ kleines verbautes Gehäuse, wo ich für einen CPU Tausch wirklich alles auseinander nehmen muss. Das kostet mich hin und zurück bestimmt 2 Tage Arbeit. Und Erfahrung mit Ausbau von CPUs habe ich keine. Wüsste nicht mal wie ich die Wärmeleitpaste sauber wieder abbekomme... und wenn ich dabei einen Pin verbiege ist es sowieso aus.

Mich nervt grade viel mehr, dass es wohl irgendeine Inkompatiblität zwischen Ryzen und Nvidia gibt, die meinen Grafikkartentreiber beim Aufwachen aus S3 Abstürzen lässt. Das Thema scheint aber länger bekannt zu sein:
 
Der Widerruf der zweiten CPU bei Mindfactory ist jetzt auch durch. Damit habe ich mein Geld für die beiden problematischen CPUs zurück. Jetzt kann ich mich uneingeschränkt den schönen Dingen des neuen PCs widmen.
 
Was für ne Kante?Wenn keine Dumpfbacken an der CPU rumpfuschen dann kann die gar nicht Abstürzen weil sie sich selber Regelt,erst wenn irgend ein anderer Müll dazwischen funkt passiert das.

???

Also ich habe in meiner Kiste lediglich die CPU von 3700X auf 5900X upgegraded. BIOS F31o war vorher schon drauf und lief stabil mit 3700X...
Also:
CPU Tausch -> CMOS-CLR -> "Load optimized defaults" -> Boot Windows 10 -> Probleme!
Dann habe ich weil ich Treiber & Energiesparpläne nunmal nicht ausschließen konnte/wollte schließlich sogar Windows 10 neu installiert.
--> Probleme.

Habe wenig Interesse im BIOS rumzukurbeln um irgendwas zu erreichen, was per default laufen sollte...

Weiß also grad nicht was mit dazwischenpfuschen gemeint sein soll?

Ein AORUS ULTRA X570 ist sicher kein Gurken-Board....
ein BeQuiet 850W StraightPower 11 ist sicher kein Gurken-Netzteil....
32GB G.Skill 3200Cl14 Samsung B-Die ist sicher kein Gurken RAM (Probleme hab ich selbst mit JEDEC 2133MHz)

Mittlerweile alles an BIOS durchprobiert was angeboten wird... F30, F31o, F31q....
 
32GB G.Skill 3200Cl14 Samsung B-Die ist sicher kein Gurken RAM (Probleme hab ich selbst mit JEDEC 2133MHz)

Trident Z RGB ?

Genau mit diesem RAM hatte ich auf meinem Crosshair auch Probleme. Komischerweise erst mit Ryzen 5xxx.
Hab das Trident Neo 2 x 16 GB 3600 mhz gekauft und der lief dann.
Zuvor hatte ich sogar mit 2133 mhz unter OCCT fehler.

Mein 5950x läuft mit SoC Voltage @ 1,1 Volt jetzt stabil. Keine WHEA und keine Neustarts mehr.
FCLK @ 1800 mhz und RAM @ 3600.

Hab sogar den FCLK und den Speicher probehalber auf 1900 mhz und 3800 mhz RAM bekommen.
 
@Riplex kein Problem, kann auch noch auf ein Micron Kit umbauen und testen... verspreche mir davon aber nichts. Zumal sich Spielereien mit dem RAM zumindest bisher bei Ryzen 3700X und 2700X nicht mit WHEA ID18 Prozessorfehler gemeldet haben...
Aber man hangelt sich ja von Strohhalm zu Strohhalm.....
 
???

Also ich habe in meiner Kiste lediglich die CPU von 3700X auf 5900X upgegraded. BIOS F31o war vorher schon drauf und lief stabil mit 3700X...
Also:
CPU Tausch -> CMOS-CLR -> "Load optimized defaults" -> Boot Windows 10 -> Probleme!
Dann habe ich weil ich Treiber & Energiesparpläne nunmal nicht ausschließen konnte/wollte schließlich sogar Windows 10 neu installiert.
--> Probleme.

Habe wenig Interesse im BIOS rumzukurbeln um irgendwas zu erreichen, was per default laufen sollte...

Weiß also grad nicht was mit dazwischenpfuschen gemeint sein soll?

Ein AORUS ULTRA X570 ist sicher kein Gurken-Board....
ein BeQuiet 850W StraightPower 11 ist sicher kein Gurken-Netzteil....
32GB G.Skill 3200Cl14 Samsung B-Die ist sicher kein Gurken RAM (Probleme hab ich selbst mit JEDEC 2133MHz)

Mittlerweile alles an BIOS durchprobiert was angeboten wird... F30, F31o, F31q....
Nicht erreichter Turbo bei Ryzen 3000 ist bekannt?
Seit dem das rausbekommen ist wurd es immer schlimmer und nicht besser,deswegen hab ich auch noch ein Bios von anfang des Jahres drauf,jeder hat dran rum gepfuscht nur weil die Honks kein Plan hatten wie Ryzen 3000 funktioniert und mit den 5000er ist es nicht anders,damit die Honks sich nicht wieder in die Buxe Pinkeln wurd einiges an der CPU geändert was vom Mainboard, Bios ,Windows......erst mal wieder umgesetzt werden muss.
 
@Casi030 Achso... ja das ist bekannt... hatte da wohl nur ein kleineres Interpretationsproblem bei deinem Post... Unterkoffeeiniert und so...
 
Ich hab nun ebenfalls die Spannung vom Ram auf 1.350v bei 3200mhz fix gesetzt und seitdem keine Neustarts/BS mehr.
 
Ich hab nun ebenfalls die Spannung vom Ram auf 1.350v bei 3200mhz fix gesetzt und seitdem keine Neustarts/BS mehr.
Nur zur Klarstellung, bitte nicht die SoC Voltage auf 1,350 V setzen! Das ist viel zu hoch. Du hast irgendeine andere Spannung vom Ram geändert, die bei mir über das JEDEC oder XMP Profil automatisch gesetzt wird.

Du hast vermutlich diese Spannung geändert:
1609245392918.png

Ich habe aber diese Spannung im BIOS geändert:
1609245505305.png
 
Zuletzt bearbeitet :
Nur zur Klarstellung, bitte nicht die SoC Voltage auf 1,350 V setzen! Das ist viel zu hoch. Du hast irgendeine andere Spannung vom Ram geändert, die bei mir über das JEDEC oder XMP Profil automatisch gesetzt wird.
Also ich hab den Wert eingestellt, den das Bios auch ändert, wenn man das XMP Profil aktiviert. Ich hab die Werte halt nur händisch eingestellt.
 
Also ich hab den Wert eingestellt, den das Bios auch ändert, wenn man das XMP Profil aktiviert. Ich hab die Werte halt nur händisch eingestellt.
Ja hier wurde aber über die SoC Voltge gesprochen. Wollte nur sichergehen, dass niemand deinen Beitrag liest und die SoC Voltage auf 1,35 stellt. Das geht sonst schief.
 
Kurze Rückmeldung von mir:

Tausch-CPU heute eingetroffen und nach ersten Test läuft die Kiste nun mit den nach BIOS-Reset geladenen "optimized defaults" nun ohne Mucken zu machen... muss man allerdings etwas länger im Auge haben denke ich, um da abschließend was sagen zu können.

ABER: Die "alte" 5900Xer CPU hat das ja schon nicht mitgemacht ohne sich mit BS abzumelden...
 
Kurze Rückmeldung von mir:

Tausch-CPU heute eingetroffen und nach ersten Test läuft die Kiste nun mit den nach BIOS-Reset geladenen "optimized defaults" nun ohne Mucken zu machen... muss man allerdings etwas länger im Auge haben denke ich, um da abschließend was sagen zu können.

ABER: Die "alte" 5900Xer CPU hat das ja schon nicht mitgemacht ohne sich mit BS abzumelden...
Dann mal zurück mit der alten CPU. Und erfreue dich an der Neuen und ihrer puren Power!
 
Kurze Rückmeldung von mir:

Tausch-CPU heute eingetroffen und nach ersten Test läuft die Kiste nun mit den nach BIOS-Reset geladenen "optimized defaults" nun ohne Mucken zu machen... muss man allerdings etwas länger im Auge haben denke ich, um da abschließend was sagen zu können.

ABER: Die "alte" 5900Xer CPU hat das ja schon nicht mitgemacht ohne sich mit BS abzumelden...
Wie sind denn Deine Temps?
Meine liegen mit einer 360er AIO im Idle bei 36 bis 45°C. Aber unter Last auch gerne mal mit über 90°C Spikes. Generell beim Rendern im Mittel bei 85°C.
AIO mehrmals auf korrekten Sitz überprüft. WLP getauscht, andere AIO benutzt. Keine Änderung.
Ich frage desshalb, ob die hohen Temps evtl. auch schon auf eine defekte CPU schliessen lassen könnten?
Sorry für die Noob Frage.
 
@Amtswalter "Pure Power" ist gut... kann am BIOS update von F31o (Ryzen 3700X) nach F31q(Ryzen5900X) liegen, aber gefühlt läuft Cyberpunkt im sonst identischen System ruckeliger... laggt irgendwie... Der Rest passt!

@Taco Zu den Temps kann ich noch nicht allzuviel sagen... Frische WLP drauf (Kryonaut) Custom Wakü... und irgendwas im Desktop lässt den grad rattern.. 58...65W Package Power recht konstant... da bleibt die Core Tctl bei ~62°C Prime vorhin 10 Minuten laufen lassen da wir die Tctl auf beiden CCD 64°C bzw. 66°C
Cyperpunkt werde ich nacher mal Spielen.. das hat bei der "alten" 5900Xer die Tctl auch auf ~85°C gebracht... recht konstant sogar... Wassertemp dabei dann 40..42°C.
So im Desktop idle... wenn sich alles bisschen beruhigt hab ich 42°C Tctl....
Was ich aber bei der "alten" CPU bemerkt habe, ist das die BIOS Versionen da einen erheblichen Einfluß hatten... bei F31o hatte ich auch höhere Temps... habe auch insgesamt die "alte" CPU 2x aus und eingebaut und mehrfach den Waterblock neu montiert weil mir die Temps. auch unplausibel erschienen. Aber die "alte" hatte ich dann auch mit F31q am laufen, da war das schon eher im Rahmen...

zwischendurch immer brav "load optimized defaults"...
 
Zuletzt bearbeitet von einem Moderator :
Je nachdem wo die Lüfter der AiO sitzen ist es auch kein Wunder das die Temps beim zocken hochschnellen.

Der ganze Abwärme der Graka zieht durch die Lüfter der AiO. Deswegen empfehle ich die Lüfter und den Radi in
die Front des Gehäuses zu montieren so das die immer kalte Luft ansaugen.
 
@Amtswalter "Pure Power" ist gut... kann am BIOS update von F31o (Ryzen 3700X) nach F31q(Ryzen5900X) liegen, aber gefühlt läuft Cyberpunkt im sonst identischen System ruckeliger... laggt irgendwie... Der Rest passt!
Hatte ich da nicht etwas gelesen, dass Cyberpunk ein Problem mit den vielen Kernen der Ryzen hat bzw. nicht mit denen umgehen kann? Du hast durch dein Upgrade ja ein paar Kerne dazugekommen.
 
Status
Nicht offen für weitere Antworten.
Oben Unten