Frage Ryzen 9 5950X crash mit Prozessor-APIC-ID14 / WHEA-Logger 18

Status
Nicht offen für weitere Antworten.

Hellsingexe

Mitglied
Mitglied seit
Nov 20, 2020
Beiträge
35
Bewertungspunkte
12
Punkte
8
AMD Ryzen 9 5950X

Fehlerbild im Windows Event-Log:
Schwerwiegender Hardwarefehler.
Prozessor-APIC-ID: 14

EventLogSystem-Win8.1Pro.PNG

-> Der Fehler tritt zufällig während des Betriebs auf und ist unabhängig von Lastsituation und Temperatur.
-> Der Fehler führt zum sofortigen Crash des Systems.

=====================================================================

Verwendestes System:
Mainboard: ASUS Crosshair VIII Hero (Wi-Fi)
CPU Kühler: Fractal Design S36 Blackout
RAM: G.Skill F4-4000C18Q-128GTRG
GPU: Inno3D iChill Black 2080 Ti
PSU: Bequiet Dark Power Pro 11 1000Watt

Getetstete Mainbaords:
ASUS Crosshair VIII Hero (Wi-Fi) Mit allen verfügbaren BIOS Versionen die Ryzen 5xxx unterstützen:
Version 2311 -> Gleicher Fehler
Version 2402 beta -> Gleicher Fehler
Version 2502 -> Gleicher Fehler
Version 2702 -> Gleicher Fehler

Gigabyte B550 AORUS ELITE (rev. 1.0) Mit allen verfügbaren BIOS Versionen die Ryzen 5xxx unterstützen:
F10 -> Gleicher Fehler
F11i -> Gleicher Fehler
F11k -> Gleicher Fehler

Getestete Varianten:
-BIOS ALLES auf DEFAULT Settings (Jeweils für alle BIOS Versionen des ASUS und Gigabyte Boards)
-Windows 10 Pro 64Bit 20H2
-Windows 10 Pro 64Bit 1909
-Windows 8.1 Pro 64 Bit
-Linux Mint 20
-Ubuntu 20.04

-Windows im Höchleistungsmodus
-Aktuelle AMD Chipsatz Treiber installiert (2.10.13.408)
-LLC auf Level 3, und 4 fixiert
-PBO deaktiviert
-SMT deaktiviert
-DF Cstates auf "Disable" (Global C-state Control)
-GPU Getauscht gegen eine GTX 970 und eine GTX 560Ti -> Gleicher Fehler
-PSU getauscht gegen ein Seasonic Focus Gold 850 Watt -> Gleicher Fehler

Getestete RAM Kits:
G.Skill F4-4000C18Q-128GTRG
4 Riegel mit 3600MHz -> Gleicher Fehler
2 Riegel mit 2666MHz -> Gleicher Fehler
1 Riegel mit 2666MHz -> Gleicher Fehler

G.Skill F4-3600C17Q-64GTZR
4 Riegel mit 3600MHz -> Gleicher Fehler
2 Riegel mit 2133MHz -> Gleicher Fehler
1 Riegel mit 2133MHz -> Gleicher Fehler
1 Riegel mit 2133MHz und 18 / 22 / 22 / 42 Timings -> Gleicher Fehler
 
Zuletzt bearbeitet :
Lösung
Update von mir:
Der neue Austausch 5950X läuft jetzt seit 24 Stunden ohne Probleme
Sowohl unter Last als auch stundenlang im Idle

Hab ihn mal 5 Stunden ohne jegliche Last vor sich hin laufen lassen

-> Update vom 19.12.
CPU läuft nach wie vor Fehlerfrei, Rechner lief testweise 24 Stunden im Idle, 24 Stunden unter Last, 24 Stunden unter Mischlasten

-> Update vom 22.12
CPU läuft weitere 72 Stunden absolut fehlerfrei, egal welche Last und welches Verhalten

Keinerlei Fehler im Eventlog, problemloser Startvorgang

RAM Profil ist das XMP der neuen G.Skill Royal:
14 / 15 / 15 / 35 bei 1,45Volt und 3600MHz DRAM / 1800MHz FCLK

BIOS Version vom Crosshair VIII:
3003 mit AMD AM4 AGESA V2 PI 1.1.0.0 Patch C

-> Würde an der Stelle mal ganz frech...
Hi Leute,

lese schon seit ein paar Tagen mit und mir gruselt es ein bischen. Hintergrund: Nach 20 Jahren Intel hab ich nun erstmalig seit 4 Tagen einen 5950iger von Mindfactory hier liegen +ne MSI RTX 3080 Suprim X ( - schaurig allerdings wen man die Beiträge von Amtswalter liest....ich ahne Schlimmes). @Amtswalter - Hoffe bei dir ist jetzt alles in Ordnung!

Nu ja. Kommende Woche sollten dann noch Asus ROG_STRIX_X570-E_GAMING + G.Skill F4-3600C17D-32GTZ ankommen und dann gehts los. Ich werde auf jeden fall berichten wie und ob es läuft. Wenn es mich nervt wirds aber gleich wieder eine Intel config ( - Notfallwarenkorb bei Alternate hab schon angelegt - meine Nerven halten sowas sonst einfach nicht mehr aus :- D ).

Was haltet ihr eig. davon ( - habe zwar weiter vorn schon gesehen das mit Spannungen experimentiert wurde aber hat das jemand so gemacht?):

"The system is stable so far with the following BIOS settings:

Go to AMD overclocking, set the Presicion Boost Overdrive to Manual. Some additional parameters will appear. In there:

  1. (The main thing) Set the EDC current limit to 200A.
  2. (Just in case) Set the power limit to 130W.
  3. (Just in case) Set the temperature limit to 83C.
1 is an increase, 2 and 3 is a decrease. Leave at zeros all the rest there."

 
Zuletzt bearbeitet :
Also bei mir haben verschiedenste Änderungen im Bios nicht geholfen, wenn ich nicht mit dem AMD Ryzen Master unter Windows den "manuellen Modus" aktiviert habe. C States, Spread Spektrum, etc.
Ich kann wirklich fast die Uhr stellen: Alles auf stock = Absturz so zwischen 1-15min, auch beim Browsen. Wie gesagt, immer nur ohne (!) Last. Ich hab an so etwas wie die Spannungswandler und alles gedacht, aber auch nach dem ersten Start des PCs passiert es fast sofort, so schnell kann sich da doch nichts aufheizen. Ich kann mir jetzt vorstellen, dass es irgendwelche Spannungsspitzen sein könnten die nicht richtig kontrolliert werden. Ich müsste den CPU mal in ein anderes Mainboard einbauen zum Test. 3500X läuft nach wie vor sofort perfekt. Es könnte also sein, dass die Mainboards nicht richtig vorbereitet waren oder zumindest nicht alle Settings final genug sind.

Was auf jeden Fall extrem helfen wird und sowieso bedacht werden sollte ist eine ordentliche Kühlung, ich war so naiv zu denken, ohne Wasserkühlung wird es schon gehen. Die Leistung skaliert echt gut mit der Kühlung mit. Hätte nicht gedacht, dass der Single-Core derart brachial gut ist, das ist wirklich respektabel bei einem Multi-Threading-Monster. Der Prozessor scheint die Teillast-Szenarien extrem auszunutzen und nutzt die 90°C Limit auch echt hart aus.
 
@Neutral versuchs mal wie in Beitrag #194 vom Mir.
Heute Morgen noch Absturz,Offset so eingestellt , Rechner jetzt gestartet und nix.Muss natürlich noch ein paar Tage wieder beobachten.
Ich denke mal das die ersten CPUs noch zu empfindlich sind und die Bios Versionen noch nicht 100% ausgereift.
 
Lieber Casi030, ich werde jetzt versuchen alles exakt wie Du es dargestellt hast einzustellen. Ich speichere meine aktuellen Einstellungen (RAM) und setzte alles komplett zurück auf stock und passe wie auf Deinem Bild in Beitrag #194 an. Ich editiere hier gleich mit den Ergebnissen : )

EDIT:
Ich hab jetzt versucht die Einstellungen nachzubilden von Casi030. Ich konnte VDDCR CPU Spannung nicht mit einem Offset belegen, ebenso nicht VDDCR SOC Voltage. Ich konnte nur direkt CPU Core Voltage und CPU NB/SoC Offset selbst setzen, allerdings war der kleinste erlaubte Wert 0.0125V. Den Ram konnte ich auf fixe 1.350 Volt setzen, der war denke ich standardmäßig bei mir auf "1,368" Volt unterwegs.
(Siehe Bild)
20201220_234058.jpg

Ich teste gerade mal Cinebench R23 Multi und Single um zu sehen ob nichts explodiert und danach schließe ich den Ryzen Master und lasse alles auf Standard und gucke ob der CPU dann unter "no load" nicht abstürzt. Zu sehen, dass ein einzelner Kern mit Stock-Settings (außer dem Mini-Offset im Bios) bis zu 110 Watt ziehen kann finde ich sehr beeindruckend^^ im Schnitt sind es angeblich etwa 80 Watt. Die Jungs holen echt aus dem Silikon alles raus.

EDIT2:
Pünktlich nach Abschluss des Cinbench R23 Single-Core runs stürzte er ohne die Last nach etwa 1-2min ab^^

Ich teste jetzt mal ohne Ryzen Master an zu haben und schaue ob es noch Abstürze gibt (alles auf stock, außer Bios Modifikationen wie oben)
 
Zuletzt bearbeitet :
Sollte ich ein Ergebnis haben werd ich alles Angeben was ich geändert habe,möglich das es auch ne Kombi ist.
 
Ich würde eine CPU, die nicht stabil mit stock settings läuft, zurückschicken. Das ist einfach der Mindestanspruch, der erfüllt sein MUSS, alles andere ist Kür. Zum Glück bin mit meinem 5950X von diesen Problem verschont, toitoitoi und klopfaufholz.
 
Wenn man den Thread betracht könnte man meinen das gefühlt jede 2. CPU irgendwelche Probleme macht.
Wäre ich doch bei meinem 10900k geblieben.........:(

Ich hab jetzt mal probehalber meine 3080 Strix an 3 x Stromanschlüssen angeschlossen.
Vorher waren es 3 aber 1 Kabel für 2 Anschlüsse gesplittet.
Würde aber trotzdem die Abstürze im Idle nicht erklären.

@HerrRossi

Denk ich mir auch. Kann nicht sein das die Leute Betatester spielen müssen für die Boardhersteller und AMD.
Viele schicken vielleicht auch nicht zurück weil sie angst haben mehrere Wochen ohne Rechner da zu stehen.
Zur Not tuts auch ein 80 € AM4 für den übergang denke ich.
 
Wenn man den Thread betracht könnte man meinen das gefühlt jede 2. CPU irgendwelche Probleme macht.
Aber nur gefühlt ;) Mindfactory hat 1.470 Stk. vom 5950X verkauft und eine RMA Quote von 0,26%.

So eine RMA ist natürlich nervig, aber man kann es nicht ändern, eine instabilen Rechner mit Hängen und Würgen halbwegs ans Laufen zu bekommen ist imho nicht Sinn und Zweck der Sache.
 
Kleines Update bei mir:

Bei mir/uns war es HWinfo64 welches die Probleme verursacht hat - seit Umstieg auf HWMonitor alles tutti, keinerlei Auffälligkeiten, keine WHEAs, keine Warnungen, nichts.
 
@Pirate85

Hab ich schon drüben bei Hardwareluxx gelesen.......stellenweise ist es unglaublich. Aber eig. kann es das doch nicht sein ( - auf einfache Programme zu verzichten, dass es läuft). Aber freut mich wenn es bei dir jetzt funzt :)

P.S. Bei mir wird Mittwoch oder Donnerstag der "Tag" der Tage sein (hoffentlich läufts) ^^
 
Ich drücke dir fest die Daumen @Zero
Wie gesagt, nimm Vorsichtshalber erstmal HWmonitor - die neueste Version kann mit Vermeer und den neuen GraKas um und funktioniert bisher unauffällig. Sicher ist Sicher...

2 weitere Systeme sind bisher wieder auf die 5000er zurück - ein hin und her die Tage, aber ich hab ja die Zeit... 😖

Ich kanns auch kaum glauben, aber das ist nicht der Weisheit letzter Schuss. Viele haben auch Probleme ohne jegliche Monitoring-Tools - dort liegt dann der Hase irgendwo anders im Heu... AGESA oder vielleicht doch defekte CPUs, ich weiß es nicht.

Bisher wie gesagt 3 Systeme inkl. meinem eigenen zurück und alle funktionieren... Toi Toi Toi.

LG
Marti
 
Kann immer mal sein. Ich hatte zeitweilig mit der 3090 und Precision X Probleme. Gerade so Tools, die "nah an die hardware" rangehen, kann man ja auch als Hersteller nicht alle im Blick haben oder berücksichtigen, was die ggf. so treiben.
 
@Amtswalter @Hellsingexe Wisst ihr, welche Produktionswoche eure funktionierenden Austausch-CPUs haben? Ich habe heute eine neue CPU bekommen, und obwohl mittlerweile 2 Wochen vergangen sind, ist sie nicht nur aus der selben Produktionswoche (47), sondern auch bei der Seriennummer nur 5 Nummern entfernt. Wenn das also ein CPU-Problem ist (Silicon Lottery...), stehen die Chancen wahrscheinlich hoch, dass die neue CPU sich nicht anders als die alte CPU verhält, wenn da in der Produktion nur Sekunden(bruchteile) dazwischen liegen. Eigenartig auch, dass einer der größten Händler in Österreich und Deutschland in den 2 Wochen noch keine neue Lieferung bekommen hat. Anderswo werden schon CPUs neuerer Produktionswochen verkauft.
 
So das Ryzen-Corona hat mich auch angesteckt. Ich bin auf Fehlersuche, das liest sich ja prima hier in dem Thread......
 
@Casi030
Bei mir war es auch unter Mischlast, bei Treiber Installationen, USB Stick anstecken, Website öffnen, etc
Ganz alltägliche Dinge eben

Im Thread hatte sich auch schon jemand mit Fertig PC gemeldet, gleiches Problem
 
Dito Hellsingexe - genau dieselbe Macke hat der eine 5800X auch. Ich werde die beiden 5800X morgen mal untereinander tauschen... mal sehen.
 
Ich habs glaube ich, muss noch testen. Werde berichten. Jemand ein Gigabyte Board hier und hat das Problem?
 
Status
Nicht offen für weitere Antworten.
Oben Unten