Frage Ryzen 9 5950X crash mit Prozessor-APIC-ID14 / WHEA-Logger 18

Status
Nicht offen für weitere Antworten.

Hellsingexe

Mitglied
Mitglied seit
Nov 20, 2020
Beiträge
35
Bewertungspunkte
12
Punkte
8
AMD Ryzen 9 5950X

Fehlerbild im Windows Event-Log:
Schwerwiegender Hardwarefehler.
Prozessor-APIC-ID: 14

EventLogSystem-Win8.1Pro.PNG

-> Der Fehler tritt zufällig während des Betriebs auf und ist unabhängig von Lastsituation und Temperatur.
-> Der Fehler führt zum sofortigen Crash des Systems.

=====================================================================

Verwendestes System:
Mainboard: ASUS Crosshair VIII Hero (Wi-Fi)
CPU Kühler: Fractal Design S36 Blackout
RAM: G.Skill F4-4000C18Q-128GTRG
GPU: Inno3D iChill Black 2080 Ti
PSU: Bequiet Dark Power Pro 11 1000Watt

Getetstete Mainbaords:
ASUS Crosshair VIII Hero (Wi-Fi) Mit allen verfügbaren BIOS Versionen die Ryzen 5xxx unterstützen:
Version 2311 -> Gleicher Fehler
Version 2402 beta -> Gleicher Fehler
Version 2502 -> Gleicher Fehler
Version 2702 -> Gleicher Fehler

Gigabyte B550 AORUS ELITE (rev. 1.0) Mit allen verfügbaren BIOS Versionen die Ryzen 5xxx unterstützen:
F10 -> Gleicher Fehler
F11i -> Gleicher Fehler
F11k -> Gleicher Fehler

Getestete Varianten:
-BIOS ALLES auf DEFAULT Settings (Jeweils für alle BIOS Versionen des ASUS und Gigabyte Boards)
-Windows 10 Pro 64Bit 20H2
-Windows 10 Pro 64Bit 1909
-Windows 8.1 Pro 64 Bit
-Linux Mint 20
-Ubuntu 20.04

-Windows im Höchleistungsmodus
-Aktuelle AMD Chipsatz Treiber installiert (2.10.13.408)
-LLC auf Level 3, und 4 fixiert
-PBO deaktiviert
-SMT deaktiviert
-DF Cstates auf "Disable" (Global C-state Control)
-GPU Getauscht gegen eine GTX 970 und eine GTX 560Ti -> Gleicher Fehler
-PSU getauscht gegen ein Seasonic Focus Gold 850 Watt -> Gleicher Fehler

Getestete RAM Kits:
G.Skill F4-4000C18Q-128GTRG
4 Riegel mit 3600MHz -> Gleicher Fehler
2 Riegel mit 2666MHz -> Gleicher Fehler
1 Riegel mit 2666MHz -> Gleicher Fehler

G.Skill F4-3600C17Q-64GTZR
4 Riegel mit 3600MHz -> Gleicher Fehler
2 Riegel mit 2133MHz -> Gleicher Fehler
1 Riegel mit 2133MHz -> Gleicher Fehler
1 Riegel mit 2133MHz und 18 / 22 / 22 / 42 Timings -> Gleicher Fehler
 
Zuletzt bearbeitet :
Lösung
Update von mir:
Der neue Austausch 5950X läuft jetzt seit 24 Stunden ohne Probleme
Sowohl unter Last als auch stundenlang im Idle

Hab ihn mal 5 Stunden ohne jegliche Last vor sich hin laufen lassen

-> Update vom 19.12.
CPU läuft nach wie vor Fehlerfrei, Rechner lief testweise 24 Stunden im Idle, 24 Stunden unter Last, 24 Stunden unter Mischlasten

-> Update vom 22.12
CPU läuft weitere 72 Stunden absolut fehlerfrei, egal welche Last und welches Verhalten

Keinerlei Fehler im Eventlog, problemloser Startvorgang

RAM Profil ist das XMP der neuen G.Skill Royal:
14 / 15 / 15 / 35 bei 1,45Volt und 3600MHz DRAM / 1800MHz FCLK

BIOS Version vom Crosshair VIII:
3003 mit AMD AM4 AGESA V2 PI 1.1.0.0 Patch C

-> Würde an der Stelle mal ganz frech...
Es ist ehr Traurig das Intel sonst nicht laufen würde,oder welchen Grund hätte es das 99% der Ram NUR auf Intel Abgestimmt ist?
Das stimmt aber doch nicht. Der gute Flare-X 3200er, also speziell auf AMD "abgestimmter" Speicher, der auf einem testweise beschafften 3800X und einem 3950X mit maximal 3600 18-19-19 lief, 3800 wurden mit 1900 fclk nie stabil erreicht. Der lief dann auf meinem 9900K auf einmal problemlos mit 4000 Mhz cl 17-18-18.
 
Ist aber wohl auch ziemlich nötig ---> unter 1,1-1,125V braucht man irgendwo nicht gehen wenn man sich bei 3600+Mhz Takt vom RAM bewegt.
na ja, da scheinen die systeme doch stark zu variieren
ich hab dann mal im bios VCORE SoC von auto auf 1.050V gestellt
SoC_XMP.jpg
das system läuft unter last (idle nicht getestet) immer noch ...
 
Das stimmt aber doch nicht. Der gute Flare-X 3200er, also speziell auf AMD "abgestimmter" Speicher, der auf einem testweise beschafften 3800X und einem 3950X mit maximal 3600 18-19-19 lief, 3800 wurden mit 1900 fclk nie stabil erreicht. Der lief dann auf meinem 9900K auf einmal problemlos mit 4000 Mhz cl 17-18-18.
Wissen ist Macht......Wenn vom Bios der IF begrenzt wird kann der Ram dennoch höher gehen.

 
Anbei meine Erfahrungen:

Eingesetzte Hardware:
AMD 5950x - Lüfter Be quiet Dark Rock Pro4
Gigabyte Aorus Master rev 1.2 mit BIOS F31q - AMD AGESA ComboAM4v2PI 1.1.0.0
64GB = 4x CMK32GX4M2D3600C18
m.2 ssd = 1x Corsair MP600, 2x Crusial P1

Mit Stock Einstellungen sporadische Neustarts. Konnte ich zu 100% provozieren durch Aufruf der Internetseite CPU-Z Benchmark - CPU-Z VALIDATOR (x86.fr) mit dem EDGE Browser und hin und her selektieren/springen in der Benchmark liste zwischen single und multi threads.

Anpassungen der RAM Frequenz - egal in welche Richtung - keinerlei Veränderung der Symptome.
Gleichzeitige Mehrfache Änderungen im BIOS wurden beim speichern nicht immer übernommen.

Nach vielen Änderungen im BIOS wurde das verhalten immer schlimmer. Manuelles zurücksetzen übers BIOS (load optimized defaults) brachte keine Verbesserung. Erst das CMOS löschen über ext. Schalter brachte das System wieder zum laufen. Cinebench konnte wieder ausgeführt werden. Allerdings wie es andere hier auch schon beschrieben haben, kommen die Probleme wieder wenn das System aus der Last in den IDLE geht und wieder über den BOOST belastet wird.

Nachdem ich im BIOS den Core Perfomance Boost ausgeschaltet hatte, wurde der Rechner nicht einmal zwangs neu gestartet. Hab dann mit der CPU Clock Ratio und System Memory Multipler experimentiert und bin zu folgenden Ergebnissen gekommen.
Erster Eintrag ist mit Core Performance Boost und Ram auf 3800MHz. Mit RAM auf 4000MHz bricht CB ab. Rechner läuft aber. Kein reboot. Danach CPB aus und manuell CPU Clock Ration eingestellt wie folgt:

CPU RAM IDLE LASTR20 R20 LASTR23.2 R23.2 CPU temp
CPB 3800 79Watt 204Watt 10033 205Watt 25882 64Grad Sys unstabil
3400 3800 78Watt 171Watt 8819 174Watt 22896 52Grad Sys stabil
3600 3800 78Watt 197Watt 9402 198Watt 24277 59Grad Sys stabil
3800 3800 78Watt 202Watt 9931 201Watt 25592 62Grad Sys stabil
4000 3800 78Watt 210Watt 10463 210Watt 26876 64Grad Sys stabil
4200 3800 78Watt 215Watt 10900 215Watt 28244 66Grad Sys stabil



Wattzahlen wurde an der Steckdose gemessen. Ist somit Gesamtsystem inkl. 3 Gehäuselüfter ohne Monitor.
Mein Fazit:
Es gibt Probleme mit dem BOOST. Feste Werte = stabiles System (bei mir zumindest). Alle Kerne können bis auf 5050Mhz hochtakten. Ich gehe davon aus das meine CPU i.O. ist. Es liegt meiner Meinung nach an der AGESA Implementierung je nach Board Hersteller. ASUS ist schon auf 1.1.8.0 während Gigabyte, MSI usw. noch auf 1.1.0.0 sind. Overclocking & Undervolting: AMD AGESA 1.1.8.0 mit Curve Optimizer startet im Dezember - ComputerBase

Hoffe das hilft dem ein oder anderen weiter.
 
Das bringt alles nichts. Viele Board haben Probleme mit dem FCLK über 1600 mhz.
Stell die SoC Voltage auf 1,1 Volt und gut ist.
 
Habs jetzt mal mit SoC auf 1,1Volt getestet.
Rechner läuft soweit. Allerdings freezt oder rebootet er wenn's in den Energiesparmodus geht.
Rechner läuft mit CPB off und fester CPU / RAM ratio Frequenz bei mir top. Ist allerdings kein Gewähr das die CPU i.O. ist.
 
Die sporadischen Reboots haben mich auch erwischt. Mal beim "YT schauen"; mal beim Zocken; mal im Win-Idle. Bios-Default und Ram-Experimente mit unterschiedlichsten Timings/Einstellungen blieben leider erfolglos. Board: MSI MAG B550 Tomahawk mit aktuellem Beta-Bios A.51 und Agesa 1.1.0.0 (vermutlich mit Patch C).

Ich werde wohl jetzt noch mit einem anderen Board testen, und sollte das Problem weiter bestehen, bleibt wohl nur "CPU weg". Ob ich dann bei AMD bleibe, weiß ich noch nicht. Bisher will AMD keine neue schicken bevor nicht die alte eingegangen ist.

Bei denen, die vorab-Tausch via AMD direkt hatten, wie habt ihr das angestellt?

Das ist und bleibt unterm Strich aber schlicht deprimierend.
 
Habs jetzt mal mit SoC auf 1,1Volt getestet.
Rechner läuft soweit. Allerdings freezt oder rebootet er wenn's in den Energiesparmodus geht.
Rechner läuft mit CPB off und fester CPU / RAM ratio Frequenz bei mir top. Ist allerdings kein Gewähr das die CPU i.O. ist.

Funktioniert bei mir ohne Probleme. Gerade nochmal ausprobiert.
Aktueller Chipsatztreiber und Windows 10 20H2 ist drauf ?
 
Gar nicht. Ich hab auf eigene Rechnung einen zweiten bzw. dritten Prozessor bestellt und nach Ankunft den Vorgänger als RMA bzw. Widerruf an den Händler zurückgeschickt.
Ganz ehrlich, da hät ich vor dem dritten Versuch die komplette Plattform gewechselt bei den aktuellen Preisen... Ich meine, die Kohle muss man im Grunde genommen ja auch erstmal "über" haben, um x-mal 600 oder mehr Euro in Vorleistung zu gehen.
 
Hatte mit meinem System auch gelegentlich spontane Reboots im Idle und anschließend den WHEA id 18 Fehler im Eventlog.

Ryzen 9 5900X
Gigabyte B550M AORUS PRO-P (rev. 1.0)
aktuelles Bios F11p
64GB RAM (Ripjaws V, F4-3600C16Q-64GVKC)
AORUS NVMe Gen4 SSD 1TB GP-ASM2NE6100TTTD
Nvidia Geforce RTX 3600 Ti (msi Ventus 2x)

Abhilfe hat bei mir die Einstellung der SoC Voltage auf 1,1V gebracht. Vorher waren per Auto 1,0V vom BIOS automatisch gesetzt. Dazu das XMP Profil für 3600Mhz ausgewählt. Seitdem keine spontanen Reboots mehr.

Allerdings habe ich nach wie vor das Problem, dass der Ruhezustand („Energie sparen“) nicht funktioniert. Nach dem aufwachen bleibt der Bildschirm schwarz, irgendwann gibt es einen harten Reboot, der Monitor zeigt dann den Startscreen, der gesicherte Zustand vom Hibernate ist verloren, aber das System funktioniert wieder.

Im Eventlog steht nach dem Neustart als Fehler ein Absturz des Nvidia Treibers nvlddmkm mit Ereignis ID 14.

Woran könnte das liegen?
 
Was für ein Fail seitens AMD und alles wird totgeschwiegen.

Habs vor ein paar Seiten schon gesagt.. CPUs reklamieren und austauschen.
Ihr braucht nicht warten, die nächsten Bios Versionen sind teilweise da wie vorausgesagt ohne Besserung.
Ihr könnt mit Spannungen experimentieren um die Probleme evtl. zu umgehen (nicht zu lösen), aber das wird eh nie default in irgendein Bios so aufgenommen werden.

Wer nicht reklamiert bleibt irgendwann auf dem Teil sitzen
 
@m4ntic0r Ich habs auch schon an anderer Stelle gesagt: Normalerweise, 6 Wochen nach Release, MUSS die CPU eingebaut werden BIOS geflasht.. oder meinetwegen vorher flashen.. was weiss ich.. Dann CMOS CLR -> Optimized Setting laden dann muss die Kiste chrashfrei laufen!
Ich hoffe sehr, so sehr ich auch AMD-Fan-man bin, dass AMD aus den RetourCPU's Pyramiden bauen kann!
Das kann einfach nicht deren Ernst sein! 6 Wochen nach Release kein stabiles AGESA? Oder sind die CPU's wirklich alle in den Fritten?
Morgen kommt meine Austausch CPU... (5900X) Ich bin gespannt! Gut gelaunt allerdings schon eine Weile nicht mehr!
Es ginge ja evtl. noch, wenn mal eine offizielle Aussage irgendwo her käme, sei es von AMD oder den Boardherstellern so á la: Leute ist momentan alles im AGESA buggy.... schaut das folgende Werte im BIOS so und so eingestellt sind, dann muss es stabil sein...
Aber selbst das kommt nicht! Stattdessen werkelt man von AGESA zu AGESA an tollen neuen Features...
Ich hab auf meinem AORUS ULTRA X570 vor und zurück geflasht... F30...F31o...F31q Nichts ist stabil! Mit dem 3700X lief F31o wie ein Länderspiel!
Einzige Änderung war die CPU! Seit über einer Woche frickel ich da jetzt schon rum... Zumutung ist da wohl noch geschmeichelt...
...in diesem Sinne!
Gruß
0ldn3rd
 
Es wird hier nichts mehr kommen, aus dem ganz einfachen Grund dass trotz der vielen problematischen CPUs die Mehrheit ja immer noch ohne Probleme läuft. So und was soll man als Boardhersteller dann bitte mit Software noch korrigieren wenn man Gefahr läuft, die problemlos laufenden CPUs auch wieder zu beeinflussen.

Ich finds ne Sauerei, dass nirgends so richtig darüber berichtet wird obwohl die Foren voll sind. Das wirft für mich ein ganz schlechtes Bild auf die Medienlandschaft und zukünftig sollte man sich wirklich mal einen Kopf machen was man wo noch glaubt.

Auch die perfekten Samples die da teilweise zu den Reviewern gehen, die mit der Realität nicht immer was zu tun haben.. wo gerne mal 200mhz Allcore@Stock Unterschied anliegen.

Ich hätte innerhalb der 14 Tage jedes noch so instabile System zurückgeschickt. Wie du sagst, nach CMOS clear und Default Einstellungen muss das zumindest mal laufen es sei denn man hat noch eine total schlechte RAM Kompatibilität. Und auch dafür gibts ja immer Listen.

Das ist die 4.!! Ryzen Generation, auf was bitte sollen da die Boardhersteller noch nicht vorbereitet gewesen sein? Bei der 1. hab ichs ja noch verstanden. Und dann läuft die Kiste nicht mal mit moderaten Settings. Scheiß egal ob man ASUS, MSI, Gigabyte hat.

Das ist eine ganze klare Schwäche der 5900x/5950x CPUs mit zwei Chiplets. Bei den 5600x/5800x passierts ja fast nie.
 
Zuletzt bearbeitet :
Was du alles gemacht hättest und was du alles schon weißt was in Zukunft passieren wird. Schon interessant. Auch interessant, dass du dich nur in diesem Forum angemeldet hast um in genau diesem Thread immer wieder denselben Rant ab zu lassen.

Ja es ist ärgerlich, das bei einer geringen Zahl von Usern die CPUs Probleme verursachen. Ja es ist ärgerlich, dass es nicht einfach zu lösen ist und nicht bei jedem jede Lösung funktioniert.

Aber hey, Hauptsache rumkacken. Weil das ja auch so viel bringt.

Andere versuchen hier effektiv Hilfe zu leisten, dass ist das einzige was wirklich den Thread voran bringt. Deine Post ziehen leider nur runter und tragen nicht wirklich etwas zum Thema bei.
 
@m4ntic0r
Stimmt so auch nicht,selbst die 1.Ryzen liefen , nur Ram OC lief nicht und das war die Aufregung. Es hatte dan auch nicht lange gedauert bis der Intel Ram durchs BIOS und Co auch zum OC zu bewegen war.Ryzen 2000 funktioniert dann.Mit Ryzen 3000 kamen die selbsternannten Experten dann wieder nicht mehr klar wie sie nicht gerafft haben wie die CPUs funktionieren und damit fin das Desaster an.
 
Hinsichtlich der Agesa-Thematik hat er ja nicht ganz unrecht. Im Zweifel halt einfach mal beim Release etwas tiefer stapeln. Hätte den Vorteil, dass man n bissl später bei nem Refresh noch n bissl mehr Spielraum hat.
Aber AMD näht die Teile auf Kante. Das ist total bescheuert...

Ich teste jetzt mit der manuellen Anpassung bei der SoC-Voltage. Mal sehen, wie es die nächsten Tage damit läuft.
 
Status
Nicht offen für weitere Antworten.
Oben Unten