Frage Ryzen 9 5950X crash mit Prozessor-APIC-ID14 / WHEA-Logger 18

Status
Nicht offen für weitere Antworten.

Hellsingexe

Mitglied
Mitglied seit
Nov 20, 2020
Beiträge
35
Bewertungspunkte
12
Punkte
8
AMD Ryzen 9 5950X

Fehlerbild im Windows Event-Log:
Schwerwiegender Hardwarefehler.
Prozessor-APIC-ID: 14

EventLogSystem-Win8.1Pro.PNG

-> Der Fehler tritt zufällig während des Betriebs auf und ist unabhängig von Lastsituation und Temperatur.
-> Der Fehler führt zum sofortigen Crash des Systems.

=====================================================================

Verwendestes System:
Mainboard: ASUS Crosshair VIII Hero (Wi-Fi)
CPU Kühler: Fractal Design S36 Blackout
RAM: G.Skill F4-4000C18Q-128GTRG
GPU: Inno3D iChill Black 2080 Ti
PSU: Bequiet Dark Power Pro 11 1000Watt

Getetstete Mainbaords:
ASUS Crosshair VIII Hero (Wi-Fi) Mit allen verfügbaren BIOS Versionen die Ryzen 5xxx unterstützen:
Version 2311 -> Gleicher Fehler
Version 2402 beta -> Gleicher Fehler
Version 2502 -> Gleicher Fehler
Version 2702 -> Gleicher Fehler

Gigabyte B550 AORUS ELITE (rev. 1.0) Mit allen verfügbaren BIOS Versionen die Ryzen 5xxx unterstützen:
F10 -> Gleicher Fehler
F11i -> Gleicher Fehler
F11k -> Gleicher Fehler

Getestete Varianten:
-BIOS ALLES auf DEFAULT Settings (Jeweils für alle BIOS Versionen des ASUS und Gigabyte Boards)
-Windows 10 Pro 64Bit 20H2
-Windows 10 Pro 64Bit 1909
-Windows 8.1 Pro 64 Bit
-Linux Mint 20
-Ubuntu 20.04

-Windows im Höchleistungsmodus
-Aktuelle AMD Chipsatz Treiber installiert (2.10.13.408)
-LLC auf Level 3, und 4 fixiert
-PBO deaktiviert
-SMT deaktiviert
-DF Cstates auf "Disable" (Global C-state Control)
-GPU Getauscht gegen eine GTX 970 und eine GTX 560Ti -> Gleicher Fehler
-PSU getauscht gegen ein Seasonic Focus Gold 850 Watt -> Gleicher Fehler

Getestete RAM Kits:
G.Skill F4-4000C18Q-128GTRG
4 Riegel mit 3600MHz -> Gleicher Fehler
2 Riegel mit 2666MHz -> Gleicher Fehler
1 Riegel mit 2666MHz -> Gleicher Fehler

G.Skill F4-3600C17Q-64GTZR
4 Riegel mit 3600MHz -> Gleicher Fehler
2 Riegel mit 2133MHz -> Gleicher Fehler
1 Riegel mit 2133MHz -> Gleicher Fehler
1 Riegel mit 2133MHz und 18 / 22 / 22 / 42 Timings -> Gleicher Fehler
 
Zuletzt bearbeitet :
Lösung
Update von mir:
Der neue Austausch 5950X läuft jetzt seit 24 Stunden ohne Probleme
Sowohl unter Last als auch stundenlang im Idle

Hab ihn mal 5 Stunden ohne jegliche Last vor sich hin laufen lassen

-> Update vom 19.12.
CPU läuft nach wie vor Fehlerfrei, Rechner lief testweise 24 Stunden im Idle, 24 Stunden unter Last, 24 Stunden unter Mischlasten

-> Update vom 22.12
CPU läuft weitere 72 Stunden absolut fehlerfrei, egal welche Last und welches Verhalten

Keinerlei Fehler im Eventlog, problemloser Startvorgang

RAM Profil ist das XMP der neuen G.Skill Royal:
14 / 15 / 15 / 35 bei 1,45Volt und 3600MHz DRAM / 1800MHz FCLK

BIOS Version vom Crosshair VIII:
3003 mit AMD AM4 AGESA V2 PI 1.1.0.0 Patch C

-> Würde an der Stelle mal ganz frech...
Hi,Wilkommen 🙂

Ich vermute das es Dir geht wie mir das auf ein neues Agesa gewartet werden muß.Da bei mir mit 1900 MHz momentan der Hahn zu ist habe ich meinen Support (MSI) Kontaktiert.Die sagten mir das für den Ram noch optimiert wird und ich auf ein neues Agesa warten soll,was aber noch dauern kann.
Vor dem Beta war bei mir bei 1600 FCLK der Ofen aus :p
 
Bevor wir dazu kommen habe ich inzwischen ein ganz anderes Problem mit den neuen Komponenten. Der Rechner ist unbrauchbar. Ständig und vollkommen willkürlich startet sich Windows abrupt neu.

Im Event Log ist zu jederzeit der gleiche Fehler zu sehen:

Schwerwiegender Hardwarefehler.

Gemeldet von Komponente: Prozessorkern
Fehlerquelle: Machine Check Exception
Fehlertyp: Cache Hierarchy Error
Prozessor-APIC-ID: 14


Im Netz findet man dazu reichlich wilde Theorien von defekten CPU übers Board usw...

Der Fehler tritt mit jedem Setting auf.:
BIOS im default mode als auch mit XMP oder mit custom Settings.

Getestet habe ich beide verfügbare BIOS Versionen welche den 5950X unterstützen:
Version 2311 -> läuft teilweise länger im idle, crasht aber im Windows Setup (20H2 Setup)
Version 2502 -> crasht fast immer während Windows Updates oder im idle (10-60 Minuten Abstand)

Getestet habe ich auch ein anderes RAM Kit
G.Skill TridenZ RGB F4-3600C17Q-64GTZR
Mit nur 2 Riegeln
-> Gleiches Fehlerbild jeweils mit allen Settings rund um den RAM

Meint ihr das so ein 5950X ab werk defekt ist und solche Fehlfunktionen verursachen kann?

CinebenchR20 habe ich mehrfach laufen lassen können, ebenso lief 2:30 Stunden Memtest86 über das F4-4000C18Q-128GTRG Kit
Beides ohne Probleme
 

Anhänge

  • Fehler.txt
    3 KB · Aufrufe : 6
Apic ist ein Interrupt Controller, das muss nicht unbedingt die CPU sein. Welches Netzteil und welche GRafikkarte hast du und hast du Ersatzgeräte?
 
Eventuell mal die Subtimings anpassen inklusive Spannungen.Gear Down aktivieren,Powerdown deaktivieren.ProcODT anpassen bei MSI liegt der bei 53.3.
Bei deinem G.Skill ist es besonders wichtig Geardown zu aktivieren da ungerade CL.
Im Bios PCIe Support mal auf 3.0 festlegen und bei den Energieoptionen vielleicht mal auf Höchstleistung stellen.
Es kann auch nicht schaden die LLC der NB anzupassen um eine stabile Spannung zu gewährleisten.
 
@HerrRossi
BeQuiet Dark Power Pro 11 / 1000Watt
Inno3D iChill Black 2080Ti

Ersatz GPU hätte ich da (GTX 970, ... etc)
Ersatz PSU ebenfalls (Seasonic Focus Gold 850Watt)

@amd_man_bavarian
Subtimings hab ich derzeit bissel schärfer wegen dem fehlenden 4000er Support. Fehler kam leider auch genau gleich mit default Settings.

BIOS Default für das G.Skill Royal Kit: FCLK 1333 / Ram 2666 / CL18 / 22 / 22 / 22 / 42

Eingestellt derzeit: FCLK 1800 / 3600 RAM
1,35 Volt bei CL17 / 19 / 19 / 19 / 39
Gear Down und Power down derzeit bei Automatic

Ich werde mal alles so testen wie von dir empfohlen

Nachtrag:
Habe grade Win10 1909 installiert statt wie bisher 20H2
bisher alles sauber, keine Probleme
 
Das 20H2 ist für undefinierte Abstürze bekannt.Das wird sogar von Windows eingeräumt.
Ich hab´s heute mal installiert um zu sehen obs stabil ist,da ich ne neue SSD eingesetzt habe.Bin gespannt obs mir auch geht wie dir dann wird wieder gewchselt.Bisher läuft die 980 Pro sauber ... bisher bei Windoof weiß man ja nie :p

GGf wenn es das Board nicht macht CL mal auf 16 oder 18 stellen.Gerade Cl ist stabiler bei AMD.
 
@amd_man_bavarian
CL16: kein POST
CL17 mit Gear Down on, Powerdown off: kein POST
CL18 beides auf auto: Bisher ok

Subtimings derzeit CL18 / tRCD 19 / tRP19 / tRAS 39 / tRC 83 / CR 1T

Edit: crash, wieder Prozessor-APIC-ID 14

@HerrRossi
Edit 2: werde jetzt mal die 2080Ti rausnehmen und gegen eine andere Karte tauschen. Und wieder versuchen Win10 zu installieren

==============================

Edit 3:
BIOS alles im Default
GPU eine GTX 560 ti
Windows 1909

2 crashes mit Prozessor-APIC-ID14
Der erste direkt beim TaskManager öffnen, der 2. im Idle

==============================

Edit 4:
BIOS alles auf Default
GPU wieder die 2080Ti
Windows 20H2

Netzteil getauscht gegen ein Seasonic Focus Gold 80+ 850 Watt

Crash beim start des Setups
Crash auf dem Desktop nach kurzer Zeit mit APIC-ID14

==============================

Edit 5:
BIOS alles auf Default
GPU die 2080Ti
Windows 20H2

Netzteil wieder das Dark Power Pro 11

PBO Testweise Deaktiviert
Crash während Windows Setup mit APIC-ID14

==============================

Edit 6:
BIOS alles auf Default
GPU die 2080Ti
Windows 20H2

Habe das ASUS Crosshair VIII Hero Beta Bios 2701 geflasht
Zu finden direkt im ASUS Forum:

Crash direkt im Windows Setup mit Prozessor-APIC-ID14
 
Zuletzt bearbeitet :
Hast du ProcODT mal auf 53.3 gesetzt ?
RTTNOM auf Disabled
RTT_WR 80 Ohm
RTT_Park 240 Ohm
Eventuell mal VDDG CCD Spannung mal auf 1.0V festsetzen , VDDG ICD auf 1.0V , clDO vDDP voltage auf 0.95V
LLC NB mal auf 3 oder ggf 4 testen.
Eventuell mal ne zeit lang die Energie option auf Höchstleistung stellen.

Eventuell mal einen CCX deaktivieren und schauen ob es mit Standard einstellungen stabil läuft di zuvor stabil waren dann mal den anderen aktivieren und ersteren deaktivieren.Wenn es mit einem von beiden instabil ist kann es auf ein Hardwareproblem hinweisen aber auch durchaus am Bios liegen.Sollte das problem mit einem der CCX bestehen mit dem anderen nicht,dann ggf mal den Hersteller kontaktieren also Asus und AMD.Ich hab bei AMD innerhalb von 2-3 Tagen eine Antwort erhalten zwecks FCLK Bug.

Ich hab so den Verdacht daß dein Bios nicht wirklich optimiert ist.
 
@Hellsingexe waren die Tests alle mit stock settings, also alles ohne OC? Dieses Drehen an den Bioseinstellungen ist ja gut und schön, aber der Rechner muss mit stock settings laufen, vorher machen weitere Einstellungen keinen Sinn.

Du könntest noch versuchen, die RAM Spannung etwas zu erhöhen, ich würde für den Anfang mal 1.4V setzen und gucken, ob der Fehler dann immer noch kommt, am besten das kleine RAM Kit dafür nehmen.

Wenn das auch nichts nutzt, fällt mir nichts mehr ein, dann bleibt wohl nur die RMA, falls du nicht noch ein MB kaufen willst.
 
@HerrRossi : es ist schon klar eigentlich alles von haus aus laufen muß,jedoch haben wir ein Releaseprodukt was es nicht tut und der Fall hier ist keine seltenheit.
Den ProcODT einzustellen bzw daß er eingestellt werden muß kann laut G.Skill support vorkommen bzw. nötig sein..
Man muß auch immer im Hinterkopf halten daß alles was über 3200MHz Ram Takt ist ein OC ist.Leider sind viele Bios noch nicht sauber abgestimmt bzw. Ram optimiert.In vielen anderen Foren haben sich zum Thema instabilität besonders die 5900X/5950X gehäuft.
Es ist halt wie mit den NVidia Abstüzen, der kunde ist jetzt der Feldtester für die Ram/Board Hersteller und AMD.

Zu mir hat AMD wörtlich geschrieben daß ich den ram mit 3200MHz innerhalb der spezifikationen der CPU nutzen soll,daß war alles.
Von MSI Support kam dann der Verweis auf das neue Bios und bei mir läuft es seit dem.
Vorher musste ich mit den angesprochenen Einstellungen arbeiten um Stabilität zu bekommen und das ohne OC ;)
 
Laut G.Skill ja.Obwohl der Ram bei meinem Board inzwischen auf der QVL steht. Ich denk da ist noch ne Menge Support nötig bei den Herstellern ;) Darum meinte ich das ja ,daß die Kunden zum Feldtester verkommen sind.
Erstmal raushauen und dann nachbessern :p
 
@HerrRossi

Bitte nicht vergessen das ich zu jedem Edit geschrieben habe das sich das BIOS in jedem fall (Beim letzten Beitrag) im DEFAULT Setting befand. Das bedeutet RAM Takt bei 2666MHz und FCLK bei 1333MHz. Ebenfalls kein CPU OC usw.

Welche RAM Spannungen ebenfalls mit dem gleichen Fehler liefen: 1,2V 1,35V 1,4V sowie 1,45V

Ich habe jetzt mal ein Austausch B550 Board von einem anderen Hersteller bestellt nur um zu sehen wie es dort laufen würde (Gleicher Fehler etc)
Das Gigabyte B550 AORUS Elite -> Kommt Montag Mittag an

@amd_man_bavarian
Werde jetzt mal deine Vorschläge durch probieren

Nachtrag:
Hab mal das Forum Thema angepasst

Versuch 1:
BIOS beta 2701
BIOS alles auf DEFAULT außer SMT OFF

explorer.exe am dauercrashen bzw zittern (Symbole werden ständig neu geladen)
-> Habe ich bisher bei jedem Versuch beobachten können. Das schreiben auch andere bspw im ASUS Forum

Versuch 2:
BIOS beta 2701
BIOS Settings:
RAM Bei 3600 / FCLK bei 1800
CL18 / 19 / 19 / 39
LCC bei Level 3
Windows im Modus Höchstleistung

Crash bei Installation vom Nvidia Treiber mit APIC-ID 14

@amd_man_bavarian
Für manche Werte kann ich bei ASUS keine ohm Zahl wählen, nur vmtl Abstufungen

RTT_WR
Dynamic ODT off
RZQ/2
RZQ/1
Hi-Z
RZQ/3

RTT_Park
Rtt_PARK Disable
RZQ/1 bis 7

Nachtrag von heute 19:33 Uhr:
Support Ticket bei AMD und bei ASUS eröffnet
 
Zuletzt bearbeitet :
Ich will dir jetzt keine Falschen Anweisungen geben,da ich das Aktuelle ASUS Uefi nicht so recht kenne.Eventuell mit dem Tool Zentimings auslesen wie die Aktuellen werte aussehen und schauen welche auswirkung eine Veränderung der Abstufung hat.
Ich weiß das es nicht die feine Englische Art ist aber ich möchte keine Defekte durch falsche Anweisungen auslösen,auch wenn du ein Auweichboard bestellt hast.
Ich habe Gerade mal bei mir den Wert für RttWR auf 80 Ohm gesetzt.Laut Zen Timings ist das RZQ/3 aber da ich das nicht Garantieren kann möchte ich da keine empfehlungen aussprechen.Man müsste mal schauen ob es eine Liste für die entsprechenden Abstufungen gibt.

Edit Habe gerade beim DRAM Calculator geschaut dort wird meine aussage bestätigt RZQ/3 80 Ohm , RZQ/1 240 Ohm , Für RTT_NOM Disable

Edit 2 : Hast du mal Probiert einen CCX zu deaktivieren,also als 6Core zu starten ?

Edit 3 : GGF mal (auch wenn es Leistungseinbußen bringt) probieren den ram auf 3200 MHz und FCLK auf 1600 mit zb 16-18-18-39 Trc 52 .Alles ist besser als ein instabiles System ;)

Edit 4 : Das Idle Problem zieht sich wie ein Roter faden durchs net.Es betrifft vorrangig die CPUs mit 2 CCX also 5900X/5950X und scheint nicht Hersteller Spezifisch zu sein.Der verdacht liegt nahe das die Spannungsversorgung im Idle zu niedrig ist.Gigabyte hab ich nicht so oft gesehen , aber Asus und MSI.Es ist aber nicht auszuschließen daß im Grunde alle Hersteller betroffen sind.Vieleicht hat AMD ja etwas zu weit nach unten korregiert um die TDP einzuhalten?

@Hellsingexe : es ist der Beste und richtigste Schritt beide Support zu kontaktieren (y)
 
Zuletzt bearbeitet von einem Moderator :
Neuer Erkenntnis:
Ich kann den Fehler zu 100% fabrizieren wenn ich versuche den aktuellen NV Treiber 457.30 zu installieren.
Sowohl mit BIOS 2701 als auch mit 2502, sowohl mit 3600er Ram als auch mit 2666er Ram und BIOS auf default

Die Installation lief gerade das erste mal erfolgreich durch nachdem ich nur 12 Kerne 24 Threads laufen habe. (1CCX deaktivert, 3 aktiv)

@amd_man_bavarian
Bitte nicht vergessen das die meisten Tests sogar mit 2666er Ram waren.
Und selbst das schon mehr als instabil läuft.
 
Ja Sorry da mit dem Ram Takt war mir entfallen,bzw ich habe so viele Daten im Kopf das es schon etwas durcheinander geht,da ich auch im MSI Forum unterwegs bin und da versuche das gleiche Problem mit einem 5900X zu lösen ... ich glaub bald muß man dem Helfer helfen :p
 
Kurzes Update von meiner Seite:

Heute kam das Gigabyte B550 AORUS Elite
-> Als RAM Kit kam das Royal zum Einsatz F4-4000C18Q-128GTRG in voller Bestückung, Speed bei 2666MHz und 1333MHz FCLK
-> Habe Problemlos das Update F11i eingespielt welches das AGESA 1.1.0.0 C enthält
-> BIOS sonst ALLES auf Default

Erster Versuch der Win10 20H2 Installation:
-> Crash im Bootmenü
-> Crash auf dem Desktop bei der NV Treiber Installation

APIC-ID 14 (Exakt gleich wie auf dem ASUS Board)
-> Ich habe das volle Eventlog System (Gigabyte Board) in den Anhang hochgeladen

==============================

Zweiter Versuch wieder mit 20H2 um dem Gigabyte Board:
-> Habe diesmal beide NVMe SSD raus (Samsung 970 EVO Plus 1TB + Corsair MP510 2TB) und gegen eine einzelne Samsung 830 120GB getauscht (Sonst kein weitere Massenspeicher verbunden, weder per SATA noch per M2)

-> Crash im Bootmenü
-> Crash kurz nach Windows Setup mit APIC-ID 14
 

Anhänge

  • Gigabyte.zip
    70,1 KB · Aufrufe : 2
Ich habe mal einen anderen versuch im Kopf,da die Häufigste Instabilität beim Idle Modus auftritt oder einem schnellen Wechsel vom idle auf last (so mein Eindruck aus mehreren Amerikanischen Foren) , wäre es mal einen Versuch Wert die Spannung der CPU festzulegen.Dieses würde zwar einen leicht höheren Stromverbrauch erzeugen könnte aber ggf. die stabilität erhöhen.Also die Spannung der CPU zB auf 1,38-1,4V festlegen und dann mal installationen starten.
Wenn das alleine nicht reicht ggf. mal den CPU takt festlegen bzw beschränken auf z.B. 16x 4,3Ghz um den taktsprung auszuschließen.
Dann mal normale aufgaben durchführen kein Prime oder ähnliches,da ich inzwischen gemerkt habe das Prime teilweise bei Instabilität weiter läuft aber einzelne Kerne dabei aussteigen,was dann bei normalen lastszenarien wieder zur Instabilität führt.
Zusätlich PCIe support auf PCIe 3.0 beschränken.
Weitere Maßnahmen fallen mir gerade sonst nicht ein.Wenn das wirken/arbeiten sollte würde ich es ersteinmal so laufen lassen und die Antwort des supports abwarten.Wenn die Spannung im normalen bereich bleibt entstehen durch das festlegen ja keine schäden.
So kann man dann aber zumindest den Rechner nutzen das bissel Leistungseinbußen hin oder her fällt dann eher nicht ins gewicht ;)
 
Status
Nicht offen für weitere Antworten.
Oben Unten