AMD 5800x Windows friert bei Lastwechsel - in den "Leerlauf" ein (kein BlueScreen)

Raynman

Neuling
Mitglied seit
Dez 6, 2020
Beiträge
8
Bewertungspunkte
0
Punkte
2
Moin!
Mein neuer Prozessor schmiert NACH dem Cinebench 20/23 (all Core) ab - unter Last läuft er einwandfrei.
  • 5800X auf Wasser - kein Problem der Temps
  • Main Board x570 ASUS ROG Crosshair VIII WiFi
  • Aktuelles BIOS von ASUS (keine Beta)
  • 4x 8 GB G.Skill Trident Z DDR4-3200 CL14-14-14-34
  • Netzteil Thermaltake Toughpower Grand 1200W
  • Vorher lief ein 3700X stabil auf dem Board
CPU läuft während des Cinebench Benchmarks auf allen Kernen über 4,6 GHz. CPU Score wird noch angezeigt - dann friert Windows ein. 1-2 mal hat er den ersten Lauf geschafft - am Ende des zweiten Benchmarks ist dann wieder Schluss mit lustig.
Auch beim Folding@Home - 10 Prozessoren im CPU Slot - ist beim beenden von FAH (Pause) Windows abgeschmiert.
Battlefield V läuft ohne Probleme. Das kann ich normal beenden - ok hier ist die CPU Last nicht entsprechend.

Das habe ich schon probiert:
- XMP/DOHC Profil raus
- BIOS Reset
-Zusätzliches 4 PIN CPU Power Kabel am Mainboard angeschlossen
- PBO Overclock von 200 auf 150 runter
- AMD Curve Optimizer im BIOS: negative und 10 für alle Cores (ich meine jetzt taktet er 5800X noch höher)

Hat jemand eine Idee - Absturz bei Lastwechsel nach unten!
Gruß Raynman
 
Lastwechsel sind für verschiedene Komponenten schwieriger als eine Dauerlast. Warum das bei dir geanu passiert, kann ich nicht sagen. Wenn der Prozessor weniger Last benötigt, wird der Takt und die Spannung herunter geregelt und das Netzteil schraubt zurück. Da kann es sein, dass die Spannung etwas zu schnell oder zu weit gesenkt wird und CPU oder RAM einen Moment zu wenig Strom bekommt.

Kannst du bei diesem Mainbaord im BIOS die Lodaline-Calibration einstellen? Probier mal etwas mehr oder weniger, auch bei der Spannung.

Alle Übertaktungen würde ich erst mal ganz raus nehmen. Dann kannst du dich langsam an das mögliche herantasten und siehst besser, woran es liegt.

Bei der neuen Prozessoren scheint der RAM empfindlicher zu reagieren. Gerade eine Vollbestückung mit 4 Riegeln scheint für die Prozessoren recht anspruchsvoll zu sein. Möglicherweise hilft es, das Timing etwas weniger straff zu setzen.
 
Alle Übertaktungen würde ich erst mal ganz raus nehmen. Dann kannst du dich langsam an das mögliche herantasten und siehst besser, woran es liegt.
So - getestet: mit nur 2 RAM Riegeln keine Besserung....
Hast du denn auch wie geraten das OC mal rausgenommen? Mach das erstmal, wenn er dann noch abschmiert und du zusätzlich im Event Log WHEA-Fehler hast --> Zurücksenden, ist ein bekanntes Problem

Das sieht erstmal einfach danach aus, als wäre dein OC nicht stabil. RAM-OC auch rausnehmen.
 
Danke!
Dann bleiben bei mir zwei Fragen:

1. Das ASUS BIOS ist IMHO unübersichtlich - PBO Einstellungen an mehreren Stellen - wie schalte ich es sicher aus?
2. WO finde ich den Event log? Wenn WHEA einen Bluescreen verursacht - den hatte ich noch NICHT!
Habe LLC probiert - sobald ich eine manuelle Einstellung vornehme (Level 1 oder 5) schmiert der Cinebench und Windows gleich ab. Auf Auto geht es wieder.
Gruß Raynman
 
2. WO finde ich den Event log? Wenn WHEA einen Bluescreen verursacht - den hatte ich noch NICHT!
Man kann in den Startoptionen von Windows einstellen, dass bei einem Bluescreen kein automatische Neustart durchgeführt wird. Dann bleibt die Meldung stehen, bis du sie wegklickst.
Später sollte die Meldung im Warungscenter im Zuverlässigkeitsverlauf zu finden sein. Man kann den Fehlerbericht auch mit Tools wie BluescreenView anzeigen.
Auf Auto geht es wieder.
Siehst du, welche Einstellung Auto wählt. Eine tiefe Einstellung kann dazu führen, dass die CPU zu wenig Strom bekommt. Eine hohe Einstellung versucht den Spannungseinbruch möglichst schnell auszugleichen. Das führt dazu, dass die Spannung höher hinauf gefahren wird vor sie sich einpendelt. Dadurch entsteht eine kurze Spannungsspitze, die auf die Dauer der CPU schaden kann. Dazu belastet es das Netzteil stärker und kann beispielsweise den RAM instabil werden lassen. Hier kann eine massvolle Einstellung besser sein als die beiden Extreme. man sollte die Loadline nur so hoch setzen, wie es für den stabilen Betrieb nötig ist.
 
Ich habe aktuell bei der Kombination 5600x und MSI B550 A-Pro genau das gleiche Problem wie Raynman.
Deaktivieren von CPB hat das Problem scheinbar behoben (aber das lindert natürlich nur das Symptom, nicht wirklich die Ursache). Werde im Laufe des Tages auch nochmal mit LLC 3 und aktivem CPB testen.
 
Ich habe aktuell bei der Kombination 5600x und MSI B550 A-Pro genau das gleiche Problem wie Raynman.
Deaktivieren von CPB hat das Problem scheinbar behoben (aber das lindert natürlich nur das Symptom, nicht wirklich die Ursache). Werde im Laufe des Tages auch nochmal mit LLC 3 und aktivem CPB testen.
Streng genommen ist der Cuve Optimizer eine OC-Funktion, deren Funktionalität nicht gewährleistet ist. Ich kann natürlich verstehen, dass man das meiste aus dem Prozessor rausholen will, aber dafür hilft es dann ggf. abzuwarten bis die AGESA von AMD stabil ist und alle BIOSe ausgereift sind, das benötigt voraussichtlich noch ein paar Wochen, bis sich das eingependelt hat. Dann würde ich wieder mit Curve Optimizer spielen, dann macht das Sinn.

Die Ursache liegt momentan vermutlich zum einen im Bios wie angesprochen um zum anderen darin, dass die Settings die oft geteilt werden nicht für jeden funktionieren und man da selbst ausloten muss bis wohin das System stabil ist und wann es instabil wird. Ist eben Overclocking und mit ein bisschen Probieren verbunden.
 
CPB ist aber kein Overclocking, das ist Teil des Chipdesigns und sollte mit den Default Werten funktionieren (und ist per Default an).
Ich kann nicht sagen, was MSI in dem Fall als Werte bei LLC einstellt, kann ein Software Bug sein wenn das instabil wird, ja.

Mit LLC3 sieht es aktuell stabil aus, ABER, die CPU scheint jetzt gar nicht mehr zu boosten (ist also wie CPB aus).
 
CPB ist aber kein Overclocking, das ist Teil des Chipdesigns und sollte mit den Default Werten funktionieren (und ist per Default an).
Ich kann nicht sagen, was MSI in dem Fall als Werte bei LLC einstellt, kann ein Software Bug sein wenn das instabil wird, ja.

Mit LLC3 sieht es aktuell stabil aus, ABER, die CPU scheint jetzt gar nicht mehr zu boosten (ist also wie CPB aus).
Ich hatte die Abkürzung "CPB" nicht als "Core Performance Boost" im Kopf, sorry. Das stimmt natürlich, das ist einfach die normale Boost-Funktion. Da muss man aber aufpassen, bei manchen Boards wird dadurch auch PBO usw. automatisch aktiviert, bei ASUS war das zumindest mal so, zu MSI kann ich nichts sagen.

Mit manueller LCC-Einstellung & Core Performance Boost auf an sollte der Prozessor aber weiterhin normal takten. Habe aber auch schon mehrfach gelesen, dass die AGESA 1.1.0.0 da noch Probleme macht, war bei mir auch so. Mit AGESA 1.1.9.0 funktioniert das optimal.
 
Danke für den Hinweis, ich habe tatsächlich gerade wieder AGESA 1.1.0.0 drauf, weil AGESA 1.1.9.0 erst im Beta BIOS von MSI enthalten ist und ich am Anfang meiner Fehlerdiagnose dachte, dass die Instabilität vom Beta BIOS kommt.

PBO ist bei MSI meines Wissens nach nicht automatisch aktiviert.
 
Die Instabilität ist zumindest bei ASRock mit der neuen AGESA im Beta BIOS besser.

Aber Achtung: dafür funktionieren Dinge wie z.B. Windows installieren nicht, das wird wohl erstmal noch ausgebügelt. Solange man also das Betriebssystem nicht neu installieren muss funktioniert alles - habe vor 2 Tagen gute 3 Stunden zugebracht bis ich darauf kam, dass ich noch die Beta drauf hab .. gab es aber auch noch nie, dass mir ein Beta BIOS beim Windows installieren solche Scherereien gemacht hat. Was soll's, das nächste Mal weiß ich es besser :)

PS: 1usmus (Yuri Bubliy) hat auf Patreon geschrieben, dass er hofft, dass für den nächsten Release Candidate vom Clock Tuner for Ryzen alle Nutzer AGESA 1.2.0.0 zur Verfügung haben, scheinbar wurden da dann die meisten Fehler ausgebessert. Warten lohnt sich bestimmt :)
 
Habe gerade noch festgestellt, dass der fehlende Boost nicht am LLC=3 liegt, sondern sobald ich Core Voltage Offset = 0.05V hatte.
Und jetzt habe ich quasi alles wieder auf Defaults gestellt und es läuft gerade stabil, sehr komplex, sehr verwirrend.

Hoffe dass AGESA 1.2.0.0 zusammen mit evtl. ClockTuner für Zen3 zu mehr Stabilität bei mir führt.

Evtl. hatte ich auch nicht die Optimized Defaults im BIOS geladen, als ich von Beta zurück auf Stable gegangen bin, vielleicht auch ein Grund?
 
Das kann auch gut sein, dass die Settings übernommen wurden, das stelle ich bei ASRock auch immer wieder fest nach einem Update.

Ich kann da nur zustimmen, die 'User Experience' bei AMD ist durch die ganzen Agesa Updates wirklich nicht so prickelnd, daher bin ich auch froh wenn dann ein gutes BIOS kommt mit dem alles problemfrei läuft.

Der CTR scheint außerdem richtig gut zu werden, der RC2 wurde schon deutlich verbessert gegenüber dem RC1, sobald da die stable Version kommt wird das bestimmt wieder richtig gut (y)
 
Falls die AISuite von Asus installiert ist dann diese mal runterwerfen. Hat schon die seltsamsten Fehler produziert.
 
@Denniss
Ne, hab nix drauf und auch keiner Auto OC Funktionen an.

Nach anfänglichem Optimus, nachdem auch in den Default Settings alles wieder funktioniert, ist jetzt gerade beim Beenden eines Spiels (AC Valhalla) wieder ein Bluescreen mit Reboot gekommen (und üblichen Fehlern im Event Log, Bus/Interconnect und WHEA).

Bisher hat nur das Deaktivieren von CPB langfristig geholfen. Bin jetzt immer noch nicht sicher ob es ein Softwareproblem ist, oder Hardwaredefekt an irgendeiner Komponente (CPU, PSU?).
 
@Denniss
Ne, hab nix drauf und auch keiner Auto OC Funktionen an.

Nach anfänglichem Optimus, nachdem auch in den Default Settings alles wieder funktioniert, ist jetzt gerade beim Beenden eines Spiels (AC Valhalla) wieder ein Bluescreen mit Reboot gekommen (und üblichen Fehlern im Event Log, Bus/Interconnect und WHEA).

Bisher hat nur das Deaktivieren von CPB langfristig geholfen. Bin jetzt immer noch nicht sicher ob es ein Softwareproblem ist, oder Hardwaredefekt an irgendeiner Komponente (CPU, PSU?).
Gibt einige CPU's die nicht gut funktionierten, im Computerbase-Forum liest man da z.B. in einem sehr langen Thread von solchen WHEA-Problemen die schlussendlich nur durch eine RMA gelöst werden konnten (und damit nachhaltig).

Andere Workarounds sind meist: leicht positives Offset bei der Spannung einstellen, DRAM-Spannung um 0.05 V (oder wie auch immer die geringste Stufe auf dem jeweiligen Board ist) erhöhen oder eben wie du CPB deaktivieren. Auch den RAM mal auf JEDEC-Einstellungen laufen zu lassen kann helfen, also XMP usw. rausnehmen.

Könnte also durchaus sein, dass die Hardware Schuld ist, das PSU könnte auch Probleme machen, halte ich aber eher für unwahrscheinlich wenn es ausreichend dimensioniert ist, da halte ich es für wahrscheinlicher, dass die Spannungsversorgung vom Mainboard nicht so schnell mitkommt. Ich würde persönlich mal versuchen ob die AGESA 1.2.0.0 das Problem behebt, wenn nicht: entweder weiterprobieren/auf neue AGESA warten oder ggf. sogar die CPU zurücksenden.

Das Problem ist derzeit in aller Munde und es scheint, als könnte eine neue AGESA Besserung bringen, das erklärt aber nicht warum es bei manchen problemlos funktioniert und bei anderen nicht. Das ist also aktuell eher Rätselraten, auch wenn die Hinweise in Richtung instabiler RAM und/oder Infinity Fabric oder Spannungsspitzen/Spannungsverwaltung deuten.


Da darf man als Kunde dann auch über eine Rücksendung nachdenken, wenn solche Probleme bestehen und sich nicht lösen lassen. Natürlich sollte man vorher schauen, ob nicht doch eine andere Komponente Probleme macht.
 
Zuletzt bearbeitet :
Ja, das schwierige ist natürlich jede einzelne Komponente auszuschließen, wenn man gerade keinen PC Hardwareladen Zuhause hat ;)

Man muss natürlich auch bedenken, die CPUs sind noch nicht so lange raus, die erste Produktion war schnell vergriffen, jetzt wird gerade die zweite ausgeliefert, da gibt es auch noch gar nicht so viele Kunden, als das man wirklich abschätzen kann, ob das grundlgende Probleme in der Qualitätssicherung sind, pauschale Softwarebugs etc. Da wirken dann 100 Leute mit Problemen im Internet so wie 50% der User.

Am besten wäre es natürlich, wenn ich direkt gegen eine andere CPU vergleichen könnte, aber das geht ja leider auch nicht so einfach und dann muss man sich überlegen, was am meisten Sinn macht.

Wenn das ein neues BIOS oder Chipsatz Treiber in den nächsten 2-3 Monaten behebt, kein Problem, warte ich gerne. Aber wenn das im Kern Hardwareprobleme aufgrund von Fertigungstoleranzen sind, dann würde ich natürlich lieber so schnell wie möglich die CPU austauschen,
 
Klar, so kann man das sehen - aber nicht jeder Nutzer ist so tolerant und ich bin mittlerweile auch wegen der zig BIOS Updates ein bisschen angefressen.

Lief das System vorher schon in der Bestückung oder alles neu? Wenn die Komponenten vorher liefen würde ich grundsätzlich davon ausgehen, dass sich bei einem CPU-Wechsel keine Komponente spontan verabschiedet hat.

Ich hab z.B. nur meinen alten Ryzen getauscht - wenn ich jetzt mit dem Neuen plötzlich WHEA-Fehler ohne Ende und Abstürze trotz aller Lösungsversuche gehabt hätte, dann wär der sofort zurückgegangen, da bin ich ehrlich. Die Toleranz da 2-3 Monate abzuwarten hätte ich nicht, vor allem weil das System auch produktiv genutzt wird.

Ähnlich lief es damals beim X570 Chipsatz - einige berichteten von endlosen POST-Problemen. Ich hatte auch Schwierigkeiten und ewig probiert - nichts half, das Ende vom Lied war: Mindfactory hat das Board problemlos ausgetauscht gegen ein Neues (selbes Modell, selbes BIOS) und alles lief wie geschmiert.
 
Ich habe leider zwangsläufig mehrere Komponenten gleichzeitig ausgetauscht (CPU, RAM, Mainboard, PSU), das macht es schwieriger. Übrigens alle zusammen bei Mindfactory bestellt, aber will die Sachen jetzt nicht einzeln austauschen um auf Fehlersuche zu gehen.

Ohne CPB ist es seit 18Uhr stabil, auch nach längeren Last-Sessions mit darauffolgendem Idle/Normallast. Bin gerade noch optimistisch, dass das nächste AGESA Update helfen kann, bzw. vielleicht auch eine manuelle Konfiguration mithilfe von ClockTuner (ohne das eigentliche Ziel von OC, sondern stabil Betrieb entlang der regulären Specs).
 
Oben Unten