Frage MSI B550 Tomahawk verliert SATA (drive_power_state_failure) resultiert in freezes??

Moosbringer

Neuling
Mitglied seit
Mai 5, 2022
Beiträge
7
Bewertungspunkte
0
Punkte
1
CPU: AMD Ryzen 5600X (neu)
MB: MSI B550 Tomahawk (neu, A94 Beta Bios-ComboAm4v2PI 1.2.0.6c)
RAM: Crucial Ballistix DDR4 4000Mhz CL18 (auf 3800Mhz 1:1, neu)
NT: BeQuite 650W Straight Power Platinum (neu)
GPU: Vega 56, Powercolor Red Dragon (alt)
SATA:
1xSamsung Evo 860 SSD 500GB (alt)
1xWestern Digital red, 4TB, EFAX (alt)

Problem:
Bild friert nacheinander ein, egal ob im idle oder unter Last. Manchmal nach 5min, manchmal nach 5+ Stunden. Zuerst der aktuelle Task, dann die Taskleiste. Mauszeiger bleibt bewegbar, Musik/Sound läuft weiter. Am Beginn des Freezes kann ich noch schnell z.B. HWinfo öffnen bevor alle Schaltflächen unklickbar werden. Uhrzeit&HWinfo wird teilweise trotzdem noch aktualisiert für einige Zeit bevor beides ebenfalls einfriert. Ein Neustart mit bluescreen erfolgt nicht oder erst sehr spät (wenig Geduld). Einmal kam nach ewigem warten tatsächlich ein bluescreen mit folgendem Wortlaut: "drive_power_state_failure".

Meist warte ich aber nicht so lange, sondern drücke den Reset-Knopf. Dann passiert eigtl. fast immer folgendes:
1. Restart failt, der PC bootet nicht.
2. Zweites mal Knopf drücken, PC bootet nicht.
3. Drittes mal Knopf drücken, PC bootet wieder -> geht meist direkt ins Bios
4. Im Bios (UEFI) sind dann die SATA Laufwerke entweder: a) Keine SATA erkannt b) Erkannt+BootManager, c) Erkannt ohne Bootmanager, d) 1v2 erkannt ohne BM
5. Reboot ohne savings
6. Back to Windows 11 -> bis zum nächsten Freeze und der loop beginnt erneut.

Aus dem kalten gestartet, z.B. am frühen Morgen geht er fast immer problemlos ins Windows. Ich habe lange Zeit gedacht, dass diese Freezes daher kommen, dass mein Verhältnis IOD&CCD&SOC Spannungen nicht gut austariert war oder dass es an irgendeinem OC-Schalter liegt, der falsch eingestellt ist. Aber diese Freezes kommen auch, wenn ich RAM+FLCK auf 1600 (3200Mhz) laufen lasse und die standart-timings einstelle, sowie PBO deaktiviere. Mittlerweile glaube ich, dass das Mainboard aus Gründen, die mit OC nichts zu tun haben sporadisch die SATA-Laufwerke verliert, bzw. diese Laufwerke keinen Strom mehr bekommen ("drive_power_state_failure").
Wie kann ich das Problem eingrenzen?
 

Anhänge

  • 54.png
    54.png
    38,8 KB · Aufrufe : 4
Hallo Moosbringer

Das ist schon ein sehr lästiges Fehlerbild. Als erstes würde ich die Stromversorgung der SATA-Laufwerke überprüfen, denn darauf deutet "drive_power_state_failure" hin. Steck die SATA-Stromversorgung am Netzteil frisch ein, so dass sie auch richtig einrastet. Die Stecker an den Laufwerken würde ich auch ausziehen und neu einstecken und etwas bewegen, damit die Kontakte etwas gereinigt werden.

Ist im BIOS CSM (Compatibility Support Mode) für die Laufwerke (Drives) eingeschaltet? Probiere das einmal mit oder ohne.

Sonst macht es natürlich Sinn, alle Übertaktungen raus zu nehmen. Am einfachsten ist es das BIOS zurück zu setzen und dann PBO ausdrücklich aus zu schalten. Der Fast-Boot des Mainboards ist dann auch gleich ausgeschaltet. Den Schnellstart von Windows würde ich auch ausschalten.
 
Im Zwischenzeit habe ich folgende Maßnahmen getroffen:

a) 2x SATA Strom-Kabelbund an 3 HDDs geändert zu 1xSATA Kabelbund an 3 HDDs mit replugging aller Stecker
- Kein Erfolg
b) SOC: 1,19V statt 1,06V
- Kein Erfolg

Ich habe aber weitere Beobachtungen gemacht. So geht die CPU-Lampe an (rote LED) auf dem Mainboard, wenn er nicht starten will.
Auch scheinen die freezes gehäuft dann aufzutreten, wenn ich Inhalte, z.B. Kommentarbereich auf einer Webseite neu bzw. nachlade. Auch interessant ist, dass sobald der freeze beginnt und noch bevor alle Elemente eingefroren sind, trennt sich meine Internetverbindung (Symbol unten rechts in der Taskleiste). Meinem Verständnis nach sind bei den neuen Ryzen CPUs die SATA Controller in der CPU verbaut und nicht mehr auf der North Bridge des Mainboards wie früher. Daher könnte ein Ausfall der HDDs auch durch einen Fehler in der CPU getriggert werden. Wenn allerdings simultan auch der LAN-Controller ausfällt, dann muss der Fehler vom Mainboard kommen und nicht von der CPU, korrekt?
Wenn hardwareseitig etwas falsch läuft, dann ist in den allermeisten Fällen eines von zwei Dingen schuld:
a) zu viel Spannung oder
b) zu wenig Spannung

Kann jemand abschätzen, ob die von Mainboard ausgelesenen Spannungen soweit okay sind?
screen1dlj1m.png
 
Zuletzt bearbeitet :
Meinem Verständnis nach sind bei den neuen Ryzen CPUs die SATA Controller in der CPU verbaut und nicht mehr auf der North Bridge des Mainboards wie früher.
Da musste ich auch nachschauen: Teilweise, 2 SATA-Anschlüsse sind an der CPU, die anderen 4 im Chipsatz.
Im Handbuch finde ich nicht beschreiben, welche der 6 Anschlüsse woran hängen. Ich vermute, dass die beiden obersten (SATA 5/6) an der CPU hängen und die unteren am Chipsatz.

Ich würde als Test einmal versuchen, nur die SATA-Anschlüsse des Chipsatzes zu verwenden. Falls nicht alle Laufwerke nötig sind, würde ich diese abklemmen. Was nicht angeschlossen ist, macht auch kein Problem.
 
Hier hat jemand scheinbar das gleiche Problem und es lag an der CPU, ein 5900X. Möglicherweise ist das Problem bekannt bei AMD und betrifft die ganze Serie. https://www.hardwareluxx.de/community/threads/ryzen-5900x-defekt.1281162/page-2

Ich hab jetzt nur zwei HDDs an Port 5/6 gesteckt, die müssten also am Chipsatz hängen. Mal schauen, wenn er jetzt tatsächlich nicht mehr einfrieren sollte, ist es aller Wahrscheinlichkeit nach der 5600X.
 
Ich hab jetzt nur zwei HDDs an Port 5/6 gesteckt, die müssten also am Chipsatz hängen.
Ich vermute eher, das sind die an der CPU. Sicher sagen kann ich es aber nicht, da ich keine Infos dazu gefunden habe. Probiere es einfach mal und wenn es nicht hilft, kannst du ja 2 andere nehmen. Man muss einfach alles durchprobieren um zu sehen, woran es liegt.
 
Ein beta-BIOS ist ja auch immer eine potentielle Fehlerquelle.
Bin jetzt grad beim Einlesen, wie MSI das handhabt, aber nicht wirklich schlau geworden.
Ich finde auf deren website nirgends ein beta-BIOS mit der von Dir angegebenen Bezeichnung, auch nicht im mod-/Beta BIOS Unterforum, geschweige denn detaillierte changelogs auch bei den "offiziellen Vollversionen".
Die letzte "offizielle" Version ist 7C91vA9 mit Erscheinungsdatum 2022-03-23.
Ist das die, die Du meinst/hast bzw. wo hattest Du die andere her, wenn es verschiedene waren?
 
Update:
SATA port 5/6 haben keine Verbesserung gebracht. Gestern lief er zwar 7 Stunden sauber durch. Heute nach dem Einschalten aber direkt nach 5min ein freeze und nach einer Neustart-Orgie, um ihn überhaupt wieder post-bios zu bekommen, der nächste freeze nach etwa 10min.

->Änderung PLL-Voltage (1P8 bei MSI) von "Auto" zu "1.80V"
Wenn das nichts bringt, auf 1.9V und wenn das auch nichts bringt, Bios-Update.
Ich vermute eher, das sind die an der CPU.
Vorher hatte ich Port 1/2, sowie 1/3 probiert. Nun 5/6. Ich könnte nur noch 3/4 testen, alles andere macht ja keinen Sinn denke ich.
Ein beta-BIOS ist ja auch immer eine potentielle Fehlerquelle.
Mein A94-Beta Bios stammt(e) von der offiziellen MSI-Seite. Sie haben es nur wieder entfernt, sobald das A9 Final herauskam. Ich habe das A9 bisher nicht installiert, weil ich auf die A10 (AGESA XX.07) update warte, was ja die Tage erscheinen soll und einen TPM-fix beinhalten soll, da ich Win11 nutze. Momentan habe ich AMD-TPM auf "Off" und secure boot auf "On", glaube aber nicht dass diese Einstellungen mit den freezes zu tun haben.

Ich könnte noch CSM+UEFI probieren, statt UEFI only. Die freezes sind zwar random, manchmal nach 5min, manchmal nach 10 Stunden, scheinen aber auffällig oft, bzw. gehäuft kurz nach dem Windows-Start aufzutauchen und/oder simultan mit dem Neuladen einer Webseite.
 
Zuletzt bearbeitet :
So geht die CPU-Lampe an (rote LED) auf dem Mainboard, wenn er nicht starten will.
Es hätte mich schon fast gewundert, wenn die Wahl der SATA-Ports oder die anderen Einstellungen etwas verändert hätten.

Auch CSM dürfte wenig verändern. Da geht es darum, ob das Bootlaufwerk mit MBR oder GPT läuft. Dazu liefert es Unterstützung für sehr alte Grafikkarten (doppelt so alt wie deine).

Wenn die CPU-LED aufleuchtet und nicht mehr aus geht, deutet das auf einen Fehler bei der CPU oder dem Mainboard hin. Alle anderen Bauteile sind zu dem Zeitpunkt noch nicht aktiv. Auch RAM und Grafikkarte kommen erst später.

Ich würde das aktuellste BIOS installieren und das BIOS zurück setzen. Den aktuellen Chipsatztreiber könnte man noch installieren. Wenn diese Massnahmen auch nichts bringen, muss man entweder CPU oder Mainboard austauschen oder die CPU mal in einem anderen PC testen.
 
Wenn Du es "aushältst" würd ich glaub ich auch warten bis das nächste update inkl "fTPM-fix" kommt, anstatt jetzt für möglicherweise nur ein paar Tage eine non-beta aufzuspielen, von der nicht bekannt ist, daß sie eindeutig derartige Instabilitäten fixt.
Immerhin ist ein BIOS-update nach wie vor ein Unterfangen potentiell nicht ohne Risiko.

Die dann neue würd ich aber auf jeden Fall ziehen, auch - oder grade weil - die changelogs bei MSI offenbar sehr grob gehalten sind, und nicht im Detail beschreiben, welche bugs bzw. Stabilitätsprobleme adressiert wurden.

Vorher würd ich auch keine weitere Arbeit reinstecken, aber das musst Du natürlich entscheiden, wie genervt Du davon bist und ob es den Zeitaufwand lohnt.
 
Erhöhung der PLL auf 1.85V hat auch nichts gebracht. Das Mainboard hat eine Vorgeschichte, die ich bisher verschwiegen habe, weil ich möglichst gedankenoffene Antworten wollte. Es ist nämlich als Rückläufer gekauft, also B-Ware bei dem die SATA-Kabel fehlten. Ich nutze daher zwei verschiedene SATA Kabel von älteren Mainboards auf denen alte bis steinalte Intel-Systeme verbaut waren (I5-4670K und Core2Quad Q6600). Könnte es theoretisch sein, dass neue Kabel das Problem lösen würden? Ich habe die HDDs in Benchmarks getestet und die Leistung ist im Soll, außerdem hat sich der SATA6G-Standart seit Ewigkeiten nicht geändert, daher hatte ich das erstmal ausgeschlossen.

Ich wollte früher oder später eine M.2 kaufen, die mit PCIe 4.0 läuft und im ersten Slot installiert wird. Wenn ich nun eine kaufe und hier Win11 drauf installiere und die SATA-Laufwerke im Bios auf den "Hot plug" modus stelle, dann könnten die theoretisch mitten in Windows ausfallen ohne dass das System abschmiert, weil der SATA-Controller egal ob in der CPU oder auf dem Chipsatz nichts mit der M.2 zu tun hat. Oder es ist so, dass dann auch die M.2 abschmiert, weil der Fehler irgendwo im Mainboard liegt, z.B. ein Kurschluss vorliegt o.ä..
 
außerdem hat sich der SATA6G-Standart seit Ewigkeiten nicht geändert, daher hatte ich das erstmal ausgeschlossen.
Es würde mich auch etwas wundern, wenn es an den Kabel läge. Ich vermute, da hast du ja auch nicht nur die steinalten getestet. Die könnten noch SATA3G sein.

Oder es ist so, dass dann auch die M.2 abschmiert, weil der Fehler irgendwo im Mainboard liegt, z.B. ein Kurschluss vorliegt o.ä..
Ohne die Ursache wirklich gefunden zu haben, würde ich nichts ausschliessen.
 
Vielleicht lohnt sich auch noch ein Blick in den Energiesparplan?
Möglicherweise ist da ja irgendwas so gestellt, daß irgendeine Platte nach (zu) kurzer Zeit ohne Zugriff in Ruhezustand geht o.ä.
Vllt. einfach mal auf "Höchstleistung" stellen wenns vorher was anderes war, bzw. wenn bereits "Höchstleistung" aktiv ist,
die einzelnen Optionen im Detail durchklicken, ob da irgendwas eigenartig ist.
Wie das in Win11 im Detail aussieht, kann ich aber leider nicht sagen.
 
Auf Höchstleistung hatte ich den Energiesparplan auch schon, ohne Unterschied. Aktuell auf "balanced".

Mittlerweile hat sich eine "3" herauskristallisiert. Also nach dem ersten Einschalten z.B. morgens läuft er nur etwa 2-20min und friert ein (meist beim lesen von Spiegel Online). Nach dem Neustarten wieder in demselben Zeitraum ein zweiter freeze und dann beim dritten erfolgreichen booten in Windows bleibt er für längere Zeit stabil, manchmal sogar für 17+ Stunden am Stück mit unterschiedlichen Lasten (Gaming, Video, lesen, schreiben). Um diese drei Boots in Windows zu schaffen, muss ich zwischen 3-9 mal die Reset-Taste betätigen.

Das Bios Update mit dem ComboAM4v2 1.2.0.7 müsste jetzt jeden Tag erscheinen. Ich hoffe das fixed dieses Problem, weil das langsam jeden Morgen zur Tortur wird.
 
Kurzes Update:

Auch ein Wechsel auf die ComboAM4v2 1.2.0.7 hat keine wesentlichen Änderung gebracht. Nach wie vor knallen sporadisch die SATA-Laufwerke raus und der PC friert ein, insbesondere und vor allem der Boot&Postvorgang scheint dieses Verhalten zu triggern. Sobald er in Windows ist, läuft er dann auch mal 70 Stunden am Stück durch ohne Problem, was der Grund ist warum ich bis heute nichts reklamiert habe. Im Moment macht er relativ wenig Faxen, sodass ich nur etwas 1-4 mal resetten muss, bevor ich in Windows bin.

Was ich noch testen werde: Neue SATA Kabel
Eine Einschicken in die RMA des Mainboards scheue ich, da ich ein zweites kaufen müsste und a) gerade knapp bin und b) dann evtl. noch bis AM5 warte und komplett wechsel, je nachdem wie sich das P/L gestaltet.

Was mir noch aufgefallen ist: Zwei oder Drei der Schrauben-Löcher des Mainboards habe ich mit Abstandshaltern, statt mit M3-Schrauben versehen, weil ich nicht genug M3 Schrauben hatte, also dort liegt es nur auf so einem Köpfchen auf. Auch sind etwa die Hälfte der Schrauben mit schwarzem Überzug (nicht leitend) und die Hälfte blank (leitend). Könnte an diesen Schraubenlöchern irgendwo potentiell ein Kurzschluss oder eine Überspannung entstehen? Haben die Löcher überhaupt eine Erdungsfunktion und wenn ja wohin erden sie, über das Gehäuse oder über das NT?
 
Zuletzt bearbeitet :
Haben die Löcher überhaupt eine Erdungsfunktion und wenn ja wohin erden sie, über das Gehäuse oder über das NT?
Ja, die Löcher erden das Mainboard. Das Mainboard hat an den Löchern kleiner Kontakte, so dass über die Schrauben eine Verbindung zum Gehäuse entsteht. Das Netzteilgehäuse ist geerdet und auch am Gehäuse des PCs festgeschraubt. Somit hat man eine durchgehende Erdung. Diese Erdung funktioniert aber auch, wenn nicht alle Schrauben drin sind. Der PC läuft auch ganz ohne, beispielsweise wenn man das Mainboard einfach auf den Tisch stellt.

Wichtig ist, dass hinter dem Mainboard an keiner Stelle Distanzhalter angebracht sind, an denen das Mainboard keine Löcher hat. Darauf muss man aufpassen, wenn man das Mainboardformat wechselt. Wenn ein Distanzhalter am falsche Ort ist, kann er auf dem Mainboard Kontakte berühren und einen Kurzschluss verursachen oder durch den Druck auf ein Bauteil etwas beschädigen.

Ideal ist natürlich schon, wenn alle Schrauben angebracht sind, damit das Mainboard stabil fixiert ist und sich durch die daran hängende Grafikkarte oder einen schweren CPU-Kühler nicht unnötig verbiegt. Kaputt gehen sollte es wegen ein paar fehlenden Schrauben aber nicht.
 
Oben Unten