Frage Hilfe: Ständige PC Reboots (R9 5900X, RTX3080, Custom Wakü)

AlexP87

Mitglied
Mitglied seit
Mrz 1, 2021
Beiträge
42
Bewertungspunkte
9
Punkte
7
Last Update: 06.04.2021:

Liebe Community,

ich benötige bitte Eure Hilfe. Seit ungefähr 2 Monaten (!) plage ich mich mit meinem neuen PC herum. Er geht immer und immer wieder unerwartet aus, rebootet und bleibt manchmal bei schwarzem Bildschirm stehen. Manchmal leuchtet die RAM-LED am MB, letztens ausnahmsweise mal die CPU-LED, manchmal nix und er bootet bis zum Windows durch. Manchmal geht er schnell hintereinander aus und wieder an. Mal im Spiel (Anno1800, R6, BF5, MSFS), mal in Excel, Text-Dokument, Discord. Es ist mir noch nie gelungen, den Reboot zu provozieren. Ich habe bereits eine Odyssey von Tests durch. Ich werde anschließend alles stichpunktartig aufführen, da der Text sonst zu lang wird:

Mein System (aktuell) - CPU-Z Report in Anlage:

  • MB: ASUS ROG Strix X570-E (BIOS auf aktuellem Stand: 3603)
  • CPU: Ryzen 9 5900X
  • GPU: MSI VENTUS X3 RTX3080 (Treiber auf aktuellem Stand)
  • RAM: HyperX 64GB 4 DIMMs á 16GB (HX432C16PB3AK4/64)
  • PSU: ASUS ROG THOR 850W
  • Custom Wasserkühlung:
  • GPU via Alphacool Eisblock Aurora Acryl GPX-N RTX
  • CPU via Corsair Hydro X Series XR5
  • Ausgleichsbehälter Lian Li O11D Distro-Plate G1 Verteilerplatte inkl. Pumpe
  • 2x 360er Radiatoren
  • Insg. 7 Corsair LL 120mm Lüfter
  • Peripherie und entsprechende RGBs aus den Komponenten:
    • Corsair K70 Tastatur
    • Maus
    • WLAN-Antenne
    • Corsair MM700 Matte
    • HOTAS X65
    • Thrustmaster Rudder Pedals
Folgendes habe ich bereits unternommen oder geprüft:

  • RMA CPU (ist bereits eine neue -> Produktionswoche KW 3/2021, davor 46/2020)
    • War aus zahlreichen Foren bzgl. WHEA-Fehlern mit ähnlichem Fehlerbild entstanden
      Tests innerhalb des RMA-Prozesses:
    • CMOS-Resets (mit Batterie, bereits mehrfach)
    • DOCP / XMP / PBO im BIOS deaktivieren
    • CPB (Core Performance Boost) im BIOS zu deaktivieren
    • Check Kühlung (iCue & GPU-Z)
      • CPU Temp.: 66,3 C (Package)
      • CPU Auslastung: 11%
      • MB-Temp. (Corsair Temp.-Fühler oberhalb CPU): 43.70°C
      • Water-Temp.:41.62°C
      • GPU Backplate Temp: 53.10°C
      • PSU-Temp.:28.29°C
      • GPU: 40.4C
      • Hot Spot 57.5C
      • Memory Temp.: 52.0C
    • Check Wats (GPU-Z):
      • Board Power Draw: 93,1 W
      • GPU Chip Power Draw: 20,0 W
      • MVDDC Power Draw: 67,5 W
      • PWR_SRC Power Draw: 62,2 W
      • PCIe Slot Power: 3,5 W
      • 8-Pin #1 Power: 34,3 W
      • 8-Pin #2 Power: 55,3 W
      • Power Consumption [% TDP]: 29,1%
    • Check Voltage (iCue & GPU-Z):
      • MB VCPU: 1.42V (1.31-1.43V gemessen)
      • 12V-Sensor: 11.97V (11.97-12.06)
      • 5V-Sensor: 5.00V (5.00-5.04)
      • 3.3V-Sensor: 3.40V (3.38-3.44)
      • GPU Voltage: 0,8750 V
  • Wärmeleitpaste erneuert
  • Energieverwaltung (verschiedene Steckdosen)
  • Keine NVMe-SSD installiert

  • PSU Tausch: von Corsair HX750i nun auf 850W (s.o.)
  • RAM Tausch: von Trident Z Royal G.Skill 2x16GB 3600 (F4-3600C16D-32GTRSC) auf 4x16GB (s.o.)
  • Hintergrund: neuer RAM in QVL Liste des MB und CPU, alter weder noch
  • Außerdem einen Trident vom Kollegen getestet
  • GPU ist vor meinem Tausch bereits mit einem Z170-A und Intel i7-6700K, sowie 2x8GB RAM problemlos gelaufen
  • Ich tauschte in einem Schwung: MB, RAM (zuerst Gskill) und CPU
  • Aktuell installierte Treiber (3x BIOS-Update, Problem besteht bei jeder Version)
  • Windows-Neuinstallation
  • Windowsenergieoptionen getestet
  • iCue deinstalliert
  • GPU mit 2 sep. Stromkabel an PSU, anstatt einem mit 2x 6+2 Stecker
  • PSU 0db Fan Modus an/aus
  • Alle SATA-Festplatten abgenommen und nacheinander wieder hinzugesteckt (Fehler trat nie auf)
  • RAMs in Single-, Dual- und Quadkonfiguration
  • PBO Fmax Enhancer: Disabled
  • PBO: Disabled
  • VDDCR CPU Voltage Offset -0.05 / -0.10 / +0.05 / +0.10
  • NVIDIA Driver Updates und auch wieder zurück
  • BIOS Updates und auch wieder zurück
  • Unterschiedliche Stromkreisläufe in der Wohnung
  • PBO Settings:
    • PBO Fmax Enhancer: Enabled
    • PBO: Manual (PPT 135 | TDC 90 | EDC 105)
    • Customized PBO Scalar 10x
    • Max CPU Boost Clock Override 600
    • Platform Thermal Throttle Limit 95
  • Weitere UEFI Settings:
    • DOCP on | BCLK Freq. 100 | SB Clock Spread Spectrum Auto | Performance Enhancer Auto | Memory Frequency 3200 (entspr. RAM) | FCLK 1600MHz | CPU Ratio Auto
    • PBO im AMD Overclocking:
      Enabled | PBO Limits MB | PBO Scalar Manual & 5X | Max CPU Boost Clock Override 200MHz | Platform Thermal Throttle Limit Auto
    • Curve Optimizer per Core 0-5: -10 | 6-11: -30
Ich meine das war alles, wenn ich was vergessen haben sollte, merkt ihr das ja in meinen Antworten.

Noch etwas Interessantes (vielleicht hilfts): Nachdem ich die neuen 4 RAM-Riegel installiert habe, lief der PC knapp 2 Tage stabil, jetzt jedoch wieder nicht.

Also, ich bin mit meinem Latein absolut am Ende (zumal ich kein ITler bin und mich lediglich Foreneinträgen, Google und Youtube bedienen kann) und würde mich wirklich wahnsinnig freuen, wenn mir jemand von Euch dort draußen helfen könnte, das Problem in den Griff zu bekommen.

Besten Dank vorab und viele Grüße
Alex

PS: Anbei Fotos von meinem Build, ein CPU-Z Report und die letzten vollständigen Logs. Außerdem die Windows-Ereignisprotokolle, die ich für die AMD-RMA festgehalten habe
 

Anhänge

  • Datensammlung.zip
    1.007,3 KB · Aufrufe : 9
Zuletzt bearbeitet :
Lösung
Hi zusammen,

ich habe mich etwas länger mit einem Update zurückgehalten, da ich nun im Rahmen einer RMA ein neues MB von ASUS geschickt bekommen habe. Das war am 23.04.2021 und ich hatte seitdem keinen einzigen Reboot mehr. So wie es aussieht, lag das Problem womöglich also an einem Defekt am Mainboard.

Nochmals danke an all die Unterstützenden hier im Forum und beste Grüße
Alex
Pass auf, ich hab gerade gesehen, dass der Infinity Fabric nicht mit dem RAM Synchron läuft, dass sollten die selben Frequenzen sein. Sprich der Memory Controller der CPU sollte gleich Takten wie der Ram selbst
 
Pass auf, ich hab gerade gesehen, dass der Infinity Fabric nicht mit dem RAM Synchron läuft, dass sollten die selben Frequenzen sein. Sprich der Memory Controller der CPU sollte gleich Takten wie der Ram selbst
Danke! Habe jetzt den Infinity auch auf 1600 gestellt und läuft nun synchron. Hier übrigens noch der R23 auch ausm Single
 

Anhänge

  • Cinebench-R23_Single_Bios-Opt.png
    Cinebench-R23_Single_Bios-Opt.png
    562,7 KB · Aufrufe : 9
Also ich hab bei meinem System jetzt seit ca 20h keinen Absturz mehr. Dann ahb ich hier wie Angekündigt von meinem BIOS mal ein paar Bilder, was ich so eingestellt habe, wenn es kein Bild gibt, steht es vermutlich auf AUTO, SAM ist aktiviert. Dann ha ich noch ein Cinbenche r23 Multi und ein Singel Core lauf gemacht und davon hba ich auch 2 Bilder mit dabei. Dazu muss ich och sagen, dass ich wahrscheinlich ene relativ schlechte CPU habe, weil gut übertakten lässt die sich nicht und auch stock ist die im Vergleich zu anderen jett nicht so gut...

(da man nur 5 datein Anhängen kann, mach ich 2 Nachrichten)
Hat leider nicht den gewünschten Erfolg gebracht. Soeben ist er wieder ausgegangen. :(
Ich update noch den ersten Eintrag um einen weiteren Versuch.

Noch jemand eine Idee?
 
Hattest jetzt mal Memtest unter Windows laufen lassen?
Hab ich soeben gemacht: Keine Fehler gefunden. Ich lese gerade ein Forumbeitrag auf "linustechtips.com", das Problem ist ja wirklich weit verbreitet und scheint vorwiegend bei AMD Zen 2 und 3 im Idle vorzukommen. Als ob CPU oder RAM (was genau der Auslöser sein könnte, weiß ich noch nicht) durch die Ruhepause so sehr undervoltet und damit abstirbt, wie ein Automotor bei dem man zu spät auf die Kupplung tritt oder sie "fallen lässt". In Benchmarks ist mir das noch nie passiert. In einem Game hingegen schon aber vor allem auch, wenn der Rechner vermeintlich nichts zu tun hat. Bei jedem Reboot gibt das Netzteil ein Knacken von sich, eben das selbe Geräusch, wie wenn der Rechner heruntergefahren wird und sich abschaltet oder er angeschaltet wird. In dem Beitrag berichten User mit einem 5950X und 1200W PSU von dem Problem, also das Netzteil kann es wirklich nicht sein.
 
Ich hoffe du hast nen Screen davon gemacht.Memtest unter Windows können nur die wenigsten richtig ausgeführt.;)
 
Igor hat mit der Grafikkarte auch ein 1200 Watt-Netzteil zum abliegen gebracht. Es geht nicht nur um die maximale Last, sondern auf die Reaktionsfähigkeit der Stromversorgung.

Wenn der PC im Idle läuft, reduziert der Prozessor den Takt und die Spannung, so dass er weniger als ein halbes Watt braucht. Die CPU kühlt auch ab. Die Grafikkarte macht es ähnlich. Auch im Leerlauf gibt es aber immer wieder kleine Arbeiten auszuführen. Auch wenn das nur ein Sekundenbruchteil ist, fährt der Prozessor und die Grafikkarte dafür auf den maximalen Boosttakt hoch. Eine RTX 3080 kann in so einem Moment über 550 Watt saufen und auch ein 5900x springt auf über 250 Watt. Wenn die Stromversorgung da zu wenig schnell nachregelt, bekommt irgend ein Bauteil einen Moment lang zu wenig Strom. Die Spannungswandler auf dem Mainboard müssen der CPU genug Strom liefern, die Spannungswandler auf der Grafikkarte der GPU. Beide hängen aber wie alle anderen Bauteile an Netzteil. Wenn das Netzteil in dem Moment nicht mit kommt, saufen CPU und GPU zu viel weg und oft ist es dann der RAM, der zu wenig bekommt und instabil wird.

In einem Game entstehen auch solche Leistungsspitzen. Es gibt immer wieder mal kurze Wartezeiten und dann wieder volle Leistung. Bei einem Benchmark hat man aber konstante Last. Dann kann die Stromversorgung immer gleich viel liefern und muss sich nicht dauernd extremen Sprüngen anpassen.

Deshalb hilft es oft auch wenig stundenlange Benchmarks zu machen. Es hilft nur, die Leistungsspitzen von CPU und GPU wo möglich zu verringern und ein genug flinkes Netzteil zu verwenden.
 
Ich hoffe du hast nen Screen davon gemacht.Memtest unter Windows können nur die wenigsten richtig ausgeführt.;)
Das hier: 1617744759991.png

Danach etwa 1 Stunde blauer Bildschirm und zwei Tests. Ergebnis wurde nur in der Taskleiste unter Benachrichtigungen kurz per Popup angezeigt: "Keine Fehler gefunden"
 
Das ist doch kein Test.....
Ein Test schaut so aus:
XMP-PROFIL Laden
CPU Voltage von Auto auf Offset - 0 stellen wie auch die SoC Voltage.
Ramspannung um 25mV senken.
LLC CPU auf Regulär
LLC SoC auf Hoch
Der 5900X hat 24 Threds , somit 24 Fenster von Memtest auf.
In HWINFO64 nachsehen wieviel RAM noch frei ist , das durch 24 und das Ergebnis dann in jedes Fenster Eintragen.Nachsehen ob es Syncron läuft.
Memtest muss dann min bis 1000% laufen.
In der Zeit die Finger vom Rechner lassen.

Hier hab ich z.b. geschaut ab wann der IF vom Bios zu gemacht wird und es waren 1880MHz mit 4x8GB Ram und SoC von 1,05V die unter Last aber bis auf 1,03...V abfallen kann was aber bei Mir nicht schlimm ist weil erst mit 1,025V wieder Fehler kommen.
 
Zuletzt bearbeitet :
Das ist doch kein Test.....
Ein Test schaut so aus:
XMP-PROFIL Laden
CPU Voltage von Auto auf Offset - 0 stellen wie auch die SoC Voltage.
Ramspannung um 25mV senken.
LLC CPU auf Regulär
LLC SoC auf Hoch
Der 5900X hat 24 Threds , somit 24 Fenster von Memtest auf.
In HWINFO64 nachsehen wieviel RAM noch frei ist , das durch 24 und das Ergebnis dann in jedes Fenster Eintragen.Nachsehen ob es Syncron läuft.
Memtest muss dann min bis 1000% laufen.
In der Zeit die Finger vom Rechner lassen.
Ich glaube ich muss nochmal klar machen, dass ich kein Hardware-Pro bin und mich mit dem Ganzen hier noch nie beschäftigen "musste". Wenn Du "Memtest unter Windows laufen lassen" schreibst, dann war das für mich der logische Weg. Ich war aber selbst überrascht, dass es dafür ein Tool von Windows gibt, jedoch nicht über das Ergebnis :LOL:. Also bitte gerne weiter Tipps und Tricks, jedoch ggf. konkreter beschrieben :).
 
Dafür hab ich ja geschrieben was du einstellen musst.
Da steht aber Windows Speicherdiagnose und nicht Memtest. ;)
Der Download zu Memtest
 
Anhand der *EFI-Problematik würde ich da erst mal das Bios löschen und komplett neu drauf machen.


Wie gesagt: LÖSCHEN, nicht mit *EFI auf *EFI einfach drüber bügeln - wennst da nen Bootkit drin hast wo einer die Adressen verbogen hat dann bringt das recht herzlich wenig einfach die Firmware im Firmware-Flashtool zu überschreiben.

Wurde bei Stargate Atlantis vor vielen Jahren bereits gezeigt, was das Problem ist: der Kuckuck wie sonst auch.

So nen CH341 bekommst für gerade mal 3-40 Curu
 
Anhand der *EFI-Problematik würde ich da erst mal das Bios löschen und komplett neu drauf machen.
Kannst du mir etwas genauer erklären, warum das nötig sein soll? Ich sehe in der Problembeschreibung keinen Hinweis darauf, dass jemand das BIOS gehackt haben könnte. Oder versteht ich da was falsch?
 
Möglicherweise habe ich eine Lösung gefunden: Power Down mode deaktivieren und RAM Volts leicht auf 1.36 erhöht hat bisher keinen Reboot ausgelöst und das System scheint stabil zu laufen. Ich berichte weiter ;)
 
Möglicherweise habe ich eine Lösung gefunden: Power Down mode deaktivieren und RAM Volts leicht auf 1.36 erhöht hat bisher keinen Reboot ausgelöst und das System scheint stabil zu laufen. Ich berichte weiter ;)
Die Stromsparmodi können in der Tat ein Problem darstellen, ist aber meist ein Indiz dafür, dass das NT ein Problem haben könnte - da du es aber schon getauschst hast, würde ich eher vom Bios/Mainboard ausgehen.

Das Problem mit den Stromsparmodi hatte ich selber schon einmal bei nem Kumpel, sein NT war aber zu knapp bemessen und 4 Jahre alt (kein Be Quiet, sondern nen anderes - Name ist mir leider entfallen), dort gab es ein ähnliches Fehlerbild. Nach dem deaktivieren sämtlicher Stromsparmodi lief es ohne Probleme.
Als er sich dann ein neues NT gekauft hat, was ausreichend ist, konnten wir diese wieder aktivieren.

Sollte es hingegen am Bios liegen, dann einfach immer nach einem aktuellen ausschau halte und ggf. diesen Fehler dem Boardhersteller benennen, wenn er nicht wieder auftritt.
 
Zuletzt bearbeitet :
Hi zusammen,

ich habe mich etwas länger mit einem Update zurückgehalten, da ich nun im Rahmen einer RMA ein neues MB von ASUS geschickt bekommen habe. Das war am 23.04.2021 und ich hatte seitdem keinen einzigen Reboot mehr. So wie es aussieht, lag das Problem womöglich also an einem Defekt am Mainboard.

Nochmals danke an all die Unterstützenden hier im Forum und beste Grüße
Alex
 
Lösung
Danke fürs Feedback, gut das es nun klappt
 
Oben Unten