Frage Hilfe: Ständige PC Reboots (R9 5900X, RTX3080, Custom Wakü)

AlexP87

Mitglied
Mitglied seit
Mrz 1, 2021
Beiträge
42
Bewertungspunkte
9
Punkte
7
Last Update: 06.04.2021:

Liebe Community,

ich benötige bitte Eure Hilfe. Seit ungefähr 2 Monaten (!) plage ich mich mit meinem neuen PC herum. Er geht immer und immer wieder unerwartet aus, rebootet und bleibt manchmal bei schwarzem Bildschirm stehen. Manchmal leuchtet die RAM-LED am MB, letztens ausnahmsweise mal die CPU-LED, manchmal nix und er bootet bis zum Windows durch. Manchmal geht er schnell hintereinander aus und wieder an. Mal im Spiel (Anno1800, R6, BF5, MSFS), mal in Excel, Text-Dokument, Discord. Es ist mir noch nie gelungen, den Reboot zu provozieren. Ich habe bereits eine Odyssey von Tests durch. Ich werde anschließend alles stichpunktartig aufführen, da der Text sonst zu lang wird:

Mein System (aktuell) - CPU-Z Report in Anlage:

  • MB: ASUS ROG Strix X570-E (BIOS auf aktuellem Stand: 3603)
  • CPU: Ryzen 9 5900X
  • GPU: MSI VENTUS X3 RTX3080 (Treiber auf aktuellem Stand)
  • RAM: HyperX 64GB 4 DIMMs á 16GB (HX432C16PB3AK4/64)
  • PSU: ASUS ROG THOR 850W
  • Custom Wasserkühlung:
  • GPU via Alphacool Eisblock Aurora Acryl GPX-N RTX
  • CPU via Corsair Hydro X Series XR5
  • Ausgleichsbehälter Lian Li O11D Distro-Plate G1 Verteilerplatte inkl. Pumpe
  • 2x 360er Radiatoren
  • Insg. 7 Corsair LL 120mm Lüfter
  • Peripherie und entsprechende RGBs aus den Komponenten:
    • Corsair K70 Tastatur
    • Maus
    • WLAN-Antenne
    • Corsair MM700 Matte
    • HOTAS X65
    • Thrustmaster Rudder Pedals
Folgendes habe ich bereits unternommen oder geprüft:

  • RMA CPU (ist bereits eine neue -> Produktionswoche KW 3/2021, davor 46/2020)
    • War aus zahlreichen Foren bzgl. WHEA-Fehlern mit ähnlichem Fehlerbild entstanden
      Tests innerhalb des RMA-Prozesses:
    • CMOS-Resets (mit Batterie, bereits mehrfach)
    • DOCP / XMP / PBO im BIOS deaktivieren
    • CPB (Core Performance Boost) im BIOS zu deaktivieren
    • Check Kühlung (iCue & GPU-Z)
      • CPU Temp.: 66,3 C (Package)
      • CPU Auslastung: 11%
      • MB-Temp. (Corsair Temp.-Fühler oberhalb CPU): 43.70°C
      • Water-Temp.:41.62°C
      • GPU Backplate Temp: 53.10°C
      • PSU-Temp.:28.29°C
      • GPU: 40.4C
      • Hot Spot 57.5C
      • Memory Temp.: 52.0C
    • Check Wats (GPU-Z):
      • Board Power Draw: 93,1 W
      • GPU Chip Power Draw: 20,0 W
      • MVDDC Power Draw: 67,5 W
      • PWR_SRC Power Draw: 62,2 W
      • PCIe Slot Power: 3,5 W
      • 8-Pin #1 Power: 34,3 W
      • 8-Pin #2 Power: 55,3 W
      • Power Consumption [% TDP]: 29,1%
    • Check Voltage (iCue & GPU-Z):
      • MB VCPU: 1.42V (1.31-1.43V gemessen)
      • 12V-Sensor: 11.97V (11.97-12.06)
      • 5V-Sensor: 5.00V (5.00-5.04)
      • 3.3V-Sensor: 3.40V (3.38-3.44)
      • GPU Voltage: 0,8750 V
  • Wärmeleitpaste erneuert
  • Energieverwaltung (verschiedene Steckdosen)
  • Keine NVMe-SSD installiert

  • PSU Tausch: von Corsair HX750i nun auf 850W (s.o.)
  • RAM Tausch: von Trident Z Royal G.Skill 2x16GB 3600 (F4-3600C16D-32GTRSC) auf 4x16GB (s.o.)
  • Hintergrund: neuer RAM in QVL Liste des MB und CPU, alter weder noch
  • Außerdem einen Trident vom Kollegen getestet
  • GPU ist vor meinem Tausch bereits mit einem Z170-A und Intel i7-6700K, sowie 2x8GB RAM problemlos gelaufen
  • Ich tauschte in einem Schwung: MB, RAM (zuerst Gskill) und CPU
  • Aktuell installierte Treiber (3x BIOS-Update, Problem besteht bei jeder Version)
  • Windows-Neuinstallation
  • Windowsenergieoptionen getestet
  • iCue deinstalliert
  • GPU mit 2 sep. Stromkabel an PSU, anstatt einem mit 2x 6+2 Stecker
  • PSU 0db Fan Modus an/aus
  • Alle SATA-Festplatten abgenommen und nacheinander wieder hinzugesteckt (Fehler trat nie auf)
  • RAMs in Single-, Dual- und Quadkonfiguration
  • PBO Fmax Enhancer: Disabled
  • PBO: Disabled
  • VDDCR CPU Voltage Offset -0.05 / -0.10 / +0.05 / +0.10
  • NVIDIA Driver Updates und auch wieder zurück
  • BIOS Updates und auch wieder zurück
  • Unterschiedliche Stromkreisläufe in der Wohnung
  • PBO Settings:
    • PBO Fmax Enhancer: Enabled
    • PBO: Manual (PPT 135 | TDC 90 | EDC 105)
    • Customized PBO Scalar 10x
    • Max CPU Boost Clock Override 600
    • Platform Thermal Throttle Limit 95
  • Weitere UEFI Settings:
    • DOCP on | BCLK Freq. 100 | SB Clock Spread Spectrum Auto | Performance Enhancer Auto | Memory Frequency 3200 (entspr. RAM) | FCLK 1600MHz | CPU Ratio Auto
    • PBO im AMD Overclocking:
      Enabled | PBO Limits MB | PBO Scalar Manual & 5X | Max CPU Boost Clock Override 200MHz | Platform Thermal Throttle Limit Auto
    • Curve Optimizer per Core 0-5: -10 | 6-11: -30
Ich meine das war alles, wenn ich was vergessen haben sollte, merkt ihr das ja in meinen Antworten.

Noch etwas Interessantes (vielleicht hilfts): Nachdem ich die neuen 4 RAM-Riegel installiert habe, lief der PC knapp 2 Tage stabil, jetzt jedoch wieder nicht.

Also, ich bin mit meinem Latein absolut am Ende (zumal ich kein ITler bin und mich lediglich Foreneinträgen, Google und Youtube bedienen kann) und würde mich wirklich wahnsinnig freuen, wenn mir jemand von Euch dort draußen helfen könnte, das Problem in den Griff zu bekommen.

Besten Dank vorab und viele Grüße
Alex

PS: Anbei Fotos von meinem Build, ein CPU-Z Report und die letzten vollständigen Logs. Außerdem die Windows-Ereignisprotokolle, die ich für die AMD-RMA festgehalten habe
 

Anhänge

  • Datensammlung.zip
    1.007,3 KB · Aufrufe : 9
Zuletzt bearbeitet :
Lösung
Hi zusammen,

ich habe mich etwas länger mit einem Update zurückgehalten, da ich nun im Rahmen einer RMA ein neues MB von ASUS geschickt bekommen habe. Das war am 23.04.2021 und ich hatte seitdem keinen einzigen Reboot mehr. So wie es aussieht, lag das Problem womöglich also an einem Defekt am Mainboard.

Nochmals danke an all die Unterstützenden hier im Forum und beste Grüße
Alex
CPU scheint mir recht warm für 11% Last unter Wakü
Grafikkarte scheint nur mit einem Stromkabel und zwei Steckern angeschlossen zu sein, bei so einem Stromsäufer empfiehlt es sich 2 Kabel zu nutzen. Sind das originalkabel vom Netzteil oder irgendwelche Modkabel?
Abstandhalter unter dem Mainboard nur dort wo sie hingehören?
 
CPU scheint mir recht warm für 11% Last unter Wakü
Grafikkarte scheint nur mit einem Stromkabel und zwei Steckern angeschlossen zu sein, bei so einem Stromsäufer empfiehlt es sich 2 Kabel zu nutzen. Sind das originalkabel vom Netzteil oder irgendwelche Modkabel?
Abstandhalter unter dem Mainboard nur dort wo sie hingehören?
Das ist die Temp. kurz nach einem Reboot gewesen.
Ich nutze nur die Originalkabel. Teste aber am WE gerne mal, die GPU an einem zusätzlichen Kabel anzuschließen (bin gerade auf Geschäftsreise)

Stell mal den CSM Support auf Lagacy im Bios .
Mache ich mal, wenn ich wieder zurück bin. Danke!
 
Mal nur mit 2 Riegeln versucht beim 4er Kit?
Du hattest als bei den 3200Mhz Riegeln XMP bzw beim ASUS D.O.C.P 3200Mhz geladen und es lief auch nicht?!
 
Mal nur mit 2 Riegeln versucht beim 4er Kit?
Du hattest als bei den 3200Mhz Riegeln XMP bzw beim ASUS D.O.C.P 3200Mhz geladen und es lief auch nicht?!
Beim 4er Kit nicht. Allerdings habe ich insgesamt 3 Kits getestet: meine ersten RAMs (s.o.) und danach ein 2er DIMM von nem Kumpel und zuletzt eben die 4er. Für die AMD RMA testete ich auch meine ersten im Singlemodus.
Alle habe ich mit und ohne XMP getestet (also die OC Taktungen und entsprechend auch ohne: 2133-2400Mhz)
Ich denke die RAM Riegel an sich kann man dadurch ausschließen.
 
Ich bin mir jetzt nicht 100% Sicher ob die Abstandhalter zum teil schon drauf waren......
Du hast CPU,Mainboard, verschiedene Ram schon getauscht und der Fehler der vielseitig ist bleibt.
Durch die Wasserkühlung ist es natürlich schlecht das Mainboard raus zu nehmen und ohne Gehäuse zu Testen,aber besteht die Möglichkeit das ein Abstandhalter an der falschen Stelle sitzt?!
Wenn du das Netzteil raus nimmst solltest eigentlich gut sehen können wo einer drinne ist und wo nicht,das mal kontrollieren.
 
Ich bin mir jetzt nicht 100% Sicher ob die Abstandhalter zum teil schon drauf waren......
Du hast CPU,Mainboard, verschiedene Ram schon getauscht und der Fehler der vielseitig ist bleibt.
Durch die Wasserkühlung ist es natürlich schlecht das Mainboard raus zu nehmen und ohne Gehäuse zu Testen,aber besteht die Möglichkeit das ein Abstandhalter an der falschen Stelle sitzt?!
Wenn du das Netzteil raus nimmst solltest eigentlich gut sehen können wo einer drinne ist und wo nicht,das mal kontrollieren.
Die Abstandshalter sind vormontiert gewesen. Das sollte also passen. Schau ich aber gern nochmal nach.
Das Netzteil ist bei diesem Case hinten verbaut, durch das Rausbauen kann man also nicht mehr sehen. Ich schau aber auf jeden Fall nochmal genau rein, denn der ASUS Support hat sich heute telefonisch gemeldet und bat mich nochmals ein CMOS Reset mit der Batterie durchzuführen und die aktuell neuen RAMs nochmals im 1er und 2er DIMM zu testen. Außerdem die ganzen Festplatten abstecken und nacheinander wieder anstecken, falls der Reboot nicht ausgelöst wird.
WE also gut Arbeit
 
Dann kann es doch sein das einer je nach Mainboard nicht mehr passte,wobei man ja zusätzlich noch welche beim ATX anbringen muss.
Eben weil das Netzteil hinten verbaut ist verdeckt es die Sicht,wobei das Blech für die Festplatten hast vermutlich auch noch drin?!
Bei mir fliegt immer alles raus was nicht gebraucht wird.
Aber man sollte von Hinten dann doch gut sehen wo welche reingeschraubt sind und wo nicht,beim weißen sieht man es natürlich noch besser.
Von Vorne siehst es ja nicht ob einer unterm Mainboard sitzt und für die Probleme sorgt.;)
 
Dann kann es doch sein das einer je nach Mainboard nicht mehr passte,wobei man ja zusätzlich noch welche beim ATX anbringen muss.
Eben weil das Netzteil hinten verbaut ist verdeckt es die Sicht,wobei das Blech für die Festplatten hast vermutlich auch noch drin?!
Bei mir fliegt immer alles raus was nicht gebraucht wird.
Aber man sollte von Hinten dann doch gut sehen wo welche reingeschraubt sind und wo nicht,beim weißen sieht man es natürlich noch besser.
Von Vorne siehst es ja nicht ob einer unterm Mainboard sitzt und für die Probleme sorgt.;)
Ja stimmt, ist alles noch drin, bis auf die Bleche wo dein Radiator hängt (dort ist meine AGB mit Pumpe). Sehr interessant dein Aufbau 😀 danke für den Einblick.
Ich schau heut Abend gleich mal nach 👀
 
Ich habe insgesamt 5 Netzteile durchprobiert und immer wieder Probleme mit Reboots gehabt.

Bei den Thermaltake (3 verschiedene Modelle, 850W und 1050W) war es immer so, dass das System erst rockstable war, egal welche Power-Anforderungen ich gestellt habe, und das System dann, nach 3-4 Wochen stabilen Betriebs, von einem Tag auf den anderen immer sofort einen Rest gemacht hat, wenn ich Spiele gestartet habe und der 3D-Modus die GPU zu einem Power-Spike veranlasst hat. Sobald dieser Punkt erreicht wat, war das System zum Spielen praktisch untauglich.

Die Thermaltake Netzteile scheinen alle eine Art Counter für Powerspikes zu haben, wie auch immer das technisch geht.

Das Kolink (1200W) Netzteil hatte generell das Problem, dass es im großen und ganzen funktionierte, aber nur bei bestimmten Spielen und bestimmten Situationen einen Reset ausgelöst hat. Durch Begrenzen des PowerLimits konnte man einigermaßen arbeiten, Spaß hat das keinen gemacht.

Jetzt ist ein Corsair 850W verbaut, und bisher ist Ruhe und das System stabil. Mal sehen, wie lange.

Das Problem mit Ampere GPUs und den Powerspikes, die bestimmte Netzteile überfordern - und zwar nicht sofort, sondern erst nach einigen Wochen - ist ziemlich krass.
 
Ja stimmt, ist alles noch drin, bis auf die Bleche wo dein Radiator hängt (dort ist meine AGB mit Pumpe). Sehr interessant dein Aufbau 😀 danke für den Einblick.
Ich schau heut Abend gleich mal nach 👀
Sooo, jetzt mal ein Update: Ich habe nun das CMOS-Update mit der Batterie gemacht, von 4 auf 1 DIMM (angeschlossen an A2) reduziert, drei von vier Festplatten abgesteckt und die Abstandshalter kontrolliert. Man kann beim Gehäuse toll von hinten zwischen Board und Rückwand blicken, sowie vorne. Der Abstand passt wunderbar.
 
Sooo, jetzt mal ein Update: Ich habe nun das CMOS-Update mit der Batterie gemacht, von 4 auf 1 DIMM (angeschlossen an A2) reduziert, drei von vier Festplatten abgesteckt und die Abstandshalter kontrolliert. Man kann beim Gehäuse toll von hinten zwischen Board und Rückwand blicken, sowie vorne. Der Abstand passt wunderbar.
Es war also keiner falsch geschraubt?!
Dann würd ich mal Richtung Netzteil schauen.
Wie und Wo ist die HW Angeschlossen?
2 Grafikkartenkabel hast auch genommen oder nur Eins mit 2 6+2 Steckern?
 
Zuletzt bearbeitet :
Es war also keiner falsch geschraubt?!
Dann würd ich mal richtig Netzteil schauen.
Wie und Wo ist die HW Angeschlossen?
2 Grafikkartenkabel hast auch genommen oder nur Eins mit 2 6+2 Steckern?
Ne, alles fein verschraubt.
Graka Anschluss würde ich allerdings zu guter Letzt checken, da die Reboots ja meist ohne Grafiklast passieren. Habe übrigens pro forma noch ein 1200W Netzteil geordert (be quiet) für alle Fälle
 
Stell mal den CSM Support auf Lagacy im Bios .

Mal eine kleine Erklärung, damit du weisst was die Einstellungen bedeuten. Seit dem ersten IBM-PC haben die PCs ein BIOS. Vor etwa 10 Jahren hat man begonnen, das BIOS durch das modernere UEFI abzulösen, das die Hardware auf eine bessere Art anspricht als das veraltete BIOS. Auch wenn man heute in allen neuen PCs ein UEFI hat, spricht man oft immer noch vom BIOS, was etwas verwirren kann.

Mit der Zeit hat man auch die angehängte Hardware angepasst, so dass sie mit dem UEFI funktioniert. Wenn man ältere Hardware verwendet, kann es aber sein, dass diese noch nicht mit einem UEFI klar kommt. Darum kann man im UEFI den Kompatibilitätsmodus, CSM, Legacy-Modus oder wie man es nennen will einschalten. Damit aktiviert man neben den UEFI-Funktionen auch Funktionen die alte Geräte die nur das BIOS kennen unterstützen. Das UEFI macht dann ein BIOS nach damit die alten Geräte auch laufen. In deinem UEFI kann man recht detailliert einschalten, für welche Geräte man die BIOS-Kompatibilität aktivieren möchte.

Um ehrlich zu sein wüsste ich nicht, welches deiner Geräte den Kompatibilitätsmodus brauchen sollte. Wenn da etwas falsch eingestellt ist, wird ein altes Gerät einfach nicht erkannt. Aber du hast ja ganz ein anderes Problem.
 
Oben Unten