Frage Random Crashes bei neuem Pc-Build, vermutlich im Zusammenhang mit der GPU

Yve

Veteran
Mitglied seit
Jul 29, 2022
Beiträge
113
Bewertungspunkte
54
Punkte
29
Hallo liebe Gemeinde!

Ich habe mit einem Freund und Streamer-Kollegen für Ihn ein neues System zusammen gestellt mit folgenden Specs:
Mobo: Gigabyte Z790 UD
CPU: I7-13700F
Ram: 2x 16GB Kingston Fury Beast CL40 DDR5-6000 (32GB KIT, eingesteckt in Slot A2 und B2)
GPU: Palit RTX 4070TI Gaming Pro
Netzteil: BQ Pure Power 12 M 750W (ATX 3.0 PSU, Grafikkarte direkt mit dem Kabel vom BQ angeschlossen)

Windows 10 Pro wurde komplett frisch installiert, alle Updates. Nvidia-Treiber per GeForce Experience, UEFI letztes Update auf Version F5, Intel Treiber bei Intel Tool.
Ansonsten ist auf dem Pc nur Chrome, Steam, Discord, OBS und paar Spiele installiert, und ein paar Tools wie HWinfo die aber definitiv nicht im Hintergrund laufen.

Nun zum Problem. Das System läuft eigentlich™ wie gehofft/geplant sehr gut von der Performance für den angedachten Einsatzzweck (Spielen beim gleichzeitigen Streamen). Jedoch, treten Random Crashes auf, die wir bislang noch nicht wirklich lokalisieren konnten.
Beispiele:
- Am Vortag Diablo 4 beta 7h spielen ohne irgend ein Problem, nächster Tag nach 3h crasht der Pc komplett weg das er Neustarten musste.
Wenn es normal läuft GPU bei 30-40% Auslastung, beim Crash Bildschirme gehen aus, GPU Fans gehen sofort auf 100%
- Resi 4 mit OBS Streamen, Encoder auf NVenc mit empfohlenen Nvidia Settings, mal crasht es wenn man ins Spiel geht, mal wenn man raus tabbt.
Hierbei sind zwei verschiedene Fehlermeldung signifikant:
"NVENC Error: nvenc_encode_tex: nv.nvEncMapInputResource(enc->session, &map) failed: 8 (NV_ENC_ERR_INVALID_PARAM)"
und
"NVENC Error: get_encoded_packet: nv.nvEncLockBitstream(s, &lock) failed: 4 (NV_ENC_ERR_INVALID_DEVICE)"
Umgestellt auf Software Encoder, und das Spiel konnte erstmal Problemfrei gestreamt werden, was aber keine Dauerhafte Lösung sein kann.

Leider haben wir noch keine Konstellation gefunden, einen dieses Fehler bewusst herbei zu führen. :(
Streßtest mit Cinebench z.B. läuft ohne Probleme. Wir haben auch versucht verschiedene Tipps wie "hardware accelerated gpu scheduling" zu deaktivieren, bei OBS und dem jeweiligen Spiel in Windows-Einstellungen die GPU auf Performance Mode zu setzen. Jedoch ohne Erfolg.

Die einzige Kausalität die mir noch einfällt wäre das eventuell die Discord App Probleme verursacht. Wir haben dort schon Overlay deaktiviert, aber das Problem tritt weiterhin auf. Diese wird aber benötigt, da Sprachchat meist über Discord läuft usw. Andere Vermutung wäre das mit den RTX 4xxx NVencodern noch irgendwas nicht stimmt.

Ich bin mit meinem Googlen leider am Ende. Ich habe Nichts gefunden wo jemand ähnliche Probleme hatte und eine tatsächliche Ursache ausgemacht wurde. Viele einzelne Kausalitäten, aber nichts wo man sagen könnte: ja das könnte man probieren, da könnte man mal nachschauen. Auch habe ich keine Ahnung wie man raus finden soll, was die Crashes verursacht, wenn die so sporadisch, nicht reproduzierbar auftreten. 😭

Wir wären unglaublich dankbar, wenn jemand eine fundierte Idee hätte.

LG Yve
 
Solche Fehler sind leider nicht selten. Fehler die ab und zu mal auftauchen sind lästig zu finden. Wenn man einen Fehler provozieren kann, kann man durchtesten bis man eine stabile Konfiguration hat. Wenn der Fehler nur ab und zu auftaucht, muss man immer ein paar Tage im Alltagsbetrieb abwarten und ist auch dann nicht sicher ob es plötzlich wieder abstürzt. Leider sieht man immer nur wenn ein Fehler passiert. Dass es stabil ist kann man aber nicht nachweisen.

Eine Grafikkarte hat einen Arbeitsspeicher und etwa 4 verschiedene Recheneinheiten. Jedes Programm erzeugt unterschiedliche Situationen. Da kann mal ein Bereich stärker belastet werden. Oft sind es auch Lastsprünge, die der Karte zu schaffen machen (wenn man ins Menu geht oder raus tabbt). Bei einem Benchmark heizt die Karte erst auf und dadurch senkt sich der Takt etwas. Danach bleibt die Last konstant. Bei Games udn Anwendungen gibt es aber immer wieder kurze Unterbrüche oder unterschiedlich starke Beanspruchungen. Das kann für eine Karte viel anspruchsvoller sein. Weil ein Benchmark nie die selbe Situation erzeugt, sagt er auch nicht aus ob es bei Games oder Rendering funktioniert.

Die ATX 3.0-Stromkabel haben 2 Sensorpins. Die zeigen aber nur, ob der Stecker überhaupt eingesteckt ist und ob das Netzteil 450 oder 600 Watt liefern kann. Deine Karte braucht nicht mal 300 Watt, also haben die Pins keine Bedeutung. Wenn der Stecker nicht richtig Kontakt hätte, würde die Karte gar nicht starten. Meist leuchtet dann eine rote LED in der Nähe des Stromanschlusses auf der Grafikkarte. Dass es da Probleme gibt, müsste schon das Netzteil defekt sein. Kurz gesagt: Bei dir läuft es, also ist das Kabel in Ordnung.
 
GPU ist ohne
Du kommst also nicht mal eben an den Rechner ran.

CineBench ist doch ein CPU Benchmark, FurMark ist z.b. GPU.

Wurden denn mal alle zusätzlichen Programme aus gelassen und nur mal über ein paar Tage gespielt mit den bekannten Spielen die irgend wann mal Probleme machen?

Und was sind empfohlene Nvidia Settings?

Wenn ich z.b. ein Grafikkarten Profil erstelle,dann nehme ich mittlerweile dabei Auf weil die Last dann doch noch etwas anders ist als ohne Aufnahme.
Pc steht in nem anderem Bundesland, also Nein. Er ist halt reiner Pc Benutzer und ich bin die, die ihre PC's seit AT Tagen selber zusammen schraubt. Ich übersetzte Quasi Geek in Laien-Sprache für ihn. 🙃
Mit dem "paar Tage" mal XY testen ist halt leider schwierig. Es streamt eigentlich jeden Tag und hat dafür nur den diesen PC. Und er hat noch 3 Tage Zeit einzelne Hardware-Komponenten zurück zuschicken, sollten die zwar technisch OK sein, aber halt nicht richtig laufen, etc.

Empfohlene Nvidia-OBS Settings: https://www.nvidia.com/en-us/geforce/guides/broadcasting-guide/

FurMark läuft das eine mal durch. Ein anderes mal wieder Crash(Bildschirme aus, Pc braucht Hard-Reset).

1679914240365.png
 
Die ATX 3.0-Stromkabel haben 2 Sensorpins. Die zeigen aber nur, ob der Stecker überhaupt eingesteckt ist und ob das Netzteil 450 oder 600 Watt liefern kann. Deine Karte braucht nicht mal 300 Watt, also haben die Pins keine Bedeutung. Wenn der Stecker nicht richtig Kontakt hätte, würde die Karte gar nicht starten. Meist leuchtet dann eine rote LED in der Nähe des Stromanschlusses auf der Grafikkarte. Dass es da Probleme gibt, müsste schon das Netzteil defekt sein. Kurz gesagt: Bei dir läuft es, also ist das Kabel in Ordnung.
Meine Vermutung als mögliche Fehler Ursache geht in die Richtung das die Graka z.B. die Sence-Pins wegen nem Bug z.B. alle auf Open stellt und das Netzteil dann auf 100W begrenzt und die Graka dann auf einmal nur 175W hat (100W Init Power vom Netzteil + 75W vom Slot hat).
 
GPU ist ohne

Pc steht in nem anderem Bundesland, also Nein. Er ist halt reiner Pc Benutzer und ich bin die, die ihre PC's seit AT Tagen selber zusammen schraubt. Ich übersetzte Quasi Geek in Laien-Sprache für ihn. 🙃
Mit dem "paar Tage" mal XY testen ist halt leider schwierig. Es streamt eigentlich jeden Tag und hat dafür nur den diesen PC. Und er hat noch 3 Tage Zeit einzelne Hardware-Komponenten zurück zuschicken, sollten die zwar technisch OK sein, aber halt nicht richtig laufen, etc.

Empfohlene Nvidia-OBS Settings: https://www.nvidia.com/en-us/geforce/guides/broadcasting-guide/

FurMark läuft das eine mal durch. Ein anderes mal wieder Crash(Bildschirme aus, Pc braucht Hard-Reset).

Anhang anzeigen 24587
Hmmmm ist natürlich schwierig mit den OBS Einstellungen was aus zu schließen und Änderungen am Takt bzw der Spannung hat er aber keine gemacht bei der Grafikkarte?!

Wir geschrieben den Ram auf 5600MHz runter zum Testen,hat ja keinen Einfluss auf die Leistung.

Für die Grafikkarte würe ich dann mal die FPS begrenzen damit die Karte weniger Lastspitzen Produziert und ruhiger läuft.

Ne vollwertige OSD Anzeige wie bei mir hat er vermutlich nicht oder?
 
Meine Vermutung als mögliche Fehler Ursache geht in die Richtung das die Graka z.B. die Sence-Pins wegen nem Bug z.B. alle auf Open stellt und das Netzteil dann auf 100W begrenzt und die Graka dann auf einmal nur 175W hat (100W Init Power vom Netzteil + 75W vom Slot hat).
Das ist nicht die Funktionsweise des Sensorpin. Der Begriff "Sensor" und "smarte Kommunikation" ist für das was die Pins bis jetzt machen etwas übertrieben. Da meint man schnell, da finde eine Kommunikation statt, was aber nicht der Fall ist.

Das Netzteil schränkt an diesem Anschluss nichts ein ausser der Maximalleistung an der Stromschiene. Am Netzteil ist der Anschluss fest mit der zweiten Stromschiene verbunden. Somit liefert er bis zu 12 V x 32 A = 384 Watt. Erst wenn von allen Bauteilen die an dieser Rail hängen 450 Watt oder mehr verbrauchen, schaltet sich das Netzteil wegen überlast ab. Das merkt man dann daran, dass der PC ganz ausgeht, neu startet oder sich erst nach einer kurzen Pause wieder einschalten lässt. Alle anderen Fehler kommen nicht vom Netzteil.

Die Grafikkarte schaut, ob der eine Sensorpin am Kabel mit Masse verbunden ist oder nicht. Wenn der verbunden ist, darf sie 600 Watt ziehen, wenn er nicht verbunden ist 450 Watt. Grafikkarten die über 450 Watt ziehen können somit etwas beschränkt werden wenn der Sensorpin nicht verbunden ist und damit anzeigt dass der Anschluss zu knapp ist. Sonst bewirkt der Sensorpin nichts. Da deine Grafikkarte keine 450 Watt braucht, gibt es da keine Einschränkung, ob nun der Pin verbunden ist oder nicht. Deine Garfikkarte kann auf jeden Fall immer so viel Strom ziehen wie sie möchte.
 
So Rückmeldung.
Wir haben mal, mangels anderer Ideen, das mitgelieferte 12VHPWR-Kabel vom BeQuite Netzteil mit dem beigefügtem Adapter von Palit ausgetauscht. Seit dem läuft die Graka jede Benchmark ohne Crash durch und läuft in den Szenarios wo vorher Random Crashes aufgetreten sind seit 48h ohne Probleme.
Gesteckt wurde das Original Kabel richtig, nachmessen ob da eventuell eine Leitung kein Durchgang hat, kann mein Freund leider nicht. Oder prüfen ob beim Ausgang des Netzteils irgend etwas nicht koscher ist.
Zu mindestens läufts jetzt erstmal so wie es die ganze Zeit schon hätte laufen sollen.
 
So Rückmeldung.
Wir haben mal, mangels anderer Ideen, das mitgelieferte 12VHPWR-Kabel vom BeQuite Netzteil mit dem beigefügtem Adapter von Palit ausgetauscht. Seit dem läuft die Graka jede Benchmark ohne Crash durch und läuft in den Szenarios wo vorher Random Crashes aufgetreten sind seit 48h ohne Probleme.
Gesteckt wurde das Original Kabel richtig, nachmessen ob da eventuell eine Leitung kein Durchgang hat, kann mein Freund leider nicht. Oder prüfen ob beim Ausgang des Netzteils irgend etwas nicht koscher ist.
Zu mindestens läufts jetzt erstmal so wie es die ganze Zeit schon hätte laufen sollen.
Das doch erst mal nice. Wenn's so läuft isses ja auch relativ egal, was genau der Fehler an dem Kabel ist - außer eventuell um bei bequiet Ersatz zu kriegen.

Wohnt er zufällig Nähe Bremen? Ich hätt nen Messgerät hier.
 
Das doch erst mal nice. Wenn's so läuft isses ja auch relativ egal, was genau der Fehler an dem Kabel ist - außer eventuell um bei bequiet Ersatz zu kriegen.

Wohnt er zufällig Nähe Bremen? Ich hätt nen Messgerät hier.
Nein, aber Danke fürs Angebot.
Und ja, wenn es so läuft dann ist er happy, bin ich happy und dann ist diese ATX 3.0 Geschichte erstmal egal. Werden das jetzt die Tage noch beobachten ob die Probleme jetzt wirklich weg sind, und wenn ja mal BQ Anschreiben.
 
Hi @Yve,

ich bin hier über den Thread gestolpert, da ich exakt das gleiche Problem bei einem PC habe, den ich für einen Kumpel zusammen baute.
Von den Komponenten variert der PC etwas zu deiner Konfiguration. Aber gemeinsam ist das identische Netzteil und eine 4070 TI (ASUS TUF Gaming GeForce RTX 4070 Ti OC).

Sind die Problem nach dem Tauschen des Kabels weg? Hast du Kontakt mit BQ aufgenommen?
 
Oben Unten