Frage Ein Unglück kommt selten allein - GPU defekt?

Du hast ja schon einiges probiert, wohl doch defekt die Karte. Bei den jetzigen Preisen bist du ja mit einer RTX 3060 oder RX 6700 XT bereits viel schneller unterwegs. Bis die neue Mittelklassse rauskommt, dauert es wohl noch zu lange.
 
Mach mal nen vollen HWINFO64 Screen.
 
Du redest vom "neuesten" legacy Treiber (also 22.6.1 vom 23.Jun22)?
War der auch schon vor dem update drauf oder erst im Zusammenhang mit den Problemen ausprobiert?

Das mit dem RAM von Casi030 ist auch ein Ansatz.
Neues BIOS = neuer Microcode auch bezogen aufs RAM, es muss also nicht in jedem Fall unbedingt immer so sein,
daß man nach dem BIOS update einfach wieder die gewohnten Einstellungen fürs RAM wieder übernimmt,
und es funzt genauso.
Ergo Frage: hast Du es mal mit Werkseinstellungen im BIOS probiert, oder gleich wieder "getweakt" nach dem update?
 
Das mit dem RAM hat er schon probiert, siehe Start-Post.
Ich würd nochmal das Bios zurücksetzen, dann das neue drauf, wieder zurücksetzen und schauen was passiert.

Dumme Frage aber, wurde der PC bewegt und sitzt die Grafikkarte noch da wo sie sitzen soll?
 
Das mit dem RAM hat er schon probiert, siehe Start-Post.
Den Ram einfach auf JEDEC zu stellen ist kein Allheilmittel,auch hier kann die SOC Spannung oder gewisse Widerstände zu weit runter/rauf gehen wenn das Mainboard misst einstellt.Genauso kann die Ramspannung zu hoch sein,macht MSI ja gerne.
 
Die HWInfo Screens kommen gleich. Habe einen direkt nach boot gemacht und mache jetzt noch einen, nachdem die GPU und die CPU ein wenig bewegt wurde. Tut mir leid, dass die nicht früher gekommen sind, aber bei dem Wetter wollte ich nach draussen in den Schatten.
 
Hier zwei Screenshots. Ram bei 2666, IF bei 1333, GPU VRam bei 825MHz einmal nach Boot und einmal nach ca 20 Minuten prime und Furmark.

Direkt nach Boot:
HWInfo 1 (2).jpg

Nach ca 20 Minuten:
HWInfo 2 15 Minuten 825MHz (2).jpg

Hier zwei Screens mit XMP 1, IF 1800, vRam bei Standard 1250MHz, Bild 1 nach boot und Bild 2 direkt nachdem die Karte im Furmark Grafikfehler produzierte.
HWInfo nach Boot VRAM 1250MHz (2).jpg
Direkt nach Grafikfehlern im Furmark. Der stürzt dann ab. Konnte mit alt+f aber noch retten.
HWInfo direkt nacht Grafikfehler in Furmark (2).jpg

Vielen Dank für Eure wertvollen Hilfen und Tipps. Ich hoffe ich erschlage euch nicht mit Bildern.
 
Zuletzt bearbeitet :
System und MOS gehen schon recht hoch mit der Temperatur.
Ram sackt mit der Spannung leicht ab,da würd ich im Bios mal von Auto auf Manuel stellen und wenn er nicht bei rund 1,35V Liegt anpassen.
SOC geht auch leicht runter,über Offset + 25mV mal sehen das es bei 1V bleibt.
Ansonsten nix auffälliges.
 
Tatsache, die 95° max ist mir vorher zumindest nicht aufgefallen. und wurde mir so in der aquasuite auch nicht angezeigt. Seltsam. Oder ich habe es einfach nur nicht gesehen. Ist wahrscheinlicher.

Ich beobachte aber gerade mal HWInfo. Da kommen bisweilen auch negative Temperaturen und ich habe das Gehäuse mal aufgemacht und nochmal mit einem Zimmerventilator draufgehalten. Dennoch wird mir jetzt bei Chipsatz auf einmal ein Maximum von 115° angezeigt. Könnte da irgendwo der Hase im Pfeffer liegen?

Wobei zu dem Zeitpunkt das System stabil lief. Also da war die GPU soweit heruntergetaktet, dass es keine Fehler gab.

Habe gerade nochmal darauf geachtet und einen Screenshot gemacht was in Furmark passiert. Furmark stürzt danach ab und auch der AMD Treiber meldet sich, dass er abgestürzt sei. Leider sind auf dem Screenshot nur kleine Grafikfehler zu sehen. Dazwischen gibt es auch auf einmal große spitzwinklige Dreiecke u.ä. Und wie man an der Zeit sieht, geht das auch sehr schnell.

Furmark Fehler.jpg

@DrDre Es gibt keine dummen Fragen. Danke für den Hinweis, aber die GPU sitzt tief und fest im Slot.

@meilodasreh Ich habe den neuesten Treiber erst im Zusammenhang mit den Problemen installiert.
 
Zuletzt bearbeitet :
Du hast in keinem Bild GPU Memory Error.
Hast in der letzten Reihe von HWINFO64 was nicht drauf passt irgend welche Error?
 
Ich habe Furmark nochmal laufen lassen und diesmal hat es erstmal länger gedauert bis der Fehler auftrat.
In der letzten Spalte kommt nur noch Network und Hardware Error. Da liegt der Zählerstand bei "0".

Ich habe zuvor im Bios unter Voltages SOC Offset +0,25 eingegeben und auch die RAM Spannung von 1,34V auf 1,35V erhöht.
Unter Core VIDs habe ich dennoch minimal 0.994V.

Doofe Frage: Wenn es die Temperaturen der GPU wahrscheinlich nicht sind, Und der Fehler auch unter Wind durch einen Ventilator auftritt. Könnte es
a) ein Softwareproblem sein? Dann installiere ich einfach Windows 10 nochmal neu und schaue was geschieht
b) ein hardwareproblem der Spannungsversorgung sein? Dann wäre es eventuell das Netzteil oder das Mainboard

Mein Fahrplan wäre (und bitte korrigiert mich, wenn ich falsch liege)

1. Belüftung optimieren
2. Win 10 neu installieren
3. Netzteilkabel tauschen
4. testweise anderes Netzteil verbauen

Ich freue mich morgen auf eure Antworten. Aber leider ist für mich Schlafenszeit angesagt. Vielen Dank euch allen.
 
Zuletzt bearbeitet :
Wenn ich mir das ganze Fehlerbild ansehe, deutet alles auf eine nicht stabil laufende Grafikkarte hin. Grafikfehler die mit der Zeit mehr werden, Treiberabstürze (und Timeouts). Manchmal ein schwarzes Bild und Abstürze.

Das einzige Bauteil, was dazu manchmal einen Beitrag leistet ist instabiler RAM. Wenn der RAM Fehler erzeugt, werden fehlerhafte Daten an die Grafikkarte gesendet, die dann auch nicht mehr stabil läuft.

Ein zu schwaches Netzteil oder Kabelprobleme führen nicht zu Grafikfehlern und Treiberabstürzen sondern lassen den PC sofort abstürzen. Das passt nicht zu dem Fehlerbild.

Da alle Temperaturen der Grafikkarte schon tief sind, würde es mich wundern wenn zusätzliche Belüftung etwas verändern würde.

Windows frisch installieren, kann man probieren. Für den schnellen Test dürfte auch ein Start im abgesicherten Modus ausreichen. Ich vermute, dass es auch dann abstürzt, denn für mich sieht das recht deutlich nach einem Hardwareproblem auf, das auftritt wenn die Grafikkarte langsam den Geist aufgibt.

Wenn möglich würde ich eine andere Grafikkarte in diesem PC testen und diese Grafikkarte in einem anderen PC testen. Das dürfte am schnellsten Klarheit geben.
 
Kennt sich einer genauer mit den power settings der CPU aus?
Hab mich aufgrund des irrwitzig über 100% liegenden Wertes bei "Power Reporting Deviation" versucht einzulesen,
und zu dem Schluss gekommen, daß das eigentlich nur falsch sein kann (sollte/müsste wenn dann nahe um 100% bei max liegen, aber auf keinen Fall so irre drüber)
meine Quelle:

Kann also irgendwie nicht sein, es sei denn das Mainboard gibt der CPU völlig falsche Werte vor.

Daß mal ein Temperatursensor falsch ausgelesen wird, und dann Minusgrade anzeigt, hab ich schon öfter gehört.
Das andere ist mir wie gesagt zu neuartig, um es voll zu begreifen.

Wollte nur anmerken, daß das eben auf keinen Fall ein normaler Wert sein sollte (min schon >100%, max >270%)
Vielleicht doch durch das BIOS-upgrade ein Fehler im microcode dazugekommen?

Mögen sich andere melden, die sich besser damit auskennen, und das Ganze dann als falschen Auslesewert oder doch mögliches Problem weiterdenken.

Super wär natürlich, wenn @ArcusX einen "Referenz-HWInfo screenshot aus der Zeit vor dem Problem hätte

...oh mann das muss ich mir für mein zukünftiges System auf jeden Fall vornehmen, da Anfangs eine "baseline" mit Werten/screenshots sämtlicher gängiger tools zu machen und irgendwo zu sichern.
 
Kann mir das einer auf deutsch erklären, was der Wert "Power Reporting Deviation" bedeutet. Aus dem Link werde ich leider nicht schlau was da woraus berechnet wird.

Wenn ich mir alle anderen Werte anschaue, sieht alles normal aus. Da ist nichts, was bedeutend über normale Werte ansteigen würde. Ich würde mir deshalb keine Sorgen machen, wegen eines einzelnen Wertes den ich nicht kenne.
 
Power Reporting Deviation 100% ist einfach gesagt Lambda 1 , der Ideal Wert.
Unter 100% Magerer,über 100% Fettet an.

Kann man sich in meinem Video gut ansehen.
 
@Casi030 danke bestens!

Es hat also mit dem BIOS zu tun.
Und die Werte ausnahmslos und so deutlich über 100% sind doch Anlass, in die Richtung weiterzudenken...?
Es steht ja im Info-Fenster eindeutig drin, daß die Werte nicht groß von um 100% abweichen dürfen,
und wenn doch, bitte im HWInfo Forum nachfragen...
Wenn die Werte stimmen, denkt die CPU aufgrund der Infos vom Board, daß sie mit z.T. fast 3x erhöhtem "Verbrauch" läuft.
Greifen deshalb eventuell irgendwelche "Gegenmaßnahmen" (Spannung runter?)

Gilt natürlich alles nur unter default Bedingungen. Sobald man an irgendwas rumfummelt, braucht man nicht auf die Werte achten.


1660576015051.png
 
Nicht mit dem Bios.
Es ist ehr dafür da um zu sehen wie der Kern/die Kerne unter Last laufen.
Das Problem ist ja,was braucht die CPU um hoch zu Takten........Spannung und bevor die Spannung nicht da ist wird auch nicht hoch getaktet und das sorgt dafür das du Max so hohe Werte hast.
 
Der Wert ist so weit abseits alles Vernünftigen und alles andere sieht ganz normal aus. Wenn die CPU Massnahmen ergreifen würde, dann wäre das an den anderen Werten sichtbar. Da regelt aber nichts zu hoch oder zu tief sondern alles normal. Also kann eigentlich nur der Wert selbst falsch sein.

Auch wenn die CPU abregeln würde, hätte das nicht die Grafikprobleme zur Folge, die du hast. Es deutet alles auf die Grafikkarte. Darum würde ich diese mal in einem anderen PC testen und mir nicht den Kopf über einen sinnlosen Wert von HWinfo zerbrechen. HWinfo zeigt so viele Daten an, dass man immer etwas finden wird, das einem verwirren kann.
 
Auweia. Wat nu? Muss ich mir bzgl der CPU nu auch Gedanken machen? Würde das erklären warum direkt nach boot eine Chipsatztemperatur von 114° gemldet wird, die dann aber quasi sofort auf 32° fällt?

Ich habe gerade gelesen, dass das nur unter voller CPU Last aussagekräftig ist.

Nach 15 Minuten prime und zurücksetzen der Werte kurz nach start von Prime
Min 103.1% max 110,3 Durchschnitt 107.6

Habe auch mal den von @Casi030 vorgeschlagenen +0,25 Offset herausgenommen
Min 103.7 Max 108.1 Durchschnitt 105.8
 
Zuletzt bearbeitet :
Oben Unten