Gaming Grafikkarten News

New World GPU-Opfer wiederbelebt! – Überlastete Vcore Power Stages auf Nvidia Ampere von Youtuber identifiziert

Der Youtuber buildzoid hat auf seinem Kanal Actually Hardcore Overclocking eine defekte Grafikkarte eines Twitter-Followers untersucht, die angeblich dem neuen Amazon MMO New World zum Opfer gefallen war. Nach wenigen Stunden mit der Grafikkarte konnte der erfahrene Hardware-Guru bereits das Problem diagnostizieren und sie tatsächlich ins Leben zurückholen!

Bereits während der Beta Phasen von Amazons neuem MMO New World gab es diverse Berichte in Foren und sozialen Netzwerken, dass dem Spiel vermehrt die Pixelbeschleuniger zum Opfer fallen. Hauptsächlich beschränkte sich das Phänomen auf high-end Nvidia Ampere Karten wie RTX 3080 und RTX 3090 Modelle, wobei es auch vereinzelt Meldungen anderer Modelle, auch mit AMD GPUs gab.

Zunächst wurde als alleinige Ursache ein Qualitätsproblem bei Grafikkarten des Herstellers EVGA vermutet, wie auch bereits bei uns zu lesen war. Ein fehlerhafter Chip zur Lüftersteuerung war hier zunächst der Hauptkandidat. Später wurde dies aber von EVGA dementiert und stattdessen eine fehlerhafte Lötstelle eines Mosfets der Spannungsversorgung als Ursache bezeichnet, für die der Hersteller auch zeitnah Austausch-Hardware an betroffene Nutzer sendete.

Amazon hatte zugleich den Zusammenhang zwischen sterbenden Grafikkarten und ihrem neuen MMO gänzlich dementiert, versichert das Spiel sei „safe to play“, aber dennoch ein FPS Limit im Menü als zusätzliche Absicherung implementiert. Wir hatten bereits damals vermutet, dass es noch eine zweite Ursache für das spontane Silizium-Ableben im Bereich der Stromversorgung geben könnte, und die Reaktion Amazons in Frage gestellt. Die Beta war vorbei, das Problem wurde nicht genauer untersucht und geriet in Vergessenheit.

Wenige Wochen später folgte nun der offizielle Launch des Spiels und prompt auch neue Meldungen toter RTX 3080 und RTX 3090 Grafikkarten, nicht nur von EVGA. Ein betroffenes RTX 3090 Vision OC Modell des Herstellers Gigabyte konnte sich der Youtuber buildzoid von einem seiner Twitter Follower ausleihen, um als einer von wenigen tatsächlich auf die Suche nach der Ursache des Silizium-Sterbens zu gehen.

Im ersten Video analysiert er die PCB und kann mit einem Multimeter bereits erste defekte Komponenten bzw. Baugruppen identifizieren. So hatte eine der Sicherungen der 12V Anschlüsse ausgelöst, aber auch mehre Phasen der GPU-Spannungsversorgung haben eine verdächtig niedrigen Erdungs-Widerstand, was auf den Defekt einer Power Stage hindeutet.

Wenig später gab es bereits ein Update-Video, in dem die Grafikkarte tatsächlich schon wieder ins Leben gerufen werden konnte. Hierfür musste lediglich die ausgelöste Sicherung und eine defekte Power Stage entfernt werden und schon kann die Karte wieder in Betrieb genommen werden. Eine vollständige Reparatur ist dies war nicht, aber zumindest startet das System, die Karte wird vom Nvidia-Treiber vollständig erkannt und kann sogar den GPU-Z Rendertest ausführen.

Was nun definitiv die Ursache für die ausgefallene Power Stage ist, konnte buildzoid bisher nicht feststellen. Mögliche Theorien sind aber zum einen ein Qualitätsproblem bei den weitreichend eingesetzten Smart Power Stage Komponenten von OnSemi oder zum anderen ein möglicher Design-Fehler der VRM-Konfiguration im Zusammenhang mit dem Stromspiegel und parallel verbauten Power Stages in einer Phase. In beiden Fällen wäre eine Reparatur wohl keine nachhaltige Lösung und es wäre mit einem erneuten Ausfall der Karte bei New World oder ähnlich anspruchsvollen Spielen zu rechnen.

Wir sind gespannt, welche neuen Erkenntnisse es noch geben wird, und dankbar, dass sich endlich jemand tiefgehend mit dem Problem auseinandersetzt und mit einer Autopsie am Silizum-Leichnam der wirklichen technischen Fehlerursache auf den Grund geht. Und auch wenn das Phänomen erst verstärkt durch New World hervorgerufen wurde, sollte eine Applikation, die lediglich dokumentierte DirectX API-Kommandos durch den Treiber absetzt, niemals einen Hardware-Ausfall auslösen können. Amazon ist hier also neutral betrachtet in Schutz zu nehmen. 

Die Hersteller der Grafikkarten oder Nvidia haben sich bisher noch gar nicht zu dem Problem geäußert, von einer transparenten Aufarbeitung ganz zu schweigen. Die tatsächliche Ursache und Lösung bleibt also weiter unklar und das Massensterben von Hardware mit jeweiligem Straßenwert von mehreren Tausend Euro in Zeiten einer beispiellosen Chipknappheit erst einmal weitergehen. Zudem sollte erwähnt sein, dass eine einzelne Grafikkarten natürlich nicht zwingend repräsentativ für alle New World-Opfer ist. Den GPU-Herstellen hingegen stünden weitaus höhere Stückzahlen Testobjekten zur Verfügung, um die Ursache zweifelsfrei festzustellen.

Lade neue Kommentare

RedF

Urgestein

1,605 Kommentare 624 Likes

Na das bringt doch ein wenig Licht ins Dunkel.

Antwort 1 Like

M
Morgrain

Veteran

118 Kommentare 80 Likes

Meine 3090 Vision OC ist mir vor einigen Monaten bei einer Runde Starcraft II abgeraucht. Black Screen Absturz, keine Fehlermeldung, Karte wurde nicht mehr erkannt. Hatte von Anfang an etwas Probleme, die Netzteil Kabel reinzustecken - der rechte Stecker ging zwar rein, rastete aber nie ein. Das war ein bekannter Serienfehler, angeblich war meine Seriennummer aber nicht mehr betroffen. Neue Revision.

Zur Reparatur eingeschickt und bekam sie wieder zurück (Seriennummer kontrolliert) - repariert. Auf einmal passten die Netzteil Kabel wunderbar und rasteten problemlos ein. Wurde also ausgetauscht, obwohl angeblich neue Revision mit bereits behobenem Fehler. Hat jetzt also alles tiptop funktioniert. Dann... vor ein paar Tagen angefangen... Halo CE (Uraltgame) auf einmal lauter Black Screen Abstürze mit 100% Fanspeed. Behebbar nur durch hardreset durch Powerknopf am Gehäuse. Habe alles an Fehlersuche betrieben. Bioseinstellungen, Netzteil ausgetauscht, Kabel ausgetauscht... Powertarget runter genommen (80%) - nichts hat geholfen. Bis ich einfach mal auf die Idee gekommen bin, mir den Core Clock der Karte anzuschauen. Weil das Spiel eben alt und gammlig ist (grafisch gesehen), läuft die Karte nur auf 40% und hat lauter Reserven für Boost - und will auf knapp 2100 Mhz takten - das ist einfach zu hoch und sorgt für Abstürze. Also einfach den Takt um -106 MHz reduziert und seitdem habe ich Ruhe. Bei anspruchsvollen Games, wo nicht so hoch getaktet wird, habe ich überhaupt keine Probleme.

Von wegen, Nvidia hätte das treiberseitig gelöst. Einen Sche*ßdr*ck hat man da gelöst. Die Teile takten immernoch zu hoch und stürzen deshalb ab. Wobei das auch nichts mit Temperaturen zutun hat. Habe vor einigen Black Screen Abstürzen mit Afterburner die Temps kontrolliert und die Karte war grade mal bei 60°C Core und knapp 79° VRAM.

Und so etwas bei so urteuren Karten... man ist Alphatester...

Antwort 4 Likes

Klicke zum Ausklappem
M
Martin Gut

Urgestein

4,022 Kommentare 1,421 Likes

Wer neben der Werbeabteilung etwas davon hat, weiss ich auch nicht. Wofür eine Karte bei 40 % Auslastung so hoch dreht oder bei Sekundenbruchteilen Last auf den vollen Boost geht, ist mir nicht klar. Ich wüsste nicht, in welcher Situation man den Unterschied zu etwas weniger Boost merken sollte. Dann, wenn man beim Arbeiten oder Gaming Leistung braucht, geht es immer um Dauerlasten über längere Zeit.

Antwort Gefällt mir

M
Morgrain

Veteran

118 Kommentare 80 Likes

Tjoa, der ganze Boostalgorithmus der RTX 3000er ist für die Tonne. Meine Karte ist im Idle Betrieb (Browser) in der Regel bei 200-435 Coreclock, alle paar jubeljahre schießt das Teil aber auch mal auf 1800 hoch. Warum, das weiß nur Nvidia. Beobachte das jetzt schon seit ich das Teil habe und das kann ich bislang immernoch nicht festmachen an irgendwas, wie Browserfenster schließen, Videos abspielen oder so. Ich nenne das mal vorsichtig zufällig, auch wenn das irgendwelche Gründe haben wird, die aber nicht sinnvoll sein werden...

Ich habe mich über die Monate auf jedenfall schon mit einigen Dingen herumplagen müssen - und das als Käufer eines urteuren Produkts. Eine Frechheit...

Antwort 3 Likes

S
Schattenläufer

Mitglied

24 Kommentare 16 Likes

Nichts wird passieren.
Bauteil- bzw. Baugruppenvorgebende Chipsatzentwickler, Boardpartner und Spieleentwickler werden den Schwarzen Peter hin- und herschieben und die Sache so gut es geht aussitzen.

Man stelle sich vor, "jemand" würde eine Fehlkonstruktion einer oder mehrerer Baugruppen zugeben und müsste Ersatz für alle möglich-betroffenen Karten leisten.
:ROFLMAO:

Antwort Gefällt mir

Zanza

Neuling

6 Kommentare 0 Likes

Spiele auch New World und hab eine RTX 3090 FTW3 ULTRA + 10-jährige Garantie und bis jetzt läuft alles.

Antwort Gefällt mir

B
BurnOut_Student

Veteran

204 Kommentare 56 Likes

Finde ich auch gut das sich endlich jemand das Problem mal näher anschaut. Ich beobachte das ne Weile da ich auch das Game selber spiele.
Gibt wirklich viele Modelle mittlerweile die über Probleme berichten, aber klar die Karten werden ans Limit gebracht und viele halten das wohl nicht mehr aus.

Trotzdem finde ich es komisch, habe bei mir ein PT von 90% eingestellt. Vorher lief die GPU immer bei 110%. 99% der Zeit habe ich Schwankungen von bis zu +5% PT so das ich auf 95% komm ... aber heute waren es auch mal kurz 108%. Muss zugeben ich habe vor NW auch nie so drauf geachtet, evtl. ist das ganz normal ka. Dank Igor wissen wir ja wie stark die GPU´s spiken können, aber evtl geschieht das hier öfters oder für einen längeren Zeitraum ? Kenne mich damit leider zuwenig aus, aber kann mir vorstellen das wenn ne GPU da schwach ist oder auf 120% PT voreingestellt ist und dann so nen Spike kommt, dabei hops geht ?

Irgendwie glaube ich das hier die Spikes anders sind (schneller, höher, länger) als bei anderen Games, wäre das möglich ?

Antwort Gefällt mir

Klicke zum Ausklappem
Gurdi

Urgestein

1,100 Kommentare 600 Likes

Interessante Erfahrungsberichte hier im Thread.
Meine XT löst das ganz elegant, Obwohl ich 2,8GHZ eingestellt habe, boostet die Karte bei Teillast auf einen offenbar fixen Maximalwert vin 2,5Ghz

Antwort Gefällt mir

B
Besterino

Urgestein

5,356 Kommentare 2,240 Likes

>100h New World seit Release, davor Closed Beta, Open Beta alles auf max @4K mit meiner 3090FTW3 Ultra ohne irgendeine Anpassung im Treiber oder BIOS, ohne aktive Zusatztool und ohne jede Probleme.

Spielspaß wie er sein soll.

Jedenfalls von der Technikseite - Warteschlangen, überfüllte Siedlungen, Lag in Instanzen sind andere Themen, für die die GPU wohl nix kann… ;)

Antwort Gefällt mir

q
quantaro

Veteran

102 Kommentare 52 Likes

Die Analyse wäre doch sicher etwas für Igorslab.:)

Komisch ist das in der Tat, warum? Die Regulation kommuniziert mit der GPU und das Modul verteilt dann die Lastzustände auf die einzelnen Phasen. Möglicherweise ein Designfehler oder ein Biosproblem. Das es auf verschiedenen Layouts zum gleichen Fehler kommt und dann der Hersteller bestimmter Komponenten das Problem sein soll, ist eher an den Haaren herbei gezogen. Man sucht den Sündenbock. In bestimmten Fällen scheint die Leistungsaufnahme im Peakbereich unter Volllastszenarien die Bauteile zu stark zu belasten und das Absenken der Spannungen reagiert zu träge, was zu einem zu lang andauernden Overshot führt, der vermutlich die Bauteile schneller altern lässt und sie in den Hardwaretod zwingt. Immer dann wenn man versucht aufgrund einer hohen Taktrate, die man anpeilt, zugleich VDroop Zustände der VCore zu minimieren um diese Taktrate hochzuhalten, besteht für die Bauteile ein gewisses Risiko, für zu hohe und zu lange "Überschwinger" über der Idlevoltage. Und das NVidia anscheinend an der Konkurrenz vorbei wollte, ist klar offensichtlich. Den Preis zahlt dann der Anwender. Zumal es die Serienstreuung auch noch gibt und das Binning ggf. auch Schuld sein könnte, weil man derzeit alles auf's Board bringt was GPU heißt (oder danach aussieht). Alias GT102 BDK Probleme inklusive...

Aber so wie wir NVidia kennen, macht es auch etwas Kleber (bei 2.5T teuren Grakas, was solls wird doch alles gekauft).;)

Schön zu wissen das man eine tickende Zeitbombe im PC verbaut hat.

Hilfe ja, VID runter, gezielt Undervolt und Leistung verlieren. Aber die Reviews sind ja gelaufen, "wir sind vorne". Da stehen einem die Nackenhaare zu Berge, wenn man glaubt das NVidia für eine 3090S das max PT auf über 450W erhöhen will.

*Und falls ich noch etwas einwerfen darf, scheint das Problem bekannt da die Partner mittlerweile "v2" bestimmter Versionen auflegen.

Antwort 1 Like

Klicke zum Ausklappem

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kannst Du per PayPal spenden.

About the author

Xaver Amberger (skullbringer)

Werbung

Werbung