Gaming Grafikkarten News

Weitere Spurensuche zum Ampere Massensterben in New World – Youtuber erklärt mögliche Ursachen

Wir hatten ja bereits vor kurzem über buildzoid und die von ihm wiederbelebte RTX 3090 GPU berichtet, die zuvor bei einem seiner Twitter Follower beim Spielen des MMOs New World den Dienst eingestellt hatte. Nun hat der Youtuber ein über 1-stündiges Video veröffentlicht, indem er mit Messergebnissen dieser Grafikkarte und diversen Datenblättern über mögliche Ursachen für das spontane Abschalten und Ableben von Nvidia Ampere GPUs in Amazons neuem MMO spekuliert.

Zunächst berichtigt er zwei Fehler aus älteren Videos. So sei nämlich das Layout der Platine der Gigabyte RTX 3090 Eagle OC doch sehr nahe am Referenz-Design von Nvidia, bei dem je nach Ausführung 9 oder 10 Power Stages für die GPU Spannungsversorgung zum Einsatz kämen. Des weiteren korrigiert er, dass diese Vcore Phasen tatsächlich von dem UP9511R PWM-Controller betrieben würden, welcher analog sei und nur 8 Phasen versorgen könne. In Folge dessen seien 2 der 10 Power Stages zusammen als eine Phase verbaut, wie es später noch im Detail erklärt wird.

Anhand des Datenblattes des PWM-Controllers von UPI Micro erklärt buildzoid zunächst die Funktionsweise der “Total Output Current Protection”, oder kurz OCP. Obwohl sich nicht alle Variablen zur Berechnung des Schwellwertes exakt ermitteln ließen, läge dieser zwischen 642 A konservativ und 1368 A realistisch. Dies sei typisch für Nvidia GPU Designs, die so ihre Lastspitzen an der TDP vorbei mogeln würden. Diese wird nämlich auf Nvidia Karten mittels “Shunt”-Widerständen gemessen, die sich vor den Kondensatoren und Induktoren der Eingangsspannung befänden und so nur einen gefilterten Durschnitt messen könnten.  

Die auf der Gigabyte Karte verbauten 60 Ampere Power Stages könnten wären zwar für kurzzeitige Lastspitzen von 80 Ampere spezifiziert, die Auswirkung solcher Peaks auf die Lebensdauer der Komponenten sei aber fragwürdig. Und auch bei den für dauerhaften Betrieb spezifizierten 60 Ampere, wäre die Abwärme mit insgesamt 90 W zu groß für die verbaute Kühllösung. Effektiv würde dies aber auch bedeuten, dass die OCP effektiv nie eingreifen würde und vorher vermutlich eher die Komponenten der Spannungsversorgung in Rauch aufgehen würden.

Dass Nvidia Ampere karten sich kurzzeitig viel höhere Ströme genehmigen können und effektiv nur im Durchschnitt der Leistungsaufnahme beschränkt werden, deckt sich auch mit Igors Messungen aus dem Launch Review, mit nahezu 600 W im Peak bei 350 W TDP.

Da die OCP höchstwahrscheinlich nie eingreifen würde, geht der Youtuber im weiteren Verlauf auf das “Channel Current Limit” Funktion ein, die eine Besonderheit bei dieser Spannungsversorgung sei. Effektiv seien die einzelnen Phasen auf eine maximale Stromstärke limitiert, bei deren Überschreitung die Phase gedrosselt wird. Während Phasen mit zwei Power Stages auf 160 Ampere limitiert seien, gäbe es einzelne Phasen sowohl mit einem 80 A Limit, als auch mit einem 130 A Limit. Wieso es hier unterschiedliche Limits für baugleiche Phasen gäbe, könne er sich nicht erklären, meint buildzoid. 

Folge der Drosselung der Stromstärke sei zwangsläufig ein kurzzeitiges Abfallen der Spannungsversorgung für die GPU, was zu Instabilität oder gar Auslösung der “Under Voltage Protection” führen würde. Letztere sei ein weiterer Schutzmechanismus, der die Spannungsversorgung bei zu niedriger Ausgangsspannung abschaltet. Die Folge dessen wäre, dass die GPU selbst abgeschaltet würde, während die restlichen Komponenten wie die Lüftersteuerung in Hysterese verfallen. Die Folge dessen wiederum wäre ein schwarzer Bildschirm und 100% Lüfterdrehzahl, was zu den diversen Erfahrungsberichten von New World Opfern passen würde. Lediglich ein komplettes Neustarten des Systems könne die ausgelöste Schutzfunktion wieder zurücksetzen.

Dass Ampere GPU aufgrund zu niedriger Spannung oder zu hoher Taktrate instabil würden, wurde ja bereits kurz nach dem Launch vermutet. Das damit verbundene “POSCAP Drama” wurde ja hinlänglich beleuchtet und was nun die wirkliche Ursache war, ein fehlerhafter Boost Algorithmus, ungenügende Chip-Qualität, zu sparsame Kondensator-Layouts, grenzwertige VRM-Konfiguration, oder eine Kombination aus allem genannten, darüber streiten sich bis heute die Geister. Klar ist aber, dass durch Nvidias Fix mit einem nachträglichen Treiber-Update, auch die kurzzeitigen Lastspitzen von Ampere GPUs merklich gedrosselt wurden.

Auch wenn sich die definitive Ursache noch immer nicht exakt bestimmen ließe, so seien Nvidias Entscheidungen bei der Implementierung der GPU Spannungsversorgung stellenweise fragwürdig oder nicht nachvollziehbar. Auch warum das spontane Ableben in New World hauptsächlich Modelle des Herstellers Gigabyte betreffen würde, könne er ohne weiteres nicht genauer erklären. Eine mögliche Erklärung wäre aber eine unterschiedliche Implementierung des Nvidia Referenzdesigns von Hersteller zu Hersteller.

Da die von ihm reparierte RTX 3090 GPU nur eine Leihstellung sei und diese wieder funktionsfähig zum Eigentümer zurückkehren solle, könnte buildzoid keine weiteren Tests durchführen ohne erneute Schäden zu riskieren. Idealerweise würde er aber mit einer Opfer-Grafikkarte und einem Oszilloskop die Stromaufnahme messen, während New World auf der Hardware ausgeführt würde. Da dies aber zu einem potentiellen Ableben der Karte führen würde und diese ja ohnehin schon alles andere als günstig sind, fehlen ihm aktuell die Mittel für weitere Untersuchungen. 

Update 26.10.2021, 12:40 Uhr:

In einem neuen kurzen Video zeigt buildzoid noch das Verhalten der Leistungsaufnahme in den Applikationen Furmark und Unigine Superposition. In ersterem, der als extrem leistungshungriger Stresstest bekannt ist, schafft es die RTX 3090 trotz automatischer Drosselung auf ca. 1200 MHz und 0,72 V GPU Spannung die 350 W TDP zu erreichen. Im Unigine Superposition mit Auflösung “8K” werden im Monitoring-Tool GPU-Z sogar kurze Peaks auf bis zu 412 W sichtbar, wohlgemerkt bei unverändertem Standard-Powerlimit von 350 W.

Dies deute darauf hin, dass die riesigen Ampere GPUs von sich aus bereits sehr stromgierig seien, vor allem wenn es Spiele schaffen einen Großteil der CUDA-Kerne auszulasten. Ähnlich wie im Superposition Benchmark bei hohen Auflösungen könne das Verhalten in New World einfach auf eine sehr gute Optimierung durch die Spiele-Entwickler und damit hohe Auslastung der GPU hindeuten. Entsprechend wäre dann bei zukünftigen Spielen mit stetig steigenden Anforderungen und immer effizienterer Auslastung der Hardware mit ähnlichen Folgen wie bei New World zu rechnen. Amazon neues MMO wäre demnach nur ein Vorbote für das, was Nvidia Ampere Grafikkarten Besitzer bald erwarten könnte.  

Lade neue Kommentare

Case39

Urgestein

1,958 Kommentare 569 Likes

Ampere macht von Anfang an den Eindruck, überhastet auf den Markt gebracht worden zu sein.

Antwort 4 Likes

2
2Chevaux

Mitglied

92 Kommentare 73 Likes

Huhu Xaver :)

Na, da hab' ich ja was angerichtet :) mit meinem Hinweis zum indirekten Zitat letzthin – ich wollte dich damit nicht verunsichern, Du hast eine angenhem flüssig lesbare Schreibe schon bisher.

Erstmal Danke, daß Du das so konsequent umgesetzt hast. Als Hinweis dazu, weil ich mit meinen Hinweis auf den Konjunktiv bei der indirekten Rede mich etwas in der Schuld für die wahrscheinlich daraus resultierende, leichte Holprigkeit im Artikel sehe:

Du kannst leicht "leseunterbrechend" wirkende "würde" und "wäre" ganz oft "wegvereinfachen" (muss nicht zwanghaft sein, aber am Konjunktiv II anzeigenden "würde" und "wäre" neigen Texte zu stocken, sie sind oft etwas fehl am Platze), so wie Du es in den ersten Absätzen wahrscheinlich auch intuitiv schon getan hast, also etwa

"Effektiv bedeute das [/dieses] aber auch [...]"
statt
"Effektiv würde dies aber auch bedeuten [...]"

oder

"Die Folge dessen sei [...]"
statt
"Die Folge dessen wäre [...]"

Auch ist in anderen Situationen meist der Konjunktiv I bei der indirekten Rede erste Wahl, also (beispielhaft) "gebe" statt "gäbe" oder "geben würde", was Du auch wieder zu Beginn intuitiv besser gemacht, im Verlauf deines Artikels dann aber hast schleifen lassen.

Vielen Dank für den Artikel davon ab aber natürlich auch inhaltlich, ich freue mich schon darauf, später am Tag Buildzoids Video zu schauen.

Viele Grüße
Thomas

Antwort 1 Like

Klicke zum Ausklappem
RedF

Urgestein

1,741 Kommentare 691 Likes

Klingt für mich als wollte Nvidia dahinter einen höheren verbrauch verstecken ( überrascht von AMDs Karten bzw deren leistung ).
Haben aber nicht mit dummen zufällen bei New World gerechnet.

Aber bin da nur Laie.

Antwort Gefällt mir

grimm

Urgestein

1,487 Kommentare 647 Likes

Danke für den Artikel. Die Hersteller sollten dem Herren von sich aus Test-Karten zur Verfügung stellen. Oder man setzt sich mal mit einem der Hardware-Versender hin und holt sich einen Rückläufer. Wird wohl niemand ein Interesse dran haben... Die Amperes überspringe ich.

Antwort Gefällt mir

P
Phelan

Mitglied

57 Kommentare 41 Likes

IMO eher das sie die Karten bis zur maximalen Grenze ausgereizt haben ... Also Werks OC bereits im Referenzdesinge.

Bei den Amper Karten kann man einfach mal 50W runter gehen und hat nur 1-3% FPS Verlust, sie laufen also weit oberhalb des Sweetspots.

Die Herstellen wollten nun aber selber noch OCn da sie die Karten von Anfang an nicht zum UVP anbieten konnten, da dieser Preis für sie niemals zu machen war. Im Glaube da wird schon wie immer Reserve trinne sein, haben sie also noch ein bischen rausgekitzelt.

Im Gegensatz zu früher war aber keine Reserve mehr trinne.

Den Trend hat man aktuell allgemein. Auch die CPUs kommen defakto Werks OC't und werden mit teils abartigen Vcore und TPDs hochgeprügelt um irgendwo noch 1% mehr rauszuquetschen.

Antwort 2 Likes

Klicke zum Ausklappem
LurkingInShadows

Veteran

470 Kommentare 137 Likes

Hose runter, Schw....vergleich halt

Da kommt mir, warum auch immer, wieder die Szene in Tomorrow Never Dies in den Sinn, wo ein Admiral zu M sagt sie habe nicht das was es für solche Handlungen braucht, und sie antwortet mit Wenigstens muss ich nicht mit dem was mir fehlt denken.

Antwort Gefällt mir

Case39

Urgestein

1,958 Kommentare 569 Likes

@Phelan Ja, das beinhaltet der Eindruck ebenfalls.

Antwort Gefällt mir

skullbringer

Veteran

200 Kommentare 188 Likes

Der Czechische Kollege hat eben nochmal nachgelegt. Im Video von heute zeigt er, dass sich eine RTX 3090 mit default 350 W TDP je nach Anwendung bereits 412 W genehmigen könne! 👀

Antwort 2 Likes

wuchzael

Urgestein

603 Kommentare 286 Likes

Buildzoids Videos schau ich mir ziemlich regelmäßig an. Der Junge hat was drauf und macht, worauf er Bock hat, ohne irgendwas großartig zu bewerben (y). Wie es mir zum Launch schon erschien, scheint bei den Ampere Karten der Performancezuwachs rein über die erhöhte Leistungsaufnahme erkauft worden zu sein und wie es aussieht, haben die AICs das wohl etwas unterschätzt. Genau dasselbe Bild wie damals, als die AMD/ATI Karten so viel Strom gebraucht haben und häufiger mal ausgefallen sind. AIBs wie Sapphire haben daraus gelernt und später stabilere Stromversorgungen auf ihre Karten gepackt. Ich fänd es aber besser, wenn die Chip-Entwickler sich darauf besinnen würden, auch mal an der Effizienz zu arbeiten, statt als weiter die Anzahl der Kerne und die Frequenz zu erhöhen. Vielleicht gäbe es dann auch mal wieder attraktivere MSRPs und weniger abgerauchte Spannungswandler.

Grüße!

Antwort 1 Like

Klicke zum Ausklappem
LurkingInShadows

Veteran

470 Kommentare 137 Likes

oder mehr Chips pro Wafer und somit insgesamt mehr Karten....

Antwort Gefällt mir

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kannst Du per PayPal spenden.

About the author

Xaver Amberger (skullbringer)

Werbung

Werbung