Gaming Grafikkarten News

Weitere Spurensuche zum Ampere Massensterben in New World – Youtuber erklärt mögliche Ursachen

Wir hatten ja bereits vor kurzem über buildzoid und die von ihm wiederbelebte RTX 3090 GPU berichtet, die zuvor bei einem seiner Twitter Follower beim Spielen des MMOs New World den Dienst eingestellt hatte. Nun hat der Youtuber ein über 1-stündiges Video veröffentlicht, indem er mit Messergebnissen dieser Grafikkarte und diversen Datenblättern über mögliche Ursachen für das spontane Abschalten und Ableben von Nvidia Ampere GPUs in Amazons neuem MMO spekuliert.

Zunächst berichtigt er zwei Fehler aus älteren Videos. So sei nämlich das Layout der Platine der Gigabyte RTX 3090 Eagle OC doch sehr nahe am Referenz-Design von Nvidia, bei dem je nach Ausführung 9 oder 10 Power Stages für die GPU Spannungsversorgung zum Einsatz kämen. Des weiteren korrigiert er, dass diese Vcore Phasen tatsächlich von dem UP9511R PWM-Controller betrieben würden, welcher analog sei und nur 8 Phasen versorgen könne. In Folge dessen seien 2 der 10 Power Stages zusammen als eine Phase verbaut, wie es später noch im Detail erklärt wird.

Anhand des Datenblattes des PWM-Controllers von UPI Micro erklärt buildzoid zunächst die Funktionsweise der „Total Output Current Protection“, oder kurz OCP. Obwohl sich nicht alle Variablen zur Berechnung des Schwellwertes exakt ermitteln ließen, läge dieser zwischen 642 A konservativ und 1368 A realistisch. Dies sei typisch für Nvidia GPU Designs, die so ihre Lastspitzen an der TDP vorbei mogeln würden. Diese wird nämlich auf Nvidia Karten mittels „Shunt“-Widerständen gemessen, die sich vor den Kondensatoren und Induktoren der Eingangsspannung befänden und so nur einen gefilterten Durschnitt messen könnten.  

Die auf der Gigabyte Karte verbauten 60 Ampere Power Stages könnten wären zwar für kurzzeitige Lastspitzen von 80 Ampere spezifiziert, die Auswirkung solcher Peaks auf die Lebensdauer der Komponenten sei aber fragwürdig. Und auch bei den für dauerhaften Betrieb spezifizierten 60 Ampere, wäre die Abwärme mit insgesamt 90 W zu groß für die verbaute Kühllösung. Effektiv würde dies aber auch bedeuten, dass die OCP effektiv nie eingreifen würde und vorher vermutlich eher die Komponenten der Spannungsversorgung in Rauch aufgehen würden.

Dass Nvidia Ampere karten sich kurzzeitig viel höhere Ströme genehmigen können und effektiv nur im Durchschnitt der Leistungsaufnahme beschränkt werden, deckt sich auch mit Igors Messungen aus dem Launch Review, mit nahezu 600 W im Peak bei 350 W TDP.

Da die OCP höchstwahrscheinlich nie eingreifen würde, geht der Youtuber im weiteren Verlauf auf das „Channel Current Limit“ Funktion ein, die eine Besonderheit bei dieser Spannungsversorgung sei. Effektiv seien die einzelnen Phasen auf eine maximale Stromstärke limitiert, bei deren Überschreitung die Phase gedrosselt wird. Während Phasen mit zwei Power Stages auf 160 Ampere limitiert seien, gäbe es einzelne Phasen sowohl mit einem 80 A Limit, als auch mit einem 130 A Limit. Wieso es hier unterschiedliche Limits für baugleiche Phasen gäbe, könne er sich nicht erklären, meint buildzoid. 

Folge der Drosselung der Stromstärke sei zwangsläufig ein kurzzeitiges Abfallen der Spannungsversorgung für die GPU, was zu Instabilität oder gar Auslösung der „Under Voltage Protection“ führen würde. Letztere sei ein weiterer Schutzmechanismus, der die Spannungsversorgung bei zu niedriger Ausgangsspannung abschaltet. Die Folge dessen wäre, dass die GPU selbst abgeschaltet würde, während die restlichen Komponenten wie die Lüftersteuerung in Hysterese verfallen. Die Folge dessen wiederum wäre ein schwarzer Bildschirm und 100% Lüfterdrehzahl, was zu den diversen Erfahrungsberichten von New World Opfern passen würde. Lediglich ein komplettes Neustarten des Systems könne die ausgelöste Schutzfunktion wieder zurücksetzen.

Dass Ampere GPU aufgrund zu niedriger Spannung oder zu hoher Taktrate instabil würden, wurde ja bereits kurz nach dem Launch vermutet. Das damit verbundene „POSCAP Drama“ wurde ja hinlänglich beleuchtet und was nun die wirkliche Ursache war, ein fehlerhafter Boost Algorithmus, ungenügende Chip-Qualität, zu sparsame Kondensator-Layouts, grenzwertige VRM-Konfiguration, oder eine Kombination aus allem genannten, darüber streiten sich bis heute die Geister. Klar ist aber, dass durch Nvidias Fix mit einem nachträglichen Treiber-Update, auch die kurzzeitigen Lastspitzen von Ampere GPUs merklich gedrosselt wurden.

Auch wenn sich die definitive Ursache noch immer nicht exakt bestimmen ließe, so seien Nvidias Entscheidungen bei der Implementierung der GPU Spannungsversorgung stellenweise fragwürdig oder nicht nachvollziehbar. Auch warum das spontane Ableben in New World hauptsächlich Modelle des Herstellers Gigabyte betreffen würde, könne er ohne weiteres nicht genauer erklären. Eine mögliche Erklärung wäre aber eine unterschiedliche Implementierung des Nvidia Referenzdesigns von Hersteller zu Hersteller.

Da die von ihm reparierte RTX 3090 GPU nur eine Leihstellung sei und diese wieder funktionsfähig zum Eigentümer zurückkehren solle, könnte buildzoid keine weiteren Tests durchführen ohne erneute Schäden zu riskieren. Idealerweise würde er aber mit einer Opfer-Grafikkarte und einem Oszilloskop die Stromaufnahme messen, während New World auf der Hardware ausgeführt würde. Da dies aber zu einem potentiellen Ableben der Karte führen würde und diese ja ohnehin schon alles andere als günstig sind, fehlen ihm aktuell die Mittel für weitere Untersuchungen. 

Update 26.10.2021, 12:40 Uhr:

In einem neuen kurzen Video zeigt buildzoid noch das Verhalten der Leistungsaufnahme in den Applikationen Furmark und Unigine Superposition. In ersterem, der als extrem leistungshungriger Stresstest bekannt ist, schafft es die RTX 3090 trotz automatischer Drosselung auf ca. 1200 MHz und 0,72 V GPU Spannung die 350 W TDP zu erreichen. Im Unigine Superposition mit Auflösung „8K“ werden im Monitoring-Tool GPU-Z sogar kurze Peaks auf bis zu 412 W sichtbar, wohlgemerkt bei unverändertem Standard-Powerlimit von 350 W.

Dies deute darauf hin, dass die riesigen Ampere GPUs von sich aus bereits sehr stromgierig seien, vor allem wenn es Spiele schaffen einen Großteil der CUDA-Kerne auszulasten. Ähnlich wie im Superposition Benchmark bei hohen Auflösungen könne das Verhalten in New World einfach auf eine sehr gute Optimierung durch die Spiele-Entwickler und damit hohe Auslastung der GPU hindeuten. Entsprechend wäre dann bei zukünftigen Spielen mit stetig steigenden Anforderungen und immer effizienterer Auslastung der Hardware mit ähnlichen Folgen wie bei New World zu rechnen. Amazon neues MMO wäre demnach nur ein Vorbote für das, was Nvidia Ampere Grafikkarten Besitzer bald erwarten könnte.  

Lade neue Kommentare

Case39

Urgestein

2,019 Kommentare 618 Likes

Ampere macht von Anfang an den Eindruck, überhastet auf den Markt gebracht worden zu sein.

Antwort 4 Likes

2
2Chevaux

Mitglied

99 Kommentare 78 Likes

Huhu Xaver :)

Na, da hab' ich ja was angerichtet :) mit meinem Hinweis zum indirekten Zitat letzthin – ich wollte dich damit nicht verunsichern, Du hast eine angenhem flüssig lesbare Schreibe schon bisher.

Erstmal Danke, daß Du das so konsequent umgesetzt hast. Als Hinweis dazu, weil ich mit meinen Hinweis auf den Konjunktiv bei der indirekten Rede mich etwas in der Schuld für die wahrscheinlich daraus resultierende, leichte Holprigkeit im Artikel sehe:

Du kannst leicht "leseunterbrechend" wirkende "würde" und "wäre" ganz oft "wegvereinfachen" (muss nicht zwanghaft sein, aber am Konjunktiv II anzeigenden "würde" und "wäre" neigen Texte zu stocken, sie sind oft etwas fehl am Platze), so wie Du es in den ersten Absätzen wahrscheinlich auch intuitiv schon getan hast, also etwa

"Effektiv bedeute das [/dieses] aber auch [...]"
statt
"Effektiv würde dies aber auch bedeuten [...]"

oder

"Die Folge dessen sei [...]"
statt
"Die Folge dessen wäre [...]"

Auch ist in anderen Situationen meist der Konjunktiv I bei der indirekten Rede erste Wahl, also (beispielhaft) "gebe" statt "gäbe" oder "geben würde", was Du auch wieder zu Beginn intuitiv besser gemacht, im Verlauf deines Artikels dann aber hast schleifen lassen.

Vielen Dank für den Artikel davon ab aber natürlich auch inhaltlich, ich freue mich schon darauf, später am Tag Buildzoids Video zu schauen.

Viele Grüße
Thomas

Antwort 1 Like

Klicke zum Ausklappem
RedF

Urgestein

2,603 Kommentare 1,140 Likes

Klingt für mich als wollte Nvidia dahinter einen höheren verbrauch verstecken ( überrascht von AMDs Karten bzw deren leistung ).
Haben aber nicht mit dummen zufällen bei New World gerechnet.

Aber bin da nur Laie.

Antwort Gefällt mir

grimm

Urgestein

1,973 Kommentare 1,105 Likes

Danke für den Artikel. Die Hersteller sollten dem Herren von sich aus Test-Karten zur Verfügung stellen. Oder man setzt sich mal mit einem der Hardware-Versender hin und holt sich einen Rückläufer. Wird wohl niemand ein Interesse dran haben... Die Amperes überspringe ich.

Antwort Gefällt mir

P
Phelan

Mitglied

98 Kommentare 72 Likes

IMO eher das sie die Karten bis zur maximalen Grenze ausgereizt haben ... Also Werks OC bereits im Referenzdesinge.

Bei den Amper Karten kann man einfach mal 50W runter gehen und hat nur 1-3% FPS Verlust, sie laufen also weit oberhalb des Sweetspots.

Die Herstellen wollten nun aber selber noch OCn da sie die Karten von Anfang an nicht zum UVP anbieten konnten, da dieser Preis für sie niemals zu machen war. Im Glaube da wird schon wie immer Reserve trinne sein, haben sie also noch ein bischen rausgekitzelt.

Im Gegensatz zu früher war aber keine Reserve mehr trinne.

Den Trend hat man aktuell allgemein. Auch die CPUs kommen defakto Werks OC't und werden mit teils abartigen Vcore und TPDs hochgeprügelt um irgendwo noch 1% mehr rauszuquetschen.

Antwort 2 Likes

Klicke zum Ausklappem
LurkingInShadows

Urgestein

501 Kommentare 153 Likes

Hose runter, Schw....vergleich halt

Da kommt mir, warum auch immer, wieder die Szene in Tomorrow Never Dies in den Sinn, wo ein Admiral zu M sagt sie habe nicht das was es für solche Handlungen braucht, und sie antwortet mit Wenigstens muss ich nicht mit dem was mir fehlt denken.

Antwort Gefällt mir

Case39

Urgestein

2,019 Kommentare 618 Likes

@Phelan Ja, das beinhaltet der Eindruck ebenfalls.

Antwort Gefällt mir

skullbringer

Veteran

244 Kommentare 225 Likes

Der Czechische Kollege hat eben nochmal nachgelegt. Im Video von heute zeigt er, dass sich eine RTX 3090 mit default 350 W TDP je nach Anwendung bereits 412 W genehmigen könne! 👀

Antwort 2 Likes

wuchzael

Moderator

658 Kommentare 333 Likes

Buildzoids Videos schau ich mir ziemlich regelmäßig an. Der Junge hat was drauf und macht, worauf er Bock hat, ohne irgendwas großartig zu bewerben (y). Wie es mir zum Launch schon erschien, scheint bei den Ampere Karten der Performancezuwachs rein über die erhöhte Leistungsaufnahme erkauft worden zu sein und wie es aussieht, haben die AICs das wohl etwas unterschätzt. Genau dasselbe Bild wie damals, als die AMD/ATI Karten so viel Strom gebraucht haben und häufiger mal ausgefallen sind. AIBs wie Sapphire haben daraus gelernt und später stabilere Stromversorgungen auf ihre Karten gepackt. Ich fänd es aber besser, wenn die Chip-Entwickler sich darauf besinnen würden, auch mal an der Effizienz zu arbeiten, statt als weiter die Anzahl der Kerne und die Frequenz zu erhöhen. Vielleicht gäbe es dann auch mal wieder attraktivere MSRPs und weniger abgerauchte Spannungswandler.

Grüße!

Antwort 1 Like

Klicke zum Ausklappem
LurkingInShadows

Urgestein

501 Kommentare 153 Likes

oder mehr Chips pro Wafer und somit insgesamt mehr Karten....

Antwort Gefällt mir

P
Phoenixxl

Mitglied

88 Kommentare 57 Likes

Erschreckend wie wenig gute Elektrotechnik man für so einen Preis bekommt.
Igor kann den Eingangsfilter bei den 6000er Karten ja gar nicht genug loben.
Dagegen scheint man hier einfach nur ein Chaos von Schutzschaltungen, Mess(Versuchen) und so weiter zu haben.
Da drängt sich der Verdacht auf, dass man am alten Layout für die RTX 2000ee möglichst wenig ändern wollte und nur Flickwerk betrieben hat.
Und dann Preise weit jenseits der 2000€. Richtig, richtig bitter.

Antwort Gefällt mir

big-maec

Veteran

210 Kommentare 109 Likes

Man darf ja sowas nicht schreiben, aber mir war das von Anfang an ein bisschen zu unsicher mit den Ampere Karten, deshalb habe ich die RTX 3090 wieder abgegeben. Habe in diesem Jahr aus mehreren Gründen mal auf AMD gesetzt, sonst Intel und Nvidia. Scheint ja bis jetzt die bessere Wahl gewesen zu sein. Werde es auch weiter verfolgen, schon allein deswegen, weil ich nach dem Launch schon woanders meine Bedenken zu dieser Generation geäußert hatte.

Antwort Gefällt mir

B
Besterino

Urgestein

5,836 Kommentare 2,628 Likes

Ich positioniere mich mal gegen den Trend: ich will mehr Leistung bei GPUs. Wenn ich dafür mehr Strom verbrauchen muss, bitte sehr. Besser wäre anders, aber wenn’s nur so geht, dann sperre ich mich nicht.

Nur stabil soll es bitte sein und die Leistung eben nur abgerufen werden, wenn es sein „muss“. Was sein muss, gibt meines Erachtens der Monitor vor: ich plädiere dafür, die Sync-Technologien noch mehr in den Vordergrund zu rücken und dann kann man die GPU auch in 99% der Fälle auf das Maximum der Monitorfrequenz begrenzen. Dann fährt die GPU ansonsten ganz entspannt weit unter ihren Möglichkeiten und säuft halt nur, wenn erforderlich. Wer dann noch mehr FPS jenseits der Hz-Grenze will, kann das ja freigeben und denjenigen ist der Verbrauch vermutlich „noch egaler“ als mir.

Nicht falsch verstehen: Ich bin aus Umweltbewusstsein (und bissi Gesundheit/Bewegung) von Auto auf Fahrrad für den täglichen Weg ins Büro umgestiegen - bei Wind und Wetter. Heizung wird gespart, Strom ansonsten auch wo geht und beim Einkauf der Fressalien wird auch auf Region und Nachhaltig geachtet.

Aber. Bei. Meinem. PC. Ist. Schluss.

Ein Laster gönne ich mir (noch). :p

Back to topic: stutzig macht mich, dass angeblich das Sterben jetzt bei Gigabyte so häufig sein soll? Was ist denn aus dem ehemaligen schwarzen Schaf EVGA geworden?

Für mich sind das immer noch alles Einzelfälle, die Äußerungen dazu von egal welcher Seite allenfalls Mutmaßungen. Schade, aber was da genau bei der GPU und Stromversorgung passiert und warum, sind und bleiben offenbar gut gehütete Geheimnisse.

Antwort 1 Like

Klicke zum Ausklappem
Wie jetzt?

Mitglied

38 Kommentare 33 Likes

Ampere scheint in der Tat mit der sprichwörtlichen heißen Nadel gestrickt worden zu sein - die Hinweise mehren sich. Gut möglich das man von der der AMD RX6000er Reihe bei der Rasterleistung kalt erwischt wurde und dann auf Kante nähen musste. Da geht mir dann aber der eigentlich begrüßenswerte Wettbewerb eindeutig in die falsche Richtung. Zu Lasten des Kunden ist nicht so dolle.

Antwort 1 Like

Genie_???

Veteran

217 Kommentare 64 Likes

Da gibt es halt das Problem, das (zu) oft nach Benchmarkbalken gekauft wird.
Der zweite ist halt der erste Verlierer.
Dem Anschein nach war hier die Maxime: Wo wir sind ist vorne und wir bleiben vorne. Koste es was es wolle?
Als Anfangs die Runde machte, dass die mit 50W weniger nur geringe Prozentwerte an FPS verlieren, habe ich schon kein gutes Gefühl gehabt.
Ich finde es jedenfalls gut, das AMD das Spiel nicht so weit mitgegangen ist.
Mit den MCM´s nächstes? Jahr dürften die 400W zumindest in der Spitze aber wohl fallen.

Antwort 1 Like

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kannst Du per PayPal spenden.

About the author

Xaver Amberger (skullbringer)

Werbung

Werbung