GPUs Graphics Latest news Practice

EVGA GeForce RTX 3080, RTX 3090 and (not only) New World – when design flaws cause graphics cards to run amok | Tests

Disclaimer: The following article is machine translated from the original German, and has not been edited or checked for errors. Thank you for understanding!

Thanks to a very large amount of reader feedback and targeted testing, it was possible to reproduce the scenario in a largely plausible and reliable manner. This is also proven by the damage picture I already reported in my first article and it also shows that you have to be very careful with even too sweeping snapshots on the Internet, even if it is of course always tempting and goes viral quickly, especially on YouTube. That’s exactly why I have to put something here first, also in the hope that at least this time it will be read.

Design-related EVGA problem instead of NVIDIA issue? EVGA GeForce RTX 3090 vs. Amazon’s New World and first insights | Exclusive

Important preliminary remark – facts and symptoms

Do you still remember my three(!) articles about the capacitor problem (“POSCAP-Gate”) of the then freshly launched GeForce RTX 3080 and the instabilities that occurred?  I had taken the trouble to provide all three articles with a special preface, pointing out that one should not generalize the analyzed contents in a sweeping and detached way and that it all has to be seen in context. But it is always such a thing with appropriate quotations and in the end many media with a wide reach, no matter whether YouTube or classic websites, only picked out what promised the biggest quota.

However, this not only distorts technical reality, but also creates supposed facts that never existed in this form. Exactly the same thing is happening right now with all the media hubbub about Amazon’s “New World” and the dying EVGA cards. I don’t want to judge whether many reports were made out of technical incomprehension and / or pure click-haggling, but I consistently miss the separation into a really existing design error (hardware) and the generally known fact that many of the current graphics cards reach their limit anyway at too high FPS numbers and thus also the area of the gripping protection circuits (software). Once again, one has NOTHING to do with the other. Apples and oranges.

Moreover, the greater the range, the more people will be found who want to have experienced what has been described superficially and who will speak out. Except that a tripped protection circuit on a Radeon card is logically something completely different than a blown controller chip on a botched board design. The protection circuit is there exactly for such a thing, only that with the fan one must question evenly. And at this point I get angry when one lumps everything together and celebrates the quota, because the hardware problem at EVGA cards does not only affect “New World”, but is of a general nature!

EVGA and the faulty fan controller

So let’s get back to EVGA and the misconstructed fan controller, that’s really the harsh way to put it. Here my thanks go especially to a reader who was able to help me with analytical expertise and effort and also risked his hardware for the reproduction. The problem in the area of the fan control is also known to EVGA for months (!), but they have so far sat it out apparently inactive. The various messages in the EVGA forum or the mails to EVGA were ignored, for whatever reason.

The statement of EVGA, that they can’t reproduce the problem now after the patch of “New World” unfortunately no more is besides also contentwise completely wrong, because one can it. And not just in the deliberate menu with the thousands of FPS, but even in the game itself. I will produce a video on this topic in the near future, which will also contain the recordings (“screen copy”), but I will use still images from these recordings for this article. The FPS rates are not limited and range between 50-70 FPS in the selected scene. Everything seems to run normally on the GeForce RTX 3080 FTW (10G-P5-3891-KR – EVGA 3080 FTW3 Ultra) for now:

But even now, the fan controller periodically runs amok for a few seconds. The higher the FPS, the more violent the fan whine and the frequency of these technical failures of the card. Under normal circumstances, however, the player will hardly notice it, because the freak-outs are too short at FPS rates below 100 FPS to drive the sluggish fans to maximum performance. But even now, it’s easy to log:

And EVGA doesn’t want to be able to reproduce that? It is exactly the conscious fan #1, that is the one above the GPU, which is driven here completely senseless. So in general it doesn’t make a difference if the frames are limited by a limiter or natural load, because it occurs at 60 as well as at 144+ FPS. What has always helped the reader so far was to lower the power limit from 100% to 50-60%, at least on “New World”. Then again, it was on.

What EVGA could have figured out even after the patch, and what is really interesting in this context, is that the card ignores any manual setting of the fan control in this situation. It does not matter if the fans are set to 50% RPM as a fixed value or if a manually created fan curve is stored. The ride into insanity always begins and the error pattern is always the same. But if there are already errors at 60 FPS, what about at 6000 FPS++? That’s exactly what you don’t even want to think about anymore.

Also the VBIOS version did not play a role here so far. As proof, the reader tested the “stock VBIOS”, the “450 Watt OC version” and the “ResizeBAR” variant on his GeForce RTX 3080 FTW. In addition, it makes no difference whether the BIOS switch is set to “Normal” or “OC”, where the semi-passive mode is replaced by a fixed minimum speed of 1000 RPM at idle. It also makes no difference to the error.

 

It is NOT a special “New World” problem after all

Again, we have to disagree with EVGA and many colleagues. It just suddenly became more noticeable because the FPS numbers were disproportionately high, which also led to the aforementioned hardware damage in places. However, we also have to add here that one of the bricked GeForce RTX 3090 additionally relied on a shunt mod. The fact that you’re undermining all of the GPU’s protections with it should be left aside, because mods like this don’t do anyone any good unless you want to have the longest and risk damage.

I also have a second video where you can see the same thing happening here! If you open the menu or the tooltip on the bottom right in Anno 1800, the fans start to take on a very strange life of their own. In this case, it is even clearly audible how fan #1 (because we just had) briefly starts up to 100% and immediately throttles back again. The third fan, which is called the “EVGA iCX Right Fan”, is not affected by this. The FPS were throttled to 60 in the game on purpose.

However, it also happens in this game that the fans keep howling and you have to close the game immediately before a blackout and the well-known emergency shutdown happens shortly after. In this case, the only thing that can be done is to disconnect the computer from the mains and wait a few seconds to be able to boot it again. This in turn indicates an emergency shutdown by the power supply, which proves that the card must have demanded an abnormal amount of power in this situation.

 

Kommentar

Lade neue Kommentare

G
Guest

Ich kann mir vorstellen das seitens EVGA die nächsten Tage ein Bios Update für die 3090 kommen wird. Da sind sie immer recht fix.
Bei meiner 3090 ftw3 werden bei GPU-Z und EVGA PresicsionX unterschiedliche Werte bei der Lüftersteuerung angezeigt, obwohl dort keine Lüfter mehr angesteckt sind. Zeigt doch schon das dort der Wurm drin ist.

View image at the forums

Antwort 1 Like

Corro Dedd

Urgestein

1,897 Kommentare 736 Likes

Hatte es gestern nicht schreiben wollen, weil ich von dem Thema zu wenig Ahnung habe, aber so etwas ähnliches hatte ich mir schon gedacht: Durch die hohen FPS kommt die Strommessung nicht mehr hinterher und der Chip fungiert als Kurzschluss, quasi open gates, und zieht statt 350W auf einmal 600W oder mehr.

Aber das erklärt noch nicht, warum überwiegend EVGA Karten betroffen sind. Wenn es doch eine von Nvidia vorgegebene Maßnahme ist, genau diesen Chip einzusetzen um den Stromfluss kurz hinter der Buchse zu messen, dann haben den doch auch Asus, MSI, Palit und Co. ebenfalls drauf. Von diesen hört man aber wenig bis nichts.

Antwort 2 Likes

Martin Gut

Urgestein

8,274 Kommentare 3,939 Likes

FAN 1 Speed (RPM) zeigt den Drehzahlmesswert. Der scheint bei den GPU-z-Screens von Igor offensichtlich falsch zu sein, denn so schnell kann ein Lüfter ja nicht drehen. Das sagt aber erst mal nur, dass die Messung oder Auslesung der Drehzahl des Lüfters nicht richtig funktioniert.

Über die Regelung des Lüfters und was dort warum schief läuft sagt der Messwert nichts aus. Die Messung hat nichts mit der Regelung zu tun. Man sieht weder warum die Regelung nicht richtig funktioniert noch was sie genau macht. Interessant wäre, ob die Regelung aufgrund von Temperatursensormessungen oder Stromsensoren irgend welche Sicherheitsfunktionen aktiviert. Das könnte ein Grund für das zeitweise Hochdrehen der Lüfter sein. Ein Grund für eine Beschädigung der Karte ist aber auch das nicht.

Warum es aber an verschiedenen Stellen zu einer Überlastung von Bauteilen kommt, ist für mich noch nicht geklärt.

Antwort Gefällt mir

D
Deridex

Urgestein

2,230 Kommentare 867 Likes

Und ich wurde erst vor einer Weile gefragt, warum ich ein Problem mit den Shunt-Mods habe...

Antwort 3 Likes

Igor Wallossek

1

11,315 Kommentare 21,484 Likes

Es steht die Frage im Raum, inwieweit der fehlerhafte Lüfter-Controller durch das verquere Schaltungsdesign wirklich Amok läuft. Es dürfte wohl sogar richtig ausgelesen werden. Nur die API-Rückgabe ist dann gestört, weil der Chip absoluten Käse produziert und wegdriftet. Die andere Kurve wird nämlich separat erzeugt und die stimmt. Allerdings ist hier die CPU nicht mit im Spiel.

Antwort Gefällt mir

LurkingInShadows

Urgestein

1,411 Kommentare 605 Likes

230.000 RPM wären auch mehr als sehr sportlich.... Turbos in der F1 machen 125.000, und die sind aktiv Ölgekühlt^^

Antwort Gefällt mir

Zanza

Mitglied

49 Kommentare 10 Likes

Frame-Limiter kann ich ja über Nvidia Systemsteuerung einstellen. Der wird bei mir immer nach einem Neustart wieder deaktiviert.

Antwort Gefällt mir

Alkbert

Urgestein

970 Kommentare 760 Likes

"[...] Allerdings muss man auch hier auch ergänzen, dass eine der gebrickten GeForce RTX 3090 zusätzlich noch auf einen Shunt-Mod setzte. Dass man damit alle Schutzmechanismen der GPU aushebelt, sei mal außen vorgelassen, denn solche Mods bringen niemandem etwas, es sei denn, man will den Längsten haben und Schäden riskieren.[...]"

Und damit ist dann auch die Garantie weg, für einen nicht spürbaren und allenfalls messbaren Vorteil bei Leuten, die zuviel Geld zu haben scheinen.
Bei Anno ist mir das im DX12 Benchmark auch schon aufgefallen. Da heulen die Lüfter auch bei meiner ASUS TUF ordentlich, wobei die Temperatur sehr (!) im Rahmen bleibt.

Antwort 1 Like

G
Guest

Man kann Shunt-Mod gutheißen oder auch nicht aber nicht jeder Versuch Bestleistung zu erzielen oder das absolute Maximum aus der Technik rauszukitzeln würde ich mit "den Längsten haben wollen" bezeichnen. ☝️

Aber ich krieg nur einmal im Jahr Weihnachtsgeld, deshalb nehme ich davon Abstand! Hatte schon Muffensausen beim Kühlerumbau.

Antwort 2 Likes

B
Besterino

Urgestein

7,152 Kommentare 3,735 Likes

Jo... ist bei mir ähnlich. Neben der Sorge um die Hardware allgemein und der miserablen Verfügbarkeiten im Hinblick auf einen Ersatz fehlt mir auch die Zeit, um mich da dann vernünftig einzulesen. Ich muss dann halt leider wohl weiter neue Grakas kaufen, bis dann endlich mal die Performance "out of the box" reicht, um auf 4K mit 120FPS daddeln zu können. Na gut, auf Wasser umbauen tu' ich auch...

Antwort 3 Likes

Wie jetzt?

Mitglied

70 Kommentare 55 Likes

Keine Ahnung ob das eine Macke speziell deines Systems ist oder bei Grün generell auftritt. Aber der MSI Afterburner bringt den Riva Tuner Statistic Server (kurz: RTSS) mit und der hat einen sehr komfortablen und für jede Anwendung separat setzbaren framelimiter dabei.

Antwort 1 Like

B
Besterino

Urgestein

7,152 Kommentare 3,735 Likes

So, Spiel läuft. Also die Charakter-Erstellung, der Rest muss bis zum Abschluss der Wartungsarbeiten warten. :D

Laut Nvidia-Anzeige bei max. 119FPS in Video und Char-Menü.

Edit &T Korrektur: auf 4K bin ich bei 82-89FPS bei allen Settings auf Very High. Der GPU wirds aber trotz Wasser warm mit 60° und quasi konstant 98-99% Auslastung.

Antwort 1 Like

A
Art

Mitglied

56 Kommentare 11 Likes

@Redaktion: 2x kleine Typos: "in einen Top zu werden" -> "in einen Topf werfen"

Antwort Gefällt mir

Alkbert

Urgestein

970 Kommentare 760 Likes

Das ist schon richtig. Aber Shunt mod heißt unter dem Strich: Ich betreibe die Karte ausserhalb der Spezifikation und auf eigenes Risiko.
Wenn ich (abstrahiert von der Legalitätsfrage) Methanol in meinen Tank schütte, kann ich auch nicht den Hersteller bei Defekten heranziehen und sollte darüber hinaus schon aus Gründen des Anstands (auch wenn das heute in gewissen Kreisen nicht mehr modern ist) davon absehen, die entsprechende Firma mit einem "Shitstorm" deswegen zu überziehen, was man gerade wieder bei EVGA sehen kann.

Antwort Gefällt mir

Igor Wallossek

1

11,315 Kommentare 21,484 Likes

Naja, also das, was bei EVGA gerade zu sehen ist, ist eine Fehlkonstruktion, die auch so zusammenklappt. Man hätte das besser kommunizieren und vor allem auch schon handeln müssen, denn ich weiß, dass sie den Grund kennen. Wo kommt wohl meine Info her... ;)

Das mit den Lüftern zieht sich schon seit einigen Monaten und hatte auch bei Turing schon diverse Probleme verursacht. Es ist nicht den Moddern anzulasten. Die Karte stirbt dann allerdings etwas eher und dann hat der Modder auch beim Sterben der Karte noch den Längsten. :D

Antwort 4 Likes

V
Venox

Neuling

2 Kommentare 0 Likes

Darf man fragen welche Asus TUF du genau hast? Ich selbst habe eine 3080 TUF OC und habe bisher sowas nicht feststellen können bei Anno 1800. Habe natürlich auch nicht aktiv drauf geachtet, überwache aber sehr konstant mit Afterburner und GPU-Z. Habe aber auch schon meine Erfahrung gemacht was den fan controller angeht als ich das vbios geupdated habe. Da war Asus Tweak II für verantwortlich, oder jedenfalls seit der Installation davon waren meine Lüfter konstant bei 53% und drehten nicht mehr hoch. Nach Deinstallation war das Problem behoben.

Antwort Gefällt mir

c
cunhell

Urgestein

585 Kommentare 557 Likes

Hallo Igor,
es hat sich ein kleiner Typo eingeschlichen. Oder war da der Wunsch der Vater des Gedanken ;-)
"Das wiederum vereist auf eine Notabschaltung durchs Netzteil hin,"
Es sollte vermutlich "verweist" heissen.

Ansonsten sehr schöner Artikel.

Grüße
Cunhell

Antwort Gefällt mir

k
k0k0k0

Veteran

136 Kommentare 63 Likes

hier ebenfalls^^:
"Auch hier muss man EVGA und vielen Kollegen wiedersprechen."

Antwort Gefällt mir

P
Phoenixxl

Veteran

160 Kommentare 124 Likes

Ich im Gespräch im Freundeskreis: Ich weiß alles über PC Hardware.
Ich, nach Lektüre eines Textes von Igor, in dem er ein bisschen genauer ins Detail geht: Ich weiß nichts über PC Hardware.

Nach diesem kleinen Spaß:
Danke, Igor, für die ausführliche Erklärung. Eigentlich hatte sich das ja genau so abgezeichnet und dass es nicht nur an New World liegen konnte, war ja eigentlich schon an der Natur des Fehlers (Hardware!) absehbar.
Jays2Cents hat sich -mal wieder- nicht mit Ruhm bekleckert. Man merkt, dass er mehr oder weniger durch Zufall ein großer Youtuber wurde. Mit echtem Know How glänzt er ja nie.
Insofern bist du ein riesen Glück für die deutschsprachige Hardware-Community!

Bisher hatte ich nie einen globalen Framelimiter drin, sondern z.B. vor dem Start von Gothic 3 das Powerlimit auf 50% gesetzt. Wenn ich mich Recht erinnere, dann ist es gar nicht soooooo selten, dass ein Intro eines altes Spiels Mal eben 8000 FPS hat. Ich bin mir aber auch gar nicht sicher, in das dann nicht pre-rendered ist.
Ich werde auf jeden Fall ein globales FPS Limit einrichten.

Peinlich an der Sache fand ich User, die geschrieben haben, dass die betroffenen ohne global Limiter selbst schuld gewesen wären.

Es ist ja nun zum Glück kein häufiges Problem , dass es erstens zu solchen Lasten kommt und zweitens die Schutzschaltungen nicht richtig auslösen.

Man vertraut ja immer auf die Selbst-Sicherung der Hardware, sobald man etwas ohne WHQL Label nutzt. Zumal das Label im Endeffekt nicht mehr wert ist als 80+X.

Ich kann's jedenfalls niemandem verübeln an einer Beta teilzunehmen, Windows 11 zu installieren usw. ohne, dass er sich Sorgen um die Hard(!)-ware macht.

Antwort 3 Likes

Klicke zum Ausklappem

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kannst Du per PayPal spenden.

About the author

Igor Wallossek

Editor-in-chief and name-giver of igor'sLAB as the content successor of Tom's Hardware Germany, whose license was returned in June 2019 in order to better meet the qualitative demands of web content and challenges of new media such as YouTube with its own channel.

Computer nerd since 1983, audio freak since 1979 and pretty much open to anything with a plug or battery for over 50 years.

Follow Igor:
YouTube Facebook Instagram Twitter

Werbung

Werbung