GPUs Graphics Latest news

Design-related EVGA problem instead of NVIDIA issue? EVGA GeForce RTX 3090 vs. Amazon’s New World and first insights | Exclusive

Disclaimer: The following article is machine translated from the original German, and has not been edited or checked for errors. Thank you for understanding!

I have now looked into the problem myself, but due to the lack of a suitable EVGA card I was only able to check it with other cards and did not find any real problems – except for the extremely high FPS numbers due to a missing limiter. However, it was possible for me to tap one or the other colleague directly in the Asian R&D departments of the biger AICs, because in the meantime even NVIDIA deals with the occurred problem. Without spoiling everything in the third sentence, we can assume that this total failure looks like a pure design problem at EVGA and does not affect the other manufacturers in this form, as long as they do not use the same stupid design. So the all-clear is given and why this is so, I will now explain to you.

The fact that the damage is said to have occurred only on certain EVGA cards of a special design certainly narrows the circle of possible causes even further. Remember the EVGA GTX 1080 FTW with AVX cooler, extreme heat problems with the memory (module M7), my saving pad mod and the following ICX design with own temperature sensors (article by me via TH US)?

And that’s probably where the new design that was introduced at the time comes into play now. As I was able to find out, it is not an area of the voltage converter that is affected by the failure, but the “Fan Control IC”, i.e. the chip for the actual fan control, which is said to be completely burnt out in the worst case. We do remember that EVGA is also working with various additional temperature sensors on the board to better adjust the cooling, based on my research at the time. This is also evidenced by submissions from the aggrieved parties who reported extreme fan whine.

In the days of a GeForce GTX 1080 FTW and the lack of control options, this may have made sense, but with a GeForce RTX 3090, this solution is actually now completely obsolete. TMON, i.e. the temperatures of the Smart Power Stages, can be read out exactly in microsecond intervals and the GDDR6X RAM also offers the possibility of a direct monitoring. So no manufacturer is forced to perform such pull-ups in order to design a suitable fan controller. NVIDIA has learned a lot and solves the problem almost perfectly without such additional gimmicks.

In addition, there are also countless safety mechanisms on the Turing and Ampere cards that monitor currents and temperatures. So you wouldn’t need this solution at all, because measuring in the chip (NVIDIA) is still more accurate than beside the chip (EVGA), especially since the sensors used are quite sluggish. But why the chip for the fan control should burn out now, probably only the board layouters at EVGA themselves know. It is interesting and a good indicator in this context that NVIDIA has already asked the other board partners whether they also use such designs.

Of course, marketing will be reluctant to give up such supposed unique selling points of the top models, which have been burned into the brains of potential buyers with a lot of effort over the years. So they keep using it, even if it hardly offers any real added value anymore. On the contrary, in such extreme situations as Amazon’s new game “New World”, it then comes to the self-destruction of an actually even unnecessary feature, where a chip then runs amok. Therefore one will probably be able to give the all-clear at this point for all those who do not use such a thing. Sometimes less is more.

 

Kommentar

Lade neue Kommentare

big-maec

Urgestein

827 Kommentare 475 Likes

So lange man nicht genau weiß was die Ausfallursache ist, gibt es aber noch viele andere Möglichkeiten. Es brauch nur Unterschiedliche Varianten und Hersteller von dem Fan Control IC geben. Die Hersteller kochen schonmal Ihr eigenes Süppchen auch wenn das IC Pinkompatibel ist. Kann auch sein das es bei dieser Kartenvariante den Ausfall stark beschleunigt hat und andere werden noch folgen. Wer weiß, das Thema sollte man auf jeden Fall noch weiter beobachten.

Antwort Gefällt mir

B
BurnOut_Student

Veteran

223 Kommentare 61 Likes

Vielen Dank fürs Nachfragen und für die ausfürliche Erklärung. (y)

Das so ein Controller kaputt geht, hatte ich nun garnicht auf den Schirm. Aber ja hätte mich sonst gewundert wenn die Karten aus irgendwelchen Belastungsgründen durchbrennen. Dafür ist die Technik schon zuweit und die Sicherheitsmechanismen zu gut, jede aktuelle Kartet taktet sich ja da vorher runter um das zu vermeiden.

Antwort Gefällt mir

grimm

Urgestein

3,081 Kommentare 2,035 Likes

Ich bin mit meiner EVGA 2080S eigentlich zufrieden. Die Kühllösung tut, was sie soll und hält die Karte grundsätzlich in einem verträglichen Temperaturfenster. Allerdings wird das gute Stück bei entsprechender Auslastung sehr laut. Im geschlossenen und einigermaßen gedämmten Gehäuse ist das kein großes Thema - vor allem dann nicht, wenn der Sound blastet ;)
Bin sehr gespannt ob und wenn ja, welcher Zusammenhang da die Karten gehimmelt hat.

Antwort Gefällt mir

Igor Wallossek

1

10,178 Kommentare 18,761 Likes

Den nutzt in dieser Form nur EVGA. Im Referenz-Design ist sowas gar nicht vorgesehen.

Naja, und die Shunt-Mod-Kiddies werden sich freuen, weil damit auch OCP/OPP ausgehebelt werden. Bei über 1000 FPS knallts dann schon mal. Andere baustelle. meine 6900XT glüht auch bis zum Blackout, geht aber nicht kaputt

Antwort 1 Like

RedF

Urgestein

4,652 Kommentare 2,549 Likes

Das nätürlich echt ärgerlich. Aber etwas schmunzeln muss ich da schon.
Amazon ist da etwas unglücklich was Games angeht. Das erste war der absolute Flop, das zweite läst die Grakas durchbrennen (auch noch von einem Hersteller der seine Produkte als die OC teile schlechthin vermakrtet ) . 😇

Antwort 1 Like

amd64

1

1,103 Kommentare 670 Likes

Das ist ja mal wieder ein gutes Beispiel dafür, dass alte Zöpfe auch mal abgeschnitten werden sollten, so schön sie auch mal waren.
Ich bin gespannt warum die Controller wirklich durchgebrannt sind.

Antwort Gefällt mir

D
Denniss

Urgestein

1,514 Kommentare 547 Likes

durchgebrannt sind bisher nur EVGAs, die anderen in der Liste sind eher thermale Probleme oder Netzteil.

Antwort Gefällt mir

Igor Wallossek

1

10,178 Kommentare 18,761 Likes

Genau das schreibe ich doch. Aber das passiert, wenn ein Nicht-Techniker wie Jayz ohne Draht in die R&Ds dieser Welt Umsatz generiert. :D

Wie wärs mal mit Minecraft in 800 x 600 ohne RTX? Da passiert das gleiche, nur wird keiner auf die Idee kommen, sowas zu machen.

Antwort 1 Like

FUSION5

Veteran

138 Kommentare 42 Likes

Ich habe das noch nicht ganz genau verstanden. Mit was kommt denn der Fan Control IC in diesem Fall in Kontakt, was ihn durchbrennen lässt?

Dann sollte ich bei meiner 3080 FTW3 auch vorsichtig sein? Oder juckt die das bei einem Wakü Umbau nicht mehr?

Antwort Gefällt mir

Igor Wallossek

1

10,178 Kommentare 18,761 Likes

Der FPS-Limiter ist nie falsch. Was die verquaste Steuerung (verstehe eh nicht, wozu man das überhaupt noch braucht) macht, untersuchen jetzt EVGA und NVIDIA.

Antwort Gefällt mir

RAZORLIGHT

Veteran

355 Kommentare 262 Likes

Also (mal wieder) ein EVGA Problem... mmmh

ps. @Igor Wallossek gibts schon News zu einem Super Refresh für den Desktop von Ampere? ;)

Antwort Gefällt mir

Igor Wallossek

1

10,178 Kommentare 18,761 Likes

Wenn etwas bestätigt wurde, liest Du es hier :)

Antwort 3 Likes

D
Daedalus

Veteran

157 Kommentare 137 Likes

Und genau dafür liebe ich diese Seite. Alle anderen melden nur dass es so ist, keiner hat eine Ahnung wieso.
Und dann geht man eben mal bei Igor schauen und zack: direkt ne technisch fundierte Einschätzung mit tiefergehenden Infos und sehr wahrscheinlich zutreffender Erklärung.

(y)(y)(y)(y)(y)(y)(y)(y)

Antwort 5 Likes

D
Deridex

Urgestein

2,212 Kommentare 846 Likes

Es zeigt mal wieder, dass der Igor recht viele Leute kennt. Nur leider bleibt das aus meiner Sicht recht oberflächlich oder vage was die technischen Details angeht.

Antwort 1 Like

B
BloodReaver

Mitglied

56 Kommentare 20 Likes

Aber warum nur die 3090 FTW3? Was ist mit der 3080 und 3080 ti FTW3? Die teileb sich doch mehr oder weniger alle das gleiche layout.

Antwort Gefällt mir

Neolecram

Mitglied

10 Kommentare 4 Likes

Fragen die bei mir sofort aufkamen: Fließt durch die Lüftersteuerung eigentlich der Strom für die Lüfter oder gibt es dahinter nochmal einen Treiber? Weißt Du zufällig, warum die Karte nichtmehr funktioniert ohne Lüftersteuerung? Also, nimmt das Bauteil andere Bauteile mit in den tot, wird es von einem anderen Bauteil abgefragt oder ist das Problem einfach, dass die Kühlung dann ausfällt und die Karte den Hitzetod stirbt? Ist es ein Softwareproblem in der Firmware von dem Controller, wenn gewisse Wertebereiche überschritten werden oder ist der Controller wirklich physisch zerstört?

Ich frage deswegen, weil ich leider genau so eine FTW3 vor 2 Wochen gekauft habe. Die Karte ist allerdings wassergekühlt, d.h. ich habe die Lüfter abgeklemmt. Jetzt hoffe ich gerade ein klein wenig, dass das bei dem Problem helfen könnte.

Antwort Gefällt mir

Neolecram

Mitglied

10 Kommentare 4 Likes

Ja, aber die 3090 hat nochmal VRAM auf der Rückseite des Boards - d.h. eventuell mehr Sensoren und vor allem auch mehr Hitze. Außerdem gab es ja vor einer Weile ja noch dieses "lustige" 500 Watt Bios, ich bin mir nicht sicher, ob es das auch für die 3080 gab.

Antwort Gefällt mir

Igor Wallossek

1

10,178 Kommentare 18,761 Likes

Die Lüftersteuerung basiert auf einigen Sensorwerten, die von MCUs erfasst werden. Was da genau Amok lief, wird gerade erforscht. Die eigentliche Ansteuerung geht danach über einen simplen PWM-Chip, das ist ja alles kein Hexenwerk. Ich vermute mal, hier sind die MCUs ins Schlingern gekommen. Wenn die Karte aus Gründen von Komponentenschäden kein Power Good Signal mehr liefert, geht sie erst gar nicht mehr an.

Eine 3090 liefert deutlich mehr FPS als eine 3080, kann auch einer der Gründe sein. Wie gesagt, es gibt zwei Ursachen, die hier wohl dumm aufeinandergetroffen sind.

Antwort Gefällt mir

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kannst Du per PayPal spenden.

About the author

Igor Wallossek

Editor-in-chief and name-giver of igor'sLAB as the content successor of Tom's Hardware Germany, whose license was returned in June 2019 in order to better meet the qualitative demands of web content and challenges of new media such as YouTube with its own channel.

Computer nerd since 1983, audio freak since 1979 and pretty much open to anything with a plug or battery for over 50 years.

Follow Igor:
YouTube Facebook Instagram Twitter

Werbung

Werbung