Grafikkarten News VGA

Grafikkarten-Probleme bei EVGA trotz Firmware-Update – Marketing vs. technische Vernunft

Echte Messwerte im Speicher-Modul

Interessanterweise schwieg sich Micron beim NVIDIA-exklusiven GDDR6(X) erst einmal komplett aus, denn selbst die der GDDR6-Dokumentation beiliegende „Device Thermal Information“ endet ärgerlicherweise immer noch bei GDDR5. Auf Nachfragen unter Kollegen z.B. aus den R&D-Abteilungen hieß es übereinstimmend, dass die Maximaltemperatur Ttot vorm Beginn einer möglichen Zerstörung des Chips bei 120 °C liegen solle und man Tjunction wohl beim GDDR6 bei 105 °C  bzw. beim GDDR6X sogar bei 110 °C als Maximalwert spezifiziert. Doch betrachten wir erst einmal das thermische Schema so eines GDDR6X-Modules, den ein wenig Theorie kann ich Euch an dieser Stelle leider nicht ersparen. Interessant ist zunächst PT, also die maximale „Power“ Ptot, die als elektrische Energie zugeführt und als Wärme auch wieder fast vollständig wieder abgegeben wird (siehe roter Pfeil).

Das sollten pro Modul so um die 2,5 bis 3 Watt sein, was erst einmal wenig klingt, aufgrund der kleinen Strukturbreite und Wärmedichte (Density) aber durchaus eine Hausnummer ist, vor allem dann, wenn die Platine darunter eh schon recht heiß ist. Denn auch wenn das Speichermodul als Package recht groß aussehen mag: der Chip selbst ist eher winzig. Man benötigt einfach viel Platz für die ganzen Anschlüsse und außerdem möchte man gern abwärtskompatibel bleiben:

Source: Micron

An der gleichen Stelle kommt nun TJ, also Tjunction ins Spiel. Maximale Chip-Temperatur und maximale Verlustleistung stehen also hier in direktem Zusammenhang. Das ist auch genau der Wert, den z.B. auch AMD im Sensor-Loop als Speichertemperatur ausgibt. Ich habe damals bei AMD nachgefragt und erfahren, dass es sich zudem nicht um einen Durchschnittswert (Average) aller Module handelt, sondern um den absoluten Peak-Wert, also Tjunction des jeweils heißesten Modules einer Karte. Wichtig sind auch die mit den beiden anderen roten Pfeilen gekennzeichneten Werte PB, also als Pboard die Verlustleistung, die über das Board abgeführt wird und PC, was für die abgeführte Wärme Pcase über die Oberseite des Gehäuses (Package) steht.

Dazu kommen dann noch alle auftretenden Wärmewiderstande der einzelnen Schichten und die Zusammenfassung zusammengehöriger Schichten als Richtungswert nach oben hin und durch die Platine nach unten hin, sowie die Temperaturen der Umgebung (Luft) TA bzw. Tair an der Ober- und Unterseite, wobei beides durchaus auch abweichend sein kann, wenn einseitig gekühlt wird. Ich schrieb ja bereits, dass man die Temperaturen, die man NEBEN so einem Speichermodul auf der Platine misst, nur indirekt zu Rate ziehen kann, wenn es um die Temperuren im INNEREN geht. Die Temperaturen des GDDR6X-Speichers lassen sich also beim GDDR6X direkt auslesen und man bekommt von NVIDIAs Firmware sogar noch den sauber herausgerechneten Hotspot-Wert auf einem silbernen Teller präsentiert. Das alles ist viel genauer als ein willkürlich außerhalb platzierter Messwiderstand und geschieht vor allem sogar in Echtzeit!

Spannungswandler-Temperaturen

Jetzt will ich mich natürlich in technischen Details verlieren, die die meisten wohl eh langweilen würden, aber ein wenig abtauchen müssen wir zum besseren Verständnis dann wohl doch. Aber keine Angst, es bleibt verständlich genug. Kommen wir deshalb jetzt direkt zu den so wichtigen Spannungswandlern! Die sogenannte DCR (Direct Current Resistance) ist die Basis, um Temperaturen und Ströme zu kalkulieren. Doch wie erfährt der Controller nun genau, welche Ströme in welchem Regelkreis fließen und welche Temperaturen herrschen? Das Monitoring kann unterschiedlich sein, denn es gibt – wen wundert es – verschiedene Methoden dafür. Da liest man auch oft etwas von den sogenannten Smart Power Stages (SPS) und der sogenannten MOSFET DCR. Und genau jetzt wird es erneut interessant!

Das Bild unten zeigt das typische Layout mit den intelligenten SPS, die für jeden einzelnen Regelkreis mit IMON den Wert für die Stromstärke (current) und mit TMON der exakten Temperaturwert liefern, den man für die exakte Überwachung so dringend braucht. Wie die SPS diesen Wert ermitteln? Es werden die Drain-Ströme der MOSFETS in Echtzeit gemessen und diese Werte sind zudem auch extrem genau (im Beispiel oben 5 μA/A Signal), das mit den Temperaturen erledigen digitale Thermalsensoren im Inneren.

Wer sehen also auch hier, dass eine Messung außerhalb auf der Platine mit einfachen Messwiderständen nie in Echtzeit und schon gar nicht exakt genug erfolgen kann.

Wozu also noch ICX?

Die Frage ist aus Sicht des Marketings natürlich klar, denn man möchte lieb gewonnene Alleinstellungsmerkmale (die wirklich mal welche waren) nicht aufgeben, auch wenn es technisch gar keinen Sinn mehr ergibt. Denn seit Turing erlaubt auch NVIDIA eine asymmetrische und unterschiedlichen Faktoren unterworfene Lüftersteuerung, die zudem auf den in Echtzeit ermittelten Werten für die GPU (samt Tjunction), den Speicher und die Spannungswandler basiert. Das kann man technisch mit einer proprietären Lösung, die auf Platinen-Messpunkten basiert, nicht besser lösen. Im Gegenteil, man wird mait mittlerweile deutlich schlechter abschneiden.

Wenn dann noch ein (vermutlich) fehlerhaftes Platinenlayout dafür sorgt, dass eine MCU zerstört wird (Überspannung?) und im Drift-Bereich bereits die absurdesten Werte ausgibt, dann hat so eine überflüssige Lösung auf einer so teuren Karte einfach nichts mehr verloren. Das ist wie mit dem Blinddarm. Keiner braucht ihn und trotzdem fliegt er erst raus, wenn er Probleme bereitet. Grund genug für EVGA also, dieses Relikt zu beerdigen. Es gibt mittlerweile genügend Sensorwerte, die man in der EVGA-Software anzeigen könnte und dem Klicki-Bunti-Universum gerecht werden zu können. Aus technischer Sicht braucht das alles wirklich kein Mensch mehr.

Und am Ende ist es wie mit einem Auto: Was erst gar nicht drin ist, kann auch nicht kaputt gehen!

 

Kommentar

Lade neue Kommentare

P
Phelan

Veteran

189 Kommentare 171 Likes

Ja eigentlich unverständlich. Zumal wir ja hier nicht von 200€ OEM Karten reden wo jeder Cent wichtig ist..

Marketing versteht blos 2 Sachen.

1. Wenns die Leute nicht kaufen
2. Wenn ihn die QS hohe Reklamationsquoten um die Ohren haut.

Also von anderen Herstellern kaufen oder
Die Karten ganz normal benutzen und bei hochdrehenden lüfter nicht "retten" oder Rücksicht darauf nehmen sondern normal weiter Spielen.
Die defekte Karte dann reklamieren.

Eigentlich sind die Amoklaufenden Lüfter ansich eine Rekla-Grund.

Antwort Gefällt mir

konkretor

Veteran

292 Kommentare 297 Likes

Hut ab für denjenigen der so ne Kostbarkeit wie aktuell ne Graka um den halben Globus verschickt. Nicht ganz ohne Risiko.

Igor aufpassen nicht das sie dir noch mit einem Arbeitsvertrag drohen bei deinen Lösungen.

Wenn ich Brasilien höre muss ich immer an die Tante denken die dort ne Plantage hatte. Kam immer mit dem Bananen Flieger, da günstiger wie mit dem normalen Flugzeug.

Antwort Gefällt mir

Martin Gut

Urgestein

7,703 Kommentare 3,530 Likes

Es ist leider oft so, dass die ersten die eine fortschrittliche Lösung erarbeiten dann auf dem erreichten Stand stehen bleiben. Eine halbwegs brauchbare Lösung wird mit allen Mitteln beibehalten solange es möglich ist.

Andere die später einsteigen erarbeiten eine bessere Lösung nach den aktuellen technischen Möglichkeiten und überholen so die Pioniere von vorher.

So wundert man sich beispielsweise dass momentan die grössten Solaranlagen in China, Afrika und sogar in arabischen Ländern die genug Erdöl hätten gebaut werden. Bei uns in Europa wird dagegen praktisch nichts mehr gebaut.

Antwort 3 Likes

e
eastcoast_pete

Urgestein

1,382 Kommentare 758 Likes

Wenn EVGAs Marketing Leute in Sachen thermales Management eine echte Differenzierung zur Konkurrenz suchen, könnten sie es z.B. versuchen, ihre Karten mit hochwertigen Fuji Poly Pads und anderen höherwertigen Kühllösungen auszustatten. Andere Hersteller machen das wohl zur Zeit nicht, und zumindest einige potentielle Käufer fänden sowas daher interessant - ich zum Beispiel. Arg viel teurer als die Sensoren, die sie am besten weglassen würden, wird das auch nicht sein.

Antwort Gefällt mir

D
Deridex

Urgestein

2,204 Kommentare 843 Likes

Wenn ich richtig das richtig gesehen habe und n Igor seine Bilder korrekt sind, werden hier an einem Spannungsteiler mit einem Temperaturabhängigen Widerstand analoge Spannungswerte erzeugt, welche die Temperatur wiedergeben. Und das auf einer Karte auf der >300W Leistung geschalten werden. Wenn das wirklich so ist, wundern mich die Spitzen bei den Messwerten recht wenig. Allerdings ist das nach wie vor eine Vermutung, die nur auf den Bildern vom Igor basiert.

Antwort Gefällt mir

wild

Mitglied

24 Kommentare 3 Likes

vielen dank für die klare analyse. weiter so!

(y)

Antwort 1 Like

z
zeutan

Mitglied

32 Kommentare 3 Likes

Ja, das ist tatsächlich so: die Einheiten sind andere, die Mathematik bleibt.
Schön zusammen gefasst unter:

Antwort Gefällt mir

ssj3rd

Veteran

212 Kommentare 142 Likes

Welche 3090 Custom gilt den zur Zeit als die leiseste? Die TUF?
Werde wohl doch von meiner FE wechseln die ab 60 Grad teilweise völlig außer Rand und Band gerät, die Lautstärke ist dann ohrenbetäubend von den Lüftern…

Evga ist für mich nach vielen Artikeln hier absolut tot und Geschichte.

Antwort Gefällt mir

p
pedi

Veteran

247 Kommentare 73 Likes

ist kein wunder, dass dich EVGA aus dem verteiler geschmissen hat, so wie du in letzter zeit gegen EVGA feuerst.
alle anderen hersteller sind perfekt und natürlich fehlerfrei, ist ja logisch.
nein, ich habe keine EVGA karte, sondern eine 60,-€ Nvidia GeForce GT 710.

Antwort Gefällt mir

Igor Wallossek

1

10,084 Kommentare 18,556 Likes

Andere bekommen auch Kritik, siehe MSI und die Pads. Im Übrigen besteht das auf Gegenseitigkeit, da ich seinerzeit Bedingungen wie Netzteiltests mit Schönfinden als Voraussetzung für ein Sampling abgelehnt habe. Das nur mal am Rande. So etwas hat noch nie ein anderer Hersteller versucht. 😁

Antwort 6 Likes

v
vonXanten

Urgestein

799 Kommentare 334 Likes

Das ganze Verhalten von EVGA spricht für sich, da ist das fernhalten kritischer Stimmen nur die konsequente Fortführung der Strategie...
Problem bei EVGA scheint meiner Meinung nach zu sein, dass alles was sie nicht selber sagen nicht sein kann. Die Kritik von Igor war sachlich und fachlich sehr gut, damit muss man ebenso emotionslos umgehen (können) und es als Chance nutzen.

Das mit der Vorabtausch Garantie ist ein weiterer Punkt. Da kann mir keiner erzählen, dass dies Vollkommen toll und gut ist (~doppelter Preis des Onlineshops als Kaution). Da kann ich es verstehen es öffentlich zu machen, es wurde ja schon genug ausgewalzt.

Bei EVGA scheint im Moment einiges schief zu laufen, vorallem wenn man Premium bedienen will aber nur Holzklasse abliefert.

Und sachlich und (fast) emotionslos zu bleiben ist heutzutage extrem selten, die meisten fühlen sich dann erst recht persönlich angegriffen und versuchen ihre Meinung als den Heiligen Gral zu verkaufen...

Hoffe Igor macht weiter so, ist einfach erfrischend so schön trocken sachlich und nicht schöngefärbt.

Antwort Gefällt mir

FUSION5

Veteran

138 Kommentare 42 Likes

Danke Igor! Wie immer top!

Solche Infos hätte ich gerne letztes Jahr in den Reviews gefunden, dann wäre meine Kaufentscheidung anders ausgefallen.

Die nächste Karte wird jedenfalls keine EVGA.

Antwort Gefällt mir

FUSION5

Veteran

138 Kommentare 42 Likes

Ich glaube auf Seite 3 hat sich noch ein kleiner Fehler eingeschlichen:

Antwort Gefällt mir

B
Ben Dover

Mitglied

13 Kommentare 10 Likes

I'm amazed at how well the machine translation to English works, especially when (as appears to be the case here) you avoid figurative phrases in the German original. Clear in ==> clear out :) . Remarkable.

And BTW thanks for such a good article on the EVGA tech. One reason I preferred them was for their monitoring; now I know that they simply haven't kept up.

Antwort 2 Likes

B
Besterino

Urgestein

6,664 Kommentare 3,260 Likes

deepl.com is an amazing translation service german/english and vice versa. Use it even for work (pro version though).

Antwort 1 Like

ipat66

Urgestein

1,337 Kommentare 1,330 Likes

EVGA nennt Ursache für defekte GeForce RTX 3090

Mängel beim Löten der MOSFETs

Antwort 1 Like

konkretor

Veteran

292 Kommentare 297 Likes

@Igor Wallossek

Also ich habe jetzt alle deine Artikel dazu gelesen und bin da deiner Meinung, wieso hauen die jetzt so etwas raus?

Antwort Gefällt mir

B
Besterino

Urgestein

6,664 Kommentare 3,260 Likes

gibt zwei Möglichkeiten: EVGA‘s Meldung stimmt oder nicht. „Vereinzelte Produktionsfehler“ sieht schon besser aus als grundsätzliche Designfehler. Genau werden wir das wohl nie erfahren, ein Indiz für mich wird die nächste Generation sein, falls da dann das zusätzliche Sensorengelumpe nicht mehr da ist oder merklich anders umgesetzt wurde. :D

Antwort 3 Likes

v
vonXanten

Urgestein

799 Kommentare 334 Likes

Das hört sich an wie "was nicht sein kann, darf auch nicht sein!" Grenzt an Ketzerei das andere sich erdreisten eine Fehleranalyse zu machen.
Und ein Rauschen was sich provozieren lässt und nicht nur an und ab auftritt?

wie @Besterino schon sagt, spätestens mit der nächsten Gen wird sich zeigen ob da etwas geändert wurde.

Antwort Gefällt mir

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kannst Du per PayPal spenden.

About the author

Igor Wallossek

Chefredakteur und Namensgeber von igor'sLAB als inhaltlichem Nachfolger von Tom's Hardware Deutschland, deren Lizenz im Juni 2019 zurückgegeben wurde, um den qualitativen Ansprüchen der Webinhalte und Herausforderungen der neuen Medien wie z.B. YouTube mit einem eigenen Kanal besser gerecht werden zu können.

Computer-Nerd seit 1983, Audio-Freak seit 1979 und seit über 50 Jahren so ziemlich offen für alles, was einen Stecker oder einen Akku hat.

Folge Igor auf:
YouTube   Facebook    Instagram Twitter

Werbung

Werbung