Reviews Simpler Pad-Mod für die GeForce RTX 3080 Founders Edition senkt die GDDR6X-Temperatur um satte 8 Grad

Ohne das Datenblatt zu den verbauten Speicherchips zu kennen, sind keine qualifizierten Aussagen zur Lebensdauer des Speichers in Abhängigkeit zur Betriebstemperatur möglich, da stehen die entsprechenden Diagramme drin. Normalerweise hilft es wenig, die Temperatur einer Komponente des Systems zu senken. Man müsste dann schon die Temperatur aller Komponenten senken, denn die Lebenszeit der verbauten Komponenten wird in der Entwicklung aufeinander abgestimmt.
 
Stimmt. Seltsam ist jedoch, dass die Datenblätter zu GDDR6X bislang nicht existieren, so wie ich das verstanden habe. Aus Erfahrung lässt sich doch aber zumindest mit hoher Wahrscheinlichkeit sagen, dass 96° besser sind als 104° und dass 104° sogar schon eher am oberen Ende der vertretbaren Skala sind.

Hatte nVidia in der Vergangenheit nicht mit RAM Temperaturen und ausfällen zu kämpfen? Ich meine mich da eine 2080ti zu erinnern.
War natürlich keine Absicht und selbstverständlich ein Fehler, trotzdem wurde scheinbar erst auf öffentlichen Druck der Hersteller gewechselt.

Gibt es denn irgendein Szenario unter dem niedrigere Spitzentemperaturen schädlich sind?
Oder steigen durch diesen Mod die Temperaturen an anderer Stelle dramatisch an?
 
@ArcusX
Sicher existieren Datenblätter, dürften aber nur wenigen ausgesuchten Entwicklern zur Verfügung stehen. Warum das so gehandhabt wird, ist mir nicht bekannt. Es ist jedenfalls unüblich, da Produkte ohne entsprechende Angaben schlecht beworben, geschweige denn sicher verbaut werden können.
Zur Temperatur, natürlich, je niedriger die Temperatur, desto länger die Lebenszeit, gilt für alle Halbleiter. Jedenfalls kenne ich keine Ausnahmen. Aber das ist keine quantitative Aussage, daraus lässt sich nicht ableiten, ob die Betriebstemperatur in diesem Falle unangemessen hoch ist oder nicht.
Bei dem Ram der 2080ti weiß ich nicht, woran es lag, aber ich glaube, es war nicht Temperaturbedingt. Das ist ja komplex, da kann vieles eine Rolle gespielt haben.
So als Fazit, die Lösung von Igor ist sicher geeignet, die Lebensdauer des Speichers zu verlängern. An anderer Stelle wird es vielleicht ein paar zehntel grade wärmer, aber das sollte man vernachlässigen können. Sicher eine empfehlenswerte Maßname.

Nur die häufig zu lesenden Aussagen, die Ingenieure bei nVidia seien hier wohl inkompetent gewesen, zu dieser Schlussfolgerung fehlen die Daten. Entweder man bekommt das Datenblatt, dann kann man sehen, ob der Speicher bei der gemessenen Temperatur 2, 4, 8 usw. Jahre hält bzw. die Ausfallraten über den Zeitraum oder man bekommt später die Zahlen bezüglich Rückläufer wegen Überhitzung des Vram, diese Analysen werden an defekten Rückläufern stichprobenartig durchgeführt, um die Produktion zu optimieren.

Vorerst sind die zusätzlichen Kühlpads eher Vorbeugung als Fehlerbehebung. Sollte nVidia hier tatsächlich zu eng kalkuliert haben, wird sich die Vorbeugung (vielleicht) auszahlen, zumal es auch noch eine preiswerte Maßnahme ist.
 
Zuletzt bearbeitet :
Ohne das Datenblatt zu den verbauten Speicherchips zu kennen, sind keine qualifizierten Aussagen zur Lebensdauer des Speichers in Abhängigkeit zur Betriebstemperatur möglich, da stehen die entsprechenden Diagramme drin. Normalerweise hilft es wenig, die Temperatur einer Komponente des Systems zu senken. Man müsste dann schon die Temperatur aller Komponenten senken, denn die Lebenszeit der verbauten Komponenten wird in der Entwicklung aufeinander abgestimmt.
das fett markierte trifft hier leider anscheinend nicht zu, da es ja nicht alle Speicherchips sind, sondern nur die, die so nah an den Spannungswandlern sitzen, wo die Temps so hoch sind bzw die Temperturdifferenz zur Umgebung so klein ist, dass nicht ausreichend Wärme abgeführt werden kann
ich denke, selbst mit Datenblatt und Diagrammen kann man die Lebendauer nur grob abschätzen, da die Werte idR auch "nur" statistische Werte aus der Ausfallverteilungsermittlung sind (z.B. Badewannenkurve)

Gibt es denn irgendein Szenario unter dem niedrigere Spitzentemperaturen schädlich sind?
ich denke nicht (bei elektronischen Bauteilen), siehe RGT-Regel (van 't Hoff/Arrenhius), je niedriger die Temperatur, desto weniger "schwingen/stoßen" die Teilchen und desto weniger können sie mit einerander reagieren (altern)

Oder steigen durch diesen Mod die Temperaturen an anderer Stelle dramatisch an?
ich denke auch das nicht, da die erzeugte Wärmemenge ja gleich bleibt und der Wärmestrom/-transport nur von hoher zu niedriger Temperatur stattfinden kann (siehe 2. HS Thermodynamik)

Die zusätzlichen Kühlpads sind eher Vorbeugung als Fehlerbehebung.
sehe ich leider nicht so, wenn der Speicher 104 °C hat und der bei 110 °C anfängt zu throtteln, ist da meinem Empfinden nach zu wenig/keine Sicherheit, unabhängig von der Lebensdauerbetrachtung...

die Ingenieure bei nVidia seien hier wohl inkompetent gewesen,
naja, an anderer Stelle, wo die Pads anscheinend nicht unbedingt benötigt werden, haben sie ja kompetenter Weise welche hingepackt ^^
aber ja, Genaues kann man nicht Schlussfolgern, was da passiert oder nicht passiert ist und wer genau das zu Verantworten hat...
 
Ich hatte Dragus im ersten Post so verstanden, dass die nVidiaangestellten mit Absicht so einen lokalen hotspot akzeptiert haben, da sonst an anderer Stelle Probleme auftauchen könnten.

Sprich: Die Energie muss ja irgenwo hin und vielleicht schlägt sie so über die Backplate an einem Ort auf, an dem niedrigere Höchsttemperaturen vielleicht schon kritisch sind.

Zum Thema Datenblätter: Das habe ich ungenau formuliert. Diese scheinen öffentlich nicht verfügbar zu sein. Auf der Micron homepage habe ich sie jedenfalls nicht gefunden, während man zu GDDR6 schon so einiges findet. Im "Thermal Application" Dokument gibt es zum Beispiel nur GDDR6.

Ich bin kein Elektroingenieur und habe in diesen Bereichen nur laienhaftes Wissen. Daher frage ich immer gerne nach, ob da nicht ein Umstand ist, den ich übersehe.

Danke @Dragus und @Sk3ptizist.
 
Zuletzt bearbeitet :
Nunja, wie bekannt ist, ist der Speicher für bis zu 21GBit gut, Nvidia wusste also genau, warum sie ihn auf 19,5 begrenzen mussten.
 
Ohne Backplatte werden alle Bauteile auf der Rückseite etwa gleich durch die Luft gekühlt. Die Platiene kann die Wärme auch noch etwas verteilen. Es wird somit dort am wärmsten, wo am meisten Wärme auf kleiner Fläche entsteht. Wenn Bauteile dadurch ihre Maximaltemperatur überschreiten würden, sollte man dort mit zusätzlichen Kühlmassnahmen wie beispielsweise kleinen Kühlkörperchen nachhelfen.
Mit der Backplatte verändert sich die Situation massiv. Bauteile mit Wärmeleitpads können die Wärme gut an die Backplatte abgeben. Diese verteilt die Wärme auf eine etwas grössere Fläche und gibt die Wärme dann besser an die Luft ab. Gleichzeitig wird aber jeder Luftstrom über die anderen Bauteile verhindert, so dass hier kaum mehr Wärme an die Luft abgegeben wird und sich die Platine stärker aufwärmt.
Wenn man die Backplatte anschaut, hat diese oben und unten in diesem Bereich ein schwarzes Dreieck. Links sind Wärmeleitpads auf VRM und rechst ist der heisse Memory, weil dort keine Pads sind. Nvidia hat sich also entschieden, vor allem VRM gut zu kühlen. Mit den zusätzlichen Pads wird natürlich mehr Wärme auf die Backplatte übertragen. Ich denke aber, dass diese genug gross ist, dass sich der linke Bereich dadurch nicht bedeutend mehr aufwärmt. Wie viel auf die VRM ausmacht müsste Igor messen. Ich vermute es werden nicht mehr als 1 bis 2 Grad sein. Ich denke, es ist besser beide Hotspots anständig zu kühlen als nur einen gut und den anderen nicht.
 
Die 3090 FE verwendet ja, so wie ich das verstanden habe, eine aktiv kühlende Backplate. Alleine schon deswegen, weil ja auch RAMs auf der Rückseite sind, geht also gar nicht anders.

Ich bin gespannt, wie sich die thermische Situation da darstellt. Und auch wie die WaKü-Block Lösungen dazu aussehen. Ich kann es kaum erwarten die Lösung von AquaComputer zu sehen. Leider werden wir da noch einige Wochen drauf warten müssen.
 
sehe ich leider nicht so, wenn der Speicher 104 °C hat und der bei 110 °C anfängt zu throtteln, ist da meinem Empfinden nach zu wenig/keine Sicherheit, unabhängig von der Lebensdauerbetrachtung...
Die Karte dürfte mit der bestehenden Kühlung kaum zu Übertakten sein, da man von Werk aus an die Grenze gegangen ist. Das ist kein Fehler, sondern ein fehlendes Feature. Ich tendiere ohnehin zum undervolten und werde das Powerlimit etwas reduzieren, weil mir die letzten 5% Leistung wenig bedeuten, da hätte nVidia auch konservativer herangehen können, aber es gibt sicher auch viele, die davon profitieren, nicht selbst Hand anlegen zu müssen um auch das letzte bisschen an Leistung herauszuholen. Warte allerdings bis zum Erscheinen der 3070 ti bzw. 3080 ti, weil mir 10 GB Vram zu wenig sind. Spiele selten, mache eher Raytracing.
Also bleibt mir genügend Zeit, in Ruhe abzuwarten, ob die Chips mit 105'C stabil laufen oder eines frühen Todes sterben. Das dürfte dann in den nächsten Monaten so einige Foren füllen und dem ein oder anderen Verantwortlichen den Job kosten. Falls nicht, umso besser. Ich gönne jedem seinen Spaß mit der neuen Generation.
 
Zuletzt bearbeitet :
Sicher. Laptop-CPUs und GPUs werden unter Last auch bei gut 100°C betrieben um die maximale Leistung zu bieten. Das ist für die meisten Kunden tatsächlich wichtiger als theoretische Vermutungen über die Lebensdauer.

NVidia verkauft die Quadro RTX 6000 mit einer spezifizierten MTBF von mindestens 700000 Stunden (=80 Jahre), und das bei 35°C Raumtemperatur.
Wenn ich mir die Thermalbilder von Igor (RTX4000, kühler ist der Speicher auf einer 6000 sicher nicht) so anschaue:
dann sind wir da bei etwa 55° über der Raumtemperatur (22°C im Test) => also gut 90°C bei der NVidia-spezifizierten Raumtemperatur.

Wenn ich davon ausgehe das bei GDDR6X das Doping im Silizium ähnlich stabil ist wie GDDR6 (weil's ja immer noch die gleiche Fertigung ist, nur der Betrieb ist anders), und die Lebenserwartung mit einem pessimistischen Faktor 3 pro 10° skaliere, komme ich bei 105°C immer noch auf eine MTBF von mindestens 135 000 Stunden oder 24 Jahren. Oder mehr, wenn nicht die Speicherbausteine sondern ein anderer Chip die Ausfallsrate treibt.

Von daher ist es reichlich albern von "105°C klingt für mich persönlich irgendwie zu hoch" gleich auf "NVidia hat schlecht designed" schließen zu wollen. Wenn die Temperatur zu Problemen führt, werden wir das in den nächsten Monaten recht schnell mitbekommen. Wenn nicht ist die igor'sche Wärmeleitoptimierung ein "Nice to Have" für begeisterte PC-Bastler, aber mehr auch nicht.
 
Zuletzt bearbeitet :
Von daher ist es reichlich albern von "105°C klingt für mich persönlich irgendwie zu hoch" gleich auf "NVidia hat schlecht designed" schließen zu wollen.
hmm, Du argumentierst mit der Lebensdauer, ich bezog mich bei der Aussage aber auf das throtteln, wenn Du nochmal nachlesen möchtest...

naja, mal abwarten, anfangs fand ich das Kühlerdesign ziemlich vielversprechend, hat sich leider bisher nicht bewahrheitet
aber ja, ihr habt natürlich recht und die haben top Arbeit geleistet... (y)
 
Hat irgendwer von Euch den Mod bereits durchgeführt ?
Hab ein 3mm Ultrasoft Pad hier von Thermal Grizzly und wäre eigentlich bereit dafür.
Jedoch ärgert es mich das ich nicht nachvollziehen kann ob es was gebracht hat, das Tool fehlt halt :)
 
Ann kann es recht ungenau mit einer IR Pistole testen.
 
Ein recht ungenaues Ergebnis ist nicht unbedingt befriedigend :)
 
Gibts nicht hier irgendwo einen Newspost von Igor, dass NV in der ajtuellen Serie genau diesen Mod selber eingeführt hat? Da haben wir uns doch noch amüsiert darüber....
 
Ja klar gibts den, bei meinem Model aber eben noch nicht.
 
Ja eh, hab ja auch eine nur halt noch ohne Pad Mod ?
 
Oben Unten