NVidia Stimmen häufen sich: Sterbende Nvidia RTX 2080 Ti Grafikkarten

Ich kann mir auch gut vorstellen das einige Nutzer ihre Lüfterkurve noch anpassen um die Karte leiser zu machen, denn die GPU selbst bleibt ja relativ kühl und hat noch Spielraum. Nur werden dann die anderen Komponenten ja auch schlechter gekühlt. Wenn der Speicher eh schon so heiß wird, kann man damit seine Grafikkarte bestimmt auch entsprechend schnell den Hitzetod sterben lassen.
 
Vielleicht ist es auch nicht der Speicher selbst. Bei der 8000er Serie (wenn ich mich richtig erinnere) gab es Probleme mit dem Lot. Da konnte der Backofen manche Karte retten. Das würde ich aber nicht ausprobieren, solange noch Garantie drauf ist.

Ich vermute auch, dass Nvidia selbst den Grund noch nicht kennt, sonst würden die Austauschkarten das Problem nicht mehr aufweisen.
 
Nicht nur Lot.
Platinen, Bauteile und Herstellprozesse selbst können dran schuld sein.
Das wird dann meist im Verlauf der nachkommenden Chargen der Karten optimiert.
 
@Igor

Nein, die max Spezifikation von GDDR6 liegt bei +125°C (selbst wenn du die Rückseite misst)! Und oben auf der Ecke sitzt ein Tempsensor für die Core Fabric. Massives Speicher OC verursacht genau diese Artefakte. Vermutlich ist die Serienstreung bei GDDR6 höher und Micron's Binning zu schlecht. Gabs ja schon mal bei einem anderen Hersteller, z.B. bei der R9 290 Serie bei Asus, wo eine gesamte Charge Müll war. Man verwurstet wohl alles was verfügbar ist. Anscheinend macht es die gleichen Probleme wie bei HBM2.

12gb/s laufen mit 1,2V (JESD8-30; POD125), alles darüber mit 1,35V (JESD8-21; POD135). Ich habe mich schon gefragt wo da der Vorteil liegen soll. Die damit zur Verfügung gestellte Bandbreite wird nicht ansatzweise ausgenutzt. Das Maximum läge ausserhalb dieser JESD Spezifikation für VDD, VDQ, VWIN/VOUT sogar bei 2,0V und für VPP bei 2,3V (Device Supply 1,3905V und Pump 1,908V max unter POD135).

Heißt der GDDR6 kann schon ordentlich Temp vertragen, OP ist die Betriebstemp nach den POD's und JESD8 Standards bei 1,25 und 1,35V. Sonst läuft der VRAM auch von -55 bis 125°C und diese sind sicher abhängig von Voltage- und Clock Waveform. Daraus ergibt sich für den jeweilig angewandten Standard die VREF und damit das Max-/Min-Clocklevel (Low/Max). Geht ja auch darum den Verbrauch nicht unnütz hochzujubeln und das Layout massiv zu verteuern.

;)
 
Mal abgesehen davon was die Fehlerquelle sein mag.
Aber einer Hardware für 1300€, darf sowas nicht passieren.
 
Mal abgesehen davon was die Fehlerquelle sein mag.
Aber einer Hardware für 1300€, darf sowas nicht passieren.

doch, aber nicht in dem prozentualen ausmass... 1/50 wäre noch ok, aber 2/10 ist schon derbe...

zumal die von NV mir ja nicht erzählen können das sie ihre referenzkarten nicht selber getestet haben wie sie "user" testen würden, sprich übertakten usw. und das mit mehr als nur einer karte, wo dann das problem evtl. nicht aufgetreten ist.
 
@gastello:
Du meinst sicher Elpida. Der war auch bei einigen Sapphire und allen R9 von HIS drauf Es sind aber damals überwiegend nur die Modelle gestorben, deren RAM eher mau gekühlt wurde. Von den zwei HIS-Karten von mir lebt eine übrigens immer noch - die mit dem Wasserblock. Die hatte ich damals umgebaut, nachdem die erst abgekackt war. Und sie lief lange Zeit fast 24/7.

So mal ganz nebenei - MSI hat den Kühler der aktuellen Karten nicht ganz zufällig umgebaut. Die hatten genau mit den Modulen M6 und M7 schon bei Pascal richtig Ärger. Wenn es zur Speicher-RMA kam, dann bei diesen beiden Kandidaten. Aktuell komme ich leider nicht an Hersteller-Daten, da hat NV leider überall die Finger drauf. NDA an allen Fronten. Dazu kommt die debile RAM-Übertakterei, die man nur für Benchmarks "braucht". Der Regler sollte in den Tools definitiv verschwinden. :D
 
Regulierungswahn und Verbieten sind die mM falschen Wege .
Als mündiger Kunde sollte es doch mir überlassen werden wie und in welchem Zeitraum ich mein erworbenes Produkt verheizen mag z.B. beim benchen.
 
Ja, aber dann nicht wegen Defekten rumheulen.

Moderne Motoren regelt auch bei zu hohen Drehzahlen ab, bevor Gefahr droht, dass sie Schaden nehmen. Solche Sperren sind m.E. durchaus sinnvoll. Wenn man sie entfernt und was kaputt geht, sollte man halt sich auch nicht wundern bzw. den Hersteller auf kostenlosen Ersatz anhauen.
 
Generell finde ich das verhalten zu Grafikkarten von vielen eher unschön. Man kauft sich eine Karte, baut sie ein, testet die Limits (Ok bei CPU machen viele das auch) und wenn mann das Gefühl hat, das man keine gute Lotterie erwischt hat, schickt man es zurück und holt sich die nächste. Das so was möglich ist, finde ich traurig. Und noch besch* finde ich es, wenn ich dann eine Karte bekomme, die schon jemand ans Limit genudelt hat, und dann als "gefällt mir nicht ungebraucht" zurück gibt. Dann habe ich den Ärger wenn was kaputt geht, ohne was dafür zu könn. Generell wäre es daher vlt schön, wenn es mehr Tools gäbe um so etwas nachzuweisen, einerseits ob OC wurde (und wie sehr) und 2 ob Karten schon betrieben wurde (und wie lange) wenn man die Zurück gibt. Dann wäre auch der Volkssport "ich OC bis ans Limit wenns kaputt geht schreie ich nach Garantie" nicht mehr möglich. Für die Preise wäre das sicher auch nicht schlecht.
 
Generell finde ich das verhalten zu Grafikkarten von vielen eher unschön. Man kauft sich eine Karte, baut sie ein, testet die Limits (Ok bei CPU machen viele das auch) und wenn mann das Gefühl hat, das man keine gute Lotterie erwischt hat, schickt man es zurück und holt sich die nächste. Das so was möglich ist, finde ich traurig. Und noch besch* finde ich es, wenn ich dann eine Karte bekomme, die schon jemand ans Limit genudelt hat, und dann als "gefällt mir nicht ungebraucht" zurück gibt. Dann habe ich den Ärger wenn was kaputt geht, ohne was dafür zu könn. Generell wäre es daher vlt schön, wenn es mehr Tools gäbe um so etwas nachzuweisen, einerseits ob OC wurde (und wie sehr) und 2 ob Karten schon betrieben wurde (und wie lange) wenn man die Zurück gibt. Dann wäre auch der Volkssport "ich OC bis ans Limit wenns kaputt geht schreie ich nach Garantie" nicht mehr möglich. Für die Preise wäre das sicher auch nicht schlecht.
Was hat das mit der aktuellen problematik zu tun?
 
Die Karten sind doch eh schon so unglaublich restriktiv, dass man normal mit Afterburner ohne Hardmods kaum noch von ernsthaftem OC sprechen kann. Kaum spiel beim Powerlimit, kein Spiel bei den Spannungen für den Speicher-PEX und die Kontrolle über Vcore ist auch eher lächerlich.

Ich will meine GPUs braten können dürfen.
Könnte man implementieren, indem man zuvor zwei Lötstellen auf dem PCB der GPU verbinden muss.
Damit wäre die Garantie futsch und man selbst hat spaß beim übertakten ohne ewig Datenblätter zu durchforsten
(die teils auch noch unter NDA stehen und für Normalos nicht einsehbar sind).

Edit:
@Igor
Wie hoch ist eigentlich der Energieverbrauch der GDDR6 Chips (und auch von GDDR5(X) als Vergleich).
Könnte es evtl. innerhalb der Chips durch den höheren Verbrauch auch heißere Hotspots geben?
 
Zuletzt bearbeitet :
Igor,da hast Du ja wieder einen neuen Auftrag.. :)
Opfere doch mal eine 2080ti im schlecht belüfteten Gehäuse
 
vor einiger Zeit gab es hier ein Bericht das Elektrische Bauteile schlechter geworden sind.
Kann das auch an den SMD Kondensatoren / Wiederstände liegen ?

Jedenfalls bleib ich bei meiner GF1060 die reicht für mich und leuft super....
 
@¿∞¡
Das glaube ich nicht, wobei bei der Auftrags-Firma die die Platinen-Valdierung der Referenz vornimmt Bewegung (aus der Tür raus) stattgefunden hat. Niedlich mal wieder, wie nVidia alles in 970 Manier abstreitet und Jensen mit dem Daumen hoch durch die Gegend rennt.:)

@Igor
OP. Temp...also operative temperature...or...dry resultant temperature...or...resultant temperature ist natürlich nicht die maximale Temperatur die ein Bauteil vertragen könnte. Micron gibt tatsächlich nur die OP.T an!

Natürlich ist es möglich das im Umfeld ein anderes Bauteil den Geist aufgibt, denk mal an unsere Diskussion zum Referenz Platinenlayout, Driver, Doubeling und VRM (13+3). Lustig...vielleicht behälst Du Recht, als du schriebst mir gefällt das Referenz Layout nicht, besonders die Rückseite in dem besagten Bereich! Überlege mal wo die Vmem VRM sitzt und wie weit das Warmeleitpad in Referenz auf der Rückseite reicht! Siehe Thermal Pad 1.;)

Das muss ja nicht an dem Speichermodul auf der Ober/-Unterseite liegen...verwachst würde ich sagen. Weder die Backplate noch die Vaporchamber kühlt das was...
 
Im Bereich der Memory VRM haben wir schlappe 75°C, wobei die drei Smart Power Stages für den Speicher schon der Overkill sind.

Die beiden parallel angesteuerten SPS (6 und 7 von oben gesehen) liegen genau auf der anderen Seite von M7. Ich habe mal die PWM Nodes verglichen, um überhaupt auf diese krude Aufsplittung und damit auch das Schema zu kommen. Da ging ja viel Müll durch den digitalen Blätterwald. Man sieht es an den Kurven am Oszi sehr schön, was parallel arbeitet und was versetzt. Und ich habe echt Blut und Wasser dabei geschwitzt. :cry:

Dieses Pärchen SPS startet ab ca. 30% Last voll durch und wenn ich mir da den Abstand zwischen Spule, SMD Caps und Memory angucke, das ist alles viel zu eng, wenn man nicht wirklich gut kühlt. Und die Kühlung mit der Vapor-Camber ist fast schon witzlos, weil da noch der dicke Alurahmen dazwischen sitzt.
Scheme-8-Phases.jpg
 
ybox720

Was das hiermit zu tuen hat? Ich finde viel. In den Tests wurde ja gezeigt das OC nicht so extrem wie früher geht. Somit ist die Frage, wie viele der "kaputten" Karten auf OC ans Limit zurück zu führen sind? Wenn man davon ausgeht das die Toleranzen sehr klein sind, OC nur leicht machbar ist, dann können es sehr leicht 50% und mehr der Karten sein die aktuell "kaputt" sind. Die wären dann in echt "OC Leichen" und würden das Ergebnis extrem verzerren.
 
@buri2: Mich interessiert das auch, wie viele der Karten die Grätsche gemacht haben, weil da wer hochtakten wollte. Ich beobachte seit Jahren mit zwiespältigem Gefühl, das quasi bei jeder CPU / GPU vorausgesetzt wird, dass da noch was zu machen ist. Teilweise sogar im Auslieferungszustand und mit boxed Kühler. Die Hersteller haben das mitgemacht (freier Multiplikator und so). Nvidia hat mit den RTX Karten zum - nach meinem Wissensstand - ersten Mal einen Riegel vorgeschoben.

Nicht falsch verstehen: CPU oder GPU zu übertakten ist im Hinblick auf Mehrleistung in vielen Fällen sinnvoll - den erforderlichen Sachverstand und das passende Equipment vorausgesetzt. Mir war das immer zu stressig und zu teuer - lieber gleich ne fettere CPU kaufen, als das Geld in Kühllösungen zu versenken :cool:
Ich hab aber im erweiterten Bekanntenkreis Leute sitzen, die sich grundsätzlich 150€ CPUs zulegen, um die dann auf die Leistung einer 300 € CPU hochzujagen (mal platt gesprochen). Das hat in wenigen Fällen funktioniert und die Teile wurden jedesmal - Widerrufsrecht bei Onlinekauf sei Dank - als "fehlerhaft" reklamiert.
Wie sehr die Hardware ans Limit getrieben wurde ist aktuell bei Intel und Nvidia zu sehen. Den 9900 stabil zu übertakten ist nur für Enthusiasten mit dem nötigen Kleingeld möglich, und an der RTX können nicht mal die Boardpartner frei skalieren.
 
Oben Unten