Dass man die RTX 2080 noch einmal etwas aufpeppt, ist die eine Sache, denn bisher war diese Karte laut Distributoren und Boardpartnern nicht wirklich das gefragteste Modelle der RTX-Reihe. Nunmehr gibt es also den Vollausbau des TU104, der vielleicht ein kleines Stück näher an die GeForce RTX 2080 Ti heranrücken kann. Aber überholen ohne einzuholen hat noch nie funktioniert und so wird man wohl froh sein dürfen, wenn diese RTX 2080 Super für Raytracing und höhere Auflösungen wenigsten ein klein wenig mehr Puste mitbringt.
Viel wichtiger ist aber erst einmal, was sich hinter der GeForce RTX 2080 Super wirklich verbirgt, was man von Ihr erwarten kann und was vielleicht auch nicht. Denn am Ende zählt einzig und allein das Ergebnis und so neu ist der Chip ja nun auch wieder nicht, nur diesmal eben endlich auch vollständig und komplett.
Ob diese GeForce RTX 2080 Super nun doch noch die Funktion ausfüllen kann, die eine RTX 2080 oft genug vergeblich anpeilte – man wird es sehen müssen. Der Wille ist irgendwie schon da, nur der Käufer muss da noch mitspielen (und natürlich auch der Preis, logisch). Denn am Ende ist es ja nichts anderes als aufgebohrte RTX 2080, die aus verständlichen Gründen nicht Ti heißen kann, sondern unbedingt ganz Super sein muss. Was dann wohl auch den komischen Namensklimmzug erklärt, den sich Nvidia einfallen lassen musste.
Der TU104-450 der GeForce RTX 2080 Super
Ähnlich wie den größeren TU102 stellt TSMC den TU104 auf seinem 12-nm-FinFET-Node her. Aber eine Transistorzahl von 13,6 Milliarden führt zu einer kleineren, „nur“ noch 545 mm² großen Die-Fläche. Das spart natürlich am Ende auch Kosten. Turing Junior übertrifft damit allerdings immer noch die 471 mm² des GP102 als Flaggschiff der letzten Generation und kommt der Größe des GK110 in der Original-GeForce GTX Titan ziemlich nahe.
Der TU104 ist aus den gleichen Bausteinen wie der TU102 aufgebaut; nur gibt es von allem halt etwas weniger. Die Streaming-Multiprozessoren verfügen immer noch über 64 CUDA-Kerne, acht Tensor-Kerne, einen RT-Kern, vier Textureinheiten, 16 Lade-/Speichereinheiten, 256 KB Registerspeicher sowie 96 KB L1-Cache/geteilten Speicher. Auch die TPCs bestehen nach wie vor aus zwei SMs und einer PolyMorph-Geometrie-Engine. Aber es gibt nun nur noch vier TPCs pro GPC und die sechs GPCs sind über den Prozessor verteilt. Daher verfügt eine voll funktionsfähige TU104 in der Summe über 48 SMs, 3072 CUDA-Kerne, 384 Tensor-Kerne, 48 RT-Kerne, 192 Textureinheiten und 24 PolyMorph-Engines.
Ein entsprechend schmaleres Back-End realisiert die Anbindung über acht 32-Bit-GDDR6-Speicher-Controller (256-Bit-Aggregat), die an 64 ROPs und 4 MB L2-Cache angeschlossen sind. Nvidia spendiert der GeForce RTX 2080 Super allerdings den etwas schnelleren Speicher mit 16 Gb/s, statt den 14 Gb/s der kleineren Modelle. Der TU104 verliert leider auch hier eine der beiden x8 NVLink-Verbindungen des TU102, was das Ganze dann auf eine x8-Verbindung und 50 GB/s bidirektionalen Durchsatz beschränkt.
Unboxing und technische Daten
Die Karte kommt im Vergleich zur GeForce RTX 2080 FE ebenfalls optisch leicht verändert daher, wobei die spiegelnde Fläche auf der Abdeckung eine tolle Fingerabdruckskartei darstellt. Bei den Anschlüssen setzt man, wie auch bei der RTX 2080 FE, auf drei DisplayPort-Anschlüsse und einen HDMI-2.0-Anschluss. Die USB-Typ-C-Buchse ist mit am Start, NVLink ist ebenfalls an der Platinenoberseite vorhanden. Der Rest ist wie gehabt und für die Details gibt es ja auch noch den kompletten Tear Down.
Einen ersten Überblick verschafft uns hier GPU-Z:
Die Tabelle gibt noch einmal einen schönen Überblick über die technischen Daten der aktuellen GeForce RTX Super und der älteren Vergleichsmodelle:
Nvidia GeForce RTX 2060 Super |
Nvidia GeForce RTX 2070 FE |
Nvidia GeForce RTX 2070 Super |
Nvidia GeForce RTX 2080 FE |
Nvidia GeForce RTX 2080 Super |
|
Architektur (GPU) |
TU106-410 | TU106-400 | TU104-410 | TU104-400 | TU104-450 |
CUDA Cores |
2176 | 2304 | 2560 | 2944 | 3073 |
Tensor Cores |
272 | 288 | 320 | 368 | 384 |
RT Cores |
34 | 36 | 40 | 46 | 48 |
Textureinheiten |
136 | 144 | 160 | 184 | 192 |
Base Clock Rate |
1470 MHz | 1410 MHz | 1605 MHz | 1515 MHz | 1650 MHz |
GPU Boost Rate |
1650 MHz | 1710 MHz | 1770 MHz | 1800 MHz | 1815 MHz |
Speicherausbau |
8GB GDDR5 | 8GB GDDR6 | 8GB GDDR6 | 8GB GDDR6 | 8GB GDDR6 |
Speicherbus |
256-bit | 256-bit | 256-bit | 256-bit | 256-bit |
Bandbreite |
448 GB/s | 448 GB/s | 448 GB/s | 448 GB/s | 496 GB/s |
ROPs |
64 | 64 | 64 | 64 | 64 |
L2 Cache |
4 MB | 4 MB | 4 MB | 4 MB | 4 MB |
TDP |
175 W | 185 W | 215 W | 225 W | 250 W |
Transistoren |
10.8 Mrd. | 10.8 Mrd. | 13.6 Mrd. | 13.6 Mrd. | 13.6 Mrd. |
Die-Größe |
445 mm² | 445 mm² | 545 mm² | 545 mm² | 545 mm² |
SLI |
Nein | Nein | NVLink x8 | NVLink x8 | NVLink x8 |
Testsystem und Messmethoden
Das Testsystem und die -methodik ist bekannt, aber da ich mittlerweile hier in Deutschland unabhängig teste, wurde das Testsystem auch noch einmal aufgerüstet, ohne auf Kollegen Rücksicht nehmen zu müssen.
Interessierten bietet die Zusammenfassung in Tabellenform schnell noch einen kurzen Überblick:
Testsysteme und Messräume | |
---|---|
Hardware: |
Intel Core i9-9900 KF MSI MEG Z390 ACE 2x 8GB KFA2 HoF DDR4 4000 1x 1 TByte Patriot Viper (NVMe System SSD) 1x Seagate FastSSD Portable USB-C Be Quiet Dark Power Pro 11, 850-Watt-Netzteil |
Kühlung: |
Alphacool Eisblock XPX 5x Be Quiet! Silent Wings 3 PWM (Closed Case Simulation) Thermal Grizzly Kryonaut (für Kühlerwechsel) |
Gehäuse: |
Lian Li PC-T70 mit Erweiterungskit und Modifikationen Modi: Open Benchtable, Closed Case |
Monitor: | Eizo EV3237-BK |
Leistungsaufnahme: |
berührungslose Gleichstrommessung am PCIe-Slot (Riser-Card) berührungslose Gleichstrommessung an der externen PCIe-Stromversorgung direkte Spannungsmessung an den jeweiligen Zuführungen und am Netzteil 2x Rohde & Schwarz HMO 3054, 500 MHz Mehrkanal-Oszillograph mit Speicherfunktion 4x Rohde & Schwarz HZO50, Stromzangenadapter (1 mA bis 30 A, 100 KHz, DC) 4x Rohde & Schwarz HZ355, Tastteiler (10:1, 500 MHz) 1x Rohde & Schwarz HMC 8012, Digitalmultimeter mit Speicherfunktion |
Thermografie: |
1x Optris PI640, 2x Xi400 Infrarotkameras Pix Connect Auswertungssoftware mit Profilen |
Akustik: |
NTI Audio M2211 (mit Kalibrierungsdatei) Steinberg UR12 (mit Phantomspeisung für die Mikrofone) Creative X7, Smaart v.7 eigener reflexionsarmer Messraum, 3,5 x 1,8 x 2,2 m (LxTxH) Axialmessungen, lotrecht zur Mitte der Schallquelle(n), Messabstand 50 cm Geräuschentwicklung in dBA (Slow) als RTA-Messung Frequenzspektrum als Grafik |
Betriebssystem | Windows 10 Pro (1903, alle Updates), Treiber aktuell |
Kommentieren