Eigentlich hatten ja alle die Ampere-Generation bereits abgehakt, doch dann kam die CES 2022 und Jensen mit der GeForce RTX 3090 Ti. Über den Sinn oder Unsinn dieser Karte im Vollausbau des GA102 und der hochenergetische Umsetzung kann man wirklich trefflich streiten, aber sie existiert und möchte auch gern getestet und bewertet werden. Wobei diese Karte bereits eine Art Sonderstellung im Übergang zur nächsten Generation einnimmt. Es ist nämlich eine Karte, die NVIDIA völlig ohne Not launcht, denn die Mitbewerber haben schon an der GeForce RTX 3090 zu knabbern. Wozu dann also so ein Monster, das den Spagat zwischen Brechstange und Mehrwert erst einmal hinbekommen muss?
Ich habe mir deshalb dieses Mal mehr Zeit für die Analyse der Technik genommen und auch viele interessante Parallelen zu dem finden können, über das ich im Hinblick auf die neuen Ada-Karten mit dem AD102 bereits geschrieben hatte. Ja, man sieht bereits die ersten Spuren der nächsten Generation und ja, die GeForce RTX 3090 Ti ist auch schneller als die bisherige GeForce RTX 3090. Und genau über die dafür notwendigen technischen Änderungen bis hin zum eher hemmungslosen Einsatz elektrischer Energie werde ich heute berichten. Die Benchmarks samt der ganzen Metriken gibt es natürlich wie immer gratis mit dazu. Zuzüglich einer schönen Zusammenfassung mit Durchschnittswerten über alle 10 Spiele in 3 Bildschirmauflösungen. Ach so, diverse Überraschungen gibt es auch, doch dazu später mehr.
Da es keine Founders-Edition der GeForce RTX 3090 Ti als Sample gibt, setze ich beim heutigen Test auf eine MSI GeForce RTX 3090 Ti SUPRIM X, die mir von MSI freundlicherweise vorab zur Verfügung gestellt wurde. Da es jedoch sinnlos wäre, diese leistungsgesteigerte Karte gegen Referenzmodelle zu testen, habe ich für alle der vertretenen Karten im Test ebenfalls die sogenannten Custom-Modelle von MSI dagegen gestellt. Bei den NVIDIA-Karten kommen alle Karten aus der Suprim-(X)-Reihe, während ich bei den AMD-Karten mangels anderer Versionen die Gaming-X-Modelle nutze. Es sind somit alles werksübertaktete Karten im Gaming-Mode und mit einer einheitlichen Hersteller-Philosophie. Alles andere wäre wirklich Augenwischerei. Deshalb ist der Test auch auf 7 relevante Karten begrenzt.
Wir sehen im Zubehör den bereits bekannten Adapter, der den neuen 12+4 PCIe-5.0-Anschluss auf 3x 6+2 Pin herunterbricht. Wozu man besser den mitgelieferten Ständer nutzen sollte, das erfahrt Ihr gleich noch. Gut, es gibt auch noch ein Mousepad frei aufs Haus, aber das ist eher Beiwerk. Ich werde zudem diese Karte noch mit dem hauseigenen 1000-Watt-Netzteil testen, aber dazu gibt es noch einen extra Absatz. Die karte bietet einen Gaming- und einen Silent-Mode, wobei ich im Test nur den Gaming-Mode genutzt habe, damit der Boost auch tut, was er tun soll. Sonst hätten wir ja auch bei der RTX 3090 ohne Ti bleiben können.
Der unbeschnittene GA102-350-A1
Wie bereits mehrmals beschrieben, besteht der GA102 aus Grafikverarbeitungs-Clustern (GPCs), Texturverarbeitungs-Clustern (TPCs), Streaming-Multiprozessoren (SMs), Raster-Operatoren (ROPS) und Speicher-Controllern. Der vollständige GA102-Grafikprozessor enthält sieben GPCs, 42 TPCs und 84 SMs. Der GPC ist der dominierende High-Level-Hardwareblock, in dem alle wichtigen Grafikverarbeitungseinheiten untergebracht sind. Jeder GPC enthält eine dedizierte Raster-Engine und jetzt auch zwei ROP-Partitionen (jede Partition enthält acht ROP-Einheiten).
Der GPC umfasst sechs TPCs, die jeweils zwei SMs und eine PolyMorph Engine enthalten. Der GA102-Grafikprozessor verfügt außerdem über 168 FP64-Einheiten (zwei pro SM), die im nachfolgenden Diagramm nicht abgebildet sind. Die FP64 TFLOP Rate ist 1/64 der TFLOP Rate von FP32 Operationen. Die geringe Anzahl von FP64-Hardware-Einheiten soll sicherstellen, dass alle Programme mit FP64-Code korrekt funktionieren, einschließlich FP64-Tensor-Core-Code.
Jeder SM enthält 128 CUDA Cores, vier Tensor Cores der dritten Generation, eine 256 KB große Registerdatei, vier Textureinheiten, einen Ray Tracing Core der zweiten Generation und 128 KB L1/Shared Memory, die je nach den Anforderungen der Rechen- oder Grafikworkloads für unterschiedliche Kapazitäten konfiguriert werden können. Das Speichersubsystem des GA102 besteht aus zwölf 32-Bit-Speicher-Controllern (insgesamt 384 Bit). Jedem 32-Bit-Speicher-Controller sind 512 KB L2-Cache zugeordnet, so dass die GA102-GPU insgesamt 6144 KB umfasst.
Beim GA102 sind die ROPs erstmalig Teil des GPCs, was die Leistung von Rasteroperationen durch die Erhöhung der Gesamtzahl der ROPs steigert und Durchsatzdiskrepanzen zwischen dem Scan-Konvertierungs-Frontend und dem Backend für Rasteroperationen beseitigt. Mit sieben GPCs und 16 ROP-Einheiten pro GPC verfügt der GA102-Grafikprozessor über 112 ROPs anstelle der 96 ROPs, die zuvor in einem 384-Bit-Grafikprozessor mit Speicherschnittstelle wie dem TU102 der vorherigen Generation verfügbar waren. Dies verbessert das Multisample-Anti-Aliasing, die Pixelfüllrate und die Blending-Leistung.
NVIDIA hat der GeForce RTX 3090 Ti insgesamt satte 24 GB GDDR6X-Speicher zur Seite gestellt, die über ein 384-Bit-Speicherinterface angebunden sind. Die GPU arbeitet mit einer Basis-Frequenz von 1560 MHz, die auf bis zu 1860 MHz (Boost) angehoben werden kann, der Speicher läuft mit 1313 MHz (21 Gbps effektiv). Dass der Boost deutlich höher ausfallen kann, ist kein Geheimnis und auch das werde ich noch unter verschiedenen Lasten protokollieren. Die TDP liegt bei 450 Watt, allerdings haben die Boardpartner noch einen gewissen Spielraum für mehr.
Die MSI GeForce RTX 3090 Ti SUPRIM X 24 GB
Das Gehäuse der Karte folgt der bekannten SUPRIM-Formensprache und ist natürlich als High-End-Modell auch ein echter Hingucker. Leichtmetall für die Abdeckung des brachialen Kühlers ist dabei genauso selbstverständlich, wie die Implementierung diverser RGB-Leuchtelemente. Mit der SUPRIM-Reihe hat MSI es geschafft, der älteren Gaming X Reihe eine etwas zeitlosere Karte ohne Gaming-Schnörkel entgegenzusetzen, was wirklich gefällt. Und das Schöne an allen LEDs ist ja, dass man sie bei Bedarf auch ausschalten kann.
Das Design mit den satten 6.5 cm Einbautiefe zuzüglich der 4 mm für die Backplate aus gebürstetem Aluminium macht diese Karte zu einem echten 3,5-Slot-Design mit allen bekannten Vor- und (in diesem Fall auch vielen) Nachteilen. Der Kühlerüberhang wird in der Backplate mit großen Wabenöffnungen auf Durchlass getrimmt. Die Backplate enthält zudem noch das bekannte LED-Logo mit feinster LED-Strahlkraft. Im Gegensatz zu den Vorgängermodellen ist die Backplate nur über die Rückseite verschraubt.
Mit den 2138 Gramm (ohne Adapter und Schutzkappen) ist die Karte zudem ein richtiges Schwergewicht. Die Länge von 33,8 cm ist heftig und auch die Einbauhöhe ist mit 13,5 cm ab der Oberkante des PCIe-Slots bei eingebauter Karte bis zur Oberseite der Abdeckung mehr als üppig. Es ist somit eine der größten und schwersten Karten in meinem Archiv und ich habe nicht nur einmal auf Extra-Befestigungen und den Ständer aus dem Zubehör gesetzt, um das Motherboard nicht zu zerstören (Slot).
Der einzelne, neue 12+4-Pin-Anschluss an der Oberseite reicht völlig aus und er markiert optisch auch des Ende der versteckten Platine. Ihr werdet auf der nächsten Seite noch anhand der Platine sehen, dass man hier mit dem überlangen Kühler noch einmal ordentlich einen drauf setzt, auch wenn die Platine allein schon recht groß ausfällt. Aber auch die drei Lüfter wollen ja noch untergebracht werden. Auf der Oberseite sehen wir den RGB-beleuchteten SUPRIM- und GeForce-Schriftzug, samt der üblichen Leuchtstreifen.
Der HDMI-2.1-Anschluss darf nicht fehlen, die drei aktuellen DisplayPorts natürlich auch nicht. Das 3-Slot-Panel ist riesig und das monströse Bracket wird trotzdem noch vom Kühleraufbau überragt. Im Endeffekt sind hier bereits vier Slots belegt und die Karte wird jedes Mini-ITX-Board genüsslich vernaschen.
Die Daten der getesteten MSI-Grafikkarte zeigt uns noch einmal der aktuelle GPU-Z Screenshot, den Rest hatte ich ja schon weiter oben aufgeführt. Die 1560 MHz Basistakt entsprechen der Referenzvorgabe von NVIDIA und den Boost-Takt hebt man bei MSI auf 1950 MHz ab Werk an. Die 1313 MHz Speichertakt waren zu erwarten und der Speicherausbau mit 24 GB am 384-Bit Interface logischerweise auch, wenn man an die 12 Speicher-Controller mit je 32 Bit aus dem oben gezeigten Schema denkt. Immerhin reicht dies für eine Speicherbandbreite 1008,4 GB/s.
Auch hier habe ich noch einmal eine Tabelle für alle Statistiker unter Euch:
- 1 - Einführung, Unboxing und technische Daten
- 2 - Netzteil und Testsystem
- 3 - Teardown, Platinenanalyse und Kühler
- 4 - Gaming Performance (Bars)
- 5 - Gaming Performance (Curves)
- 6 - Percentiles (Curves)
- 7 - Frame Times (Curves)
- 8 - Frame Times (Bars)
- 9 - Variances (Bars)
- 10 - Power Draw GPU im Detail (jedes Spiel)
- 11 - Power Draw CPU im Detail (jedes Spiel)
- 12 - Effizienz im Detail (jedes Spiel)
- 13 - Leistungsaufnahme in Spielen und Anwendungen
- 14 - Normeinhaltung, Lastspitzen und Netzteilempfehlung
- 15 - Temperaturen und Infrarot-Tests
- 16 - Geräuschemission / Noise
- 17 - Zusammenfassung. Features und Fazit
52 Antworten
Kommentar
Lade neue Kommentare
Urgestein
Mitglied
1
Urgestein
Moderator
Mitglied
Urgestein
Mitglied
Urgestein
Veteran
Urgestein
Urgestein
Veteran
Mitglied
Urgestein
Urgestein
Urgestein
Mitglied
Mitglied
Alle Kommentare lesen unter igor´sLAB Community →