Es ist soweit und nach fast unerträglicher Zeit des Wartens und der Spekulationen kann ich heute die GeForce RTX 4090 Founders Edition (FE) auch endlich einschließlich aller technischen Details und der lang ersehnten Benchmarks vorstellen. Ich schrieb ja schon einen Artikel zur Herkunft der mega-großen Kühler, aber das wird heute bis zum Absatz mit den Temperaturen nur eine (wenn auch wichtige) Randnotiz bleiben. Denn unsere Schwerpunkte sind so vielfältig, dass wir nicht nur einen oder zwei, sondern gleich mehrere Artikel veröffentlichen werden.
Wichtiges Vorwort
Heute geht es erst einmal primär um die technische Übersicht einschließlich der GeForce RTX 4090 FE als Testobjekt. Natürlich wie gewohnt samt Benchmarks, Teardown, Platinen- und Kühler Analyse, sowie die Leistungsaufnahme und die Lastspitzen mit Netzteilempfehlung. Selbstverständlich haben wir auch die wichtigen Dinge wie DLSS 3.0 und Reflex mit in den Benchmarks (samt kurzer Einführungen), aber ich muss bereits jetzt auf die vielen weiteren Follow-Ups verweisen, die sich dann mit weiteren Benchmarks, Bildqualitätsvergleichen zu FSR und Xe sowie den Latenzen befassen werden.
Diese Materie ist mittlerweile nämlich so komplex geworden, dass man dem Thema mit einem kurzen Drüberfliegen einfach nicht gerecht werden würde. Wir haben dann sogar eine spezielle Video-Analyse für Euch, deren Basis ich am Wochenende noch im CMS eingebaut habe. Es lohnt sich also, die NVIDIA-Woche bis zum Ende zu genießen. Und wir werden diesen ganzen Aufwand natürlich auch als Grundlage dafür nutzen, um im November dann dies alles noch einmal direkt mit der kommenden RDNA3-Grafikkarten-Generation von AMD zu vergleichen.
Der AD 102 und die neue Ada-Architektur
Die NVIDIA GeForce RTX 4090 wird im TSMC 4N Prozess gefertigt und verfügt über 76,3 Milliarden Transistoren und bietet, da kann ich schon einmal spoilern, einen enormen Sprung in Sachen Leistung, Effizienz und auch KI-gestützter Grafik. Die Ada-Architektur setzt dabei auf bis zu 12 Graphic Processing Clusters (GPC) und bis zu 144 neue Streaming-Multiprozessoren (SM) mit über 18.00 CUDA Cores, deren Performance und Energieeffizienz deutlich gestiegen ist.
Dazu kommen Tensor-Kerne der 4. Generation und Optical Flow, was transformative KI-Technologien, einschließlich NVIDIA DLSS und dem neuen Bildraten-Vervielfacher NVIDIA DLSS 3 ermöglicht. Die RT-Kerne der 3. Generation bieten bis zu 2-fache Raytracing-Leistung, Shader Execution Reordering (SER) verbessert die Raytracing-Operationen zudem um das Doppelte. Außerdem nutzt nun auch NVIDIA einen dualen AV1 Encoder, wobei der NVIDIA Encoder (NVENC) der 8. Generation mit AV1 bis zu 40% effizienter als H.264 arbeiten soll.
Der AD102-300 der GeForce RTX 4090 wurde etwas beschränkt und bietet in der Summe noch 11 GPC, von denen jedoch zwei von 12 auf 10 SM eingekürzt wurden. Damit ergeben sich noch 128 SM einschließlich der 16384 CUDA-Cores für den Chip der neuen Consumer-Karte. Dazu kommen noch insgesamt 64 Texture Processing Clusters (TPC), 128 RT-Cores der 3. Generation, 512 Tensor-Cores der 4. Generation, 512 Texture Units (TU) und 176 ROPs. Der L2-Cache ist insgesamt 73728 KB groß und die Karte nutzt 24 GB GDDR6X mit 10501 MHz Takt and einem 384-bit Interface, was einer Datenrate von 21 Gbps und einer Bandbreite von 1008 GB/s entspricht.
Die Änderungen an allen drei Kern-Typen kann man recht einfach zusammenfassen:
- Programmierbarer Shader: Die SM von Ada umfassen eine wichtige neue Technologie namens Shader Execution Reordering (SER), die die Arbeit im laufenden Betrieb neu ordnet, was eine 2-fache Beschleunigung fürs Raytracing ermöglicht. SER ist eine ebenso große Innovation, wie es seinerzeit die Out-of-Order-Ausführung für CPUs war. 83 Shader-TFLOPS sind da schon eine Ansage
- Tensor Cores der 4. Generation: Der neue Tensor Core in Ada umfasst die NVIDIA Hopper FP8 Transformer Engine, die in der RTX 4090 über 1,3 PetaFLOPS für KI-Inferenz-Workloads liefert. Im Vergleich zu FP16 halbiert FP8 den Datenspeicherbedarf und verdoppelt die KI-Leistung. Die GeForce RTX 4090 bietet somit mehr als das Doppelte der gesamten Tensor Core-Verarbeitungsleistung der RTX 3090 Ti.
- RT Core der 3. Generation: Eine neue Opacity Micromap Engine beschleunigt das Raytracing von alphageprüften Geometrien um den Faktor 2. Dazu kommt eine neue Micro-Mesh Engine, die die ganze geometrische Fülle ohne weitere BVH-Erstellungs- und Speicherkosten bewältigt. Der Triangulierungs-Durchsatz beträgt 191 RT-TFLOPS, verglichen mit den 78 RTTFLOPS bei Ampere.
Die Karte setzt nach wie vor auf ein PCIe Gen. 4 Interface und nur beim externen Stromanschluss mit dem 12VHPWR-Anschluss (12+4 Pin) auf ein Element der PCIe Gen. 5 Spezifikation. Die TGP liegt bei 450 Watt und kann, je nach Boardpartner, auch auf bis zu 600 Watt angehoben werden (was eher sinnlos ist, weil die Spannung ab 500 Watt sowieso limitiert). Die für den Chip maximal zulässigen 90 °C wird der extrem überdimensionierte Kühler ja sowieso zu verhindern wissen.
Die NVIDIA GeForce RTX 4090 FE 24 GB im Detail
Die FE wiegt “nur” 2075 Gramm. Mit den 30,5 cm Länge und 13 cm Höhe ab Slot bis zur Oberkante und einer Dicke von genau 6 cm ist das zwar noch ein echter Kracher, aber sie ist trotzdem noch deutlich kompakter als die meisten Boardpartnerkarten. Mit vier 6+2-Pin-Anschlüssen fällt der beigelegte Adapter auf den 12+4 Pin-Anschluss deutlich kräftiger aus, als der alte Dreier der GeForce RTX 3090 Ti. Was uns wohl in der Endkonsequenz erwartet? Ich weiß es ja schon und Ihr dürft Euch gleich überraschen lassen!
Und doch reicht es, wenn man für die standardmäßigen 450 Watt, die jeder Karte ab Werk mitgegeben werden, auch nur drei statt vier Anschlüssen anschließt, denn kontrollieren kann das die Karte nicht. Oder man nutzt gleich das vom Netzteilhersteller bereitgestellte Kabel, falls es eins gibt. Jedenfalls sieht es schon lustig aus, wie die vier kleinen Schreihälse um Strom betteln. Der sei ihnen gegönnt…
Man kann nicht nur Strom in die Karte stecken, sondern auch Videoanschlüsse. Vier, um ganz genau zu sein, als da wären: dreimal DisplayPort 1.4a und einmal HDMI 2.1a. Das ist vor allem beim DisplayPort schade, wenn es um die neuen Spezifikationen geht. Chance vertan, leider.
Sieht aus wie eine geschlossene Veranstaltung, doch…
… es ist nicht der einzige magnetische Verschluss, den man entblättern kann! Doch alles zu seiner Zeit, heute ist bei der Unterwäsche erst einmal Schluss. Nackte Tatsachen gibt es gleich, versprochen!
Damit wäre die erste Seite geschafft und wir bereiten uns schon einmal langsam aufs Testgeschehen vor.
- 1 - Einführung, technische Daten und Technologie
- 2 - Test System im igor'sLAB MIFCOM-PC
- 3 - Teardown: Platine und Kühler
- 4 - Gaming-Performance WQHD (2560 x 1440 Pixel)
- 5 - Gaming-Performance UHD (3840 x 2160 Pixel)
- 6 - Gaming-Performance UHD + DLSS/FSR/XeSS (3840 x 2160 Pixel)
- 7 - DLSS 3.0 und die längsten Balken
- 8 - NVIDIA Reflex und Latenzen
- 9 - Workstation Grafik und Rendering
- 10 - Leistungsaufnahme und Lastverteilung
- 11 - Lastspitzen, Kappung und Netzteilempfehlung
- 12 - Temperaturen, Taktraten, Lüfter und Lautstärke
- 13 - Zusammenfassung und Fazit
545 Antworten
Kommentar
Lade neue Kommentare
Urgestein
Veteran
Urgestein
Urgestein
Urgestein
Urgestein
Veteran
Urgestein
Veteran
Urgestein
Mitglied
Veteran
Urgestein
Veteran
Urgestein
Urgestein
Mitglied
Mitglied
Veteran
Alle Kommentare lesen unter igor´sLAB Community →