Das, was ich heute mache, ist natürlich nur ein erster Vorgeschmack auf das, was später noch in voller Pracht kommt. Aber große Workloads brauchen auch Zeit in der Vorbereitung, denn es soll ja auch einen echten Mehrwert bringen. Und genau da werde ich ein größeres Review bringen, das dann neben den Benchmarks aus dem Produktivbereich auch die üblichen Dinge wie Teardown, Leistungsaufnahme, Netzteiltests, Akustik-Chamber usw. beinhaltet. Damit Euch (und mir) bis dahin die Zeit nicht zu lang wird, gibt es heute mal einen vorgezogenen Teil mit Spielen in höheren Auflösungen und ersten Eindrücken der neuen, großen Ampere-Karte.
Der in der Quadro RTX A6000 verwendete GA102 verfügt im ungekürzten Maximalausbau über alle 7 GPC (Graphics Processor Cluster) mit jeweils 12 SM (Streaming Multiprocessor), was dann 10.752 CUDA-Cores bedeutet. Bei der GeForce RTX 3090 sind bekannterweise ja zwei SM deaktiviert, was “nur” 10.496 ALUs ergibt und somit 97,6% entspricht. Das man hier nun noch einmal eine Consumer-Karte im Vollausbau nachschieben könnte, ist also eher unwahrscheinlich. Der von Jensen Huang kolportierte Codename “BFGPU” für die GeForce RTX 3090, was am Ende ja nichts anderes als “Big Ferocious GPU” bedeutet, wird wohl für den Consumer die Maximalversion bleiben. Doch heute geht es um mehr, denn heute will ich mal alles. Can it run Crysis? Ja, das auch, aber noch viel mehr.
Ihr kennt es ja schon vom Werkzeug, denn alles, womit man Geld verdienen muss, kostet auch erst einmal selbiges und zwar nicht zu knapp. Die Zielgruppe ist damit eigentlich komplett, denn es wird der Spezialist in der Visualisierung genauso angesprochen wie der Creator, dem eine Quadro RTX nicht zu teuer ist. Es ist das Wunschobjekt all derer, die Grafik und Rechenpower in einem benötigen, viel ECC-Speicher haben möchten und die auf die zertifizierten Treiber angewiesen sind. Wobei sich das mit dem Preis relativiert, wenn man sich überlegt, was man mit solchen Karten im Produktivbereich alles anstellen und letztendlich auch erwirtschaften kann.
Theorie, naja, nimmt man gern mit, aber jetzt geht es direkt ans Eingemachte. Das Gehäuse der Karte ist ein optisch ansehnlicher Mix aus Leichtmetall, Kunststoff und Eisenwaren, der sich durchaus wertig anfasst und zudem auch vom netten Anblick lebt. Das Design mit den schlanken 3.5 cm Einbautiefe inklusive der 4 mm Backplate macht diese Karte zu einem astreinen Dual-Slot-Design mit allen bekannten Vor- und kaum Nachteilen.
Es impliziert Leistung und gute Kühlung in einem und ich darf jetzt schon mal spoilern, dass es der bisher leiseste Radiallüfter einer 300-Watt-Karte ist, den ich je neben mir betrieben habe. Man will es kaum glauben, aber es ist so. NVIDIA hat hier noch ein paar Kunstgriffe parat, die man aber nur mit einem Blick ins Innere und auf den verwendeten Radiallüfter erkennen kann. Im Übrigen darf der neuartige Lüfter von beiden Seiten saugen, auch eine sehr interessante Variante.
Mit den 1168 Gramm ist die Karte noch nicht einmal so extrem schwer, aber eben auch nicht ultraleicht, was vom Kühler und dem sehr massiven, gedrungenen Aufbau herrührt. Die Länge von knapp 27 cm ist klassenüblich und auch die Einbauhöhe ist mit 10,5 cm ab der Oberkante des PCIe-Slots bei eingebauter Karte bis zur Oberseite der Abdeckung voll im Standard. Den NVLINK-Anschluss hat Nvidia hinter einer Kappe versteckt.
Interessant ist der 8-Pin-EPS Anschluss der Karte analog zum 8-Pin-EPS des Motherboards. Hier könnte man entweder ein geeignetes EPS-Kabel direkt anschließen oder aber 2x 6+2-Pin PCIe über den mitgelieferten Adapter. NVIDIA hat es bei Ampere also echt mit neuen Wegen beim Anschluss der Spannungsversorgung.
Die vier DisplayPort 1.4 Anschlüsse liefern bis zu 7680 x 4320 Pixel bei 60 Hz und können maximal 4 Bildschirme bedienen. Der Rest der Slotblende dient der Heißluftabfuhr und ja, es funktioniert sogar als Fön. Doch dazu ein andermal mehr.
Die Daten der Quadro RTX A6000 zeigt uns noch einmal der aktuelle GPU-Z Screenshot, den Rest hatte ich ja schon weiter oben aufgeführt. Die 1410 MHz Basis und die 1800 MHz Boost-Takt sind nicht von schlechten Eltern und der GDDR6-Speicher läuft mit vollen 2000 MHz. Im Übrigen ist auch Resizeable BAR mit an Bord.
Anhand des Auszugs sehen wir auch, dass eine TBP von 300 Watt hinterlegt ist und auch nicht überschritten werden kann.
Auch hier habe ich noch einmal eine Tabelle für alle Statistiker unter Euch, bevor es dann ab der nächsten Seite wirklich voll losgeht.
Quadro RTX A6000 |
GeForce RTX 3090 | |
---|---|---|
GPU | GA102 | GA102-300 |
Process Node | Samsung 8nm | Samsung 8nm |
Die Size | 628.4 mm2 | 628.4 mm2 |
Transistoren | 28 Mrd. | 28 Mrd. |
CUDA Cores | 10752 | 10496 |
TMUs/ROPs | 336 / 112 | 328/112 |
Tensor/RT | 336 / 84 | 328 / 82 |
Basis-Takt |
1410 MHz | 1400 MHz |
Boost-Takt |
1800 MHz | 1700 MHz |
Speicher | 48 GB GDDR6 | 24 GB GDDR6X |
Interface | 384-bit | 384-bit |
Durchsatz | 16 Gbps | 19.5 Gbps |
Bandbreite | 768 Gbps | 936 Gbps |
TGP | 300W | 350W |
Testsystem und Auswertungssoftware
Das Benchmarksystem ist neu und steht jetzt nicht mehr im Labor, sondern wieder im Redaktionsraum. Ich setze nunmehr auch auf PCIe 4.0, das passende X570 Motherboard in Form eines MSI MEG X570 Godlike und einen Ryzen 9 5950X der wassergekühlt übertaktet wurde. Dazu kommen der passende DDR4 3800 RAM, sowie mehrere schnelle NVMe SSDs. Für das direkte Loggen während aller Spiele und Anwendungen nutze ich zusätzlich auch NVIDIAs PCAD, was den Komfort ungemein erhöht.
Die Messung der Leistungsaufnahme und anderer Dinge erfolgt hier im Speziallabor auf einem redundanten und bis ins Detail identischem Testsystem dann zweigleisig mittels hochauflösender Oszillographen-Technik…
…und dem selbst erschaffenen, MCU-basierten Messaufbau für Motherboards Grafikkarten (Bilder unten), wo am Ende im klimatisierten Raum auch die thermografischen Infrarot-Aufnahmen mit einer hochauflösenden Industrie-Kamera erstellt werden. Die Audio-Messungen erfolgen außerhalb in meiner Chamber.
Die einzelnen Komponenten des Testsystems habe ich auch noch einmal tabellarisch zusammengefasst:
Test System and Equipment |
|
---|---|
Hardware: |
AMD Ryzen 9 5950X MSI MEG X570 Godlike 2x 16 GB Corsair Vengeance Pro RGB DDR4 4000 @DDR4 3800 1x 2 TByte Aorus (NVMe System SSD, PCIe Gen. 4) 1x 500 GB Toshiba RC500 1x Seagate FastSSD Portable USB-C Be Quiet! Dark Power Pro 12 1200 Watt |
Cooling: |
Alphacool Eisblock XPX Pro Alphacool Eiswolf (modified) Alphacool Subzero |
Case: |
Raijintek Paean |
Monitor: | BenQ PD3220U |
Power Consumption: |
Oscilloscope-based system: Non-contact direct current measurement on PCIe slot (riser card) Non-contact direct current measurement at the external PCIe power supply Direct voltage measurement at the respective connectors and at the power supply unit 2x Rohde & Schwarz HMO 3054, 500 MHz multichannel oscilloscope with memory function 4x Rohde & Schwarz HZO50, current clamp adapter (1 mA to 30 A, 100 KHz, DC) 4x Rohde & Schwarz HZ355, probe (10:1, 500 MHz) 1x Rohde & Schwarz HMC 8012, HiRes digital multimeter with memory function MCU-based shunt measuring (own build, Powenetics software) NVIDIA PCAT and FrameView 1.1 |
Thermal Imager: |
1x Optris PI640 + 2x Xi400 Thermal Imagers Pix Connect Software Type K Class 1 thermal sensors (up to 4 channels) |
Acoustics: |
NTI Audio M2211 (with calibration file) Steinberg UR12 (with phantom power for the microphones) Creative X7, Smaart v.7 Own anechoic chamber, 3.5 x 1.8 x 2.2 m (LxTxH) Axial measurements, perpendicular to the centre of the sound source(s), measuring distance 50 cm Noise emission in dBA (slow) as RTA measurement Frequency spectrum as graphic |
OS: | Windows 10 Pro (2004, all updates, current certified drivers, NVIDIA press driver R456) |
32 Antworten
Kommentar
Lade neue Kommentare
Veteran
Urgestein
Urgestein
Veteran
1
Veteran
Mitglied
Veteran
Urgestein
Urgestein
Urgestein
Mitglied
Urgestein
Veteran
Veteran
Mitglied
Urgestein
Alle Kommentare lesen unter igor´sLAB Community →