Grafikkarten Testberichte VGA

Greift AMD jetzt nach der Krone? Radeon RX 6900 XT 16 GB im Test mit Benchmarks und einer Technikanalyse

Einen hat AMD noch und genau den gibt es heute. Man möchte auf die konkurrenzfähige Radeon RX 6800 XT 16 GB noch einen draufsetzen und so zog Dr. Lisa Su bereits vor einiger Zeit ein letztes Ass aus dem Ärmel und präsentierte die Radeon RX 6900 XT zunächst virtuell und als rein digitalen Folien-Tiger. Nachdem sich diese Karte nun auch für uns endlich materialisiert hat, stellt sie die Frage der Woche: Schmusekatze, Stubentiger oder Raubkatze? Es wird eng, das darf ich an dieser Stelle schon einmal spoilern. Den Rest gibt es natürlich im heutigen Artikel, dessen Lektüre über alle Seiten damit eigentlich Pflicht ist.

Das Dickschiff Radeon RX 6900 XT setzt nun endlich den vorläufigen Schlusspunkt der neuen RDNA2-Reihe nach oben hin, denn mit Navi22, Navi23 und Navi24 wird auch in absehbarer Zeit noch einiges nachkommen. Weiter unten natürlich. Was aber macht aus diese neue Karten für den Endanwender so interessant? Mit RDNA 2 hatte AMD neue Stromspartechniken eingeführt, mit dem „Infinity Cache“ will man zudem höhere Speicherbandbreiten pro Watt ermöglichen, da das Speicherinterface selbst auch aus Effizienzgründen mit 256 Bit eher schmal ausfällt und mit den Taktraten geizt auch niemand.

Die neuen Grafikkarten kommen auch bereits mit dem neuen Videocodec AV1 zurecht, sie unterstützen erstmals auch DirectX 12 Ultimate und damit eben auch DirectX Raytracing (DXR). Mit AMD FidelityFX bieten sie zudem ein Feature, das Entwicklern zudem mehr Spielraum bei der Auswahl der Effekte ermöglichen soll. Ebenfalls dabei ist Variable Rate Shading (VRS), was immens Rechenleistung sparen kann, wenn Bildbereiche, die ohnehin nicht im Auge des Spielers liegen, in der Darstellungsqualität smart reduziert werden.

 

Die Radeon RX 6900 XT als Referenzdesign

Mit den 80 Compute Units (CU) statt den 72 bei der Radeon RX 6800 XT besitzt die Radeon RX 6900 XT im Vollausbau nunmehr 5120 Shader . Der Basistakt liegt wie bei der Radeon RX 6800 XT bei 2015 MHz und der Boost-Takt bei 2250 MHz als Vorgabe. Die Karte setzt ebenfalls auf 16 GB GDDR6 mit 16 Gbps, die sich aus jeweils 8 Modulen mit 2 GB Größe ergeben. Bekannt ist auch das 256-Bit Speicherinterface und der 128 MB große Infinity Cache, der das Bandbreitenproblem lösen soll.

Die Radeon RX 6900 XT wiegt knapp 1500 Gramm, ist 26,7 cm Lang, 12 cm hoch (11,5 cm Einbauhöhe ab PEG), 4.5 cm dick (2.5-Slot-Design), wobei noch eine Backplate und das PCB mit insgesamt vier weiteren Millimetern dazukommen. Die Slot-Blende ist geschlossen, trägt 1x HDMI 2.1 und zwei DP-1.4a-Anschlüsse. Dazu kommt noch eine USB-Type-C Buchse. Der Korpus ist aus Leichtmetall, der Radeon-Schriftzug ist beleuchtet (sogar RGB-steuerbar) und versorgt wird das Ganze, wie auch bei der Radeon RX 6800 XT, wieder über zwei 8-Pin-Buchsen. Mehr dazu dann auch noch auf der nächsten Seite beim Teardown.

Der Screenshots aus GPU-Z gibt dann noch Auskunft über die restlichen Daten der neuen Karte:

Raytracing / DXR

Spätestens seit der Präsentation der neuen Radeon-Karten ist klar, dass auch AMD Raytracing unterstützen wird. Hier geht man einen zu NVIDIA deutlich abweichenden Weg und implementiert einen sogenannten “Ray Accelerator” pro Compute Unit (CU). Da die Radeon RX 6900 XT insgesamt 80 CUs besitzt, ergeben sich somit auch 80 solcher Beschleuniger für die Radeon RX 6900XT, bei der kleineren Radeon RX 6800 XT sind es noch 72 bzw. ganze 60 bei der RX 6800. Eine GeForce RTX 3090 kommt auf 82 RT Cores, also nominell erst einmal zwei weniger. Beim Vergleich der kleineren Karten steht es dann 72 für die RX 6800 XT und 68 für die GeForce RTX 3080. Allerdings sind die RT-Cores anders organisiert und man wird abwarten müssen, was hier am Ende wirklich ankommt. Es wäre also ein Äpfel mit Birnen Vergleich.

Doch was hat sich AMD eigentlich ausgedacht? Jeder dieser Beschleuniger ist erst einmal in der Lage, gleichzeitig bis zu 4 Strahl-/Box-Schnittpunkte oder einen einzigen Strahl-/Dreieckschnitt pro Takt zu berechnen. So berechnet man die Schnittpunkte der Strahlen mit der Szenengeometrie (analog zur Bounding Volume Hierarchy), sortiert sie zunächst vor und gibt diese Informationen dann an die Shader zur weiteren Bearbeitung innerhalb der Szene zurück bzw. gibt das finale Shading-Resultat aus. NVIDIAs RT-Cores scheinen da allerdings deutlich komplexer vorzugehen, wie ich es beim Turing-Launch bereits ausführlich erläutert habe. Was zählt, ist allein das Ergebnis und genau dafür haben wir auch passende Benchmarks.

Smart Access Memory (SAM)

AMD zeigte auf der Präsentation der neuen Radeon-Karten bereits SAM, also Smart Access Memory – ein Feature, das ich heute zusätzlich auch zu den normalen Benchmarks aktiviert habe, womit auch ein direkter Vergleich möglich wird. Doch eigentlich ist SAM nicht Neuers, nur verbal schöner verpackt. Dahinter verbirgt sich nämlich nichts anderes als der clevere Umgang mit dem Base Address Register (BAR) und genau dieser Support muss zwingend auch im Unterbau aktiviert sein. Bei moderner AMD-Grafikhardware spielen größenveränderbare PCI-Bars (siehe auch PCI SIG vom 24.0.4.2008) schon länger eine wichtige Rolle, da die eigentlichen PCI BARs normalerweise ja nur auf 256 MB begrenzt sind, während man bei den neuen Radeon Grafikkarten nun bis zu 16 GB VRAM vorfindet.

Die Folge ist, dass nur ein Bruchteil des VRAM für die CPU direkt zugänglich ist, was ohne SAM eine ganze Reihe von Umgehungslösungen im sogenannten Treiber-Stack erfordert. Das kostet natürlich stets Performance und sollte demzufolge vermieden werden. AMD setzt bei SAM also genau dort an. Neu ist das nicht, muss aber sauber im UEFI implementiert und später auch aktiviert werden. Das wiederum geht nur, wenn das System im UEFI Modus läuft und CSM/Legacy deaktiviert sind.

CSM steht dabei für das Compatibility Support Module. Das Compatibility Support Module gibt es ausschließlich unter UEFI und es sorgt dafür, dass ältere Hardware und Software auch mit UEFI funktioniert. Das CSM ist immer dann hilfreich, wenn nicht alle Hardware-Komponenten zu UEFI kompatibel sind. Einige ältere Betriebssysteme sowie die 32-Bit-Versionen von Windows lassen sich auch nicht auf UEFI-Hardware installieren. Genau diese Kompatibilitätseinstellung verhindert jedoch die saubere und für die neuen AMD-Komponenten benötigte Windows-Variante oft schon bei der Installation.

Zunächst muss man im BIOS nachsehen, ob UEFI oder CSM/Legacy aktiv ist und falls nicht, diesen Schritt unbedingt machen. Erst dann kann man die größenveränderbaren PCI-BARs überhaupt aktivieren und nutzen, doch Stopp – bootet Euer Windows dann überhaupt noch? Wie man einen (älteren) Datenträger von MBR zu GPT konvertiert, damit er unter UEFI sauber erkannt wird, könnte Ihr unter anderem auch im Forum nachlesen, falls es diesbezüglich Fragen gibt, das führt hier jetzt zu weit.
 
Fakt ist, dass AMD hier die Hürden für die Nutzung von SAM recht hoch anlegt und das bisher auch nur spärlich kommuniziert hat. Man setzt eine aktuelle Zen3-CPU voraus, dazu ein B550- oder X570-Motherboard samt aktualisiertem BIOS. Das mit dem UEFI ist dann wiederum eine kleine, aber ungemein wichtige Randnotiz. Man sollte auch anmerken, dass NVIDIA und Intel bereits eigene Lösungen angekündigt haben bzw. in Zukunft nutzen wollen. Einer legt vor, die anderen ziehen nach, wobei man es längst hätte tun können. Hat man aber nicht, warum auch immer. Über 12 Jahre Schublade sind reichlich vertane Zeit. Aber lieber spät als nie.
 
Eine interessante Randnotiz dazu ist übrigens auch, dass neuerdings auch ausgewählte Intel-Boards Resizeable Bars unterstützen. So schnell kann es also manchmal gehen, wenn einer nur erstmal damit angefangen hat! Neugier siegt und so habe ich noch einen kleinen Gegentest gemacht. Das geht durchaus, wenn auch etwas anders und fest immer etwas weniger deutlich als beim Ryzen 9 5950X. Vielleicht findet sich ja noch etwas Zeit, das nach den ganzen Launches etwas näher zu beleuchten.
 
 
 

Benchmarks und Auswertung

Für die Benchmarks habe ich diesmal 10 Spiele sehr zielgerichtet ausgewählt und dabei zwischen alt und neu, sowie AMD- oder NVIDIA-speziell gewichtet. Drei davon werden auch zusätzlich mit DXR gemessen, allerdings im Hinblick auf spielbare Frameraten nur in 1080p. Damit entfällt auch NVIDIAs DLSS, das man fairerweise mit dazunehmen könnte, hier aber wegen der Auflösung keinen Sinn ergibt. Dafür messe ich die beiden Radeons einmal ohne und einmal mit SAM über alle Spiele und Auflösungen, obwohl es aktuell genauso proprietär ist wie NVIDIAs DLSS. Aber es muss zumindest nicht in die Spiele implementiert werden und steht somit immer zur Verfügung, passende Hardware vorausgesetzt.

Ich habe die einzelnen Spiele jeweils auf einer Seite mit insgesamt 6 Grafiken pro Auflösung bzw. Setting abgehandelt. Das ist absolut selbsterklärend und ich erspare mir anhand der ganzen Grafiken auch den Text, der dadurch obsolet wird. Fakten statt Worte. Dafür gibt es dann am Ende noch eine kumulierte Zusammenfassung mit einer ausführlichen Erklärung. Effizienz und Leistungsaufnahme gibt es ebenfalls spielebezogen und kumuliert, dazu kommen die Frame Times und die Varianzen, denn Perzentile allein sind auch nicht der Weisheit letzter Schluss..

  Radeon RX 6900 XT Radeon RX 6800 XT Radeon RX 6800
Stream processors 5,120 4,608 3,840
Compute units 80 72 60
Texture units 320 288 240
Ray accelerators 80 72 60
Game clock 2,015 MHz 2,015 MHz 1,815 MHz
Boost clock 2,250 MHz 2,250 MHz 2,105 MHz
Memory 16 GB GDDR6 16 GB GDDR6 16 GB GDDR6
Infinity Cache 128 MB 128 MB 128 MB
TDP 300 W 300 W 250 W
Slot size 2.5 2.5 2

Testsystem und Auswertungssoftware

Das Benchmarksystem ist neu und setzt nun komplett auf AMD. PCIe 4.0 ist natürlich Pflicht. Dazu gehören das passende X570 Motherboard in Form eines MSI MEG X570 Godlike und der Ryzen 9 5950X, der wassergekühlt betrieben und leicht übertaktet wird. Dazu kommen der passende DDR4 4000 RAM von Corsair in Form des Vengeance RGB, sowie mehrere schnelle NVMe SSDs. Für das direkte Loggen während aller Spiele und Anwendungen nutze ich sowohl NVIDIAs PCAT, als auch mein eigenes Shunt-Mess-System, was den Komfort ungemein erhöht. Die Messung der detaillierten Leistungsaufnahme und anderer etwas komplizierterer Dinge erfolgt im Speziallabor zweigleisig mittels hochauflösender Oszillographen-Technik…

…und dem selbst erschaffenen, MCU-basierten Messaufbau für Motherboards Grafikkarten (Bilder unten), wo am Ende im klimatisierten Raum auch die thermografischen Infrarot-Aufnahmen mit einer hochauflösenden Industrie-Kamera erstellt werden. Die Audio-Messungen erfolgen dann außerhalb in meiner Chamber (Raum-im-Raum).

Die verwendete Software setzt auf meinen eigenen Interpreter samt Auswertungssoftware sowie ein sehr umfangreiches und flexibles Excel-Sheet für die grafische Umsetzung. Die einzelnen Komponenten des Testsystems habe ich auch noch einmal tabellarisch zusammengefasst:

Test System and Equipment
Hardware:
AMD Ryzen 9 5950X OC
MSI MEG X570 Godlike
2x 16 GB Corsair DDR4 4000 Vengeance RGB Pro
1x 2 TByte Aorus (NVMe System SSD, PCIe Gen. 4)
1x 2 TB Corsair MP400 (Data)
1x Seagate FastSSD Portable USB-C
Be Quiet! Dark Power Pro 12 1200 Watt
Cooling:
Alphacool Eisblock XPX Pro
Alphacool Eiswolf (modified)
Thermal Grizzly Kryonaut
Case:
Raijintek Paean
Monitor: BenQ PD3220U
Power Consumption:
Oscilloscope-based system:
Non-contact direct current measurement on PCIe slot (riser card)
Non-contact direct current measurement at the external PCIe power supply
Direct voltage measurement at the respective connectors and at the power supply unit
2x Rohde & Schwarz HMO 3054, 500 MHz multichannel oscilloscope with memory function
4x Rohde & Schwarz HZO50, current clamp adapter (1 mA to 30 A, 100 KHz, DC)
4x Rohde & Schwarz HZ355, probe (10:1, 500 MHz)
1x Rohde & Schwarz HMC 8012, HiRes digital multimeter with memory function

MCU-based shunt measuring (own build, Powenetics software)
Up to 10 channels (max. 100 values per second)
Special riser card with shunts for the PCIe x16 Slot (PEG)

NVIDIA PCAT and FrameView 1.1

Thermal Imager:
1x Optris PI640 + 2x Xi400 Thermal Imagers
Pix Connect Software
Type K Class 1 thermal sensors (up to 4 channels)
Acoustics:
NTI Audio M2211 (with calibration file)
Steinberg UR12 (with phantom power for the microphones)
Creative X7, Smaart v.7
Own anechoic chamber, 3.5 x 1.8 x 2.2 m (LxTxH)
Axial measurements, perpendicular to the centre of the sound source(s), measuring distance 50 cm
Noise emission in dBA (slow) as RTA measurement
Frequency spectrum as graphic
OS: Windows 10 Pro (all updates, current certified or press drivers)

 

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kann Du per PayPal spenden.

About the author

Igor Wallossek

Chefredakteur und Namensgeber von igor'sLAB als inhaltlichem Nachfolger von Tom's Hardware Deutschland, deren Lizenz im Juni 2019 zurückgegeben wurde, um den qualitativen Ansprüchen der Webinhalte und Herausforderungen der neuen Medien wie z.B. YouTube mit einem eigenen Kanal besser gerecht werden zu können.

Computer-Nerd seit 1983, Audio-Freak seit 1979 und seit über 50 Jahren so ziemlich offen für alles, was einen Stecker oder einen Akku hat.

Folge Igor auf:
YouTube   Facebook    Instagram Twitter