Gaming Grafikkarten Testberichte VGA

Zurück an der Spitze?! AMD Radeon RX 6800 und RX 6800 XT im Test – Gefühlter Gleichstand, aber mit großen Unterschieden im Detail

Ohne allen jetzt schon im ersten Satz durch einen voreiligen Spoiler die Freude verderben zu wollen: AMD ist auch bei den GPUs zurück. Und wie! Trotzdem muss man bei aller Euphorie über den gewaltigen Leistungsschub fair bleiben und den gesamten Pixel-Kosmos betrachten: Performance (Rasterization, DXR, Compute), Feature-Set, elektrische sowie mechanische Umsetzung und die Treiber. Das macht den heutigen Artikel ein wenig komplexer und auch nicht einfacher, selbst wenn aus diversen Gründen gar nicht alles vollumfänglich getestet werden konnte. Aber auch für so etwas gibt es eine Lösung: die Follow-Ups!

Wunschtraum oder Wirklichkeit?

 

Doch zurück zum Thema und den beiden Hautdarstellerinnen des heutigen Launch-Reviews: der Radeon RX 6800 XT und der kleineren Schwester Radeon RX 6800. Das Dickschiff Radeon RX 6900 XT kommt ja bekanntlich später. Was aber macht die beiden neuen Karten für den Endanwender so interessant? Mit RDNA 2 führt AMD neue Stromspartechniken ein, mit dem „Infinity Cache“ will man zudem höhere Speicherbandbreiten pro Watt ermöglichen, da das Speicherinterface selbst auch aus Effizienzgründen mit 256 Bit eher schmal ausfällt.

Die neuen Grafikkarten kommen auch bereits mit dem neuen Videocodec AV1 zurecht, sie unterstützen erstmals auch DirectX 12 Ultimate und damit eben auch DirectX Raytracing (DXR). Mit AMD FidelityFX bieten sie zudem ein Feature, das Entwicklern zudem mehr Spielraum bei der Auswahl der Effekte ermöglichen soll. Ebenfalls dabei ist Variable Rate Shading (VRS), was immens Rechenleistung sparen kann, wenn Bildbereiche, die ohnehin nicht im Auge des Spielers liegen, in der Darstellungsqualität smart reduziert werden.

 

Die Radeon RX 6800 XT und RX 6800 als Referenzdesign

Mit den 72 Compute Units (CU) besitzt die RX 6800 XT 4608 Shader, die RX 6800 kommt auf 62 CU bzw. 3840 Shader. Während der Basistakt der RX 6800 XT mit 2015 MHz und der Boost-Takt mit 2250 MHz angegeben wird, muss die RX 6800 mit 1815 bzw. 2105 MHz auskommen. Beide Karten setzen auf 16 GB GDDR6 mit 16 Gbps, die sich aus jeweils 8 Modulen mit 2 GB Größe ergeben. Gemeinsam sind auch das 256-Bit Speicherinterface und der 128 MB große Infinity Cache, der das Bandbreitenproblem lösen soll.

Die RX 6800 XT wiegt 1501 Gramm, ist 26,7 cm Lang, 12 cm hoch (11,5 cm Einbauhöhe ab PEG), 4.5 cm dick (2.5-Slot-Design), wobei noch eine Backplate und das PCB mit insgesamt vier weiteren Millimetern dazukommen. Die Slot-Blende ist geschlossen, trägt 1x HDMI 2.1 und zwei DP-Anschlüsse. Dazu kommt noch eine USB Type C Buchse. Der Korpus ist aus Leichtmetall, der Radeon-Schriftzug ist beleuchtet und versorgt wird das Ganze über zwei 8-Pin-Buchsen. Mehr dazu dann auch noch auf der nächsten Seite beim Teardown.

Die kleine RX 6800 wiegt 1386 Gramm, ist ebenfalls 26,7 cm Lang, 12 cm hoch (11,5 cm Einbauhöhe ab PEG), 3.8 cm dick (2.5-Slot-Design), wobei noch eine Backplate und das PCB mit insgesamt vier weiteren Millimetern dazukommen. Die Slot-Blende ist ebenfalls geschlossen und trägt 1x HDMI 2.1 sowie zwei DP-Anschlüsse. Dazu kommt noch eine USB Type C Buchse. Der Korpus ist auch aus Leichtmetall, der Radeon-Schriftzug ist rot beleuchtet und versorgt wird das Ganze wieder über zwei 8-Pin-Buchsen.

Die beiden Screenshots aus GPU-Z geben dann och Auskunft über die restlichen Daten der beiden Karten:

 

Raytracing / DXR

Spätestens seit der Präsentation der neuen Radeon-Karten ist klar, dass auch AMD Raytracing unterstützen wird. Hier geht man einen zu NVIDIA deutlich abweichenden Weg und implementiert einen sogenannten “Ray Accelerator” pro Compute Unit (CU). Da die Radeon RX 6800 insgesamt 72 CUs besitzt, ergeben sich somit auch 72 solcher Beschleuniger für die Radeon RX 6800XT, bei der kleineren Radeon RX 6800 sind es noch 60. Eine GeForce RTX 3080 kommt auf 68 RT Cores, also nominell erst einmal weniger. Beim Vergleich der kleineren Karten steht es dann 62 für die RX 6800 und 46  für die GeForce RTX 3070. Allerdings sind die RT-Cores anders organisiert und man wird abwarten müssen, was hier Menge gegen Spezialisierung ausrichten kann. Es ist am Ende also erst einmal ein Äpfel und Birnen Vergleich.

Doch was hat sich AMD hier ausgedacht? Jeder dieser Beschleuniger ist erst einmal in der Lage, gleichzeitig bis zu 4 Strahl-/Box-Schnittpunkte oder einen einzigen Strahl-/Dreieckschnitt pro Takt zu berechnen. So berechnet man die Schnittpunkte der Strahlen mit der Szenengeometrie (analog zur Bounding Volume Hierarchy), sortiert sie zunächst vor und gibt diese Informationen dann an die Shader zur weiteren Bearbeitung innerhalb der Szene zurück bzw. gibt das finale Shading-Resultat aus. NVIDIAs RT-Cores scheinen da allerdings deutlich komplexer vorzugehen, wie ich es beim Turing-Launch bereits ausführlich erläutert habe. Was zählt, ist allein das Ergebnis und genau dafür haben wir auch passende Benchmarks.

Smart Access Memory (SAM)

AMD zeigte auf der Präsentation der neuen Radeon-Karten bereits SAM, also Smart Access Memory – ein Feature, das ich heute zusätzlich auch zu den normalen Benchmarks aktiviert habe, womit auch ein direkter Vergleich möglich wird. Doch eigentlich ist SAM nicht Neuers, nur verbal schöner verpackt. Dahinter verbirgt sich nämlich nichts anderes als der clevere Umgang mit dem Base Address Register (BAR) und genau dieser Support muss zwingend auch im Unterbau aktiviert sein. Bei moderner AMD-Grafikhardware spielen größenveränderbare  PCI-Bars (siehe auch PCI SIG vom 24.0.4.2008) schon länger eine wichtige Rolle, da die eigentlichen PCI BARs normalerweise ja nur auf 256 MB begrenzt sind, während man bei den neuen Radeon Grafikkarten nun bis zu 16 GB VRAM vorfindet.

Die Folge ist, dass nur ein Bruchteil des VRAM für die CPU direkt zugänglich ist, was ohne SAM eine ganze Reihe von Umgehungslösungen im sogenannten Treiber-Stack erfordert. Das kostet natürlich stets Performance und sollte demzufolge vermieden werden. AMD setzt bei SAM also genau dort an. Neu ist das nicht, muss aber sauber im UEFI implementiert und später auch aktiviert werden. Das wiederum geht nur, wenn das System im UEFI Modus läuft und CSM/Legacy deaktiviert sind.

CSM steht dabei für das Compatibility Support Module. Das Compatibility Support Module gibt es ausschließlich unter UEFI und es sorgt dafür, dass ältere Hardware und Software auch mit UEFI funktioniert. Das CSM ist immer dann hilfreich, wenn nicht alle Hardware-Komponenten zu UEFI kompatibel sind. Einige ältere Betriebssysteme sowie die 32-Bit-Versionen von Windows lassen sich auch nicht auf UEFI-Hardware installieren. Genau diese Kompatibilitätseinstellung verhindert jedoch die saubere und für die neuen AMD-Komponenten benötigte Windows-Variante oft schon bei der Installation.

Zunächst muss man im BIOS nachsehen, ob UEFI oder CSM/Legacy aktiv ist und falls nicht, diesen Schritt unbedingt machen. Erst dann kann man die größenveränderbaren PCI-BARs überhaupt aktivieren und nutzen, doch Stopp – bootet Euer Windows dann überhaupt noch? Wie man einen (älteren) Datenträger von MBR zu GPT konvertiert, damit er unter UEFI sauber erkannt wird, könnte Ihr unter anderem auch im Forum nachlesen, falls es diesbezüglich Fragen gibt, das führt hier jetzt zu weit.
 
Fakt ist, dass AMD hier die Hürden für die Nutzung von SAM recht hoch anlegt und das bisher auch nur spärlich kommuniziert hat. Man setzt eine aktuelle Zen3-CPU voraus, dazu ein B550- oder X570-Motherboard samt aktualisiertem BIOS. Das mit dem UEFI ist dann wiederum eine kleine, aber ungemein wichtige Randnotiz. Man sollte auch anmerken, dass NVIDIA und Intel bereits eigene Lösungen angekündigt haben bzw. in Zukunft nutzen wollen. Einer legt vor, die anderen ziehen nach, wobei man es längst hätte tun können. Hat man aber nicht, warum auch immer. Über 12 Jahre Schublade sind reichlich vertane Zeit. Aber lieber spät als nie.
 

Benchmarks und Auswertung

Für die Benchmarks habe ich diesmal 10 Spiele sehr zielgerichtet ausgewählt und dabei zwischen alt und neu, sowie AMD- oder NVIDIA-speziell gewichtet. Drei davon werden auch zusätzlich mit DXR gemessen, allerdings im Hinblick auf spielbare Frameraten nur in 1080p. Damit entfällt auch NVIDIAs DLSS, das man faieerweise mit dazunehmen könnte, hier aber wegen der Auflösung keinen Sinn ergibt. Dafür messe ich die beiden Radeons einmal ohne und einmal mit SAM über alle Spiele und Auflösungen, obwohl es aktuell genauso proprietär ist wie NVIDIAs DLSS. Aber es muss zumindest nicht in die Spiele implementiert werden und steht somit immer zur Verfügung, passende Hardware vorausgesetzt.

Ich habe die einzelnen Spiele jeweils auf einer Seite mit insgesamt 6 Grafiken pro Auflösung bzw. Setting abgehandelt. Das ist absolut selbsterklärend und ich erspare mir anhand der ganzen Grafiken auch den Text, der dadurch obsolet wird. Fakten statt Worte. Dafür gibt es dann am Ende noch eine kumulierte Zusammenfassung mit einer ausführlichen Erklärung. Effizienz und Leistungsaufnahme gibt es ebenfalls spielebezogen und kumuliert, dazu kommen die Frame Times und die Varianzen, denn Perzentile allein sind auch nicht der Weisheit letzter Schluss.

Testsystem und Auswertungssoftware

Das Benchmarksystem ist neu und setzt nun komplett auf AMD. PCIe 4.0 ist natürlich Pflicht. Dazu gehören das passende X570 Motherboard in Form eines MSI MEG X570 Godlike und der Ryzen 9 5950X, der wassergekühlt betrieben und leicht übertaktet wird. Dazu kommen der passende DDR4 4000 RAM von Corsair in Form des Vengeance RGB, sowie mehrere schnelle NVMe SSDs. Für das direkte Loggen während aller Spiele und Anwendungen nutze ich sowohl NVIDIAs PCAT, als auch mein eigenes Shunt-Mess-System, was den Komfort ungemein erhöht. Die Messung der detaillierten Leistungsaufnahme und anderer etwas komplizierterer Dinge erfolgt im Speziallabor zweigleisig mittels hochauflösender Oszillographen-Technik…

…und dem selbst erschaffenen, MCU-basierten Messaufbau für Motherboards Grafikkarten (Bilder unten), wo am Ende im klimatisierten Raum auch die thermografischen Infrarot-Aufnahmen mit einer hochauflösenden Industrie-Kamera erstellt werden. Die Audio-Messungen erfolgen dann außerhalb in meiner Chamber (Raum-im-Raum).

Die verwendete Software setzt auf meinen eigenen Interpreter samt Auswertungssoftware sowie ein sehr umfangreiches und flexibles Excel-Sheet für die grafische Umsetzung. Die einzelnen Komponenten des Testsystems habe ich auch noch einmal tabellarisch zusammengefasst:

Test System and Equipment
Hardware:
AMD Ryzen 9 5950X OC
MSI MEG X570 Godlike
2x 16 GB Corsair DDR4 4000 Vengeance RGB Pro
1x 2 TByte Aorus (NVMe System SSD, PCIe Gen. 4)
1x 2 TB Corsair MP400 (Data)
1x Seagate FastSSD Portable USB-C
Be Quiet! Dark Power Pro 12 1200 Watt
Cooling:
Alphacool Eisblock XPX Pro
Alphacool Eiswolf (modified)
Thermal Grizzly Kryonaut
Case:
Raijintek Paean
Monitor: BenQ PD3220U
Power Consumption:
Oscilloscope-based system:
Non-contact direct current measurement on PCIe slot (riser card)
Non-contact direct current measurement at the external PCIe power supply
Direct voltage measurement at the respective connectors and at the power supply unit
2x Rohde & Schwarz HMO 3054, 500 MHz multichannel oscilloscope with memory function
4x Rohde & Schwarz HZO50, current clamp adapter (1 mA to 30 A, 100 KHz, DC)
4x Rohde & Schwarz HZ355, probe (10:1, 500 MHz)
1x Rohde & Schwarz HMC 8012, HiRes digital multimeter with memory function

MCU-based shunt measuring (own build, Powenetics software)
Up to 10 channels (max. 100 values per second)
Special riser card with shunts for the PCIe x16 Slot (PEG)

NVIDIA PCAT and FrameView 1.1

Thermal Imager:
1x Optris PI640 + 2x Xi400 Thermal Imagers
Pix Connect Software
Type K Class 1 thermal sensors (up to 4 channels)
Acoustics:
NTI Audio M2211 (with calibration file)
Steinberg UR12 (with phantom power for the microphones)
Creative X7, Smaart v.7
Own anechoic chamber, 3.5 x 1.8 x 2.2 m (LxTxH)
Axial measurements, perpendicular to the centre of the sound source(s), measuring distance 50 cm
Noise emission in dBA (slow) as RTA measurement
Frequency spectrum as graphic
OS: Windows 10 Pro (all updates, current certified or press drivers)

 

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kann Du per PayPal spenden.

About the author

Igor Wallossek

Chefredakteur und Namensgeber von igor'sLAB als inhaltlichem Nachfolger von Tom's Hardware Deutschland, deren Lizenz im Juni 2019 zurückgegeben wurde, um den qualitativen Ansprüchen der Webinhalte und Herausforderungen der neuen Medien wie z.B. YouTube mit einem eigenen Kanal besser gerecht werden zu können.

Computer-Nerd seit 1983, Audio-Freak seit 1979 und seit über 50 Jahren so ziemlich offen für alles, was einen Stecker oder einen Akku hat.

Folge Igor auf:
YouTube   Facebook    Instagram Twitter