Mit der heute vorgestellten Radeon RX 6700XT rundet AMD das Big-Navi-Portfolio nun vorerst nach unten hin ab. Die Boardpartnerkarten dürfen dann ab morgen vorgestellt werden und auch dafür gibt es bereits Produkte in der Pipeline. Doch dazu zu passender Zeit mehr. Der Navi22-Chip der RX 6700XT ist neu und wir werden ihn uns auch gleich noch genauer betrachten. Generell sind Grafikkarten aktuell aber ein heikles Thema, so dass man sehr stark zwischen technischer und emotionaler Betrachtung trennen muss. Lassen wir deshalb bitte Miner, Scalper und den teilweise schon größenwahnsinnigen Einzelhandel erst einmal beiseite und widmen uns zunächst rein der Technik. Über den Rest schreibe ich am Schluss noch etwas, man kann ja gar nicht anders.
Die Radeon RX 6700 XT als Referenzdesign
Mit den 40 Compute Units (CU) besitzt die RX 6700 XT 2560 Shader und ist damit faktisch eine halbe RX 6900XT. Während der Basistakt der RX 6800 mit 1815 bzw. der Boost mit 2105 MHz angegeben werden, schafft es die RX 6700XT auf 1594 bis 2689 MHz. Die Karte setzt auf 12 GB GDDR6 16 Gbps, die sich aus jeweils 6 Modulen mit 2 GB Größe ergeben. Gemeinsam sind auch das 192-Bit Speicherinterface und der 96 MB große Infinity Cache, der das Bandbreitenproblem lösen soll.
Die RX 6700 XT wiegt nur reichlich 900 Gramm, ist 26,7 cm Lang, 12 cm hoch (11,5 cm Einbauhöhe ab PEG), 3.8 cm dick (2-Slot-Design), wobei noch eine Backplate und das PCB mit insgesamt vier weiteren Millimetern dazukommen. Die Slot-Blende ist geschlossen, trägt 1x HDMI 2.1 und drei aktuelle DP-Anschlüsse. Der USB Type C entfällt. Der Korpus ist aus Leichtmetall, der Radeon-Schriftzug ist beleuchtet und versorgt wird das Ganze über eine 8-Pin- und eine 6-Pin-Buchse. Mehr dazu dann auch noch auf der nächsten Seite beim Teardown.
Der Screenshot aus GPU-Z gibt dann noch Auskunft über die restlichen Daten der Karte:
Auch hier habe ich noch einmal eine Tabelle für alle Statistiker unter Euch, bevor es dann ab der nächsten Seite wirklich voll losgeht.
Name | RX 6900 XT | RX 6800 XT | RX 6800 | RX 6700 XT |
---|---|---|---|---|
Chip | Navi 21 XTX | Navi 21 XT | Navi 21 XL | Navi 22 XT |
Chip Size | 520 mm² | 520 mm² | 520 mm² | n/a |
Shader-Cluster | 80 | 72 | 60 | 40 |
Shader/TMUs/ROPs | 5.120/320/128 | 4.608/288/128 | 3.840/240/96 | 2560/160/64 |
RT Units | 80 | 72 | 60 | 40 |
Infinity Cache MB | 128 | 128 | 128 | 96 |
GPU Game Clock MHz | 2.015 | 2.015 | 1.815 | 2 |
FP16 TFLOPS | 41.27 | 37,14 | 27.88 | 23.04 |
FP32/FP64 TFLOPS | 20.63/1.29 | 18.57/1.16 | 13.94/0.87 | 11.52/0.72 |
Fillrate Mtex/Mpix per sec. | 644.8/257.9 | 580.3/257.9 | 435.6/174.2 | 432/144 |
L2 Cache MB | 4 | 4 | 4 | 3 |
Memory Interface | 256-bit | 256-bit | 256-bit | 192-bit |
Memory Speed Gbps | 16 | 16 | 16 | 16 |
Memory | GDDR6 | GDDR6 | GDDR6 | GDDR6 |
Bandwidth GB/s | 512 | 512 | 512 | 384 |
Memory Capacity GB | 16 | 16 | 16 | 12 |
PCIe Connectors | 2× 8-Pin | 2× 8-Pin | 2× 8-Pin | 1× 8-Pin + 1x 6-Pin |
TBP Watts | 300 | 300 | 250 | 230 |
Launch-Preis (UVP) | 999 Euro | 649 Euro | 579 Euro | n/a |
Raytracing / DXR
Spätestens seit der Präsentation der neuen Radeon-Karten ist klar, dass auch AMD Raytracing unterstützen wird. Hier geht man einen zu NVIDIA deutlich abweichenden Weg und implementiert einen sogenannten “Ray Accelerator” pro Compute Unit (CU). Da die Radeon RX 6700XT insgesamt 40 CUs besitzt, ergeben sich somit auch 40 solcher Beschleuniger. Eine GeForce RTX 3070 kommt auf 46 RT Cores. Allerdings sind die RT-Cores anders organisiert und man wird abwarten müssen, was hier Menge gegen Spezialisierung ausrichten kann. Es ist am Ende also erst einmal ein Äpfel und Birnen Vergleich.
Doch was hat sich AMD hier ausgedacht? Jeder dieser Beschleuniger ist erst einmal in der Lage, gleichzeitig bis zu 4 Strahl-/Box-Schnittpunkte oder einen einzigen Strahl-/Dreieckschnitt pro Takt zu berechnen. So berechnet man die Schnittpunkte der Strahlen mit der Szenengeometrie (analog zur Bounding Volume Hierarchy), sortiert sie zunächst vor und gibt diese Informationen dann an die Shader zur weiteren Bearbeitung innerhalb der Szene zurück bzw. gibt das finale Shading-Resultat aus. NVIDIAs RT-Cores scheinen da allerdings deutlich komplexer vorzugehen, wie ich es beim Turing-Launch bereits ausführlich erläutert habe. Was zählt, ist allein das Ergebnis und genau dafür haben wir auch passende Benchmarks.
Smart Access Memory (SAM)
AMD zeigte auf der Präsentation der neuen Radeon-Karten bereits SAM, also Smart Access Memory – ein Feature, das ich heute zusätzlich auch zu den normalen Benchmarks aktiviert habe, womit auch ein direkter Vergleich möglich wird. Doch eigentlich ist SAM nicht Neuers, nur verbal schöner verpackt. Dahinter verbirgt sich nämlich nichts anderes als der clevere Umgang mit dem Base Address Register (BAR) und genau dieser Support muss zwingend auch im Unterbau aktiviert sein. Bei moderner AMD-Grafikhardware spielen größenveränderbare PCI-Bars (siehe auch PCI SIG vom 24.0.4.2008) schon länger eine wichtige Rolle, da die eigentlichen PCI BARs normalerweise ja nur auf 256 MB begrenzt sind, während man bei den neuen Radeon Grafikkarten nun bis zu 16 GB VRAM (hier sind es 12 GB) vorfindet.
Die Folge ist, dass nur ein Bruchteil des VRAM für die CPU direkt zugänglich ist, was ohne SAM eine ganze Reihe von Umgehungslösungen im sogenannten Treiber-Stack erfordert. Das kostet natürlich stets Performance und sollte demzufolge vermieden werden. AMD setzt bei SAM also genau dort an. Neu ist das nicht, muss aber sauber im UEFI implementiert und später auch aktiviert werden. Das wiederum geht nur, wenn das System im UEFI Modus läuft und CSM/Legacy deaktiviert sind.
CSM steht dabei für das Compatibility Support Module. Das Compatibility Support Module gibt es ausschließlich unter UEFI und es sorgt dafür, dass ältere Hardware und Software auch mit UEFI funktioniert. Das CSM ist immer dann hilfreich, wenn nicht alle Hardware-Komponenten zu UEFI kompatibel sind. Einige ältere Betriebssysteme sowie die 32-Bit-Versionen von Windows lassen sich auch nicht auf UEFI-Hardware installieren. Genau diese Kompatibilitätseinstellung verhindert jedoch die saubere und für die neuen AMD-Komponenten benötigte Windows-Variante oft schon bei der Installation.
Testsystem und Auswertungssoftware
Das Benchmarksystem ist neu und steht jetzt nicht mehr im Labor, sondern wieder im Redaktionsraum. Ich setze nunmehr auch auf PCIe 4.0, das passende X570 Motherboard in Form eines MSI MEG X570 Godlike und einen selektierten Ryzen 9 5950 X, der wassergekühlt stark übertaktet wurde. Dazu kommt schneller RAM sowie mehrere schnelle NVMe SSDs. Für das direkte Loggen während aller Spiele und Anwendungen nutze ich NVIDIAs PCAD, was den Komfort ungemein erhöht.
Die Messung der Leistungsaufnahme und anderer Dinge erfolgt hier im Speziallabor auf einem redundanten und bis ins Detail identischem Testsystem dann zweigleisig mittels hochauflösender Oszillographen-Technik…
…und dem selbst erschaffenen, MCU-basierten Messaufbau für Motherboards Grafikkarten (Bilder unten), wo am Ende im klimatisierten Raum auch die thermografischen Infrarot-Aufnahmen mit einer hochauflösenden Industrie-Kamera erstellt werden. Die Audio-Messungen erfolgen außerhalb in meiner Chamber.
Die einzelnen Komponenten des Testsystems habe ich auch noch einmal tabellarisch zusammengefasst:
Test System and Equipment |
|
---|---|
Hardware: |
AMD Ryzen 9 5950X OC MSI MEG X570 Godlike 2x 16 GB Corsair DDR4 4000 Vengeance RGB Pro 1x 2 TByte Aorus (NVMe System SSD, PCIe Gen. 4) 1x 2 TB Corsair MP400 (Data) 1x Seagate FastSSD Portable USB-C Be Quiet! Dark Power Pro 12 1200 Watt |
Cooling: |
Alphacool Eisblock XPX Pro Alphacool Eiswolf (modified) Thermal Grizzly Kryonaut |
Case: |
Raijintek Paean |
Monitor: | BenQ PD3220U |
Power Consumption: |
Oscilloscope-based system: Non-contact direct current measurement on PCIe slot (riser card) Non-contact direct current measurement at the external PCIe power supply Direct voltage measurement at the respective connectors and at the power supply unit 2x Rohde & Schwarz HMO 3054, 500 MHz multichannel oscilloscope with memory function 4x Rohde & Schwarz HZO50, current clamp adapter (1 mA to 30 A, 100 KHz, DC) 4x Rohde & Schwarz HZ355, probe (10:1, 500 MHz) 1x Rohde & Schwarz HMC 8012, HiRes digital multimeter with memory function MCU-based shunt measuring (own build, Powenetics software) NVIDIA PCAT and FrameView 1.1 |
Thermal Imager: |
1x Optris PI640 + 2x Xi400 Thermal Imagers Pix Connect Software Type K Class 1 thermal sensors (up to 4 channels) |
Acoustics: |
NTI Audio M2211 (with calibration file) Steinberg UR12 (with phantom power for the microphones) Creative X7, Smaart v.7 Own anechoic chamber, 3.5 x 1.8 x 2.2 m (LxTxH) Axial measurements, perpendicular to the centre of the sound source(s), measuring distance 50 cm Noise emission in dBA (slow) as RTA measurement Frequency spectrum as graphic |
OS: | Windows 10 Pro (all updates, current certified or press drivers) |
- 1 - Einführung und Testsystem
- 2 - Teardown, Platinenanalyse und Kühler
- 3 - Gaming Performance Full-HD
- 4 - Gaming Performance WQHD
- 5 - Details: Frames per Second (Curve)
- 6 - Details: Percentiles (Curve)
- 7 - Details: Frame Times (Bar)
- 8 - Details: Frame Times (Curves)
- 9 - Details: Variances (Bar)
- 10 - Leistungsaufnahme und Effizienz der Einzelspiele
- 11 - Leistungsaufnahme: Übersicht & Netzteil-Empfehlung
- 12 - Temperaturen und Infrarot-Tests
- 13 - Geräuschemission / Noise
- 14 - Zusammenfassung. Features und Fazit
137 Antworten
Kommentar
Lade neue Kommentare
Neuling
Mitglied
1
Mitglied
1
Mitglied
Mitglied
Mitglied
Mitglied
Veteran
Urgestein
Neuling
Mitglied
Urgestein
Mitglied
1
1
Mitglied
Alle Kommentare lesen unter igor´sLAB Community →