Grafikkarten Hardware Testberichte

Heißes Eisen im Test: AMD Radeon VII – mit viel Anlauf und Wind auf Augenhöhe zur Geforce RTX 2080

Aus dem Rechenzentrum in den Zocker-PC: Vega 20

Eigentlich ist es mit der Vega 20 wie mit der Titan V. Man nehme einen für Rechenzentren entwickelten Chip, streiche einige Features zusammen und beglücke damit die Hochpreis-Community. Gleiches Recht für alle, wird sich AMD gedacht haben, als man Vega 20 auch für die Spieler zugänglich machen wollte. Unter der Haube sieht der AMD-Grafikprozessor Vega 20 dem Vega 10 der Radeon RX Vega 64 sehr ähnlich. Aber gerade die Verlagerung von der 14nm-Fertigung bei GlobalFoundries auf den 7nm-Prozess von TSMC ermöglicht es AMD, die Vega 20 mit viel höheren Taktraten zu betreiben.

Mit ihren 331 mm² ist so eine Vega 20 zudem auch noch viel kleiner als die Vega 10 mit ihren 495 mm². Das hat am Ende auch den benötigten Platz geschaffen, um noch zwei weitere HBM2-Stacks hinzuzufügen. Gleichzeitig verfügt die Vega 20 nunmehr über 13,2 Milliarden Transistoren (gegenüber der Vega 10 mit 12,5 Milliarden). AMD erklärte uns dazu, dass die zusätzlichen 700 Millionen Transistoren zur Optimierung für höhere Taktraten, zur Verbesserung der Hardware-basierten Video-Codierung für 4K/60 Hz und zur Steigerung der Rechenleistung dienen.

Wir vermuten mal, dass die von AMD angesprochenen Erweiterungen der Compute-Engine eher FP64 mit halber Rate und die Unterstützung für neue INT8- und INT4-Anweisungen betreffen Während die Radeon Instinct MI50- und MI60-Karten, die auf dem gleichen Prozessor basieren, alle ihre Funktionen nutzen dürfen, ist der Double-Precision-Durchsatz der Radeon VII künstlich beschränkt. Ursprünglich hat AMD die gleiche 1/16-Rate wie schon bei der Radeon RX Vega kommuniziert, was aber falsch ist.

In Wirklichkeit ist der Doppelpräzisionsdurchsatz der Radeon VII künstlich nur auf ein Viertel der Einzelpräzisionsrate der Radeon VII beschränkt. Das ist deutlich besser als zunächst mitgeteilt wurde. Nachdem wir AMD unsere internen Benchmark-Daten vorgelegt hatten, überarbeitete der Hersteller die Spezifikationen der Karte noch einmal. Das VBIOS und die Treiber waren nämlich bereits auf die höhere 1/4 FP32-Rate ausgelegt. Infolgedessen bietet die Radeon VII somit eine höhere FP64-Spitzenleistung als jede andere AMD-Consumer-Karte und liegt tatsächlich nur hinter Nvidias deutlich teurerer Titan V zurück.

Die PCI-Express 4.0-Kompatibilät der Radeon Instinct MI50 und MI60  entfällt, genauso wie die die Infinity Fabric-Links der Instinct-Karten. Laut AMD sind die Rechenfähigkeiten von Radeon VII wie folgt ausgelegt:

  Radeon RX Vega 64 Radeon VII Radeon Instinct MI60
Peak FP64 0.84 TFLOPS 0.88 TFLOPS 7.4 TFLOPS
Peak FP32 12.7 TFLOPS 14.1 TFLOPS 14.7 TFLOPS
Peak FP16 25.3 TFLOPS 28.1 TFLOPS 29.5 TFLOPS
Peak INT8 53.4 TOPS 56.3 TOPS 59 TOPS
Peak INT4 106.8 TOPS 112.5 TOPS 112.5 TOPS

 

Mit der neuesten Version von SiSoftware Sandra konnten wir beispielsweise Daten generieren, die zeigen, wie eine Radeon VII unglaubliche FP64-Leistung und anomale FP16-Ergebnisse liefert. Aber nachdem wir diese Resultate mit AMD und Sandra’s Entwicklern ausgewertet haben, sind wir ziemlich sicher, dass sie nicht repräsentativ für den erwarteten theoretischen Durchsatz der Karte sind. Die offizielle Antwort von AMD deutet zudem auch darauf hin, dass Treiber und Workloads noch deutlich angepasst werden müssen:

“Although what we shared are theoretical calculations, our initial exploration shows some compute benchmarks that are memory size and memory bandwidth intensive, where an FP64 workload on Radeon VII will perform considerably better. With FP16, we are exploring this anomaly further. However, initial exploration suggests that for this particular GPGPU workload, driver optimization will be required.”

Offiziell gibt es zwar kein wirklich authentisches Blockschaltbild, aber man kann Vega 10 durchaus als Vorlage nehmen. Deshalb würden wir die Veränderungen auch nicht wirklich als GCN 5.1 bezeichnen, denn sie sind ist eigentlich nur marginal und stellen keine echte Iteration dar.

Ansonsten bedeutet ein so ähnliches Layout, dass ein kompletter Vega-20-Chip ebenfalls mit vier Shader-Engines ausgestattet ist, die jeweils über einen eigenen Geometrieprozessor und Rasterizer verfügen. Es gibt damit ebenfalls 16 Recheneinheiten (Compute Unit, CU) pro Shader-Engine mit 64 Stream-Prozessoren und vier Textureinheiten pro CU. Insgesamt sind das dann also 4.096 Stream-Prozessoren und 256 Textureinheiten auf der gesamten GPU.

Aber die getestete Radeon VII verwendet leider keinen kompletten Vega 20, wie er auf der Radeon Instinct MI60 verbaut wird. Stattdessen deaktiviert AMD (per Hardware-Strap?) vier der CUs dieses Chips, was dann exakt die 3.840 Stream-Prozessoren und 240 Textureinheiten ergibt, die wir auch von AMD genannt bekamen. Man kompensiert das Abspecken im Vergleich zur Radeon RX Vega64, indem man die Radeon VII mit viel höheren Taktraten betreibt.

Der Basis-Takt der Radeon RX Vega64 von nur 1.274 MHz steigt bei der Radeon VII auf 1.400 MHz, während der Boost-Takt der Vega 64 von 1.546 MHz auf 1.750 MHz bei der Radeon VII ansteigt. AMD schreibt auch über 1.800 MHz Spitzen-Takt für geringere Arbeitslasten, aber die haben wir selbst bei leichten CAD-Workloads nie protokollierbar erreichen können.

Jede der Shader Engines einer Vega 20 verfügt zudem über vier Render-Backends mit einer Kapazität von 16 Pixeln pro Taktzyklus und 64 ROPs. Diese Render-Backends werden, wie wir bereits wissen, zu Clients des L2 Cache. Dieser L2-cache ist 4 MB groß, also ähnlich wie schon bei der Vega 10, und doppelt so groß wie die 2 MB L2-Cache der Fiji-Chips. Obwohl ein großer L2-Cache dazu beiträgt, häufig verwendete Daten in der Nähe der GPU zu halten, sollte Vega 20 dank eines ausgewogeneren Speichersubsystems nicht so abhängig davon sein, wie noch Vega 10 es war.

Die Radeon VII erweitert zudem den Speicherausbau der RX Vega auf vier HBM2-Stacks, was am Ende einen aggregierten 4.096-Bit-Pfad ergibt (die Fury X lässt grüßen). Nur ermöglicht uns eine Datenrate von 2 Gb/s die erstaunliche Bandbreite von 1 TB/s, was nicht nur auf dem Papier ein gewissen Vorteil sein dürfte.

Das Mehrfach-BIOS des Radeon RX Vega mit mehreren Leistungsprofilen entfällt bei der Radeon VII. Die Angabe der 300 Watt TBP ist real, auch wenn man diesen Wert natürlich durch manuelles Zutun noch deutlich sprengen könnte – wenn man es denn wollte. Das sind auf dem Papier übrigens 5 Watt mehr, als man für eine RX Vega 64 seinerzeit als Maximum angab. Nur ist es müßig, bereits an dieser Stelle irgendwelche Effizienzbetrachtungen anzustellen, denn noch haben wir ja nichts gebenchmarkt.

 

Thermische Überwachung

Was der Karte zugeführt wird, muss am Ende auch wieder fast 1:1 als Abwärme abgeführt werden. Genau da kommen dann der Kühler und das gewählte Lüfterprofile zum Zuge die, das will ich an dieser Stelle schon mal kurz spoilern, zu argem Stirnrunzeln geführt haben. Aber dazu komme ich später noch, denn für jede Behauptung habe ich auch sehr detaillierte Messungen mit professionellem Equipment parat. Zunächst bespreche ich aber erst einmal das, was AMD neu eingeführt hat.

Konkret geht es um das Bestreben, durch eine verbesserte thermische Überwachung mehr Leistung aus der GPU herauszukitzeln. Anstatt die Temperaturen mit 32 Sensoren innerhalb und außerhalb der GPU zu messen, wie man es noch bei der Vega 10 getan hat, bezieht der Arbitrator nun Daten von 64 Sensoren, die strategisch im und um den Vega-20-Chip herum platziert sind.

Und während die Sperrschichttemperatur (Tjunction), die von diesen Sensoren abgeleitet wurde, seinerzeit nur den thermischen Abschaltschutz kontrollierte, wird sie nun auch für die Drosselung und Lüftersteuerung verwendet. Womit auch meine damalige Untersuchung zum ominösen „Hotspot“ bestätig wäre. Denn selbst wenn eine Überwachungssoftware z.B. nur eine GPU-Temperatur von 75°C oder 80˚C anzeigt, kann die tatsächliche Spitzentemperatur in einigen Bereichen der Sperrschicht bereits 95˚C oder mehr betragen. Dann aber werden die Lüfter auf knapp 3000 U/min hochgedreht.

Die Quintessenz all dessen ist, dass AMD nunmehr in der Lage sein möchte, aggressiver zu agieren, wenn es darum geht, Vega 20 bei hohen Taktraten zu halten, weil einfach mehr Daten aus einem größeren Netzwerk von Sensoren vorliegen, um dann mit angemessener Sicherheit zu wissen, dass andere Bereiche des Grafikprozessors nicht bei Temperaturen außerhalb sicherer Grenzwerte liegen. Man erhält höhere FPS-Raten, kann aber im Gegenzug auch mit höheren Lüfterdrehzahlen „abgestraft“ werden.

Ich habe dafür diesmal extra  auch ein Video aus meiner Audio-Chamber mit eingefügt und die vom Messmikrofon erfassten Lüftergeräusche aufgezeichnet. Samt einer dokumentierten Analyse des Frequenzspektrums wird es also ein gewisses Alleinstellungsmerkmal dieses Reviews werden. Ein anderes Highlight ist übrigens die Platinen-Analyse. Dafür bitte einmal weiterblättern…

 

 

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kannst Du per PayPal spenden.

About the author

Igor Wallossek

Chefredakteur und Namensgeber von igor'sLAB als inhaltlichem Nachfolger von Tom's Hardware Deutschland, deren Lizenz im Juni 2019 zurückgegeben wurde, um den qualitativen Ansprüchen der Webinhalte und Herausforderungen der neuen Medien wie z.B. YouTube mit einem eigenen Kanal besser gerecht werden zu können.

Computer-Nerd seit 1983, Audio-Freak seit 1979 und seit über 50 Jahren so ziemlich offen für alles, was einen Stecker oder einen Akku hat.

Folge Igor auf:
YouTube   Facebook    Instagram Twitter

Werbung

Werbung