Grafikkarten Motherboard Praxis Prozessor Testberichte VGA

Resizeable BAR – Ryzen R9 5900X vs. Ryzen 9 3900XT mit AMD Radeon und NVIDIA GeForce im Benchmark

Inoffiziell ging es ja mit dem ComboAM4PI V2 1.2.0.1 schon länger, aber seit dem 03.03.2021 hat AMD auch offiziell die Unterstützung von Zen2 angekündigt. Man setzte ja bisher bei AMD eine aktuelle Zen3-CPU voraus, dazu ein B550- oder X570-Motherboard samt aktualisiertem BIOS. Oder eben eine aktuelle Intel-Lösung. Nun also auch offiziell Zen2 und es ist an der Zeit, hier einmal den direkten Vergleich zu ziehen, was die native Implementierung von Zen3 und die zum Teil über die Firmware adaptierte Nutzung von Zen2 auch bei der Performance unterscheidet. Oder vielleicht auch nicht? Lassen wir uns überraschen!

Zum Einsatz kommen ein aktueller Ryzen 9 5900X sowie ein Ryzen 9 3900XT, die mit den verwendeten Grafikkarten in Form einer Radeon RX 6800 16 GB Referenz und der KFA2 GeForce RTX 3060 EX 12 GB auf einem MSI MEG X570 Godlike laufen, für das mittlerweile ebenfalls ein passendes BIOS bereitsteht. Als Spiel habe ich exemplarisch Borderlands 3 gewählt, weil hier die Vorteile der Verwendung des Resizeable BAR (Ja, es ist sächlich und kein Tresen!) besonders gut zur Geltung kommen. Badass Settings und Full-HD vs. WQHD gegen eine Radeon RX 6800 und eine GeForce RTX 3060, die wohl beide nicht geeignet sind, hierbei die CPUs zum Flaschenhals werden zu lassen.

Doch vorab müssen wir noch den Begriff BAR, also das Base Address Register klären.

Was steckt hinter Resizeable BAR?

Hinter diesem, mittlerweile gern genutzten Schlagwort, verbirgt sich eigentlich nichts anderes als der clevere Umgang mit dem Base Address Register (BAR) und genau dieser Support muss zwingend auch im Unterbau integriert und auch aktiviert sein. Bei moderner AMD-Grafikhardware spielen größenveränderbare PCI-BAR (siehe auch PCI SIG vom 24.0.4.2008) schon länger eine wichtige Rolle, da die eigentlichen PCI BAR normalerweise ja nur auf 256 MB begrenzt sind, während man bei den neuen Radeon Grafikkarten nun bis zu 16 GB VRAM und auf der GeForce RTX 3060, der einzigen bisher unterstützten Grafikkarte von NVIDIA, immerhin noch 12 GB vorfindet.

Die Folge ist, dass nur ein Bruchteil des VRAM für die CPU direkt zugänglich ist, was ohne das Feature eine ganze Reihe von Umgehungslösungen im sogenannten Treiber-Stack erfordert. Das kostet natürlich stets Performance und sollte demzufolge vermieden werden. AMD und mittlerweile auch Intel setzen nun genau dort an. So richtig neu ist das nicht, es muss aber sauber im UEFI implementiert und später auch aktiviert werden. Das wiederum geht nur, wenn das System im UEFI Modus läuft und CSM/Legacy deaktiviert sind.

CSM steht dabei für das Compatibility Support Module. Das Compatibility Support Module gibt es ausschließlich unter UEFI und es sorgt dafür, dass ältere Hardware und Software auch mit UEFI funktioniert. Das CSM ist immer dann hilfreich, wenn nicht alle Hardware-Komponenten zu UEFI kompatibel sind. Einige ältere Betriebssysteme sowie die 32-Bit-Versionen von Windows lassen sich auch nicht auf UEFI-Hardware installieren. Genau diese Kompatibilitätseinstellung verhindert jedoch die saubere und für die neuen AMD-Komponenten benötigte Windows-Variante oft schon bei der Installation.

 
Zunächst muss man im BIOS des Motherboards nachsehen, ob UEFI oder CSM/Legacy aktiv ist und falls nicht, diesen Schritt unbedingt machen. Erst dann kann man die größenveränderbaren PCI-BAs überhaupt aktivieren und nutzen, doch Stopp – bootet Euer Windows dann überhaupt noch? Wie man einen (älteren) Datenträger von MBR zu GPT mit Bordmitteln konvertiert, damit er unter UEFI sauber erkannt wird, könnte Ihr unter anderem auch im Forum nachlesen, falls es diesbezüglich Fragen gibt, das führt hier jetzt zu weit.
 
Fakt ist, dass AMD hier die Hürden für die Nutzung schon recht hoch anlegt und das bisher auch nur spärlich kommuniziert hat. Doch hat man das BIOS aktualisiert, steht auch den Ryzen 9 3900XT die Welt des größeren Adress-Registers (in Folge auch rBAR genannt) offen:
 
 
 

Benchmarks, Testsystem und Auswertungssoftware

Das Benchmarksystem ist angepasst worden und ich setze ebenfalls auf PCIe 4.0, das passende X570 Motherboard in Form der MSI MEG X570 Godlike und die beiden Ryzen 9 der zweiten und dritten Generation, die wassergekühlt betrieben, aber nicht weiter manuell übertaktet wurden. Dazu kommen der passende DDR4 3600 VIPER von Patriot, sowie mehrere schnelle NVMe SSDs. Der Speicher läuft bei beiden CPUs mit identischen Settings, was die Vergleichbarkeit natürlich fördert.

Die einzelnen Komponenten des Testsystems habe ich auch noch einmal tabellarisch zusammengefasst:

Test System and Equipment
Hardware:
AMD Ryzen 9 5900X / Ryzen 9 3900XT
MSI MEG X570 Godlike
2x 16 GB Patriot DDR4 3600 VIPER
1x 2 TB Aorus (NVMe System SSD, PCIe Gen. 4)
1x 2 TB Corsair MP400 (Data)
1x Seagate FastSSD Portable USB-C
Be Quiet! Straight Power 11 1000 Watt Platin
Cooling:
Alphacool Eisblock XPX Pro
Alphacool Eisball, 360 Radiator
Alphacool Subzero
Case:
Banchetto 101
Monitor: BenQ PD3220U
Power Consumption:
MCU-based shunt measuring (own build, Powenetics software)
Up to 10 channels (max. 100 values per second)
Special riser card with shunts for the PCIe x16 Slot (PEG)

NVIDIA PCAT and FrameView 1.1

Thermal Imager:
1x Optris PI640 + 2x Xi400 Thermal Imagers
Pix Connect Software
Type K Class 1 thermal sensors (up to 4 channels)
OS: Windows 10 Pro (all updates, current certified or press drivers)

Kommentar

Lade neue Kommentare

P
Pheenox

Mitglied

88 Kommentare 35 Likes

@Igor Wallossek Danke Dir für diesen Vergleich. Interessant ist, dass der Bildverlauf durch rBAR "unrund" wird anstatt sich zu bessern.

Aber ein grundsätzlicher Wunsch:
Du testest fast ausnahmslos mit dem R9 5900X; auch, wenn Du wieder eine Grafikkarten Testmuster in Deinen Händen hast.
In der Breite ist allerdings nicht der R9 der am meisten vertretene Prozessor, sondern vielmehr die kleinen Brüder. Wenn ich mir die nackten Zahlen von Mindfactory anschaue, ist der R5 5600X viermal häufiger verkauft worden als der R9.
Ich kann es natürlich nicht belegen, aber ich vermute, dass es für eine Vielzahl der Zocker und Streamer da draußen ein gutes Stück interessanter ist, wie sich z. B. eine 6800XT/3080 mit einem R5 5600X respektive einem R7 5800X schlägt.

Könntest Du diesen Aspekt eventuell mit in Deine Testszenarien einfließen lassen?

Antwort Gefällt mir

Igor Wallossek

1

10,198 Kommentare 18,815 Likes

Der Witz ist: der 5800X zeigt hier zum 5900X keinen echten Unterschied, beim 5600X bin ich ohne OC aber fast immer im CPU-Limit, mit der 6800 auch noch in WQHD. Für Tests ist das eher albern, weil man keine allumfassende Aussage bekommt.

Mit dem 5900X kann ich sowohl im CPU- als auch im GPU-Limit testen. Da kann sich der 5600X-Nutzer die Wiksamkeit unter Full-HD ansehen. :)

Antwort 2 Likes

P
Pheenox

Mitglied

88 Kommentare 35 Likes

Spannend, dass 5800X und 5900X so nah zusammen liegen, der 5600X hier aber deutlich abfällt.
Ich hab in meinem Rig ja die 6800XT zusammen mit dem 5600X auf WQHD werkeln. Lasse ich in die In Game Benchmarks laufen (Borderlands 3, Ghost Recon Breakpoint, AC Valhalla, Forza), habe ich eine CPU-Last, die im Durchschnitt bei 65-70% liegt. Die CPU läuft ohne OC im Auto Modus und dennoch bin ich vom CPU-Limit entfernt. 🤔 Allerdings stehen die Settings bei mir allesamt auf Ultra/Badass.

Machen dann die Einstellungen den Unterschied, dass ich nie ins CPU-Limit laufe?
Oder an den Monitoring-Programmen, die Du vermutlich parallel laufen lässt und die Kerne auslastest?

Ein bisschen verunsichert hast Du mich jetzt schon mit der Info bzgl. des CPU-Limits, das weckt dann immer meine Neugier. 😃

Antwort 2 Likes

Wie jetzt?

Mitglied

55 Kommentare 44 Likes

Prima Test, sehr aufschlussreich, danke dafür!
@Pheenox: 5600X, 6 Kerne, 12 Threads. Wenn deine Anwendung 4 Kerne und 8 Threads nutzen kann und diese dann voll auslastet bist du bereits bei 66% Auslastung der CPU im CPU-limit. So einfach ist es also nicht.

Antwort 4 Likes

8j0ern

Urgestein

2,506 Kommentare 787 Likes

Danke, ich habe selbst noch keinen Vergleich gemacht mit meinem 3900XT und der Vega64.
Seit dem es Rize BAR im UEFI gibt ist es an bei mir.
Borderlands 2 läuft mit im Spiel gedeckelten 120FPS astrein, die Frametime Linie ist stets Flach auch bei schnellen Bewegungen und viele Effekte.

Hast du bei dem Test System auch "Secure Boot" an oder ist das bei dir aus gewesen?

Antwort Gefällt mir

D
Denniss

Urgestein

1,516 Kommentare 548 Likes

wieviel bringt rBar eigentlich im CPU-Limit? oder bringts da gar nichts?

Antwort Gefällt mir

G
Guest

Habe ähnliche Erfahrungen gemacht (5800x reicht vollkommen). Was Nvidia angeht, muss man abwarten. Sieht aber eher ernüchternd aus. Ihnen fehlt wohl der L3 in Form des IFC, der für die volle Beschleunigung auf PCIe4 BW sorgt.

Mittlerweile scheinen sie mit dem Taktverhalten der IFC auch die Hitrate in höheren Auflösungen anzupassen. Also SAM scheint nicht einfach nur rBAR zu sein, was scheinbar so geplant war, setzt aber grundsätzlich auf dem Protokoll der PCI Sig auf.

Antwort Gefällt mir

Case39

Urgestein

2,503 Kommentare 929 Likes

Maßnahmen wie rBAR (SAM), DLSS, Infinity Cache, FidelityFX usw. lassen langsam erkennen, das beide Anbieter, rein von der Hardware, keine Steigerungen wie in den letzten Jahren mehr erwarten.

Antwort 1 Like

G
Guest

Das würde ich so nicht schreiben case..:). Man nutzt eher was brach liegt. Letztlich ist rBAR ein GPUMmu (WDDM2) Feature, dass man in Software und Hardware unterstützen kann, es ist optional (daher muss man Nvidia auch keine Schuld geben, wenn es eben nicht so ist) und wenn man es in Hardware unterstützen will erfordert das einige Register mehr. Die werden benötigt, um der Software in Hardware auch mitzuteilen, welche Ressource wo verfügbar ist, wobei die Software dann der größten Ressource zuweisen kann.

Da sich ein paar der Partner für Nvidia aus dem Fenster gelehnt haben (Asus mal wieder vorne weg), sind sie nun in der Bringpflicht obwohl sie diese Register in Hardware wahrscheinlich auf Gamerhardware nicht unterstützen.

rBAR war dazu gedacht bestimmten Impact bei großen Speicherkonfigurationen abzufedern und auf feste Größen von Systemressourcen zu programmieren, wenn Dynamic nicht erforderlich ist weil Poole groß genug sind. Die PCI Sig schrieb aber nie vor es in Hardware unterstützen zu müssen und an deiner Auflistung erkennt man das Kleinvieh auch Mist machen kann.

Natürlich kann Software bei der Ressourcenzuweisung einen Overhead erzeugen, wie das bei Treibern (bzw. den genannten Dienstprogrammen) auch schon erkennbar war. Das Nvidia gerne was an der Hardware vorbei scriptet ist ja auch bekannt. AMD tut sicher nichts anderes, wenn's drauf ankommt. War ja bei den ACE auch schon so.

Da kommunizieren einfach zwei I/O Die direkt, was klar schneller funzt. Nur muss die Software es zulassen, wie man an den APIs (Spiele) gut erkennt, unterstützen es nicht alle gleich gut.

Die ursprünglichen Ideengeber (Sponsoren) waren HP in Zusammenarbeit mit AMD. Nur logisch das sie dann irgendwann damit kommen.

Antwort 1 Like

Klicke zum Ausklappem
Case39

Urgestein

2,503 Kommentare 929 Likes

@gastello Was rBAR angeht, hat AMD sehr tief in die Mottenkiste gegriffen...es wurde ja schon 2008 in den PCIE Standard (3.0) integriert.

Antwort Gefällt mir

DommeP

Veteran

119 Kommentare 33 Likes

@8j0ern funktioniert das mit der Vaga64? Dachte das es erst mit den rdna2 Karten läuft. Das mit der VII zu testen wäre für mich nämlich auch verlockend...

Antwort Gefällt mir

c
cunhell

Urgestein

549 Kommentare 503 Likes

Naja, aber immerhin hat AMD in der Mottenkiste gegruschelt und damit noch ein paar Prozent mehr Leistung für quasi umsonst gefunden.
Und es ist etwas, dass einem für alle zugänglichen Standard entspricht und keine properitäre Lösung wie sie andere Hersteller gerne verwenden.

Cunhell

Antwort Gefällt mir

G
Guest

Ich denke letztlich hilft Resizable BAR ein wenig ein etwas zu schmales Speicherinterface zu entlasten. Es spielt seine Stärke also ganz besonders im Zusammenhang mit dem InifinityCache und gleichzeitig geringerer VRAM-Bandbreite aus.

Andererseits kann ich mir vorstellen, dass ein großes VRAM den positiven Effekt von ReBAR wieder ein wenig schmälert. Weil einfach seltener große Datenmengen übertragen werden müssen (oder anders gesagt: Wenn der Speicher näher an die Grenzen kommt, müssen Daten potentiell öfter übertragen werden). Bei solchen Szenarien müsste also eigentlich NVidia eher einen Vorteil von ReBAR haben.

Gerade diesen Effekt wird man aber gerade bei der 3060 dank ihren 12 GB eben nicht sehen.

Letztich hilft ReBAR die Auswirkungen bestimmter Flaschenhälse zu verringern. D.h. wenn es sich stark auswirkt, ist es nicht unbedingt nur positiv sondern ein Zeichen, das hier Potential für Verbesserung ist.

Ich bin gespannt wie die Vergleiche bei einer 3070 und 3080 aussehen werden.

Antwort 1 Like

DommeP

Veteran

119 Kommentare 33 Likes

@Grestorn klingt einleuchtend - und demnach würde es grade mit der VII also keinen sinn machen da Sie bzgl. Bandbreite & Größe des Speichers relativ selten Probleme bekommt.

Also ist rBAR eigentlich ein anderer Lösungsansatz für das gleiche Problem...
Irgendwie fühlt sich das Jetzt an wie ein Workaround um an die Leistung zu kommen die liegen gelassen wurde als man auf HBM verzichtet hat...

Antwort Gefällt mir

c
cunhell

Urgestein

549 Kommentare 503 Likes

Wie soll rBAR die Speicherbandbreite erhöhen? Du hast mit rBAR nur vollen Zugriff von der CPU auf den VRAM und kannst direkt ohne Umwege reinschreiben. Der Inifinity-Cache sollte für die CPU transparent sein, sonst würd die CPU ja nur die Größe
des Caches sehen und nicht die 16GB VRAM. Da aber die Daten trotzdem durch den Infinity-Cache müssen, bleibt die Bandbreite zum VRAM hin gleich.
Und Dein Argument mit der VRAM-Größe passt auch irgendwie nicht. Die 6800er haben 16GB, die 3060 nur 12. Mit deinem Argument müsste also die 3060 mehr profitieren als die 6800er. Tut sie aber nicht.

Was dagegen sein kann ist, dass es eben nicht reicht einfach nur ReBAR zu aktivieren ohne Soft- und Hardwareseitig entsprechende Optimieriungen vorzusehen. Bestes Beispiel war aus meiner Sicht Async Compute, das auf AMD besser lief als bei Nvidia, da es Nvidia nicht so performant umgesetzt hatte. Sie konnten es zwar dann als unterstützt angeben, waren aber bei dem Feature schlechter was die Leistung angeht als AMD, da sie die Vorteile durch einen nötigen Overhead verspielt haben, den AMD nicht hatte.

Cunhell

Antwort 1 Like

D
Deridex

Urgestein

2,213 Kommentare 846 Likes

Ich zweifle auch an dieser Annahme. Anscheinend bringt SAM ja bei niedriger Auflösung mehr und da habe ich doch Zweifel, dass bei FullHD das Speicherinterface der limitierende Faktor ist.

Ich glaube eher, dass NVidia etwas Zeit braucht um eine wirklich sinnvolle Nutzung der rBar umzusetzen. Ich würde daher damit rechnen, dass Nvidia da eventuell noch etwas nachlegt.

Antwort 1 Like

c
cunhell

Urgestein

549 Kommentare 503 Likes

Ich denke, Nvidia wird erst bei der nächsten Generation wirklich von dem Feature profitieren. Sieht ja man quasi am anderen Ende auch. Der AMD Ryzen 3900 kann es zwar mittlerweile auch und gewinnt etwas Leistung, der 5000er, der schon vom Design her darauf ausgelegt ist, hat aber mehr Vorteile davon. Ich kann mir gut vorstellen, dass ein einfaches Bios-Update auf den Nvidia-Karten nicht soviel herausholen kann wie eine direkte Auslegung der Hardware auf das Feature. Hier hat AMD wohl diesmal eben eine Generation Vorsprung. Den hat Nvidia wiederum in anderen Bereichen, in denen AMD aufholen muss.

So lange sich die Beiden, und später evtl. auch Intel, gegenseitig puschen, kann es uns doch nur recht sein. Es gibt nichts innovationsfeindlicheres als ein quasi-Monopol. Sieht man ja auch an den aufgerufenen UVPs, die zum Teil deutlich gesunken sind. Leider sind die Umstände jetzt so, dass es zu viele Faktoren gibt, die dem jetzt entgegen stehen, aber man würde heute sehr viel Leistung zu einem doch ganz fairen Preis bekommen.

Cunhell

Antwort 1 Like

Wallenstein

Mitglied

30 Kommentare 10 Likes

Würde man aber bei dieser Anwendung nicht genauso mit 12 Kernen / 24 Threads ins gleiche Limit laufen? Dann hätte man eben nur noch 33% Auslastung, wäre aber trotzdem im Limit.

Ich finde es auch immer etwas suboptimal wenn mit Hardware getestet wird, die nur einer deutlichen Minderheit der Nutzer (sei es durch hohe Preise oder geringe Verfügbarkeit) zugänglich ist. Natürlich kann man nicht jede beliebige Konfiguration testen, aber das am weitesten verbreitete Modell der aktuellen Generation zu verwenden wäre für die meisten Leser vermutlich "praxisrelevanter", sozusagen. Die Ergebnisse sind mit der besten Hardware natürlich besser messbar, aber am Ende stelle ich mir immer die Frage, wem nutzt die Information letzten Endes?

Antwort 1 Like

N
Nothhelfer

Neuling

6 Kommentare 1 Likes

Danke für den Test Igor. Was mich noch interessieren würde, wäre ein Test mit einem Intel Board, ich habe gesehen, selbst für mein Z390 Board von Gigabyte gibt es ein BIOS mit rBAR. Oder funktioniert das aus irgendeinem Grund (noch) nicht?

Antwort Gefällt mir

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kannst Du per PayPal spenden.

About the author

Igor Wallossek

Chefredakteur und Namensgeber von igor'sLAB als inhaltlichem Nachfolger von Tom's Hardware Deutschland, deren Lizenz im Juni 2019 zurückgegeben wurde, um den qualitativen Ansprüchen der Webinhalte und Herausforderungen der neuen Medien wie z.B. YouTube mit einem eigenen Kanal besser gerecht werden zu können.

Computer-Nerd seit 1983, Audio-Freak seit 1979 und seit über 50 Jahren so ziemlich offen für alles, was einen Stecker oder einen Akku hat.

Folge Igor auf:
YouTube   Facebook    Instagram Twitter

Werbung

Werbung