Basics Gaming GPUs Graphics Practice Reviews

NVIDIA and DirectX 12 Bottleneck? MSI GeForce RTX 3090 SUPRIM vs. MSI Radeon RX 6900XT Gaming X and its own drivers

Shifting performance in the limit?

No, it’s not because of Horizon Zero Dawn, which I chose out of many other games I tried on, it’s really because of another problem that I’ll locate later. Because the speculation whether all this can be traced back to a driver overhead caused by whatever or to something else does not help at this point. We need to test, test, test!

You can reproduce this behavior similarly in many other titles, but I found my choice to be most appropriate for my test because of the good CPU scaling. Watch Dogs Legion, for example, is similarly well suited for the effect, although the results here were a bit too scattered for me. But important for me was the really almost perfect reproducibility and consistency of the results, together with the mentioned feature “Asynchronous Compute”. Because of the reproducibility I only use the integrated benchmark.

 

Let’s first look at the performance with 4 cores (8 threads). While the Radeon is still about 13 percentage points behind in 2160p, it’s already 2 percentage points ahead in 1440p, which then increases to 6 percent in 1080p, to even rise to 11 percentage points in 720p. Let’s remember 11, please. But it’s also interesting that the values of both cards in 2160p are already more or less identical to those with 6 or 8 cores, so hardly limiting the CPU here. However, the CPU bottleneck becomes more and more effective in WQHD and higher. However, the effects hit the GeForce card much harder than the Radeon card, albeit only relatively in terms of FPS!

With 6 cores and 12 threads, it only gets interesting below 1440p, because both cards perform equally fast in WQHD. The distance in 2160p is the same as with 4 cores. Feat, because the FPS are also the same, because only the graphics card limits here. The Radeon’s lead only becomes apparent in 1080p, where it is just under 4 percentage points. By the way, the Radeon with only 4 cores is just as fast as the GeForce with 6 cores now. interesting insight on the side. And in 720p? That’s exactly 10 percentage points more!

And what happens if you run both cards with 8 cores and 16 threads? In 2160p the Radeon is just as behind as always, in 1440p there is once again a tie and in 1080p the Radeon still leads with 4 percentage points and in 720p it’s now almost 11 percentage points again. It still increases the FPS slightly below 1440p (but only slightly) and remains in the performance increase but in almost the same ratio.

A counter test with a Ryzen 9 5950X including manual overclocking achieves a whole 4 FPS more with the Radeon RX 6900XT in 720p in the overall system, and just under 3 FPS with the GeForce. Again, the ratio remains about the same, but despite almost 300 MHz more clock, both cards only gain marginally.

Interim summary

I didn’t expect these findings (or maybe I did?) and they even contradict a little bit the benchmarks of the colleagues from Hardware Unboxed, who observed the same phenomenon, but also tested with different platforms and older generations. Indeed, a much weaker card tested for comparison in the form of the MSI Radeon RX 5700XT Gaming X Trio was unable to outperform the GeForce RTX 3090 even with only 2 or 4 cores. So it’s not that extreme.

But you get much closer than expected. With 4 cores, it’s only 154 FPS in 720p for the GeForce RTX 3090 and 136 FPS for the Radeon RX 5700XT, which should nominally be light years behind NVIDIA’s current top model. That’s only 13 percentage points behind! With older DirectX11 titles, the behavior is not really comprehensible in this form. And because it might be interesting, I’ve once again counter-tested the Radeon RX 5700XT with a nominally faster MSI RTX 3060 Ti as well. For the sake of better playability with the 4 core variant:

We see the same effect below 1080p, when both cards run back into the CPU limit, where the nominally much slower Radeon RX 5700XT can suddenly pass the GeForce RTX 3060 Ti.

According to these tests, I wouldn’t attribute the recognizable behavior to a poorly optimized driver and a general overhead, but rather to disadvantages of the NVIDIA cards in asynchronous compute. Depending on the optimization of an engine, this might explain the difference between DirectX 12 games.
 
I don’t want to get stuck here, because in the end, as always, dear time is missing. But I see the whole thing as a thought-provoking impulse, in which direction one should test once more exactly and above all also as a small nudge in the direction of NVIDIA to examine all this once more more exactly. In the pages that follow now, I’ve also laid out the full metrics for each of the core constellations, from FPS and percentiles, to frame time and variances, to power consumption and efficiency.
 
I ask to put the focus mainly on the variances, which yes the rounder scrolling can be seen very well and also on the power consumption of the GPU including efficiency.  Have fun, then here’s my conclusion.

 

143 Antworten

Kommentar

Lade neue Kommentare

Case39

Urgestein

2,503 Kommentare 929 Likes

Guten Morgen und Danke für den aufklärenden Artikel. Ich behaupte mal, dieser wird mit sehr viel Aufmerksamkeit durch das Netz gehen!
Der fulminante Wochenstart ist schon mal gesichert👍

Antwort 3 Likes

Igor Wallossek

1

10,198 Kommentare 18,815 Likes

Kannst ihn ja mal teilen ;)

Antwort 1 Like

Case39

Urgestein

2,503 Kommentare 929 Likes

Erledigt....3DC, PCGH, CB.

Antwort 5 Likes

Igor Wallossek

1

10,198 Kommentare 18,815 Likes

PCGH und CB sehe ich nichts, haben die das schon wieder weggelöscht? Das 3DC besuche ich nicht mehr. Zu klein und unbedeutend, deren Reichweite ist komplett abgeschmiert. Was mich aber auch nicht wundert. Elitärer Sebstbeweihräucherungsverein. Die echten Urgesteine und interessanten User haben sie mittlerweile alle vergrault oder weggebissen. Es ist wirklich erschreckend, wie 4-5 Leute ein gesamtes Forum ruinieren können und die Mods noch seelenruhig dabei zuschauen. ;)

View image at the forums

Antwort 5 Likes

G
Guest

Vielen Dank für den überaus arbeitsintensiven und aufschlussreichen Artikel!

Im Prinzip bestätigt er, was eigentlich von Anfang in den Benchmarks zu RDNA2 und Ampere offensichtlich geworden ist: Ampere ist deutlich CPU abhängiger und kann seine theoretischen Vorteile an Rechenleistung erst ab 4k so richtig ausspielen.

Deine Theorie mit dem Async Computing ist interessant. Aber das würde ja bedeuten, dass entweder das Setup von diesem Feature bei Ampere mehr CPU Zeit braucht - oder dessen Ausführung. Bei letzterem kann ich mir das kaum vorstellen, denn die Ausführung muss ja die GPU erledigen. Also kann es doch nur das Setup sein. Eventuell muss da was umorganisiert oder sortiert werden, damit die GPU optimale Ergebnisse liefert?

Nicht desto trotz...

Häme incoming in 3... 2... 1...

Antwort 1 Like

konkretor

Veteran

298 Kommentare 301 Likes

War nicht mal das Spiel Ashes of Singularity der Test für async compute. Um alle Graks zu knechten? Mit dem Spiel hatte AMD damals gezeigt besser von DX12 zu profitieren zu können als Nvidida.

Sollte das Spiel nochmals durch den Benchmark gejagt werden?

Antwort Gefällt mir

Igor Wallossek

1

10,198 Kommentare 18,815 Likes

Da haben die Teams die Treiber mittlerweile sicher totoptimiert. :D
Horizon Zero Dawn ist da viel subtiler und hinterhältiger.

Antwort 1 Like

s
summit

Veteran

150 Kommentare 73 Likes

Du skalierst also wirklich nur die Kerne?
Bei HU sieht man ja ( ryzen 1600,2600,3600) dass es vorallem auch an der IPC liegt.

Antwort 1 Like

Case39

Urgestein

2,503 Kommentare 929 Likes
Case39

Urgestein

2,503 Kommentare 929 Likes

Ich hab es einfach in nen passenden Thread gepostet. Ja, 3DC ist richtig in die Bedeutungslosigkeit gerutscht....

Antwort Gefällt mir

Igor Wallossek

1

10,198 Kommentare 18,815 Likes

Hast Du bitte einen CB-/PCGH-Link? Oder ich bin zu blöd zum Suchen? :D

Antwort Gefällt mir

O
Oberst

Veteran

337 Kommentare 131 Likes

Sollte das in der Erkenntnis 1 auf Seite 1 nicht Radeon heißen? Denn die ist ja in WQHD und darunter überdurchschnittlich besser. Die Charts erinnern mich irgendwie immer an Vega, nur dieses mal mit umgedrehten Herstellern. NVidia kann die deutliche Mehrleistung von grob 36TFlop (gegenüber 23TFlop der 6900XT) erst ab 4k wirklich nutzen.

Antwort 1 Like

Case39

Urgestein

2,503 Kommentare 929 Likes

raff von PCGH scheint ebenfalls nen Artikel vorzubereiten....

Wie schon geschrieben. Hab es einfach nur in einem passenden Thread gepostet...

Antwort 2 Likes

Klicke zum Ausklappem
BlackFireHawk

Veteran

101 Kommentare 106 Likes

Also Sehr interessanter und guter Artikel. Daumen Hoch.

ich habe jedoch eine kleine anmerkung,
du gehst hier über die Kernskalierung des Spieles.. benutzt aber bei jeden Bench Run die gleiche CPU.. einen Zen3 Prozessor der eine Hohe IPC / Leistung pro Kern hat... ich glaub momentan sogar die höchste verfügbare IPC

was mich jetzt interressieren würde ist. wie Skaliert das ganze mit weniger leistung pro Kern.. eine RTX3090/3080 oder eine RX 6900xt/6800XT wird ja oft auch mit Älteren CPUs kombiniert die nicht soviel "Leistung pro Kern" haben..
Oft sieht man diese Karten zb mit nem Ryzen 3700x/3600x oder einem Intel 10600k/9700K/8700K kombiniert.. auch ohne entsprechendes K suffix

der allgemeine konsens ist ja "spare an der CPU und kaufe dafür eine stärkere GPU, denn ab 1440p bist du ja angeblich sowieso im GPU limit"

ein 5800x hat ja in etwa 20% mehr singlecore leistung als zb ein 9900k wenn ich mir die CB20 Singlecore ergebenisse ansehe
und knapp 30% mehr als ein 3700x..

Ich würde mir jetzt zumindestens einen zusätzlichen Bench wünschen mit weniger pro Kern leistung.
1440p/8kerne skalierung und das ganze dann mit 30% weniger takt/ sprich den 5800x einfach mal fix auf 3.6ghz festgetaktet

Antwort 3 Likes

Klicke zum Ausklappem
D
Denniss

Urgestein

1,516 Kommentare 548 Likes

Bitte gebt dem Igor mal ein wenig Zeit zum Durchschnaufen, er muß ja noch Rocket Lake und die kleinen Navis quälen.
Andere CPUs kann er ja irgendwann nachtesten z.B. den 3800x/xt

Antwort 7 Likes

BlackFireHawk

Veteran

101 Kommentare 106 Likes

keine frage das IST alles arbeit.
nur seh ich hier einen sehr wichtigen aspekt in der sache, denn hardware unboxed vergleicht unterschiedlich starke "pro kern leistung" und bekommt hier extreme unterschiede zwischen AMD und Nvidia

Antwort 1 Like

FritzHunter01

Moderator

1,155 Kommentare 1,572 Likes

Hallo,

alleine die Tatsache, dass es mit der aktuellen Ryzen Generation beim Abschalten von Kernen bereits zu einem solchen Phänomen kommt, zeigt, dass Nvidia hier ein Thema hat.
Der Steve von Hardware Unboxed ist zufällig beim CPU Vergleich darauf gestoßen und mit dem Test von Igor im Vergleich, wird deutlich, dass ältere CPUs das Thema noch deutlicher hervorheben. Es liegt also sehr wahrscheinlich nicht nur an der reinen IPC.

Meine Latenzmessungen haben ein extremes Verhalten offenbart... dazu kommen noch mindestens zwei Artikel von mir!

kleiner Spoiler:

3800X 4.45 GHz all core OC

3080 vs 5700 XT

CoD MW Multplayer 1080p Low Details

Beide GPUs in etwa gleich schnell mit 247 FPS im Durchschnitt

Antwort 2 Likes

Igor Wallossek

1

10,198 Kommentare 18,815 Likes

Schenke mir bitte die Zeit ;)

Am Ende wollen wir ja auch nicht alle Arikel durcheinander vermischen :D

Antwort 2 Likes

s
summit

Veteran

150 Kommentare 73 Likes

Ist mir auch schon auf Twitch aufgefallen, die spielen meist auf 1080p low details und haben mit ihrer 3080 probleme.
Kann man mal einen älteren Treiber nutzen? Imho war dies doch nicht schon "immer" so.

Antwort Gefällt mir

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kannst Du per PayPal spenden.

About the author

Igor Wallossek

Editor-in-chief and name-giver of igor'sLAB as the content successor of Tom's Hardware Germany, whose license was returned in June 2019 in order to better meet the qualitative demands of web content and challenges of new media such as YouTube with its own channel.

Computer nerd since 1983, audio freak since 1979 and pretty much open to anything with a plug or battery for over 50 years.

Follow Igor:
YouTube Facebook Instagram Twitter

Werbung

Werbung