CPU Editor's Desk Practice System

AVX512 throttling, clock stretching or something else entirely?! – 9800X3D with up to 35% less performance at the same clock | Investigative

BIOS 2602 – Asus Crosshair X670E Gene

Now we start with the Ryzen 7 9800X3D. This is a normal retail CPU – not an engineering sample or anything like that – and also the silicon quality is also not great. X3D CPUs with one CCD, such as the predecessors 5800X3D or 7800X3D, are known to be an excellent choice for gaming, but until now they were not really overclockable. The 9800X3D changes this and for the first time AMD also allows a static clock to be set for this X3D CPU. This is exactly where I noticed the strange behavior, but one thing at a time.

First of all, the CPU simply runs with its standard settings as far as the core clock is concerned. FCLK and RAM are fixed as described and identical for all subsequent tests. So you would expect the same performance for all tests with the same core clock, right?

4.9 GHz – dynamic (stock)

First of all, the 9800X3D CPU “stock” is allowed to deliver a performance baseline. The CPU ultimately averages out at a clock rate of approx. 4.9 GHz on all cores, at least according to the effective clock in the HWInfo. No limits such as PPT, TDC, EDC or TJMax are reached and the CPU needs approx. 18.5 seconds for y-cruncher 1b. So far so good.

Now we do the whole thing again statically at 4.9 GHz (1.25 V LLC5). Theoretically, the performance should be more or less identical. The effective clock is also around 4.9 GHz as in the stock test. But suddenly the performance drops to over 21 seconds in y-cruncher 1b. We only changed how the clock is reached – statically, instead of dynamically via the standard boost curve – and as a result the performance drops by 14%. This is completely confusing.

4.9 GHz – static

No limits are reached either. The boost limits are already overridden with a static clock and the core temperatures are also completely fine at a maximum of 60 °C. So there is actually no reason why the performance would drop like this.

Perhaps the CPU actually boosted higher than 4.9 GHz in the “stock” test and ran much faster…? a 14% performance difference would have to mean 14% more hidden clock speed, i.e. 5.58 GHz, but be that as it may. How do we test this? We can do it the other way around and cap the boost clock. With the “Fmax” setting (Max CPU Boost Clock Override in the Asus BIOS), the boost clock can be effectively lowered so that the highest possible clock rate is reached by all cores. With an Fmax offset of -1000 (MHz), the CPU then clocks to approx. 4.2 GHz on all cores. We have effectively turned the standard boost into a statically capped all-core underclock. With this setting, the CPU completes the y-cruncher in approx. 19.2 seconds.

4.3 GHz – dynamic, Fmax -1000

Sure, that’s a bit slower than completely stock – we underclocked the CPU after all – but that’s only about 3.5% performance loss. Conversely, the CPU is now a good 10% faster at 4.2 GHz with Fmax than with truly static OC at 4.9 GHz! How can a static 4.9 GHz on all cores be 10% slower than 4.2 GHz in boost on all cores?

Now we can have some fun and use ECLK2 – the base clock that only controls the CPU cores – to boost the clock from the previous config so that we get back to 4.9 GHz and have a 1:1 comparison of the dynamic clock at 4.9 GHz and the static clock at 4.9 GHz. Of course, we now have to check the voltage manually, as the boost algorithm only requests voltage for 4.2 GHz. 1.25V at LLC5 as with the static OC is now present.

4.9 GHz – dynamic, Fmax -1000, ELCK2 116.5

And lo and behold, we are back at approx. 18.5 seconds in the y-cruncher. It is therefore not due to a hidden boost of individual cores that the CPU is so much faster with dynamically clocked cores than with statically clocked cores.

To summarize the tests up to this point: As soon as the CPU is statically overclocked, i.e. “All Core Clock” is set in the BIOS, approx. 14% performance is lost in the y-cruncher. That’s massive, but how come?

 

Kommentar

Lade neue Kommentare

RedF

Urgestein

5,272 Kommentare 3,069 Likes

Schön mal einen richtigen OC Artikel zu lesen : )

Antwort 4 Likes

RedF

Urgestein

5,272 Kommentare 3,069 Likes

Seit den neueren AGESAs ist AIDA inzwischen ja unbrauchbar (war immer schon nicht reproduzierbar genug), was Latenz Messung angeht. Was wohl an den Prefetchern liegt.

Kelutrel hat dazu im OCN einiges erhellendes geschrieben.

View image at the forums

View image at the forums

btw: Fürs Asrock B650 HDV gibt es mit der V3.15 jetzt LLC für CPU und SOC, vermute gleiches für dein Lightning.

Antwort 2 Likes

e
eastcoast_pete

Urgestein

2,216 Kommentare 1,415 Likes

@skullbringer : Interessanter Test und Artikel! Bei der ganzen Thematik "AVX512 und Arbeitstakt" kommen gleich die Erinnerungen an die Intel CPUs auf, die ja zT bis zu 50% runter takteten wenn ihre AVX512 Funktion aufgerufen wurde. Denn damit wurde es denen schon sehr warm ums Silizium Herz, und thermal Throttling wurde massiv getriggert. Damals haben sich viele Leute darüber echauffiert, allerdings waren Programme (wie Y Cruncher), die AVX512 einsetzen konnten, trotz des Runtertaktens damit immer noch mehr als doppelt so schnell als ohne AVX512.
In den Intel Prozessoren von damals ™ waren die Schaltungen für AVX2 und v.a. 512 in einem bestimmten Bereich des Kerns, und dort wurde es auch richtig heiß wenn AVX512 SIMDs liefen. Wundere mich jetzt, ob es möglich wäre, auch in den CCDs der 9800 X3D Ryzens die Hot Spots zu finden, die sich bei AVX512 Einsatz zeigen, oder ob es die in den Zen Chiplets so nicht gibt. Der Effekt des LN2 Modes suggeriert allerdings, daß AMD hier schon vorsichtshalber etwas auf die Bremse tritt, damit die CCD keinen Hitzeschlag kriegt. Nehme aber auch an, daß, trotz etwas drosseln, Programme wie Y Cruncher trotzdem noch deutlich schneller mit AVX512 laufen als ohne.

Antwort 2 Likes

Klicke zum Ausklappem
Shakj

Mitglied

19 Kommentare 19 Likes

Kann man das Asus-Board eigentlich auch über die Funktion "Per-Core Boost Clock Limit" dazu bringen, besser zu performen, wenn man da einen Wert (250,500,1000 weniger) direkt reinschreibt? Weil das ist ja so ein Asus-Ding, meine ich. MSI hatte das mal drin, flog aber irgendwann raus. Hatte das gesehen, weil ich das gesucht hatte und Fmax einem bei Dual CCDs nicht hilft, weil das beide parallel runterreißt, wenn man den Clock-CCD mit 200Mhz weniger versehen wollen würde.

Antwort Gefällt mir

s
scotch

Veteran

179 Kommentare 146 Likes

Also mal kurz für den Laien. Aktuell besser bei default Werten im Bios bleiben was den CPU Takt angeht?

Antwort Gefällt mir

skullbringer

Veteran

330 Kommentare 364 Likes

Leider nein, auch damit clock stretcht die CPU. Nur Fmax oder LN2 mode sind mir bisher als Workarounds bekannt.
Ganz bei default lassen oder eben mit Curve Optimizer / Offsets arbeiten. Solange die CPU fröhlich boosten kann, ist sie happy und performt korrekt.

Von statischem OC ist abzuraten, wenn man keine Performance verlieren oder den Fmax / LN2 mode Workaround nutzen möchte.

Antwort 3 Likes

B
Besterino

Urgestein

7,269 Kommentare 3,817 Likes

Finde ich ja eigentlich hübsch, dass man inzwischen wirklich nicht mehr Hand anlegen muss, um dem Optimum der CPU-Performance schon sehr nahe zu kommen.

Jetzt bitte das Gleiche nochfür RAM und ich muss eigentlich gar nix mehr manuell tunen... ;) Mir wär's recht (hab da wenig Spaß dran).

Graka mach' ich schon länger nicht mehr (Performance reicht) und bei meinem 13900KS war halt noch bisken was drin, wenn man manuell Hand anlegt. Ich hab's da aber auch nicht übertrieben, sondern meine CPU boostet nun halt bis 6.3GHz statt nur bis 6.0GHz. Theoretisch also auch nur ein Plus von 5% (best case).

Antwort 3 Likes

grimm

Urgestein

3,446 Kommentare 2,416 Likes

Das war schon mein Eindruck beim 5800X3D - wenn der gut gekühlt ist und seinen Max-Takt erreicht, fehlt es nicht an Leistung. Das ganze Gefrickel mit PBO und CO macht nix anderes (spart ggf. ein bisschen Strom) - ich hatte am Ende den Eindruck, dass ich eigentlich nur versuche, die CPU Voreinstellungen irgendwie nachzubauen und dabei 2-3° kühler zu bleiben bzw. 100-200 MHz mehr Takt zu erzielen.
Die einzigen manuellen Eingriffe, die verwertbare Resultate brachten, waren gezielte Optimierungen auf eine Anwendung (CB23, Gaming-Benchmarks) hin. Die haben aber an anderer Stelle nix gebracht oder sogar Fehler produziert.

Antwort 1 Like

e
exc0mmunicated

Mitglied

22 Kommentare 8 Likes

Herzlichen Dank für dieses Thema.
Nicht weniger interessant ist der aktuelle Umgang von DDR5 RAM, welcher "nur" XMP-zertifiziert ist, also keine EXPO-Profile inne hat.
Ich kann hier nur für die neusten Asus Mainboards sprechen. Seit dem letzten AGESA 1.2.0.2b refresh ist es nicht mehr möglich, non EXPO RAM z.B. mit 7200MT/s oder höher zu betreiben.
Auf Nachfrage hin, warum das jetzt so sei, wurde von safedisk darauf hingewiesen, dass dieses mit dem RAM, welcher "nur" XMP hat, eben so sei.
What?!
Mit dem vorletzten AGESA 1.2.0.2b refresh sowie allen älteren BIOS-Versionen war dieses bislang möglich.
Weder Asus noch AMD hat mir respektive sollte uns vorschreiben, den völlig überteuerten RAM mit EXPO-Profilen zu kaufen.
Leider weiß ich nicht, ob sich Asus oder AMD für diesen Weg nun entschieden haben.

Ein kurzes Wort zu Asus und Nitropath!
Ja ich bin mit meinem Strix X870E-E auf dieses Versprechen reingefallen. Die 8000MT/s schaffe ich auch mit einem X670E-E.
Dieses Versprechen von Asus, dass durch Nitropath bis zu 400MT/s mehr möglich sind, kann ich gelinde gesagt nicht nachvollziehen.
Das Board bootet zwar mit z.B. 8300MT/s, allerdings sind die Timings und Voltages fern ab von Gut und Böse. Naja und stabil ist es natürlich auch nicht. Bitte setzt bei mir vorraus, dass ich z.B Timings settings ect., Ahnung habe. Die Stunden mit Karhu, Y..., oder TM5 kann ich gar nicht mehr zählen.
Ich habe unzählige Einstellungen versucht und komme so langsam zu dem Schluss, dass Nitropath *#€©° ist!

Antwort 2 Likes

Klicke zum Ausklappem
RedF

Urgestein

5,272 Kommentare 3,069 Likes
c
carrera

Veteran

201 Kommentare 123 Likes

sehr interessanter Artikel. vielen Dank dafür

Antwort 1 Like

ApolloX

Urgestein

1,729 Kommentare 987 Likes

"Es kann doch nicht sein, dass hier mal eben per BIOS Update 12% Leistung verloren gehen."
Xaver, du bist doch ein alter Hase, du kennst das doch. Bis Update und Zack, CO oder RAM passen nicht mehr..

Diese Nussknacker-Workloads sind für einen 8-er 3D aber auch nicht der typische Anwendungsfall.

Mir fällt hier Mal wieder auf der mobilen Version auf, das die riesen breiten Balken und ganz kleine Schriftgrößen nicht zusammenpassen. Diagrammbeschriftungen kann ich nicht ablesen.

Aber: interessanter Artikel!

Antwort 1 Like

8j0ern

Urgestein

3,414 Kommentare 1,076 Likes

Bei Phoronix gibt es AVX 512 Werte vom Ryzen 7000: https://www.phoronix.com/review/amd-zen4-avx512/6

Laut ihm sind keine Probleme mit Takt und Temperatur zu erwarten.

Aber vielleicht arbeitet der Windows 11 Kernel etwas anders. ;)

Antwort Gefällt mir

skullbringer

Veteran

330 Kommentare 364 Likes

Naja, RAM läuft nicht mehr im XMP Profil stabil ist schon noch was anderes als: CPU performt out of the box 12 % schlechter.

Mit ganz viel Alufolie aufm Kopf könnte man auch behaupten, AMD hat die Leistung nur für die Reviews in der Launchzeit aufgedreht, und hinterher für die Langlebigkeit gedrosselt. :alien:

12%, das sind so Hausordnungen, wo man sich auch das Upgrade von der Vorgänger-CPU hätte sparen können.

Und danke für das Feedback bzgl. Mobile - da ist Luft nach oben! 🫡

Antwort 2 Likes

Alkbert

Urgestein

1,019 Kommentare 802 Likes

Mein 10980Xe taktet bei AVX 512 auf 2,2 Ghz runter und wird dennoch derartig heiß dabei, dass die AIO ihre liebe Mühe hat, das Teil unter 85°C zu halten.

Antwort 1 Like

8j0ern

Urgestein

3,414 Kommentare 1,076 Likes

Bei OCCT gibt es inzwischen auch AVX512 für den CPU StressTest, also ohne Leistungsangaben.

Da sind es bei mir knapp 50°C, das packt meine WaKü gerade noch. :cool:

View image at the forums

Antwort Gefällt mir

_
_roman_

Veteran

161 Kommentare 47 Likes

Man kann im netzwerklosen Modus mit einem geeigneten Betriebssystem AVX512 code ausführen und die Start und Endzeit aufzeichnen.
Je kürzer die Zeit umso besser. Meine Empfehlung den DRAM benutzen.

Ja - es ist keine Windows Binary Software. Aber es würde gewisse offene Fragen beantworten. Ich habe nicht jeden Absatz gelesen.

Mit der Zeitdifferenz kann man reproduzieren, ob ein ASUS Uefi Fix besser oder schlechter abschneidet.

Gleichzeitig meldet einem die Software dann zuverlaessigerweise crashes - als mit anderen üblicheren Betriebssysteme. Stichwort - unstable overclock.

Antwort 1 Like

Sephiroth Nikon

Mitglied

71 Kommentare 12 Likes

Vielen Dank für diesen klasse Artikel Xaver. (y) Ich habe den Artikel 2 mal gelesen, in Zukunft gern mehr. Das wird die CPU für mein neues System, leider konnte ich beim "ersten Verkauf" oder Leckerlies unter die Meute werfen, keinen ergattern.

Antwort 2 Likes

T
Tralien

Veteran

195 Kommentare 69 Likes

wie gehts hier weiter? oc mit dem neuen 9800x3d interessiert mich brennend....

Antwort Gefällt mir

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kannst Du per PayPal spenden.

About the author

Xaver Amberger (skullbringer)

Werbung

Werbung