CPU Editor's Desk Practice System

AVX512 throttling, clock stretching or something else entirely?! – 9800X3D with up to 35% less performance at the same clock | Investigative

Static overclocking of CPUs has been a thing of the past, inefficient and literally uncool, and not just since yesterday. Instead, dynamic OCs as an optimization of the boost behavior ex works are often the method of choice nowadays. Not least because AMD had completely deactivated static overclocking in the past with X3D CPUs especially popular for gaming. With the 9800X3D, however, the age-old all-core OC was released again, not least because thermal limitations were solved by shifting cores and cache silicon layers.

Actually, today was supposed to be about a 9800X3D tuning guide, including RAM OC, Infinity Fabric and co (CO). But while testing for it, I unfortunately came across a bug that may not be a bug at all, but should definitely be examined more closely – at least in my opinion. It’s about a considerable loss of performance in demanding computing tasks with high power consumption and AVX512, such as y-cruncher. For most use cases of a 9800X3D this is probably of little relevance, but with the upcoming 12- and 16-core 9000X3D chips and workstation use cases, things could soon look very different.

Test setup and methodology

As a benchmark, I use y-cruncher with preset 1b, version 0.8.5 from Benchmate 12.1.0. You can optimize various parameters here to speed up the calculation, but for most tests I don’t bother here, because the aim is to compare the different CPU overclocks. For workload, “Intel Cannon Lake (AVX512)” is selected, which is optimized for AVX512 and will become interesting later, and the priority is set to “Realtime” for the most constant results possible. Three runs are carried out for each configuration and the best result is used. Incidentally, HWinfo runs in the background during all tests, which affects performance. If you want to reproduce the results, please bear this in mind.

The main motherboard used is the Asus Crosshair X670E Gene, but the behavior can also be reproduced with other motherboards. More on this later. For the RAM, I use DDR5-6000 with manually fixed timings (also subtimings) for the sake of simplicity, see screenshots. The FCLK runs at 2100 MHz. Every board and every CPU can do this and so we control these variables.

Ryzen 9 7950X as reference

Before we put the Ryzen 7 9800X3D through its paces, I would like to establish a baseline first. A non-X3D chip is used for this, in this case a Ryzen 9 7950X. We simply run this CPU through the y-cruncher with standard clock settings and note the result. We then configure the same all-core clock statically and compare the results. The RAM and FCLK settings are slightly different here, but that doesn’t matter because we are only interested in the difference in performance between the dynamic and static clock.

Out of the box, the cores of the 7950X clock to approx. 5.4 GHz on the first CCD and 5.2 GHz on the second CCD, i.e. around 5.3 GHz on average. In y-cruncher 1b, the 16-core Raphael CPU then needs approx. 14.1 seconds.

If we statically overclock the CPU to 5.3 GHz on all cores (with 1.35 V at LLC5), the CPU performs roughly the same at just under 14 seconds. The difference is probably due to the slightly different clock rate compared to stock. Same clock – same performance. This is not rocket science and is actually completely self-evident, but I wanted to prove this in advance before we descend into the strange clock abysses of the 9800X3D.

 

Kommentar

Lade neue Kommentare

RedF

Urgestein

5,253 Kommentare 3,051 Likes

Schön mal einen richtigen OC Artikel zu lesen : )

Antwort 4 Likes

RedF

Urgestein

5,253 Kommentare 3,051 Likes

Seit den neueren AGESAs ist AIDA inzwischen ja unbrauchbar (war immer schon nicht reproduzierbar genug), was Latenz Messung angeht. Was wohl an den Prefetchern liegt.

Kelutrel hat dazu im OCN einiges erhellendes geschrieben.

View image at the forums

View image at the forums

btw: Fürs Asrock B650 HDV gibt es mit der V3.15 jetzt LLC für CPU und SOC, vermute gleiches für dein Lightning.

Antwort 2 Likes

e
eastcoast_pete

Urgestein

2,149 Kommentare 1,376 Likes

@skullbringer : Interessanter Test und Artikel! Bei der ganzen Thematik "AVX512 und Arbeitstakt" kommen gleich die Erinnerungen an die Intel CPUs auf, die ja zT bis zu 50% runter takteten wenn ihre AVX512 Funktion aufgerufen wurde. Denn damit wurde es denen schon sehr warm ums Silizium Herz, und thermal Throttling wurde massiv getriggert. Damals haben sich viele Leute darüber echauffiert, allerdings waren Programme (wie Y Cruncher), die AVX512 einsetzen konnten, trotz des Runtertaktens damit immer noch mehr als doppelt so schnell als ohne AVX512.
In den Intel Prozessoren von damals ™ waren die Schaltungen für AVX2 und v.a. 512 in einem bestimmten Bereich des Kerns, und dort wurde es auch richtig heiß wenn AVX512 SIMDs liefen. Wundere mich jetzt, ob es möglich wäre, auch in den CCDs der 9800 X3D Ryzens die Hot Spots zu finden, die sich bei AVX512 Einsatz zeigen, oder ob es die in den Zen Chiplets so nicht gibt. Der Effekt des LN2 Modes suggeriert allerdings, daß AMD hier schon vorsichtshalber etwas auf die Bremse tritt, damit die CCD keinen Hitzeschlag kriegt. Nehme aber auch an, daß, trotz etwas drosseln, Programme wie Y Cruncher trotzdem noch deutlich schneller mit AVX512 laufen als ohne.

Antwort 2 Likes

Klicke zum Ausklappem
Shakj

Mitglied

19 Kommentare 19 Likes

Kann man das Asus-Board eigentlich auch über die Funktion "Per-Core Boost Clock Limit" dazu bringen, besser zu performen, wenn man da einen Wert (250,500,1000 weniger) direkt reinschreibt? Weil das ist ja so ein Asus-Ding, meine ich. MSI hatte das mal drin, flog aber irgendwann raus. Hatte das gesehen, weil ich das gesucht hatte und Fmax einem bei Dual CCDs nicht hilft, weil das beide parallel runterreißt, wenn man den Clock-CCD mit 200Mhz weniger versehen wollen würde.

Antwort Gefällt mir

s
scotch

Veteran

174 Kommentare 119 Likes

Also mal kurz für den Laien. Aktuell besser bei default Werten im Bios bleiben was den CPU Takt angeht?

Antwort Gefällt mir

skullbringer

Veteran

330 Kommentare 364 Likes

Leider nein, auch damit clock stretcht die CPU. Nur Fmax oder LN2 mode sind mir bisher als Workarounds bekannt.
Ganz bei default lassen oder eben mit Curve Optimizer / Offsets arbeiten. Solange die CPU fröhlich boosten kann, ist sie happy und performt korrekt.

Von statischem OC ist abzuraten, wenn man keine Performance verlieren oder den Fmax / LN2 mode Workaround nutzen möchte.

Antwort 3 Likes

B
Besterino

Urgestein

7,180 Kommentare 3,746 Likes

Finde ich ja eigentlich hübsch, dass man inzwischen wirklich nicht mehr Hand anlegen muss, um dem Optimum der CPU-Performance schon sehr nahe zu kommen.

Jetzt bitte das Gleiche nochfür RAM und ich muss eigentlich gar nix mehr manuell tunen... ;) Mir wär's recht (hab da wenig Spaß dran).

Graka mach' ich schon länger nicht mehr (Performance reicht) und bei meinem 13900KS war halt noch bisken was drin, wenn man manuell Hand anlegt. Ich hab's da aber auch nicht übertrieben, sondern meine CPU boostet nun halt bis 6.3GHz statt nur bis 6.0GHz. Theoretisch also auch nur ein Plus von 5% (best case).

Antwort 3 Likes

grimm

Urgestein

3,375 Kommentare 2,307 Likes

Das war schon mein Eindruck beim 5800X3D - wenn der gut gekühlt ist und seinen Max-Takt erreicht, fehlt es nicht an Leistung. Das ganze Gefrickel mit PBO und CO macht nix anderes (spart ggf. ein bisschen Strom) - ich hatte am Ende den Eindruck, dass ich eigentlich nur versuche, die CPU Voreinstellungen irgendwie nachzubauen und dabei 2-3° kühler zu bleiben bzw. 100-200 MHz mehr Takt zu erzielen.
Die einzigen manuellen Eingriffe, die verwertbare Resultate brachten, waren gezielte Optimierungen auf eine Anwendung (CB23, Gaming-Benchmarks) hin. Die haben aber an anderer Stelle nix gebracht oder sogar Fehler produziert.

Antwort 1 Like

e
exc0mmunicated

Mitglied

21 Kommentare 8 Likes

Herzlichen Dank für dieses Thema.
Nicht weniger interessant ist der aktuelle Umgang von DDR5 RAM, welcher "nur" XMP-zertifiziert ist, also keine EXPO-Profile inne hat.
Ich kann hier nur für die neusten Asus Mainboards sprechen. Seit dem letzten AGESA 1.2.0.2b refresh ist es nicht mehr möglich, non EXPO RAM z.B. mit 7200MT/s oder höher zu betreiben.
Auf Nachfrage hin, warum das jetzt so sei, wurde von safedisk darauf hingewiesen, dass dieses mit dem RAM, welcher "nur" XMP hat, eben so sei.
What?!
Mit dem vorletzten AGESA 1.2.0.2b refresh sowie allen älteren BIOS-Versionen war dieses bislang möglich.
Weder Asus noch AMD hat mir respektive sollte uns vorschreiben, den völlig überteuerten RAM mit EXPO-Profilen zu kaufen.
Leider weiß ich nicht, ob sich Asus oder AMD für diesen Weg nun entschieden haben.

Ein kurzes Wort zu Asus und Nitropath!
Ja ich bin mit meinem Strix X870E-E auf dieses Versprechen reingefallen. Die 8000MT/s schaffe ich auch mit einem X670E-E.
Dieses Versprechen von Asus, dass durch Nitropath bis zu 400MT/s mehr möglich sind, kann ich gelinde gesagt nicht nachvollziehen.
Das Board bootet zwar mit z.B. 8300MT/s, allerdings sind die Timings und Voltages fern ab von Gut und Böse. Naja und stabil ist es natürlich auch nicht. Bitte setzt bei mir vorraus, dass ich z.B Timings settings ect., Ahnung habe. Die Stunden mit Karhu, Y..., oder TM5 kann ich gar nicht mehr zählen.
Ich habe unzählige Einstellungen versucht und komme so langsam zu dem Schluss, dass Nitropath *#€©° ist!

Antwort 2 Likes

Klicke zum Ausklappem
RedF

Urgestein

5,253 Kommentare 3,051 Likes
c
carrera

Veteran

192 Kommentare 114 Likes

sehr interessanter Artikel. vielen Dank dafür

Antwort 1 Like

ApolloX

Urgestein

1,718 Kommentare 979 Likes

"Es kann doch nicht sein, dass hier mal eben per BIOS Update 12% Leistung verloren gehen."
Xaver, du bist doch ein alter Hase, du kennst das doch. Bis Update und Zack, CO oder RAM passen nicht mehr..

Diese Nussknacker-Workloads sind für einen 8-er 3D aber auch nicht der typische Anwendungsfall.

Mir fällt hier Mal wieder auf der mobilen Version auf, das die riesen breiten Balken und ganz kleine Schriftgrößen nicht zusammenpassen. Diagrammbeschriftungen kann ich nicht ablesen.

Aber: interessanter Artikel!

Antwort 1 Like

8j0ern

Urgestein

3,279 Kommentare 1,042 Likes

Bei Phoronix gibt es AVX 512 Werte vom Ryzen 7000: https://www.phoronix.com/review/amd-zen4-avx512/6

Laut ihm sind keine Probleme mit Takt und Temperatur zu erwarten.

Aber vielleicht arbeitet der Windows 11 Kernel etwas anders. ;)

Antwort Gefällt mir

skullbringer

Veteran

330 Kommentare 364 Likes

Naja, RAM läuft nicht mehr im XMP Profil stabil ist schon noch was anderes als: CPU performt out of the box 12 % schlechter.

Mit ganz viel Alufolie aufm Kopf könnte man auch behaupten, AMD hat die Leistung nur für die Reviews in der Launchzeit aufgedreht, und hinterher für die Langlebigkeit gedrosselt. :alien:

12%, das sind so Hausordnungen, wo man sich auch das Upgrade von der Vorgänger-CPU hätte sparen können.

Und danke für das Feedback bzgl. Mobile - da ist Luft nach oben! 🫡

Antwort 2 Likes

Alkbert

Urgestein

1,000 Kommentare 782 Likes

Mein 10980Xe taktet bei AVX 512 auf 2,2 Ghz runter und wird dennoch derartig heiß dabei, dass die AIO ihre liebe Mühe hat, das Teil unter 85°C zu halten.

Antwort 1 Like

8j0ern

Urgestein

3,279 Kommentare 1,042 Likes

Bei OCCT gibt es inzwischen auch AVX512 für den CPU StressTest, also ohne Leistungsangaben.

Da sind es bei mir knapp 50°C, das packt meine WaKü gerade noch. :cool:

View image at the forums

Antwort Gefällt mir

_
_roman_

Veteran

148 Kommentare 37 Likes

Man kann im netzwerklosen Modus mit einem geeigneten Betriebssystem AVX512 code ausführen und die Start und Endzeit aufzeichnen.
Je kürzer die Zeit umso besser. Meine Empfehlung den DRAM benutzen.

Ja - es ist keine Windows Binary Software. Aber es würde gewisse offene Fragen beantworten. Ich habe nicht jeden Absatz gelesen.

Mit der Zeitdifferenz kann man reproduzieren, ob ein ASUS Uefi Fix besser oder schlechter abschneidet.

Gleichzeitig meldet einem die Software dann zuverlaessigerweise crashes - als mit anderen üblicheren Betriebssysteme. Stichwort - unstable overclock.

Antwort 1 Like

Sephiroth Nikon

Mitglied

65 Kommentare 10 Likes

Vielen Dank für diesen klasse Artikel Xaver. (y) Ich habe den Artikel 2 mal gelesen, in Zukunft gern mehr. Das wird die CPU für mein neues System, leider konnte ich beim "ersten Verkauf" oder Leckerlies unter die Meute werfen, keinen ergattern.

Antwort 2 Likes

T
Tralien

Veteran

162 Kommentare 57 Likes

wie gehts hier weiter? oc mit dem neuen 9800x3d interessiert mich brennend....

Antwort Gefällt mir

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kannst Du per PayPal spenden.

About the author

Xaver Amberger (skullbringer)

Werbung

Werbung