CPU Latest news

AMD Ryzen 9 9950X3D spotted: Over 5.6 GHz boost clock and 128 MB L3 cache in CPU-Z leak

There are once again new details on the high-end AMD Ryzen 9 9950X3D processor with extended L3 cache. The AMD Ryzen 9 9950X3D was spotted as an engineering sample in the CPU-Z hardware database. The processor shows unchanged clock rates compared to the non-X3D variant, supplemented by additional L3 cache, which is realized with 3D-V cache technology. This article summarizes the most important technical details and innovations.

Clock rates and technical basis

According to the information available, the boost clock rate of the Ryzen 9 9950X3D remains unchanged at around 5.7 GHz. A screenshot from CPU-Z shows a measured clock rate of 5.65 GHz, but this is attributed to an engineering sample. The technical data indicates that the processor is based on the architecture of the Ryzen 9000 series, with the internal code name “Granite Ridge”. The Ryzen 9 9950X3D will be based on two Core Complex Dies (CCDs), each of which has eight cores with a dedicated L3 cache of 32 MB each. In addition, a chiplet with 64 MB L3 cache is integrated under one of the CCDs, which increases the total capacity to 128 MB L3 cache. Together with the L2 cache, this results in a total cache volume of 144 MB.

Source: 94G8LA via X

Energy consumption and architecture

The processor has a thermal power dissipation (TDP) of 170 watts, identical to that of the Ryzen 9 9950X. These TDP values are in line with other models in the Ryzen 9000 series. The placement of the additional cache chiplet below the CCD enables more efficient heat dissipation, as the cores have direct contact with the Integrated Heat Spreader (IHS). This favors the maintenance of clock rates under load and at the same time offers scope for possible overclocking.

Comparison with previous models

Unlike some of AMD’s previous X3D models, where base clock speeds were reduced in favor of the additional cache, there is no evidence of such an adjustment with the Ryzen 9 9950X3D. Core clock speeds remain on par with the non-X3D version, suggesting that AMD has placed an emphasis on the balance between performance and cache expansion. The additional L3 cache could be particularly beneficial in applications with high memory bandwidth requirements. This applies to both productive workloads and gaming, where the extended cache can ensure better data availability for the CPU cores.

Market launch and accompanying products

AMD plans to introduce the Ryzen 9 9950X3D together with the Ryzen 9 9900X3D, which is also based on 3D-V cache, at CES 2025. Both processors are expected to ship with a new chipset driver (version 1.0.0.7) that has been optimized for the use of advanced cache technology, and AMD is expected to unveil other products in addition to the processors, including the next generation of Radeon graphics cards based on the RDNA 4 architecture and the new version of FidelityFX Super Resolution technology (FSR 4). The AMD Ryzen 9 9950X3D is a technical evolution of the Ryzen 9000 series, without making any fundamental compromises in terms of clock speeds or energy efficiency. The integration of 3D V-Cache expands the application possibilities without compromising overall performance. Further details on availability, pricing and real-world testing are expected to be announced at CES 2025.

Source: 94G8LA via X

Kommentar

Lade neue Kommentare

e
eastcoast_pete

Urgestein

2,141 Kommentare 1,372 Likes

Irgendwie aber auch schade, daß es keinen X3D Cache unter beiden CCDs geben soll. Meine Vermutung: den gibt's dann nächstes Jahr als neues Topmodel.

Antwort Gefällt mir

NamaNatranius

Mitglied

61 Kommentare 24 Likes

Find auch auch schade hätte mir gern 16kern gekauft sollte der leak stimmen dann wirds bei mir leider nur 9800x3d werden. Wird die erste cpu seit 7 jahren die weniger als 10 kerne hat macht mich ein bischen traurig.

Antwort Gefällt mir

zuchti

Mitglied

20 Kommentare 8 Likes

bekommst du das so krass mit ? das du dann weniger kerne hast, weil habe von ein i9 11900kf zu 7800x3d gewechselt und merke kaum unterschied auser natührlich in der gaming leistung.

Antwort 1 Like

e
eastcoast_pete

Urgestein

2,141 Kommentare 1,372 Likes

Das (mögliche ) Problem bei den Ryzens mit mehr als 8 Kernen, also 2 CCDs - 1 CCD mit X3D, einer ohne - ist, daß man gerade Windoof manchmal mit der Nase darauf stoßen muß, ein Programm (Spiel) auf dem CCD mit X3D laufen zu lassen, und nicht auf einem der Kerne auf dem CCD ohne X3D. Bei den 8 und 6 Kernern gibt's ja nur 1 CCD, so daß Programme und OS bei dem 7800X3D, 9800 X3D usw erst gar keine Wahl haben, und immer Kern(e) auf dem CCD mit X3D benutzen müssen. Was man ja gerade in Spielen will. Wenn zB ein 9950 (16 Kerne in 2 CCDs) X3D unter jedem der zwei CCDs hätte, wär es dagegen egal, wo das OS ein Programm ausführen will.

Völliger Spekulatius meinerseits: So einen 2x X3D Zen5 16 Kerner wird AMD uU für HEDT und Workstations zurückhalten , also als entry level Threadripper (mit TR Preisen😜). Sind eben nicht nur Spiele, die durch extra Cache deutlich schneller und effizienter laufen können.

OT: bin gespannt, ob und wie Intel sowas ähnliches wie X3D in Panther Lake bringen wird. Intel ist hier im Zugzwang, und muss sich was einfallen lassen.

Antwort 2 Likes

Klicke zum Ausklappem
NamaNatranius

Mitglied

61 Kommentare 24 Likes

Laut disem Interview wird die nächsten jahre kein stackt chace kommen. Ob das wirklich so ist oder nicht wird sich zeigen.

Antwort Gefällt mir

zuchti

Mitglied

20 Kommentare 8 Likes
M
MGFirewater

Veteran

169 Kommentare 62 Likes

Naja aber Anwendungen die Kerne brauchen werden mit dem 9950 nicht mehr so ausgebremst wie bei den Vorgänger.

Im Endeffekt muss Windows steam und co nur wissen welche App max 8 x3d braucht und alle anderen Laufen mit identischen takt auf 32 Threads

Antwort 1 Like

Kevin Frickler

Mitglied

31 Kommentare 10 Likes

Die Aussage "Zusammen mit dem L2-Cache ergibt sich ein Cache-Gesamtvolumen von 144 MB" halte ich für etwas irreführend,
die beiden Caches L2 und L3 sind ja nicht additiv, sondern funktional gestapelt, erst L3, dann L2.
Außerdem ist L2 doch je Core - d.h. L2-Cache-Änderungen müssen an die anderen Cores signalisiert werden, das ist kein großer, zusammenhängender Cache.

Übrigens: die 2 x Cache-Dies würden vermutlich nur was bringen, wenn sie miteinander verbunden wären. Und das dürfte mit dem derzeitigen Chiplet-Design wohl eher nicht möglich sein. Somit kann ein Core des einen Chiplets nicht auf bereits im L3 befindliche Daten des anderen Chiplets zugreifen, sprich: die Daten müssten je nach Thread und Programm in beiden L3 Caches, also doppelt vorgehalten werden und damit auch oft doppelt aus dem RAM geladen werden.

Bei den Server-CPUs greifen dann ohnehin andere Mittel, die fahren auch nicht mit Windows 10, sondern mit Server-Betriebssystemen, die andere Scheduler haben. Manche Server sind ja NUMA, d.h. verschiedene Prozessoren greifen auf unterschiedlichen RAM zu, das dazu passende Scheduling bzw. Thread-Verteilung auf die jeweils zusammenpassenden Cores muss das Betriebsystem können. Bei Servern geht es um Anwendungen, Filesysteme und Datenbanken, die wohl eher ein anderes Thread-Verhalten als Feld/Wald/Wiesen-Games haben.

Antwort Gefällt mir

Klicke zum Ausklappem
8j0ern

Urgestein

3,276 Kommentare 1,039 Likes

@Kevin Frickler

Das hängt mit der Art der Hierarchie Zusammen, AMD nutzt schon sehr lange die Exclusive Policy.

Also die 144MB stimmen demnach.

Antwort Gefällt mir

Kevin Frickler

Mitglied

31 Kommentare 10 Likes

Lt anandtech ist zumindest Zen 2 nur L2->L3 non-inclusive.

Ich meine dennoch, aus Prozessorsicht darf ich nicht einfach L1+L2+L3 rechnen,
weil die L1+L2 ja letztlich nur von jeweils einem Core gesehen werden.
D.h. wenn ein Core eine RAM-Zelle in L1+L2 gelesen hat, haben die anderen Cores erstmal nix davon.
Ebenso dienen die 96 MB L3 ja nicht nur exklusiv einem, sondern acht oder zwölf Cores.

Und die 32+64=96 MB L3 des einen CCDs einfach mit den 32 MB L3 des anderen CCDs addieren,
dürfte ich eigentlich nur, wenn diese L3 Caches untereinander kommunizieren könnten.
Sonst muss nach einem RAM-Write des einen CCDs ein entsprechend vorhandener L3-Eintrag im anderen CCD
invalidiert und dort ggf. neu gelesen werden.

Aber vielleicht konzentriert man sich letztlich besser auf die Resultate,
wenn die Gurken offiziell angekündigt werden.

Antwort 1 Like

8j0ern

Urgestein

3,276 Kommentare 1,039 Likes

Ein Ausschnitt aus dem Zen5 White-paper:

Was verbinden die Infinity Fabrik Links nochmal ?

Antwort Gefällt mir

Kevin Frickler

Mitglied

31 Kommentare 10 Likes

Was soll mir das sagen ?

Die Infinity Fabric verbindet die CCDs mit dem IOD, nicht aber die Caches untereinander.
Sonst könnten bereits jetzt beide CCDs auf die gemeinsamen 96+32 MB L3 zugreifen.

Aus der von dir oben verlinkten Webseite entnehme ich:
If this causes a block to be evicted from L1, the evicted block is then placed into L2. This is the only way L2 gets populated.

Auf Ryzen L2-L3 bezogen: in den L3 eines CCD geht nur rein, was aus dem L2 eines Cores dieses CCDs rausfliegt.
Also nix mit "hintenrum über die Fabric in den L3 des anderen CCDs".

Ich bin nicht mal sicher, ob überhaupt die anderen Cores desselben CCDs auf L2->L3 overflow Daten
eines anderen Cores zugreifen dürfen, finde dazu aber nur nicht-AMD-spezifische Aussagen.

Die IF Taktrate liegt übrigens weit unterhalb den Cache-Taktraten, hier zwei Links:
Der Takt des Infinity Fabric liegt üblicherweise zwischen 1.600 und 1.800 MHz.
FCLK is typically far lower than L3 and core clocks.

Im zweiten Link kann man auch sehen, dass die CCDs nicht direkt miteinander verbunden sind,
sondern die CCDs jeweils nur mit der Fabric und..
Wenn die Cores der CCDs über dieses Konstrukt ihre Daten miteinander teilen wollten,
müssten diese ja zweimal übertragen werden (CCDx-Fabric-CCDy), das führt zu Latenzen.

So eine Inter-CCD Cache-Direktverbindung führt zu deftigem Overhead/Komplexität - und die Wege,
auch wenn es sich nur um Milli- oder Mikrometer handelt, sind auch zu berücksichtigen (Latenz).

Die machen ja schon bei der Signalisierung zwischen den CCDs Probleme, hier : Absatz "Kern-Latenzen",
dafür gab's schon einen AGESA Update, da reden wir aber über Prozessor-Signalisierung,
nicht über Cache-to-Cache-Verbindung, wo es um echte Datenmengen ginge.

Aber mal ehrlich, was soll das Bohei um die "möche-ich-haben" doppelten L3-Caches eigentlich ?
Ein Profi, der wirklich Anwendungen fährt, wird doch nicht etwa Spiele auf seine Workstation laden ?
Dann sollte das Finanzamt (und/oder eine eventuelle Geschäftsführung ;-) das aber nicht mitbekommen.

Und ein Gamer, der ab und an ein paar Videos erstellt ?
Sooo langsam sind die ?600X3D/?800X3D nu ja auch wieder nicht.

Antwort Gefällt mir

Klicke zum Ausklappem
8j0ern

Urgestein

3,276 Kommentare 1,039 Likes

Ich finde es schade, dass anandtech sich zu viel, selbst zusammen gereimt hat.

Hätte er mal bei AMD direkt Nachgefragt, oder deren Quellen genutzt. Wäre er evt. heute noch da, wo er war. ;)

Edit: Alle 3rd Party Tools bestätigen mir, alle Cache Level sind Unified.
Also alles addieren, oder der Diskussion fern bleiben !

Antwort Gefällt mir

Kevin Frickler

Mitglied

31 Kommentare 10 Likes

Alles addieren = Marketing. Dazu ist die Funktion der Caches m.E. zu komplex.
Mir selbst war es nur wichtig, die Funktion der Caches besser zu verstehen.

Schleierhaft ist mir allerdings, wie "3rd Party Tools" herausfinden sollen, wie die Hardware strukturiert ist.
Und was ist mit "alle Cache Level sind Unified" gemeint ? Dass alle - auch über Chiplets hinweg - verbunden sind ?
Das würde allen Dokumentationen widersprechen, wir reden nicht nur über Anandtech.
Die Diskussion ist aber ohnehin nicht zielführend - egal, wie der Cache ausgelegt ist,
entscheidend ist, was hinten rauskommt. Also abwarten und Tee trinken.

Der Leak selbst bringt im Grunde nix Neues: wenn man die seitherigen Prozessoren
7950X3D, 9700X, 9800X3D im Zusammenhang betrachtet, kann man sich die Struktur gut herleiten,
einen zweiten 3D-Cache wird es wohl nicht geben, dafür mehr Takt und OC für den 3D-Cache-CCX.
Vielleicht will AMD da zu den Server-Prozessoren (z.B. Genoa-X: je CCD 96 MB L3) differenzieren.

Jedenfalls falls der L3 als Overflow nur je Core-L2 verwendet würde und auch nur dieser jeweilige Core
die Daten wieder aus L3 in seinen L2 zurückbrächte, dann würde ein zweiter Cache-Die Sinn machen.
In dem Fall würde eine Verbindung der beiden L3-Caches auch keinen Sinn machen.
Aber das kann AMD wohl am Besten beurteilen.

Antwort Gefällt mir

Klicke zum Ausklappem
D
Denniss

Urgestein

1,677 Kommentare 636 Likes

L1/L2 ist nur für die jeweiligen Kerne verfügbar, der L3 ist für alle Kerne des jeweiligen CCX verfügbar. Ich meine aber das es ein L3 Cache-snooping gib d.h. Kerne eines anderen CCX/CCD können schauen ob dort für sie relevante Daten verfügbar sind. Sehr wahrscheinlich ist auf den fremden L3 aber nur ein lesender Zugriff möglich.

Antwort Gefällt mir

Kevin Frickler

Mitglied

31 Kommentare 10 Likes

Hab bei dem Sauwetter heute mal länger recherchiert, es gibt allerdings keine belastbaren Aussagen und viel Widersprüchliches.
Könnte auch mit dem Zen-Unterschied Server (Genoa/Epyc) vs. Desktop (Ryzen) zu tun haben.

Jedenfalls hat wohl AMD vor einigen Jahren ein Patent für ein Directory-based Cachemanagement eingereicht.
Anscheinend fahren die zwischen den Prozessoren keinen echten Snoop, sondern ein Directory je Node (Chiplet ?).
Die Cachedaten werden schon zwischen den Nodes/Cores ausgetauscht, ich nehm auch an, dass es für I/O-DMA ein Snooping gibt
(die Cores müssen ja erkennen, ob ein DMA-Controller den Speicher geändert hat).

Wenn das zitierte Patent wirklich in den Zen-CPUs implementiert wurde, tauschen die Nodes untereinander (L3) Cache-Inhalte aus.
Das Patent bringt lt. AMD Optimierungen bzgl. der Node-Kommunikation, indem wohl nach meinem Verständnis
der Owner einer Cache-Line (bin dabei über MOESI gestolpert) immer "hart" wechselt
(um die Bilder im o.g. Patent zu verstehen, muss man im PDF die Seite 9 rechts lesen).

Jedenfalls ist die Sache an sich recht geheimnisvoll und ich bin froh,
dass meine Ryzens auch ohne mein Zutun fröhlich und ohne Murren und Knurren arbeiten.

View image at the forums

Antwort 1 Like

Klicke zum Ausklappem
zuchti

Mitglied

20 Kommentare 8 Likes

komm bis montag können wir doch abwarten da wissen wir mehr :) die werden bestimmt was dazu sagen.

Antwort 1 Like

8j0ern

Urgestein

3,276 Kommentare 1,039 Likes

Ich habe die Infos von der offiziellen AMD Seite und wenn du mal nach schaust was ein White Paper ist, sollte dir bekannt sein, dass es sich hierbei nicht um Marketing handelt!

Mit einer Sache hast du aber recht, das Thema Cache-Coherent ist ein sehr Komplexe Angelegenheit.
Weshalb sich meiner Meinung nach auch nur Leute damit auseinander setzen sollten, die in der Materie sind.
Da sonst schnell Missverständnisse aufkommen. ;)

Edit: Ein interessanter Link m.M.n. http://lastweek.io/notes/cache_coherence/

Antwort Gefällt mir

Kevin Frickler

Mitglied

31 Kommentare 10 Likes

Das sind die Links zwischen CCD und IO-Die. Was hat das mit Cache zu tun ?

Bei CXL geht es nach meinem Verständnis um das Erweitern des RAM mit anderen Medien (SSD), siehe hier und hier und hier

Das hatte ich nicht gewusst. Wie der Austausch von Cache-Daten zwischen den Nodes und Cores bei AMD abläuft, geht aus deren Patentdokumenten vor , dieses Prinzip wurde wohl in der Zen-Architektur implementiert.

Das bedeutet aber nicht, dass ein Core direkt auf den Cache eines anderen Dies zugreifen kann, vielmehr bekommt er die Daten über die Links (Latenz !). Ein Direktzugriff eines Core auf den L3 eines anderen Core würde auch dem von dir genannten non-inclusive widersprechen.

Schade, dass du so denkst, sonst hätte ich dir noch folgende Lektüre empfohlen: Kap. 3, 6, 7 (aus 2022, behandelt zwar Zen 3 EPYC Server Prozessoren, ich nehm aber an, das Prinzip wird auch in Zen 4/5 verwendet, da finde ich nirgends, dass sich da etwas signifikant geändert hätte).

Antwort Gefällt mir

Klicke zum Ausklappem

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kannst Du per PayPal spenden.

About the author

Samir Bashir

Werbung

Werbung