CPU Latest news

AMD Ryzen 9 7950X3D spotted on Geekbench with similar single-core performance as 7950X

The AMD Ryzen 9 7950X3D is the upcoming 16-core/32-thread processor that comes with 64 MB of 3D V-cache. This is the flagship Ryzen CPU for the AM5 socket, which is scheduled for release later this month.

Source: WccfTech

The processor was tested on the ASUS X670E Hero motherboard and together with 32 GB of DDR5 memory with unknown speed. The Geekbench data shows that the CPU was clocked at 5.1 to 5.68 GHz throughout the benchmark.

Source: Geekbench

The X3D series was not expected to show its strength in synthetic benchmarks like Geekbench. This was already known since the 5800X3D SKU with Zen3 architecture was just as fast as the 5800X in such tests. The advantages of the increased cache will rather show up in gaming workloads, which Geekbnech simply does not test. However, the 7950X3D scores 2157 points in the single-core test and 21841 points in the multi-core test, just for clarification. This is the V5 version of Geekbench, so the results may be different with the updated software.

Source: Geekbench

In the multi-core test, these results are 5% worse than those of the 7950X and less than 2% in the single-core test. It should be noted that the average value of the 7950X is based on many results, while the 7950X3D is only from one run. Therefore, these results are not comparable. Furthermore, we don’t know anything about the memory specifications or whether the latest BIOS was used. What is clear from these tests is that the AMD Ryzen 7000X3D series is now available for testers and we should be hearing more about these CPUs very soon, hopefully with more gaming performance data as well.

The 7950X3D has also been spotted on the Sisoftware Sandra and Blender websites:

 

 

Source: Geekbench via @BenchLeaks

Kommentar

Lade neue Kommentare

D
Das_B

Mitglied

11 Kommentare 3 Likes

So fehlt nur noch die Info, auf welchem CCX denn der Single-Core-Score ermittelt wurde? Auf dem mit dem Extra-Cache, dafür jedoch weniger Takt oder dem anderen? Wenn ihr dann hoffentlich bald die X3D Modelle zum testen da habt, schaut bitte ob das CCX ohne Extra-Cache deaktiviert werden kann und macht damit auch ein paar Testläufe. Sollte dann ja quasi ziemlich 1:1 die (Gaming)Leistung des 7800X3D darstellen.

Antwort Gefällt mir

Hagal77

Veteran

148 Kommentare 89 Likes

Nun, sollte wie zu Befürchten der 12 Core im 6+6 design daherkommen, wird das Ding die totale Gurke, zu dem muss wieder der Sheduler angepasst werden. Der wird dann schlechter Performen als der 8+0 7800.

Wenn AMD was hätte richtig machen wollen, hätten die beiden CCX 3D Cache gegönnt, so wird das nix werden und ich werde einen 50% X3D so wieso auf keinen Fall kaufen. inkl. der frechen 'Preise für AM5 ist diese Generation damit für mich Unkaufbar, Geld wäre genug da, aber seh ich gar nicht ein!

mfg

Antwort Gefällt mir

Locutos

Mitglied

20 Kommentare 14 Likes

Ich warte noch auf den 7960DoubleX3D, der hoffentlich im Oktober erscheinen wird....:coffee:

Antwort 3 Likes

K
KalleWirsch

Veteran

192 Kommentare 94 Likes

Hmm, wusste nicht das nur ein CCX den extra Cache hat. Das ist dann tatsächlich nur halb gut.

Antwort 1 Like

a
abufrejoval

Mitglied

14 Kommentare 15 Likes

Na das sollte wohl ziemlich klar sein, daß das auf dem CCD ohne V-Cache laufen wird, nur der kann analog zum 7950X hochtakten.

Der V-Cache CCD könnte genauso wie der "normale" CCD trotzdem noch ein etwas besseres Bin als ein 7800X3D (bzw. 7800X für den cache-losen) sein, weil das nötig ist, um SoCs mit zwei CCDs in das gemeinsame Hitzebudget zu zwängen. Aber ja, sonst dürften sich die beiden, je nachdem welche Seite man abschaltet, wie der analoge "kleine Bruder" verhalten.

Für die Multithread-Leistung müssen dann beide CCDs eh auf Frequenzen heruntertakten, die unterhalb des Bereiches sind, wo die V-Cache-Variante drosseln müßte und entsprechend sind da ziemlich vergleichbare Werte zu erwarten.

Diese beiden CCDs miteinander zu kombinieren ist schon ein genialer Schachzug, aber irgendwie scheint bei der Presse noch nicht durchgedrungen zu sein, daß man die hohen Turbos und den großen Cache nie gleichzeitig bekommen kann, sondern nur über die Auswahl des entsprechenden CCDs entscheidet, welche der beiden Qualitäten man ausnutzen möchte. Das wird noch einiges Geschrei geben, wenn die Leute das endlich kapieren. Und ziemlich sicher wird es einen "7960X3D" o.ä. mit 2 V-Cache CCDs nicht geben, weil vielleicht 2 Leute auf dem Planeten dafür eine passende Workload besitzen und diese greifen dann wohl eher zum EPYC.

Das größte Problem dürfte die Software dafür sein, denn ein klassischer OS-Scheduler sollte kaum beurteilen können, welche Workload auf welchen CCD gehört. Und je nachdem wie gut das gemacht wurde, dürfte sich das Geschrei dann noch einmal vervielfachen, während Intel massiv mit seinem Thread-Director trommeln wird.

Trotzdem ist gerade der 7950X3D für Leute sehr interessant, die verstehen, was sie da kaufen. Denn er ermöglicht zum einen die hohe Einzelprozessortakte für skalare oder schwach parallele Lasten, kann zum anderen aber auch Spiele mit schwächerer Lokalität über die dicken Caches glätten, jedenfalls solange die noch nicht mehr als 8 Kerne auslasten können. Und wenn dann doch alle 8 Kerne mal voll ausgelastet werden, muß man sich eh mit weit geringeren Taktraten zufriedengeben.

Knapp sechs GHz auf 16 CMOS Kernen kann nichts und niemand mit der aktuellen Technik wegkühlen und kann es entsprechend auch nicht geben. Hier kann man eben quasi alle mögliche Kompromisvarianten mit einem SoC durchspielen und das hat was, selbst wenn es wohl kaum jemals für irgendeinen Anwender wirklich kritisch sein wird.

Antwort 2 Likes

Klicke zum Ausklappem
a
abufrejoval

Mitglied

14 Kommentare 15 Likes

Ja, das könnte man denken. Aber tatsächlich ist es genau so eigentlich ideal bzw. nicht wirklich verbesserbar.

Denn man findet Arbeitslasten, welche vom zusätzlichen Cache profitieren und Arbeitslasten, welche die von den hohen Taktraten profitieren. Beides zusammen auf einem Kern ist physikalisch unmöglich, genauso wie voller Takt auf allen Kernen.

Solange keine Arbeitslast mehr als 8 Kerne braucht, können sie sich je nach Cache- oder Taktpräferenz verteilen. Geht man tatsächlich auf mehr Kerne, müssen alle heruntertakten, weil man sonst das Hitzebudget sprengt.

Mit der Kombination kann man also für real existierende Anwendungen jeweils optimale Verteilungen ermitteln und nutzen, nur der Aufwand, welcher für diese Entscheidung nötig ist, dürfte manchen Anwender überfordern. Und leider werden die dann meist schnell laut--natürlich völlig zu unrecht.

Antwort 2 Likes

K
KalleWirsch

Veteran

192 Kommentare 94 Likes

Ich hab mir gerade mal die Specs vom 7950X3d angeschaut, 128MB L3 Cache, doppelt so groß wie beim normalen 7950X.
Ich denke das ist der wahre Vorteil. ob dahinter noch mal 64MB 3D Cache hinter hängen. Ich weiß nicht ob das mehr Marketing Gimick oder wirkliche Verbesserung ist.
Nehmen wir an es ist nur ein Marketing Gimmick, bleibt der doppelte L3 Cache. Bringt es tatsächlich was, dann hat man auf einem CCX quasi noch mal 64MB extra. Ich stell mir das schwierig vor Zu entscheiden was wie/wo gecached wird.

Da frage ich mich: Ist der 3d Cache eine Art L4 Cache, oder eine Art L2.5 Cache oder eine Art Aushilfs-L3-Cache. Oder ist das im Prinzip so das ein CCX ein Performance CCX ist mit 3 Fach Cache (inkl 3D) und dann auch noch den kompletten L3 Cache oben drauf bekommt? Und im Multi-Core hat man dann halt "nur" doppelt L3-Cache und der 3D-Cache spielt keine große Rolle?
Weiss da jemand Details?

Antwort Gefällt mir

a
abufrejoval

Mitglied

14 Kommentare 15 Likes

Zunächst einmal: Die CCX gibt es bei Zen 3 nicht mehr, wo Zen 2 noch zwei CCX (2x4 Kerne) in einem CCD (core compute die) hatte, ist bei Zen3 und Zen4 pro CCD nur ein CCX vorhanden: Die einzelnen Chiplets sind quasi monolithische 8-Kerner.

Beim 7950X3D ist einer der CCDs analog zu einem 5800X aufgebaut, also ganz normal 32MB L3-Cache. Der andere ist analog zum 5800X3D, wo der L3-Cache über einen "aufgeklebten" Chip von 32MB um 64MB auf 96MB erweitert wurde. Zusammen mit den 32MB L3 vom ersten CCD gibt das 128MB L3, aber eben 32/96MB auf die beiden CCDs verteilt. Und der CCD mit der aufgeklebten Cache-Erweiterung wird beim Takt gegenüber dem normalen CCD eingebremst, weil der Cache zum eine natürlich selbst Strom braucht (6 oder 8 CMOS Transistoren pro Bit) und zum anderen die Kühlung des darunter liegenden CCD verschlechtert.

Das "aufkleben" geschieht über "TSV" oder through silicon vias die bereits auf allen CCDs seit Zen3 vorhanden sind und aber nur bei den 3D Chips mit den 64MB SRAM Chips zu einem gesamten 96MB L3 Cache verbunden sind. Das ist kein separates Cache Layer, sondern tatsächlich einfach ein entsprechend größerer Cache, der nicht einmal große Timing-Unterschiede haben soll. Wie genau die TSVs miteinander verbunden werden weiß außerhalb von TSMC wohl keiner so ganz genau, aber es ist letztendlich eine Kupfer-zu-Kupfer Verbindung ähnlich wie zwischen verschiedenen Schichten innerhalb des Chips auch, vergleichbar schnell, vergleichbare Ströme und Kapazitanz und mit einer hohen Kontaktdichte.

Zugriffe auf den L3 Cache des anderen CCD sind zwar möglich, genau wie auf die immerhin 8 CCDs von einem EPYC Chip, aber dabei muß über den Infinity Fabric und den IOD gegangen werden, was sicher immer noch deutlich schneller als DRAM sein sollte, aber deutlich langsamer als der lokale L3. Die 16 Kerne in einem Desktop SoC mit 2 CCDs oder die bis zu 64 Kerne in einem EPYC (96 bei Genoa) verhalten sich nicht mehr monolithisch.

Ob der große L3 Cache bei einer Arbeitslast überhaupt einen Vorteil bringt, hängt halt davon ab, was da gerechnet wird. Die Lokalität bei Code ist häufig so groß, daß der die meiste Zeit vollständig aus den Caches heraus laufen kann. Und wenn es bei den Daten nicht viel anders ist, oder diese im Gegenteil eine richtig miese Lokalität haben, wird man kaum einen Unterschied bemerken. Aber manche Workloads im HPC Umfeld profitieren vehement von genau diesen 64MB extra L3, daß sich spezifische EPYC Chips mit nur 3D CCDs lohnen. Und bei Spielen hat AMD offensichtlich ebenfalls genügend Fälle ermittelt, wo der 3D Cache die Leistung mehr glättet als höhere Taktraten. Und in diesen Situationen kann man mit dem 7950X3D sozusagen fliegend zwischen einem 7800X und einem 7800X3D wechseln, da die wenigsten Spiele 8 Kerne voll auslasten. Und selbst bei 8 voll belasteten Kernen dürften die Taktraten bereits so weit sinken, daß der Taktnachteil der 3D Variante eine immer geringere Rolle spielt, wenngleich sie bei Volllast auf allen Kernen möglicherweise immer noch ein kleines bißchen langsamer takten mögen, als die Kerne im normalen CCD: Die zusätzliche Hitzequelle verschwindet ja nicht.

Und ja, die Entscheidung was auf welchem CCD läuft, dürfte schwierig werden, zumal sich der Nutzen des extra Caches ja je nach Anwendung oder auch Spielszene ändern kann. Da sehe ich noch eine riesige Menge schlechter Presse auf uns zurollen, auch wenn der Ansatz eigentlich sehr smart ist.

Antwort 2 Likes

Klicke zum Ausklappem
Hagal77

Veteran

148 Kommentare 89 Likes

Immer diese Totschlagargumente, brauchen nur zwei Leute auf den Planeten.
Was ich oder anderen brauchen oder wollen das Überlasse mal schön uns selbst!;)

Es gibt sehr wohl Spiele und Programme die mehr wie 8 Kerne nutzen und auch von Cache profitieren. In dem Fall würde eine Dual 3D Cache natürlich etwas bewirken.

Nächster Punkt CCD/CCX föllig Latte Schlaubi, der Punkt ist, sollte es 6+6 sein macht es keinen Sinn den 7900X ztu kaufen, dann macht nur der 7800X3D oder 7950X3D noch Sinn.

Letzter Punkt, Whitelist/Sheduler, es gab und gibt immer wieder Probleme das von Windows die Workloads richtig zugeordnet werden.
Warum sollte dass dieses mal anders sein. Das werden wir ja sehen, wenn Sie raus sind.

Es geht am Ende nur darum dass wieder vieles im Raum steht und wenn nur Teilweise was davon eintritt, wird es echt ärgerlich.

mfg

Antwort Gefällt mir

B
Besterino

Urgestein

7,128 Kommentare 3,699 Likes

Naja, bei Intel heißt das halt P und E-Kerne. :D

je komplexer das Silikon, desto wichtiger wird dazu passende Software. :(

Antwort 2 Likes

e
eastcoast_pete

Urgestein

1,992 Kommentare 1,251 Likes

Da kommt es jetzt wohl sehr darauf an, wie gut oder schlecht AMD und Microsoft zusammenarbeiten bzw zusammen vorgearbeitet haben, um die Zuweisung von Arbeitslasten so zu machen, daß die jeweilig besser geeignete CCD (mehr Cache ist besser oder höhere Frequenz bringt mehr) entsprechend gewählt wird.
In Linux bin ich nicht viel unterwegs, aber wenn es jemand hier ist, könnte man uU schon sehen, was AMD hierzu eingebracht hat. Aber, wie gesagt, bei Linux kenn ich mich nicht so aus.

Zum Thema warum Extra Cache nur für eine von zwei CCDs : AMD hatte diese 3D Cache Geschichten ja zunächst und zuerst für Server CPUs (EPYCs) entwickelt und angeboten; denn dort gibt es eben Anwendungen, wo sich das auch für die Kunden sehr lohnen kann, die Gewinnspanne bei Server CPUs ist eben um einiges höher, und die 3D Geschichten kosten ja auch mehr in der Herstellung. Der 5800x (mit einer CCD) kam ja auch erst, nachdem AMD (TSMC Foundry) hier genügend Kapazität frei hatten, CCDs mit 3D Cache auch für Desktop anzubieten ohne Serverkunden warten zu lassen, und sich das so einigermaßen rechnete für AMD. Und bei den 7xxx Ryzens wird das nicht anders sein; Server kriegten (kriegen) zuerst, und dann Desktop, und da zunächst Mal eine CCD mit 3D Cache pro CPU, die andere bleibt "ungekrönt". Eine Desktop CPU bei der beide CCDs 3D Cache haben wird's wohl erst geben, wenn a. die Kapazität dafür frei ist und b. Intel irgendwas neueres rausbringt, das AMD die Gaming Krone wieder wegnimmt. Oder (reine Spekulation!) AMD bringt tatsächlich einen TR Nachfolger für HEDT; da könnte eine CPU mit 3D Cache auf allen CCDs uU sehr interessant sein.

Antwort 2 Likes

Klicke zum Ausklappem
E
Ehnoah

Mitglied

21 Kommentare 3 Likes

Das liest sich hier alles sehr kryptisch in den comments.

als normaler Gamer , sollte man dann eher zu Intel wechseln?

wenn man kein bock hat auf irgendwelche tools?
Aktuell hab ich den 5950X wollte mir aber den 7590X3D holen.

aber irgendwie liest sich das hier alles sehr negativ xD

Antwort Gefällt mir

D
Denniss

Urgestein

1,652 Kommentare 622 Likes

Erstmal abwarten was die Tests so sagen. Und Intel hat da auch die eigenen Probleme mit den E-Cores die sie aber zusammen mit M$ wohl so halbwegs im Griff haben

Antwort 1 Like

a
abufrejoval

Mitglied

14 Kommentare 15 Likes

Ich glaube nicht, daß AMD unter Linux durch spezifische Änderungen am Scheduler zwischen beiden CCDs differenzieren wird. Und dann erfordert die Auswahl tatsächlich Anwendungswissen, welches sich vielleicht ein Profiler aber kein Scheduler generisch erarbeiten kann: Das sind keine Expertensysteme!

Mittels numactl kann man unter Linux als Anwender die Zuweisung von Prozessen auf Kerne kontrollieren und hat damit schon mal mehr Kontrolle als unter Windows ohne Hilfsmittel (z.B. Lasso) möglich ist. Für eine von AMD gelieferte Spieleoptimierungssoftware, wie sie unter Windows ggf. kommen wird, ist Linux noch zu weit davon entfernt, eine primäre Gaming-Plattform für diese Chips zu werden.
Noch gibt es ja keine Angaben darüber, wo die 3D CCDs der 7950X3D bei den Taktraten landen könnten. Wegen der besseren BINs der dual-CCDs SoCs könnte das durchaus etwas jenseits der 5GHz der 7800X3D landen und nicht jeder ist auf die letzten 400MHz oder so angewiesen.

Bei einem meiner Systeme habe ich mich bewußt für einen 5800X3D entschieden, obwohl in vielen Szenarien vielleicht ein 5800X schneller gewesen wäre, bei einem anderen hatte ich von einem 5800X auf einen 5950X gewechselt. Das Hauptmotiv für den 3D war, daß der Preisunterschied derart geschrumpft war, daß kein Schicksalsthema mehr war. Und dann ist es ein 24x7 Dauerläufer mit ECC RAM und diversen VMs, wo ich mir dank großer Caches ebenfalls weniger Ruckler vorstellen konnte, während der 5800 in jeder Variante den Haswell Xeon E3 Vorgänger um 2-4x übertrumpfen würde.

Beim EPYC hat man ein paar Anwendungen gefunden, die vom zusätzlichen 3D Cache erheblich profitiert haben, meiner Erinnnerung nach waren das z.B. Chip-Design Verification Tools, die dann auf einmal keinen Hauptspeicher mehr brauchten. Ob das beim nächsten Chip dann immer noch klappt, dürfte eher Zufall sein.

Und wenn man tatsächlich bei einer solchen Anwendung richtig was herausholen möchte, könnte es sinnvoller sein, sie auf SoCs mit HBM anzupassen, wenn diese mal in ausreichender Stückzahl und Kapazität vorliegen.

Ich bin mir ziemlich sicher, daß AMD gründlich durchgerechnet hat, ob eine Desktop CPU mit zwei V-Cache CCDs genügend kritische Käufermasse hat, um ihre SKU Kosten zu rechtfertigen. Auf Halde möchten die nach ihrem Trauma mit den LLano APUs sicher nicht wieder produzieren! Daß es sie nicht gibt, ist wohl die Antwort. Produktionskapazitäten oder -probleme sollten sie dank der vielen EPYCs inzwischen im Griff haben, die CCDs sind bis zum Einbau auf den Die Carriers ja zwischen Ryzen und EPYC nicht differenziert.

Ja, je mehr SoC Varianten man da mittel Chiplets zusammenstellen kann, desto mehr wünscht man sich wie bei einem Autohersteller eine ganz eigene Kombination zusammenstellen zu können, ohne mehr als echte Aufwände und einem minimalen Anpassungsaufschlag zu bezahlen. Aber nur Großkunden werden da bedient werden können, möglicherweise immer weniger, weil die inzwischen ihre eigenen Chip entwerfen.

Bezüglich TR steht AMD etwas unter Zugzwang, aber entsprechende SKUs sollten relativ einfach sein, sofern man den Markt als groß genug erachtet oder Intel die Parade verhageln möchte. Letzteres war bisher keine AMD Strategie, aber mit den Custom Designs der Hyperscaler wird der x86 Endkampf nur rauer werden können.

Antwort 2 Likes

Klicke zum Ausklappem
K
KalleWirsch

Veteran

192 Kommentare 94 Likes

@abufrejoval Vielen Dank für die ausführliche Übersicht.

Antwort 1 Like

e
eastcoast_pete

Urgestein

1,992 Kommentare 1,251 Likes

Schließe ich mich an!

Antwort Gefällt mir

e
eastcoast_pete

Urgestein

1,992 Kommentare 1,251 Likes

Und da ich schon im vollen "was wäre, wenn" Spekulationsmodus bin, hier noch ein Einsatzbereich für 8 Kern Zen 4 CCD mit 3DCache Sahnehäubchen: Eine XBox SeriesX oder Playstation 5 jeweils als "Pro" Version, also eine Fortentwicklung der derzeitigen Top Konsolen; der Boost bei vielen Spielen könnte in der Tat ziemlich groß ausfallen, v.a. wenn die SoCs auch mit mehr GDDR6 RAM (zB 20 oder 24 GB, ja nach Verfügbarkeit von RAM Modulen), besserer/größerer iGPU (RDNA3+, mehr CUs) und eventuell noch mit KI/NPU Beschleuniger (von Phoenix) daherkommen würden. Das ganze noch in 5 nm gefertigt, und dann wäre der Stromverbrauch nicht so viel höher als die derzeitigen APUs in den Konsolen.
Wobei all das im Moment zugegebenermaßen einfach Fantasie ist, aber reizen würde mich so ein Teil schon. Passieren wird's eher nicht, denn sowohl Sony als auch MS werden in Zukunft wohl immer stärker auf Cloud Gaming setzen, und diesem Geschäftsmodell sind leistungsstarke Konsolen (und PCs) eher im Weg.

Antwort Gefällt mir

Igor Wallossek

1

11,224 Kommentare 21,289 Likes

Sagen wir es mal so: das Setup ist arg verzwirbelt und man muss mit etwas Pech auch sehr, sehr viel Zeit investieren. AMD und Software, besonders Windows... Naja. Aber die Geduld wird durchaus belohnt, auch wenn ich dem Ryzen 7 7800X3D schlussendlich die deutlich besseren Chancen einräume (Preispunkt, Handhabbarkeit). Zumal auch die BIOSe noch nachgebessert werden müssen, weil auch den Boardherstellern mal wieder nur die Hälfte kommuniziert wurde.

Aber diesmal schaue ich sehr genau hin, denn auch die Ergebnisse der alten SKUs differieren mit dem neuen AGESA und den Chipsatztreibern etwas. Das ist gerade Vollstress, der sich allerdings lohnt. ich habe am Samstag angefangen und doch erst 4 SKUs fertig. Allerdings wird sich gut erkennen lasssen, wer mal wieder nur Daten recycelt hat: :(

Antwort Gefällt mir

Cubayashi

Neuling

2 Kommentare 0 Likes

Bin schon sehr gespannt auf die Testergebnisse - mittlerweile liegen hier Mainboard, RAM und Gehäuse schon bereit und ich werde direkt auf den 7950X3D gehen. Die Tage kommen weitere Teile um die WaKü vorzubereiten (Radiatoren, hardtubes usw.). Anfangs wollte ich noch alle drei X3D-Tests abwarten, aber mittlerweile bin ich des Wartens einfach überdrüssig!😉 Habe einfach Bock wieder zu basteln und mich an neuer Hardware zu erfreuen!:love:
Das einzige Problem wird wohl sein, wo ich am schnellsten die CPU bekomme - und wie viel Lieferzeit nach D auf uns zukommt...

@abufrejoval vielen Dank für Deine Ausführungen, sehr informativ!(y)

Antwort Gefällt mir

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kannst Du per PayPal spenden.

About the author

Samir Bashir

Werbung

Werbung