News AMD EPYC 7452 "7nm Rome" CPU mit 32 Kernen und 64 Threads in Benchmarks entdeckt: Schneller als Intels Xeon und EPYC Naples

Jakob Ginzburg

Urgestein
Mitglied seit
Jun 17, 2018
Beiträge
843
Bewertungspunkte
290
Punkte
63
AMD-EPYC-ROME-7452-CPU1.png


Jakob Ginzburg submitted a new blog post
Die ersten Benchmarks des AMD EPYC 7452 „Rome“ Prozessors wurden durch OpenBenchmarking veröffentlicht. Der EPYC 7452 ist der interessanteste Chip in der ganzen Reihe, da er auf der 7nm Zen-2-Kernarchitektur basiert. Die CPU verfügt über 32 Kerne und 64 Threads. Die Taktfrequenz liegt bei 2,35 GHz und damit deutlich höher, als beispielsweise bei einem EPYC 7551 'Naples' Prozessor

Continue reading the Original Blog Post.
 
Na hier ist aber so einiges schief gelaufen; die offensichtlichsten Punkte vorweg:

"Der AMD EPYC 7551 [alter Naples, 32 Kerne aber nur 2,0 GHz] hingegen weist eine TDP von 180 Watt auf und kostet 3600 USD. Der kleinere EPYC 7452 [neuer Rome, 32 Kerne, 2,35 GHz laut Grafik] wird vermutlich noch niedrigere TDP-Werte erreichen und auch zu einem deutlich günstigeren Preis angeboten werden. "

Ob der bei dem höheren Takt tatsächlich eine nenneswert niedrigere TDP erreicht, steht erst mal auf einem anderen Blatt (zumal mit voraussichtlich monströsen 128 MiB L3, denn bei den Consumer-Chips hat AMD bisher auch immer den vollen L3 des Chiplets beibehalten), aber warum wird der als "kleiner" bezeichnet und warum sollte AMD nun neuere, leistungsfähigere Technik nochmals günstiger auf den Markt werfen? Hat AMD die AG in eine e.V. umfirmiert?

"Nun mag der Vergleich eines 20-Kerners [offensichtlich der Xeon Gold 6148] mit einem 32-Kerner [dem Epyc 7452 Rome] unfair erscheinen. Man sollte jedoch bedenken, dass das Intel-Setup mit einer geringeren Kernanzahl fast doppelt so viel kostet. Für einen Intel Xeon Platinum 8280 mit 28 Kernen ..."

Der Xeon Gold 6148 wird derzeit bei uns ab etwa 3400 € angeboten, der alte Epyc 7551 ab etwa 3800 € und bei dem sich, wie schon oben erwähnt, die Frage stellt, warum dessen leistungsfähigerer Nachfolger noch einmal günstiger ausfallen sollte. Darüber hinaus, auch wenn der Rest der Intel-Plattform typischerweise auch etwas teuerer ausfällt, die Frage, warum das Intel-Setup deswegen hier fast doppelt so viel kosten sollte?
Und abschließend die weitere Frage, wie und warum hier auf einmal Intel's Top-Modell Platinum 8280 ins Spiel gebracht wird (ab 10300 €)? Das gibt der Äpfel-und-Birnen-Thematik eine neue Dimension.
Wie ich hier im Nachhinein noch einmal bei wccftech gegengelesen habe,. ist die deutsche Übersetztung "kaputt". *)

Zu den Benchmark-Ergebnissen ...

Die Blowfish, DES und RSA-Tests klammere ich mal aus, denn vielleicht hat AMD ja auch an den Krypto-Funktionseinheiten geschraubt. Abseits dessen dürften das rein CPU-interne Tests sein, die AMD zum Teil schon durch die Caches erschlägt, Naples bereits mit 64 MiB, Rome in diesem Fall ggf. gar mit bis zu 128 MiB L3. (Die L3-Caches dürften durchaus relevant sein, da aus kryptographischer Sicht ein Arbeiten mit extrem kleinen Daten (bspw. im L1) unsinnig wäre. -- Leider ist auf openbenchmarking.org nicht so leicht nachzulesen, was die Benchmarks wie konkret testen)

Sowohl die PHP-Kompilierung als auch Gzip sind Integer- und I/O-lastig, die Ergebnisse liegen in etwa im Rahmen des Erwartbaren, auch wenn es mich schon etwas wundert, das Naples trotz 8-Kanal-Speicher und größerem L3 so deutlich zurückfällt.

Besonders auffällig sind aber die Werte zu C-Ray und Smallpt, insbesondere zu letzterem, bei dem das Intel-System gar um den Faktor x10 langsamer sein soll. Beide werfen offensichtliche Fragen auf.
Bereits der deutliche Rückstand zu C-Ray verwundert, also was ist das? Wie sich herausstellt, ist das ein kleines Testprojekt, das einen minimalistischen Raytracer mit noch minimalistischeren Testdaten mit so wenig Code wie möglich implementiert, der am Ende quasi ausschließlich die FP-Leistung und den Cache beansprucht. Aufgrund der minimalistischen Implementation ist hier zudem von keinerlei FP-Optimierungen wie SIMD auszugehen.
Ähnlich verhält es sich mit Smallpt, das eine CornellBox mit minimalistischen 99 Zeilen C-Code implementiert und einfache FP-Arithmetik verwendet und aufgrund der extrem beschränkten Datenmenge wohl ebenfalls ausschließlich in den Caches abläuft. Zudem scheint der Code hier dermaßen unvorteilhaft für den Xeon zu sein, sodass dieser gar die CPU beträchtlich ausbremst.
Beide Tests sind jedoch von extrem geringer Relevanz, Smallpt ist in diesem Fall gar unbrauchbar und C-Ray eher für theoretische Zwecke geeignet, bspw. um FP-Funktionseinheiten und Caches für Tests zu separieren.
Ein Gegenvergleich mit einem etwas praxisrelevanterem Cinebench R20 Multi-Thread zeigt ein etwas anderes Bild (und der R20 nutzt offensichtlich weder AVX-512 noch 256-bittiges AVX in relevantem Maße):
  • 2x Epyc 7451 24C, 64 MiB, 2,3 GHz = 13493 Pkt.
  • 2x Xeon Gold 6148 20C, 27,5 MiB, 2,4 GHz = 12713 Pkt.
Alternative aber hiermit nicht direkt zusammenhängende Wert, die aber zumindest direkt mit den Cores vergleichbar sind:
  • Ryzen TR 2950X 16C, 32 MiB, 3,5 GHz = 6932 Pkt.
  • Xeon Gold 6130 16C, 22 MiB, 2,1 GHz = 5400 Pkt.
Und auch das abschließende geometrische Mittel als Zusammenfassung der Tabelle ist nicht nachvollziehbar. Jedenfalls beruht es nicht direkt auf den in der Tabelle ersichtlichen Werten und eine Zusammenfasssung erscheint auch grundsätzlich wenig sinnvoll, da hier komplett unterschiedliche Einheiten wie Renderzeiten in Sekunden, komprimierte Datenmengen in Sekunden, und Schlüsseliterationen pro Zeiteinheit durcheinandergewürfelt werden.

Die grundsätzliche Frage wäre natürlich an wccftech zu stellen, aber bei der Rezitierung entsprechender Quellen würde ich schon mehr als nur schlichtes Abschreiben erwarten.


*) Edit/Ergänzung: Der Vergleich ist schlussendlich auch schon bei wccftech arg schief. Vergleicht man den Gold 6148, wären die Systeme wohl gleich teuer, zumal man noch davon ausgeht, dass Rome hier noch günstiger als Naples werden soll. Nimmt man dagegen einen Dual-Socket Platinum 8280 zum Vergleich, geht es eher schon in Richtung dreimal so teuer.
Da CSL hier jedoch grundsätzlich kerntechnisch im Nachteil ist (-12 %, max. 28 vs. 32) und er Rome möglicherweise zumindest in den kaum I/O-lastigen/CPU-internen Tests grundsätzlich nicht das Wasser reichen kann, wäre wohl eher ein Vergleich gegen einen Platinum 8270 [26 C, 2,7 GHz, 7400$] oder gar gegen einen 8260 [24 C, 2,4 GHz, 4700$] sinnvoller. - Immerhin hat man es vermieden, den 8280L mit large memory support für 18000$ dagegenzuhalten ;-) Ich bin gespannt auf erste SPEC- und Datenbank-Benchmarkwerte von Rome.
 
Zuletzt bearbeitet :
Dem kann ich so nur zustimmen - den Artikel würde ich so lieber von der Seite herunternehmen :confused: Da sind ja soviele Vergleiche die komplett sinnlos und teilweise falsch sind - ohne nun noch einmal alles anzuführen.
 
Oben Unten