Frage Welche CPU (min 10C/20T - max. 12C/24T) mit 256GB RAM und hoher Fließkommaperformance

anfreund

Mitglied
Mitglied seit
Nov 11, 2021
Beiträge
30
Bewertungspunkte
4
Punkte
8
Hallo,

das Thema steht ja im Wesentlichen schon in der Überschrift. Für meine Firma suche ich eine neuen Rechenknecht. Aufgrund der Softwarelizenzen benötige ich max. 12C/24T, da ich nur auf 10-Kernen rechnen kann. Die durchgeführten Simulationen selbst basieren hauptsächlich auf Fließkommarechnungen. Eine GPU (Titan V) wird davon einen Teil übernehmen. Allerdings hab ich auch Szenarien, wo die Programme GPGPU nicht unterstützen und ich reine CPU-Leistung brauche. Da die berechneten Modell recht groß sind, sollen 256GB RAM zum Einsatz kommen.
Im Moment nutze ich ein System aus 2x Xeon E5 2687W v2 mit 192GB RAM und bin da teilweise am Limit. Jetzt benötige ich Empfehlungen, welche CPU hier sinnvoll wäre.

Danke
 
Da es meines Wissens momentan weder unregistered DDR4 Riegel mit 64 GB als auch DDR5 ( sind zwar angekündigt wann die im Markt verfügbar werden kann ich aber nicht sagen ) zu kaufen gibt bleibt dir quasi nur HEDT da hier 8 Speicherslots zur Verfügung stehen . Du hast momentan reg ECC DDR3 wenn ich das richtig sehe,wenn die fehlerkorrektur erhalten bleiben soll bleiben nur noch EPYC und Xeon zur Auswahl.
 
Threadripper. Wenn mit ECC als Pro, wenn nicht reicht auch non-Pro - ggf. noch warten bis 2022, da kommen zumindest wohl die neuen Pro-Modelle mit Zen3.
 
Ein Budget wäre natürlich sinnvoll. Oder geht es nur um absolut maximale Performance und der Preis ist zweitrangig?

Leider gibt es für die TR nicht den SPEC FP Benchmark, der sollte als gute Orientierung helfen. Wenn du bei den Kernen hart limitiert bist, sollten m.E. z.B. zwei Intel W-1350P mehr FP Performance bieten als ein 3990X, wenn ich mir die "Floating Point Math" Werte mal pro Kern umrechne':



Hier habe ich nur einmal den erstbesten Xeon gegriffen.

Im professionellen Bereich würde ich immer auf einen A-Brand Hersteller mit VOS zurückgreifen (z.B. DELL o. HP) und ggf. auch eine Rackmount Workstation in Betracht ziehen (Kühlung, USV, Sicherheit, etc).
 
Wenn du bei den Kernen hart limitiert bist, sollten m.E. z.B. zwei Intel W-1350P mehr FP Performance bieten als ein 3990X

Der genannte Xeon W-1350 ist Sockel LGA1200, dafür gibt es nur UP Boards (max. ein Sockel).
Außerdem hat die Reihe max. 8 Kerne und nur ein 2 Kanal Speicher, schließlich ist es Rocket-Lake-S CPU mit ECC Support und ein paar anderen Features. Der passt also ganz und gar nicht.
 
Also: Dass nur Xeon oder Epyc bzw. TR PRO in Frage kommen, sollte sich eigentlich aus der Fragestellung ergeben haben. Der vorgeschlagene Xeon W-1350 (wie auch die ganze Baureihe Xeon W-1xxx) kann nur max. 128GB RAM und disqualifiziert sich somit. Auch der Hinweis, dass zwei Xeons W-1350P einem Threadripper in FPU-Performance überlegen sind disqualifiziert sich, da es sich bei dieser CPU um eine Single-Socket-Variante handelt.

Im Moment hadere ich mit einem Epyc 73F3, der aber leider die alte Zen3-Architektur nutzt. Man sieht am Ryzen 9 ganz gut, welchen Sprung Zen4 ggü. Zen3 macht. Leider sieht man da noch keinen Epyc oder TR...

Die vorgegebene Kernanzahl hängt mit der verwendeten Software zusammen. Klar könnte ich auch mehr Kerne lizensieren, aber dann laufen die Kosten ins Uferlose. An meiner Auswahl (Epyc 73F3) sieht man sicherlich auch, dass das Budget für die Rechentechnik völlig untergeordnet ist, da die Softwarekosten pro Jahr bei ca. 30k€ (für max. 10 Kerne) liegen. Ob die CPU jetzt 1000 oder 5000€ kostet, ist mir da ziemlich egal. Die Verfügbarkeit ist auch so ein Ding...

Ich ziehe gerade auch eine Zwischenlösung in Betracht. Der AVX2-Support des E5-2687W v4 bedeutet auch eine Beschleunigung um Faktor 1,5, zu mal dank DDR4 auch etwas mehr Speicherdurchsatz möglich ist. Und die Dinger sind sogar problemfrei erhältlich (und kosten im Prinzip nix ;-))
 
wenn die fehlerkorrektur erhalten bleiben soll bleiben nur noch EPYC und Xeon zur Auswahl.
ggf. noch warten bis 2022, da kommen zumindest wohl die neuen Pro-Modelle mit Zen3.

Ich würde jetzt auch keinen Zen2 Threadripper mehr empfehlen. Wenn jetzt gekauft werden muss, dann (Zen3) AMD Epyc 7343 z.B..
Der müsste der bei der FP Leistung die Intel Konkurrenz bei gleicher Kernanzahl deutlich übertreffen.


Die Auswahl ist dem Bereich auch nicht sonderlich groß:

AMD https://geizhals.de/?cat=cpuamdam4&xf=16686_Epyc+7003~25_16

Intel https://geizhals.de/?cat=cpu1151&xf=12099_Server~12099_Workstation~14840_12~820_4189
 
Im Moment hadere ich mit einem Epyc 73F3, der aber leider die alte Zen3-Architektur nutzt. Man sieht am Ryzen 9 ganz gut, welchen Sprung Zen4 ggü. Zen3 macht. Leider sieht man da noch keinen Epyc oder TR...

300 MHz mehr Basis- und 100MHz mehr Turbotakt für +2k € gegenüber dem 7343 muss der 73F3 erstmal wieder reinholen.
Bei den Lizenzkosten sind das natürlich Peanuts.

Zen4 kommt erst Anfang nächsten Jahres und wurden auch schon für Epyc angekündigt.
Der Epyc 7373X könnte interessant sein.

Und die Dinger sind sogar problemfrei erhältlich (und kosten im Prinzip nix ;-))

Und sind 5 Jahre alt :D
 
...und der TR zieht doch gerade im Bereich Floating Point Math dem Xeon W-1350 völlig davon (Faktor >3 bei "nur" 2x Cores).
 
...und der TR zieht doch gerade im Bereich Floating Point Math dem Xeon W-1350 völlig davon (Faktor >3 bei "nur" 2x Cores).
Da wäre eine Quellenangabe schön. Ich komme nur auf Faktor 1,4 pro Kern gerechnet. Außerdem hat der W-1350 nur 6C/12T und kann nur 128GB RAM - sprich, der hat nur die Hälfte dessen, was ich brauche.
 
Zuletzt bearbeitet :
300 MHz mehr Basis- und 100MHz mehr Turbotakt für +2k € gegenüber dem 7343 muss der 73F3 erstmal wieder reinholen.
Bei den Lizenzkosten sind das natürlich Peanuts.

Zen4 kommt erst Anfang nächsten Jahres und wurden auch schon für Epyc angekündigt.
Der Epyc 7373X könnte interessant sein.



Und sind 5 Jahre alt :D

Epyc 73F3 ggü. 7343:
doppelt L3-Cache --> das erklärt die Vorteile bei der Matrixmultiplikation und lässt für Milan-X hoffen.

E5-2687W v4:
Naja 5 Jahre alt, aber verfügbar und zumindest 1,5x schneller... Ich lass mir jetzt mal ein Angebot für eine HP Z4 G4 mit W-2265 und 256GB RAM machen. Mal schauen...

Epyc 7373X:
Der Epyc 7373X (Milan-X) könnte tatsächlich interessant sein. Cache-Monster. Ich frage mich jedoch, warum der Ryzen 9 5900X ggü. den Epyc so schnell ist. Wo holt der das her? Zen4 hat der ja auch noch nicht, wie ich grad lesen musste...
 
Zuletzt bearbeitet :
Ich hatte ja geschrieben, dass ich einfach mal den erstbesten Xenonn rausgepickt hatte - sorry dass sich nun alles so sehr auf das Modell versteifen.
Die Message war doch, dass der TR bei einer harten Limtierung der Kerne ggf. nicht die Allerbeste Wahl ist. Wenn der TE deswegen meint, dass sich der komplette Hinweis deswegen disqualifiziert, ist das auch in Ordnung. Gern geschehen.

...und der TR zieht doch gerade im Bereich Floating Point Math dem Xeon W-1350 völlig davon (Faktor >3 bei "nur" 2x Cores).

Habe ich hier einen Denkfehler?
CoresFPMath MOps/SecFPM MOps/Sec/Core
64280,6084384.5
636,7196119.8

Würde für mich bei 10 Kernen welche man nutzen kann, fast 30% mehr Performance sein.
 
Zuletzt bearbeitet :
Ich hatte ja geschrieben, dass ich einfach mal den erstbesten Xeopn rausgepickt hatte - sorry dass sich nun alles so sehr auf das Modell versteifen.
Die Message ware doch, dass der TR bei einer harten Limtierung der Kerne ggf. nicht die Allerbeste Wahl ist. Wenn der TE deswegen meint, dass sich der komplette Hinweis deswegen disqualifiziert, ist das auch in Ordnung. Gern geschehen.



Habe ich hier einen Denkfehler?
CoresFPMath MOps/SecFPM MOps/Sec/Core
64280,6084384.5
636,7196119.8

Würde für mich bei 10 Kernen welche man nutzen kann, fast 30% mehr Performance sein.
Faktor 3 bei doppelter Core-Anzahl ist nunmal nur Faktor 1,5 pro Core und ich kann nur max. 10 Cores verwenden. Das "disqualifizert" bezog sich darauf, dass die Antwort bzgl. eines beliebig rausgepicketen Xeons am Thema vorbei ging. Ebenso die Empfehlung zu 2x Xeon 1350P (da diese CPU nur eine 1-Sockel-CPU ist) Wollte nicht unhöflich sein, aber Deine Beiträge sind hier nicht gerade hilfreich. Sorry

PS: Außerdem sind es fast 40% mehr FP-Performance pro Core ;-)
 
Zuletzt bearbeitet :
Alles klar, gar kein Problem!

Wie genau kommst du denn auf den Faktor 3 bzw. 1,5? Was vergleichst du dort miteinander?

Nun mal ein möglicher Dual Socket Xenon Kandidat verglichen mit dem o.g. EPYC:



Auch hier ist der Xenon 6244 ca. 10% schneller als der AMD EPYC 73F3 bei FP Berechnungen (und für die Server CPUs gibt es wenigstens den SPEC Benchmark).
 
Alles klar, gar kein Problem!

Wie genau kommst du denn auf den Faktor 3 bzw. 1,5? Was vergleichst du dort miteinander?

Nun mal ein möglicher Dual Socket Xenon Kandidat verglichen mit dem o.g. EPYC:



Auch hier ist der Xenon 6244 ca. 10% schneller als der AMD EPYC 73F3 bei FP Berechnungen (und für die Server CPUs gibt es wenigstens den SPEC Benchmark).
Verglichen hab ich zunächst die FPU MOps/s aus dem Passmark und jeweils pro Kern verglichen. Der jetzt erwähnte Xeon Gold 6244 hat leider nur 8C/16T. Hier wäre der 6264 geeigneter, aber für den gibts ja wieder keine Daten. Erfahrungsgemäß sinkt die Performance bei CPUs mit mehr Kernen, d.h. die 10% Vorteil sind dann schnell dahin. Ein Dual-Sockel-System möchte ich eigentlich nicht mehr. Preislich liegen die Xeon Gold wie auch die Epycs in einer Liga und sind auch nahezu nicht erhältlich, was viel schlimmer ist...

Und ja, ich muss mir dieses Jahr aus steuerlichen Gründen noch neue Rechentechnik anschaffen.
 
Epyc 73F3 ggü. 7343:
doppelt L3-Cache --> das erklärt die Vorteile bei der Matrixmultiplikation und lässt für Milan-X hoffen.
Stimmt, das hatte ich übersehen.

Und ja, ich muss mir dieses Jahr aus steuerlichen Gründen noch neue Rechentechnik anschaffen.

Dann hast du ja eh kein große Wahl. Wenn es denn auch ein UP Board sein soll, kommst du am 73F3 wohl nicht vorbei.
Wenn du nur ein System brauchst, bei Jacob E. werden 5 Stück lagernd angezeigt. Da kann man sich i.d.R. drauf verlassen.
 
Verglichen hab ich zunächst die FPU MOps/s aus dem Passmark und jeweils pro Kern verglichen.

Die Werte hatte ich doch oben gepostet - daher ist doch der Xeon pro Core deutlich schneller?

Der jetzt erwähnte Xeon Gold 6244 hat leider nur 8C/16T. Hier wäre der 6264 geeigneter, aber für den gibts ja wieder keine Daten. Erfahrungsgemäß sinkt die Performance bei CPUs mit mehr Kernen, d.h. die 10% Vorteil sind dann schnell dahin.

Genau dort bin ich ja bei dir! Das war auch mein initialer Stein des Anstoßes, einmal eine Dual-Socket Xenon WS vorzuschlagen. Da kannst du dann zwei sehr Single-Thread optimierte CPUs reinbauen und kommst trotzdem auf deine Kernanzahl. Daher auch der 6244, der einen höheren Takt hat als der 6264 und daher mit zwei CPUs mehr rausholt als ein 6262 (bei deinem Use-Case).
Denk bei den CPUs daran, dass du statt 256GB auf 192GB oder 384GB RAM gehen solltest für eine optimale Speicherbandbreite.
 
Die Werte hatte ich doch oben gepostet - daher ist doch der Xeon pro Core deutlich schneller?



Genau dort bin ich ja bei dir! Das war auch mein initialer Stein des Anstoßes, einmal eine Dual-Socket Xenon WS vorzuschlagen. Da kannst du dann zwei sehr Single-Thread optimierte CPUs reinbauen und kommst trotzdem auf deine Kernanzahl. Daher auch der 6244, der einen höheren Takt hat als der 6264 und daher mit zwei CPUs mehr rausholt als ein 6262 (bei deinem Use-Case).
Denk bei den CPUs daran, dass du statt 256GB auf 192GB oder 384GB RAM gehen solltest für eine optimale Speicherbandbreite.
Die Werte hat ich bereits im Beitrag #10 als Grundlage. Allererdings sieht das für den Epyc 73F3 bzw. 7343 schon wieder ganz anders aus.

Bzgl. Xeon 6244:
Das ist ja mit Cascade Lake der gleiche Kern wie der W-2265, nur das letzterer ein deutlich höheren Takt hat und sogar verfügbar ist. Für meine Fälle ist ein Single Socket System zu bevorzugen. Die 6 Speicherkanäle bei den Xeon Gold auf Cascade Lake Basis sind blöd und der W-2265 hat nur 4 Speicherkanäle, was auch blöd ist. 8 wären mir lieber. Also Epyc, der ja wiederum mit der Intel MKL Probleme macht.

Aktuell am liebsten wäre mir Stand jetzt der W-3323. Ist sogar verfügbar, aber da werd ich das System selbst konfektionieren müssen...

Vielleicht noch etwas Hintergund zum Anwendungsfall. Es geht um FEM-Berechnungen. Dort benötige ich zum einen natürliche eine hohe Speicherbandbreite und eine CPU, deren Leistung recht gut über die Kernanzahl skaliert, die also pro Kern ein gute Leistung hat und einen hohen Basistakt aufweist. Weiterhin gibt es Anwendungfälle (z.B. Kontaktiterationen), die nur auf einem Kern laufen - dort ist ein möglichst hoher Turbo sinnvoll.
 
Zuletzt bearbeitet :
Als Cascade Lake ginge auch ein CoreX der 10er Serie, die haben 4 Kanal und 256 GB max Ram. Schnell ist das aber wohl eher nicht.
 
Oben Unten