Zum Thema Folien fällt mir noch die (
NAMD Performance) ein. Ein Test würde auch hier Klarheit schaffen.
Ich würde schon davon ausgehen, dass Intel's Daten soweit korrekt sind, denn derartige Systeme werden gerade auch in diesem Bereich genutzt, die SW ist Standard und für einige Großkunden (u. a. Universitäten) wäre es ein leichtes, den Benchmark der SW anzuwerfen um zu sehen, ob etwas Vergleichbares zu Intels Zahlen herauskommt. Würde Intel hier das Blaue vom Himmel lügen, wäre das ein beträchtlicher Imageverlust, der auch schnell seinen Weg in die Medien finden würde.
Darüber hinaus war AMDs Vergleich schlicht unsinnig (oder schlampig). Hier könnte ich mir durchaus vorstellen, dass Lisa Su nachträglich noch jemanden dazu zur Rede gestellt haben wird. Es sei denn, der temporäre Wow-Effekt war alles, worum es ging, was ich aber nicht glaube, da AMD eher bodenständig, wenn es so etwas in der Marketingarena überhaupt gibt, auftritt.
Aber 56 Intel-Kerne gegen mehr als doppelt so viele AMD-Kerne (128) und, oh Wunder, das AMD-System ist doppelt so schnell, ist keine Sensation *). Interessanterweise reagierte während der Präsentation aber keiner dahingehend wirklich (während man bei der Apple-Präsentation zu den 999 US$ des Monitorständers ein deutliches Raunen im Saal vernahm). AMD hätte das Ganze während der Präsentation leicht in ein stimmigeres Bild umwandeln können, wenn man etwas wie einen Vergleich auf Flops/Dollar oder Flops/Watt herausgestrichen hätte, aber diesbezügliche Erwähnungen blieben aus und man beließ es rein bei einem Performancevergleich..
Darüber hinaus, Cascade Lake-AP ist ein Monster mit bis zu 56 Kernen (Platinum 9282), 12 Speicherkanälen, doppelten FMA-Pipelines, Dual-Socket-fähig und mit Optane Memory bis zu 7,68 TiB Hauptspeicher pro System ausbaubar, jedoch auch mit 400 W für eine CPU aufgrund von weiterhin 14nm++.
In Intels Gegendarstellung schlagen bereits 96 Intel-Kerne 128 AMD-Kerne, was nicht auszuschließen ist. Maximale Optimierungen im HCP-Bereich sind normal, Intel unterstützt AVX-512, was noch einmal zu mehr Leistung führen kann (trotz niedrigerem Takt) und auch die Speicherbandbreite des Intel-Systems ist voraussichtlich signifikant höher. Wer das nötige
Kleingeld hat und maximale Rechenleistung pro Rack benötigt **), dürfte solche Systeme durchaus attraktiv finden. Intel bewirbt die Xeon-APs nicht umsonst als
high-performance, high-density compute platform und darüber hinaus wäre es unsinnig anzunehmen, dass Intel so eine speziell angepasste, sehr teuere Plattform auf gut Glück entwirft. Hier wird es durchaus schon entsprechende Signale aus der Industrie gegeben haben (und schlussendliche sind solche Analysen grundsätzlicher Bestandteil von gutem Product Development).
Am Ende noch die Anmerkung, dass man auch leicht Preis/Leistungs-Vergleiche verzerren kann, denn schlicht die Top-Modelle gegeneinander zu vergleichen ist in vielen Fällen nicht zielführend. Nachfolgend einige ältere Zahlen zu Skylake-SP. Mitte 2017 kostete ein Epyc 7601 (
Naples) mit 32 Kernen bei 2,2/3,2 GHz bspw. rund 4.200 US$, ein Xeon Platinum 8180 ***) mit 28 Kernen, 2,5/3,8 GHz und 38,5 MB L3 rund 10.010 US$, während jedoch ein Xeon Platinum 8164 mit 26 Kernen, 2,0/3,7 GHz und 35,75 MB L3 nur noch 6.120 US$ kostete, was den Preisunterschied bereits deutlich verkleinert.
*) Es ist zweifelsfrei ein Fortschritt, gar ein beträchtlicher, denn Epyc/Naples hätte hier im wörtlichen Sinne kläglich versagt, aufgrund des nur halb so hohen AVX2-Durchsatzes, jedoch wurde auch diese argumentative Karte während der Präsentation nicht ausgespielt.
Im Nov'18 gab Intel während des Entwicklungsverlaufs zu Cascade Lake an, dass ein Xeon-AP mit 2x48 Kernen einen Dual-7601 im NAMD (APOA1) mit Faktor 2,1 schlägt, während der Linpack (bei nummerischer Algebra) das AMD-System gar um Faktor 3,4 schlägt. Natürlich haben diese Zahlen auch Werbecharakter, jedoch stellen diese auch deutlich dar, warum AMD gar nichts anderes übrig blieb, als diesen beträchtlichen Rückstand bei nummerischen Berechnungen bzw. der Vektoreinheit mit Zen2 anzugehen.
**) Da die Bauform sehr speziell ist und es derzeit bspw. auch keinen Sockel für 12 Speicherkanäle bei Intel gibt, gibt es die CPUs nur als BGA auf auswählbaren Boards, wahlweise mit Luft- oder Wasserkühlung. Maximal liefert Intel bis zu 4 Blades auf 2U (dabei voraussichtlich Single-Socket bei 4 Blades). Rechnet man für einen typischen 42U-Rack pauschal 4U für Networking ab, wären das 76 Blades im Rack, also 4256 CPU-Kerne (und doppelt so viele, mögliche Threads). Die akkumulierte Speicherbandbreite des Racks würde bei rund 20,8 TiB/s liegen. Abwärme und Anschaffungskosten für einen einzelnen Rack rechnet man dann aber besser nicht aus.
***) Wenn man es gar noch auf die Spitze treiben wollte, könnte man gegen die Platinum 8180M-Variante mit erweitertem Hauptspeichersupport für etwa 13.010 US$ vergleichen.