Super Pi 32M und AIDA64
Um die Auswirkungen der verschiedenen RAM-CPU-Konfigurationen noch vielschichtiger sichtbar zu machen, werde ich heute ein paar für mich neue Benchmarks auf die Systeme loslassen. Beginnen möchte ich mit dem altbekannten Wettkampf-Benchmark SuperPi mit dem Preset „32M“. In diesem Benchmark geht es darum in 24 Wiederholungen 32 Millionen Stellen der Zahl Pi zu berechnen, wobei hier kleinste Änderungen an CPU und RAM im Ergebnis sichtbar werden. Der Benchmark dauert mit aktueller Hardware noch immer mehrere Minuten und die Ergebnisse sind dennoch oft auf den Bruchteil einer Sekunde reproduzierbar. Ausschlaggebend sind hier die Leistung eines einzelnen CPU-Threads zusammen mit Cache und Arbeitsspeicher. Zudem kommt es hier nicht auf den Durchsatz, sondern auf die Latenz des RAMs an. Obwohl dieser Benchmark mit Hyperthreading aus besser performt, wurde die Einstellung zur besseren Vergleichbarkeit mit den restlichen Tests an gelassen.
Erwartungsgemäß liegt die Rocket Lake CPU vor der Comet Lake CPU, aufgrund der größeren und leistungsstärkeren Kerne. Dass aber von Rocket Lake zu Alder Lake auch noch mal ein Leistungssprung bei den Kernen stattgefunden haben soll, wird hier anscheinend von einem anderen Faktor überschattet – Stichwort: Latenz. 26 Sekunden langsamer ist der 12900K als sein Vorgänger, mit identischem RAM. Nun muss man fairerweise dazu sagen, dass Alder Lake im Gear 1 mittlerweile höhere Taktraten unterstützt. Bis zu DDR4-4200 CL16 konnten wir schon als stabil verifizieren. Aber selbst mit viel manuellem Tuning wird es den Extrem-Overclockern sehr schwer fallen, den Nachteil von nahezu 8 % in der Berechnungszeit zu Rocket Lake aufzuholen. Der 11900K wird also wohl zumindest für diese Kundschaft bis auf weiteres die erste Wahl bleiben.
Mit Latenz soll es auch gleich weitergehen, diesmal im vertrauten AIDA64 Cache & Memory Benchmark. Hier bestätigt sich erneut Alder Lake’s Nachteil bei der Latenz, wobei tatsächlich Comet Lake hier noch am flinksten ist, wenn es darum geht, wenige Daten schnell zwischen RAM und CPU zu übertragen. Seit Comet Lake ist die RAM-Latenz bei Intel CPUs stetig gewachsen, bedingt zunächst durch den physikalisch längeren Ring, der die nun 10 statt vorher 8 CPU Kerne von Coffee Lake miteinander verbinden musste. Mit Rocket Lake wurde das Gearing eingeführt und mit Alder Lake kam nun noch ein zweiter Speichercontroller und 8 weitere kleine Kerne hinzu, die alle auch auf dem Ring mitsprechen möchten. Die Konsequenz ist auch bei deaktivieren E-Cores ein höherer Overhead und damit langsamere Latenzen beim RAM-Zugriff.
Die Tests zum Datendurchsatz habe ich zum Vergleich mal in eine Galerie zum selber durch-switchen zusammen gepackt. Im Read und Copy machen sich die größten Unterschiede zwischen den CPU Generationen bemerkbar, während im Write effektiv alle gleich auf sind. MSI hatte bei ihrer Erklärung der nun zwei IMCs bei Alder Lake genau diesen AIDA64 Copy Test als Beispiel für den daraus resultierenden Performance-Zuwachs genannt. Soweit können wir dies auch bestätigen. Es sollte aber auch erwähnt werden, dass diese Datenraten auch von der Kern-Leistung der CPU abhängig sind und da Alder Lake hier auch mit Fortschritten wirbt, können wir nicht genau sagen, woher nun der Leistungszuwachs in den Ergebnissen wirklich kommt.
Linpack Xtreme und Geekbench 3
Nun gibt es noch einen weiteren Benchmark-Neuling, den Linpack Xtreme in Version 1.1.5. Dieser Benchmark verwendet die Intel Math Kernel Library und damit auch AVX2 bzw. AVX512 zur Berechnung linearer Algebra und sorgt damit für eine extrem hohe Belastung der CPU und des Arbeitsspeichers. Neben einem Stresstest bietet dieser Benchmark aber auch eine Leistungsmetrik in Form von Flops, also Berechnungen pro Sekunde. Die Leistung steigt zudem mit der Größe verwendeten Arbeitsspeichers, da damit auch die Komplexität der Gleichungen in Form der „Problem Size“ erhöht wird. Hier haben wir uns für das 10 G Preset mit einer Problem Size von 35000 entschieden, um die Unterschiede zwischen den verschiedenen CPU-Konfigurationen möglichst stark hervorzuheben.
Hier spielt es im Übrigen auch eine Rolle, ob auf den neuen Alder Lake CPUs das AVX512 Befehlssatz aktiviert ist oder nicht. Da dieser nur von den P-Kernen unterstützt wird, setzt dies die Deaktivierung der E-Kerne voraus. Wir haben die Ergebnisse einmal mit und einmal ohne AVX512 ermittelt, aber immer mit deaktivierten E-Kernen. Denn sind die E-Kerne wie ab Werk aktiviert, muss zum einen der Takt des Caches abgesenkt werden und zum anderen Kosten die E-Kerne hier tatsächlich Leistung. Die E-Cores wollen eigentlich nur helfen, stehen aber effektiv den P-Cores oft nur Richtung Arbeitsspeicher im Weg. Die Folge sind bei gleichem P-Core- und Cache-Takt ca. 15 GFlops weniger mit, statt ohne E-Cores. Stau auf dem Alder Lake Ring trotz Tempolimit und „Thread Director“ Verkehrsleitsystem.
Interessant ist hier auch, dass die Golden Cove P-Kerne von Alder Lake sogar mit AVX512 nicht ganz an das Leistungsniveau von Rocket Lake mit seinen Cypress Cove Kernen herankommen. Da der Takt aber effektiv der selbe ist und es auch sonst kein Nachteil für den 12900K geben dürfte, bleibt als Erklärung nur wieder die höhere RAM-Latenz. Intels neue Compute-Monster wollen auch zeitgerecht gefüttert werden, sonst bleiben die Glanzleistungen aus. Natürlich kommen in der echten Welt hier die mit Alder Lake höheren möglichen RAM-Taktraten helfend entgegen, aber ob DDR5’s Zuwachs beim Durchsatz das Defizit bei der Latenz letztendlich ausgleichen können wird, muss sich ein andermal zeigen. Das war übrigens auch der einzige Benchmark, bei dem AVX512 einen Unterschied macht. Bei allen anderen Tests waren die Ergebnisse mit und ohne dem aktiven Befehlssatz identisch.
Abschließend gibt es noch wie schon bei bisherigen RAM-Tests den Geekbench 3 Multi-Core Memory Performance Score. Auch hier zeigt sich ein großer Sprung nach vorne von Comet Lake zu Lake und ein Schritt zurück von Rocket zu Alder Lake. Nochmal zur Erinnerung, alle Primär-, Sekundär- und Tertiär-Timings des RAM sind identisch zwischen den Konfigurationen. Einzig die jeweilige CPU und ihr interner Aufbau sind maßgeblich für die Unterschiede in der gemessenen Leistung. Auch hier wird sich noch zeigen müssen ob und wann die 12te Generation mit DDR5 ihr vermeintliches Defizit aufholen können wird.
22 Antworten
Kommentar
Lade neue Kommentare
Neuling
Urgestein
Veteran
Veteran
Urgestein
Urgestein
Veteran
Urgestein
Veteran
Mitglied
Mitglied
Urgestein
Mitglied
Urgestein
Mitglied
Urgestein
1
Veteran
Urgestein
Alle Kommentare lesen unter igor´sLAB Community →