AVX-512 war rund um den Launch der neuen Intel Alder Lake CPUs ein heiß diskutiertes Thema. Erst hieß es, die P-Kerne unterstützten es grundsätzlich, aber um einen gemeinen Befehlssatz mit den E-Kernen bieten zu können, werde das Feature auf Silizum-Ebene abgeschaltet. Später hätten dann aber Mainboard-Hersteller das Feature funktionsfähig auf den CPUs vorgefunden und es mit Hacks im Microcode über das BIOS wieder aktivierbar gemacht. Was das wieder gefundene Feature wirklich bringt, sehen wir uns heute an.
Wer mit „AVX-512“ noch nichts anzufangen weiß, den möchte ich noch kurz abholen, bevor es gleich tiefer in die Materie geht. Im Prinzip handelt es sich dabei um einen Befehlssatz, mit der die CPU spezielle Arten von Berechnungen besonders schnell durchführen kann. Erstmals wurde das Feature 2013 auf Intel’s High End Desktop Plattform mit der „Skylake-X“ CPU-Generation integriert und war vor allem durch seine extrem hohe Leistungsaufnahme bekannt. Kraft und Kraftstoff, ihr wisst schon.
CPUs der Intel Mainstream Plattformen mit kleineren Sockeln haben das Feature erst deutlich später und vor kurzem bekommen, mit der 11. Generation, auch bekannt als Rocket Lake. Diese Generation litt bekanntlich unter vielen anderen Problem, weswegen AVX-512 hier nicht wirklich zur Sprache kam. Aber immerhin war es standardmäßig aktiv und hat in der einen oder anderen Anwendung für etwas mehr Leistung gesorgt.
Unser Britische Kollege Dr. Ian Cutress hat zur Vorgeschichte von AVX-512 und Alder Lake ausführlich auf Twitter berichtet. Also wer sich für die Details interessiert, dem kann ich diesen Thread ans Herz legen.
Just to clarify in Roman's video here. Intel's engineers (Ari) specifically stated in Architecture Day (Aug) that AVX512 was fused. I explicitly asked the question if AVX512 would work in any instance, and they said no.https://t.co/jEgnrbKTEG
— 𝐷𝑟. 𝐼𝑎𝑛 𝐶𝑢𝑡𝑟𝑒𝑠𝑠 (@IanCutress) November 7, 2021
Aber zurück zu heute und unserem Test: Nach dem Launch ist Fakt, das Feature ist physisch vorhanden und von allen Mainboard-Herstellen in BIOS-Updates auf so gut wie jedem Board zugänglich gemacht worden. Einzige Voraussetzung für das Aktivieren von AVX-512 ist das Abschalten der E-Kerne, die den Befehlssatz aufgrund ihrer Architektur nicht unterstützen.
Nun haben wir also diese neue, sonderbare Hybrid-Plattform, mit jeweils 8 P- und E-Kernen, wovon aber nur erstere AVX-512 unterstützen. Also hat sich mir natürlich die Frage gestellt: Welche Konfiguration performt denn nun eigentlich am besten, alle Kerne, nur P-Kerne, nur P-Kerne mit AVX-512? Wir hatten in einem vergangenen Test ja bereits gesehen, dass die E-Kerne nicht immer der Leistung zuträglich sind, etwa weil sie das Speichersystem zusätzlich belasten oder den Cache-Takt absenken, aber dazu gleich noch mehr.
Ich falle gleich mal mit der Tür ins Haus, so wie sie mir auch ins Gesicht fiel, als ich bei ersten Tests mit den Einstellungen mal herumspielte:
Prime 95 ist ein altbekannter Stresstest mit sehr hoher CPU-Last, der mit Alder Lake noch so seine Probleme hat und nur 16 Threads unterstützt, auch wenn die neuen CPUs ja standardmäßig eigentlich 24 haben. In Folge dessen langweilt sich ein Drittel der Kerne und entsprechend ist auch der Stromverbrauch geringer. Aber das ist nur ein Nebenschauplatz. Interessant wird es wenn wir die P-Kerne mit und ohne AVX-512 vergleichen. Denn wenn das Feature AVX-512 aktiv ist, hat die CPU eine geringere Leistungsaufnahme als ohne. “Kann gar nicht sein, AVX-512 war schon immer das Hölleninferno von Befehlssätzen, da muss etwas faul mit HWInfo sein!”, dachte ich mir. Also habe ich mit dem Elmorlabs (Power Measurement Device) einmal auf Hardware-Ebene nachgemessen.
Das Gerät ist eigentlich nur Eine Platine mit Messwiderständen, die zwischen Netzteil und 12 V EPS-Anschluss des Mainboards verkabelt wird. So kann es den Strom, der für die CPU-Stromversorgung an das Mainboard geliefert wird, relativ präzise messen. Das Ergebnis sehr ihr auch schon oben im Diagramm. Zum einen bestätigt sich der Trend, dass 8 P-Kerne mit AVX-512 weniger Strom brauchen als ohne, und zum anderen zeigt sich ein großer Unterschied zwischen Leistungsmessungen in Hardware und Software mal wieder deutlich. Hier kommen die auf Mainboards vordefinierten AC und DC Loadlines ins Spiel, die Igor ja letztens schon beleuchtet hatte.
Nun wollte ich aber noch wissen, leisten die P-Kerne mit AVX-512 denn nun einfach nur weniger Arbeit oder liegt der geringeren Leistungsaufnahme tatsächlich eine höhere Effizienz zugrunde? Hierfür habe ich mir zwei synthetische Benchmarks rausgesucht, von denen bekannt ist, dass sie von AVX-512 profitieren, Y-Cruncher und LinX. Und interessehalber habe ich noch das Spiel Far Cry 6 in den Ring geworfen, da es bei unserem vergangenen CPU-Generationenvergleich am deutlichsten Unterschiede zwischen CPUs beim Daddeln sichtbar machen konnte. Die verwendete Test-Hardware gibt’s wie immer hier zum Nachlesen:
Testsysteme |
|
---|---|
Hardware: |
|
Kühlung: |
|
Gehäuse: |
|
Peripherie: |
|
Messgeräte |
|
49 Antworten
Kommentar
Lade neue Kommentare
1
Veteran
Veteran
Mitglied
Mitglied
1
1
Urgestein
Urgestein
1
Mitglied
Urgestein
Veteran
Veteran
Urgestein
Alle Kommentare lesen unter igor´sLAB Community →