Effizienz-Geheimtipp AVX-512 auf Alder Lake – Der wieder aufgetauchte Befehlssatz im Praxistest

Redaktion

Artikel-Butler
Mitarbeiter
Mitglied seit
Aug 6, 2018
Beiträge
1.818
Bewertungspunkte
8.817
Punkte
1
Standort
Redaktion
AVX-512 war rund um den Launch der neuen Intel Alder Lake CPUs ein heiß diskutiertes Thema. Erst hieß es, die P-Kerne unterstützten es grundsätzlich, aber um einen gemeinen Befehlssatz mit den E-Kernen bieten zu können, werde das Feature auf Silizum-Ebene abgeschaltet. Später hätten dann aber Mainboard-Hersteller das Feature funktionsfähig auf den CPUs vorgefunden und es (read full article...)
 
..., aber aus 08/15 Kunden Sicht (subjektiv) überzeugt mich die Plattform überhaupt nicht. Und das ist der Eindruck oder Beigeschmack, der sich irgendwie einstellt.
Um 3 Ecken wird ein Vorzug zur nicht genannten Konkurrenz konstruiert, der bestimmt vorhanden ist, aber eigentlich kein Stück für mich als Nutzen sehe. (das heißt nix, ich bin bestimmt nicht der Premium User, der das alles zu schätzen weiß)

Abgesehen von AVX 512 ist gerade für 08/15 Nutzer Alder Lake in Form eines 12600(K) doch erste Wahl, wenn die Preise bald fallen. Das modernere, noch einmal CPU-aufrüstbare System mit anständig höherer Singlecore Leistung und sehr guter Multicoreleistung. Und zum Kostensparen halt ein preiswerteres DDR4 Mainboard. Jetzt noch Ryzen 5000 zu kaufen macht doch weniger Sinn.
 
warum soll das keinen sinn machen jetz noch einen ryzen zu kaufen?

jetzt board und CPU mit zb 8kernen holen und später, wenn upgegradet werden sol, einen 5950, dann mit 3D-cache ist eine gute upgrade-strategie.
und mit intels neuen CPU's kann man das auch so machen, wobei ich bei intel immer nicht das vertrauen habe, das es auch funktioniert und man nicht doch ein neues board braucht.

und zum RAM: naja, was es heute an DDR5 gibt ist nicht wirklich schneller, ich zb hab meinen rechner gar noch auf DDR3 laufen :) funktioniert tadelos und ich krebse nicht mit nur 10fps dahin.....
DDR5 ist nett, aber erst in mindestens 2-3jahren so weit das sich da ein neukauf lohnt, nur wegen dem RAM.
DDR4 ist umgekehrt keine brense derzeit, also, wenn man nicht eh neukauft, warum zwingend DDR5?!
 
Zuletzt bearbeitet :
Wie gesagt, aus meiner subjektiven Sichtweise......
Wozu soll ich mit jetzt (Sig) den Stress antun meine AM4 Plattform mit Verlust zu verkaufen, um dann mich über die 1. Gen. DDR5 (Speed/Timing/Verfügbarkeit) rumzuärgern, um ein AVX zu bekommen, was mir in WQHD mit 6900XT was nützt?
Dann nehme ich lieber aus Spaß an der Freude einen (und je nach Preis) 3D-Cache Ryzen mit und gebe den 5900X an nächst schwächeren PC weiter (Junjor) und schaue mit in meinen üblichen GraKa Limit und mit gewissen Abstand die nächste Hi-End Graka entgegen.....
(noch gaaaaanz weit weg) und vielleicht das nächste CPU - Limit und wie sich bis dahin AM5 entwickelt.
Das ist aber halt auch OT und meine Meinung über mein persönliches GPU-Limit sollte nicht missgünstig gegenüber Entwicklungen Befehlssätze oder sonstiges sein bzw klingen.
 
Leeeude, was ist hier los? :D Ich habe maximal 101W mit CX ausgelesen in Far Cry 6 (P-Cores only und AVX512 on). Bitte nicht falsch verstehen, ich will nicht einfach nur stänkern, würd's gerne verstehen. Vom Prinzip her muss EPS 12V Power leicht über der Package Power liegen, da ja die Spannungswandlerverluste mit drin sind.

Anhang anzeigen 16182
auf welchem Board und mit welcher AC_LL und VRM LLC?

Denke mal, dass deine Zahlen schon nicht verkehrt sind. Wenn ich meine PMD 12 V EPS Werte nehme und ein bisschen Schaltverluste abziehe, käme das zumindest annähernd aufs gleiche
 
wobei es hier nicht um Personen geht die nach einem Jahr upgraden sondern perspektivisch die ein älteres System haben 3 Jahre + und dann ein upgrade vorsehen da bekommt man mit Intel im Moment halt das neuere "bessere" System. Sicher liegt immer an jedem selber aber für nen großteil wird es so sein
 
Neuer? Ja!
Besser? Hmmm
Seit Jahren ist die Situation eher so (AMD inklusive): Neues System = Ärger, 1Jahr später besser, 2 Jahre später ausgereift"er" usw.

Aktuell würde ich kein AlderLake kaufen, Bios Gedöns, Motherboard halbgar, DDR5 Mondpreise bzw. ausverkauft, Schedulerprobleme Win10/Linux, ...
Verstehe die ganze Technik nicht mehr, da hat man Hardware-Dispatcher verbaut aber für AVX512 muss man E-Kerne abschalten (wer designed so einen Murks), für Software X Hyperthreading OFF, für Software Y noch ne Sonderlocke etc.
Und am Ende ist man bei einem 08/15 System mit default Einstellungen das sich nicht wirklich spürbar von einem AMD-System absetzen kann, preislich auch nicht.
Bei AMD gibts halt "nur" USB-Probleme...
Das geht irgendwie alles in die falsche Richtung...
 
Ich hätte gerne einen Nachfolger für die X299 Plattform zu einem brauchbaren Preis. sTRX ist mir da schon "too much". Und da sehe ich nix am Horizont.
 
Wenn man sieht wie ähnlich die Leistung der Konfiguration E-Kerne mit AVX512 und "Out of the box" ist, dann bestätigt sich mein Jahre alter Verdacht, dass Big little auf dem Desktop begrenzt nützlich ist.
Ja, ein geringer Effiziensgewinn ist da und man muss sich über jedes Prozent freuen.
So wie es aussieht hätte sich Intel aber sehr viel Designarbeit schenken können.

Andererseits steht Intel ja mit dem Konzept ganz am Anfang und wer weiß, ob mit der Erfahrung die jetzt gemacht wird in Zukunft nicht noch deutlich mehr gewonnen werden kann.

Im Interesse der Kompatibilität (hat da jemand Kopierschutz gesagt?) ist es gemessen an den Testergebnissen hier aktuell vermutlich sogar zu empfehlen die E-Kerne zu deaktivieren.

Bleibt die Frage: Hat Intel es ursprünglich mit AVX512 so gehandhabt, damit genau das nicht zum Hauptthema beim Launch wird?

Am Ende ist Alder Lake ja ein sehr gelungenes Produkt
 
auf welchem Board und mit welcher AC_LL und VRM LLC?
Hab die DDR5 Benchmarks auf dem ASUS ROG MAXIMUS Z690 HERO gemacht. Die von dir erwähnten Settings waren auf Auto. Vcore LLC selbst hatte ich auf Level 4 eingestellt.
Denke mal, dass deine Zahlen schon nicht verkehrt sind. Wenn ich meine PMD 12 V EPS Werte nehme und ein bisschen Schaltverluste abziehe, käme das zumindest annähernd aufs gleiche
Eigentlich müsste man ja nur die Spannungswandlereffizienz gegenrechnen. Wo liegt die so? Bei knapp über 90% würde ich schätzen. Dann bleibt noch Frage, ob die Stromversorgung auch teils über den 24-Pin Stecker abgedeckt wird?!
 
Wenn man sieht wie ähnlich die Leistung der Konfiguration E-Kerne mit AVX512 und "Out of the box" ist, dann bestätigt sich mein Jahre alter Verdacht, dass Big little auf dem Desktop begrenzt nützlich ist.
Ja, ein geringer Effiziensgewinn ist da und man muss sich über jedes Prozent freuen.

Was mir in dem Thread hier völlig untergeht, ist doch der folgende Punkt: Es wird hier die Effizienz während der maximal Auslastung der CPU getestet.

Die Anzahl an Desktop CPUs in der Welt, welche regelmäßig im absoluten CPU Limit laufen, sollte verschwinden gering sein. Und dafür ist bigLITTLE sicher auch nicht primär gedacht. Die absolut überwältigende Mehrheit der CPUs wird, meiner Meinung nach, den Großteil ihrer Zeit im unteren einstelligen Prozentbereich rumdümpeln.
 
Hab die DDR5 Benchmarks auf dem ASUS ROG MAXIMUS Z690 HERO gemacht. Die von dir erwähnten Settings waren auf Auto. Vcore LLC selbst hatte ich auf Level 4 eingestellt.

Eigentlich müsste man ja nur die Spannungswandlereffizienz gegenrechnen. Wo liegt die so? Bei knapp über 90% würde ich schätzen. Dann bleibt noch Frage, ob die Stromversorgung auch teils über den 24-Pin Stecker abgedeckt wird?!
Ok, dann haben wir immerhin schon mal die selben Widerstandswerte je "Level" im BIOS. Aber das "Auto"-Verhalten kann sich auch je BIOS-Version ändern. Hier wäre es gut zu wissen, was der tatsächlich angewandte Wert in Ohm für AC_LL und DC_LL ist, da dementsprechend ja die SVID bzw. die berechnete Package Power beeinflusst wird.

Im BIOS sieht man leider den aktuellen Wert nicht, aber über das Asus "Work Tool" Tool.exe lässt es sich auslesen, unter Intel / Monitoring:
avx512_acdc_readout.png
Bei mir sind es 0.6 mOhm. Wäre interessant zu wissen, was dein Hero hier verwendet.

VRM LLC hatte ich Auto, sprich Level 3, also 1.1 mOhm.

Der VCore VRM läuft i.d.R. immer auch über die 12 V EPS Zufuhr, also ja die Effizienz müsste man abziehen. Das Hero hat einen etwas weniger effizienten VRM mit 18 Vcore SPS je 90A, während das Apex 22 SPS je 105A hat. Grob überschlagen würde ich 200 A für Volllast annehmen und dann sollten die Schaltverluste etwa bei 20 W auf dem Hero und 15 W auf dem Apex liegen.

Artverwandte Frage, wenn du auf dem Hero AVX512 aktivierst und einen statischen Takt einstellst, z.B. 5.0 GHz, taktet die CPU bei dir unter Volllast (P95 Small FFTs) um 100 MHz runter?
 
Artverwandte Frage, wenn du auf dem Hero AVX512 aktivierst und einen statischen Takt einstellst, z.B. 5.0 GHz, taktet die CPU bei dir unter Volllast (P95 Small FFTs) um 100 MHz runter?
Habe ich noch nicht getestet. Hast du einen AVX-512 Offset eingestellt? Ich glaube, der ist default bei 0.
 
Habe ich noch nicht getestet. Hast du einen AVX-512 Offset eingestellt? Ich glaube, der ist default bei 0.
Es gibt kein AVX512 Offset im BIOS, nur ein AVX2 Offset und letzteres funktioniert auch.

Ich kann z.B. mit AVX2 5.3 GHz bei 1.15Vmin im Prime95 Small-FFTs problemlos 10 Minuten laufen lassen, ca. 320 W und knapp unter 100 °C.

Wenn ich aber AVX512 aktiviere (bzw auf auto lassen nachdem ich die E cores deaktiviere), taktet sich die CPU unter selber Last nach wenigen Sekunden immer um x1 Multiplikator runter, auch bei 3.2 GHz und 1.0 Vmin mit 68 W und 36 °C. Super strange...
 
@Igor Wallossek Zum Thema Offtopic: Ich war auch kürzlich wieder unvernünftig und habe mir einen AmpX und Cambride DacMagic 200M angeschafft. Weil? Braucht man halt. Naja, oder auch nicht.

180W packt der AmpX zwar auch nicht (und 5:1 kann der sowieso nicht), aber Stereo mit bis zu 110W reicht für meine Zwecke locker aus - wenn's hoch kommt, muss der nur zwei NuVero50 befeuern... ;)

Mal schauen, was dann noch in Sachen Subwoofer nötig sein wird... :p

@skullbringer Danke für den Artikel! :D
 
Wenn man sieht wie ähnlich die Leistung der Konfiguration E-Kerne mit AVX512 und "Out of the box" ist, dann bestätigt sich mein Jahre alter Verdacht, dass Big little auf dem Desktop begrenzt nützlich ist.
oder
W10 ist net geeignet, um AVX512 auf die richtigen Cores zu bringen!?

W11+ thread director und Nachhilfe vom Studio per Patch sollten Das doch regeln können.
 
Das is ja ein ganz schöner Klopper:
 

Anhänge

  • nubert-nusub-xw-1200-subwoofer-home-65285.jpg
    nubert-nusub-xw-1200-subwoofer-home-65285.jpg
    204,2 KB · Aufrufe : 12
Was soll ich sagen außer "gmta"...

Aktuell ist der Raum leider noch 'ne Baustelle. Aber das ist auch das Wohnzimmer und ampX/200m sind für einen anderen Raum, für den ich nie im Leben so einen durchbekäme (und auch wirklich mal so richtig schwachsinnig wäre). :D

sub.jpg

Bin auch noch am Austesten, wo ich das Ding hinstelle - der wummert halt doch schon ganz ordentlich, wenn er nicht ideal steht... ;)

P.S.: vielleicht mal im anderen Sub-Forum nen Nubert-Sammler oder so aufmachen... sorry for offtopic! ;)
 
So nah an der Wand wird das nix... die sind leider recht wählerisch was den Aufstellort anbelangt.
Ich wollte den Kleinen hinterm Sofa verstecken, das ging voll in die Hose.
Jetzt steht er etwas auffälliger frei und die Frau nennt ihn Kühlschrank...
 
Ich bin mir nicht ganz sicher ob ich den Inhalt des Artikels korrekt erfasst habe, geht es hier um:

A) Den Fakt dass wenn man die E-Cores deaktiviert hat, es anscheinend einen geringeren Stromverbrauch gibt wenn AVX512 am Board aktiviert ist aber von der Anwendung garnicht genutzt wird?

B) Dass der AVX512 Befehlssatz unter Alder Lake plötzlich total effizient geworden ist?

Also zu B) würde ich mal behaupten dass dies eher unwahrscheinlich ist und Phoronix hat zumindest unter Linux dass auch schon getestet und da explodiert die Leistungsaufnahme wie üblich: https://www.phoronix.com/scan.php?page=article&item=alder-lake-avx512&num=2

Bei A) wäre mal interessant ob das an einer nicht unterstützten / unvollständig implementierten Version des AVX512 liegt. Normalerweise wird ja mit aktivierten AVX auch die CPU Frequenz limitiert da dass Ganze sonst temperaturmäßig schnell ausser Kontrolle gerät. Es wäre hier interessant zu wissen was die Ursache für den geringeren Verbrauch ist.
 
Oben Unten