Frage IPC bei single vs multi?

Babyface

Veteran
Mitglied seit
Jan 5, 2020
Beiträge
395
Bewertungspunkte
22
Punkte
17
Grüße

Ich hab mal aufgeschnappt wie jemand gerne die IPC zwischen IPC-ST und IPC-MT (single-threaded und multi-threaded) unterscheiden würde und dafüre Winrar 5.x Bench als Basis nahm. Wohl mangels zum Zeitpunkt anderer Vergleichsmöglichkeiten.
Ein wohl recht temperiertes System mit einem 2500k und 4.5Ghz gegen einen 9900KS mit 5.2Ghz. Das Ergebnis war:
2500k - 7339 (DDR3-2000)
9900KS - 36143 (DDR4-4266)

In etwa 5x schneller. Jetzt bringt so ein 9900Ks aber 8 Kerne und 16 Threads. Um die Leistung pro Kern zu ermitteln wurden die Ergebnisse durch die Anzahl der Threads dividiert. Plus und anhand dessen auch noch in etwa die Leistung des 9900KS bei ebenfalls 4.5Ghz angepeilt. Ergab:
2500k - 1845/Thread
9900KS - 2259/Thread
9900KS "4.5 Ghz" - 1918/Thread

Das wäre jetzt glaub ich etwas um +4.5% rum Zugewinn pro Thread beim 9900KS beim gleichen Takt. Bei einem Benchmark der auf Speicherspeed wie Timings feststellbar reagiert. Also auch noch DDR3 vs. DDR4 (wie oben).
Da befand er, die heilige Kuh IPC sieht in einem multi-threaded Szenario mal ganz anders als im single-threaded. Erstmal wohl ja. Das ist ein anderes Bild, als wenn man die beiden gegenüberstellt und Multithreading abwählt ;)

Nur war das eben Winrar. Keine Ahnung, ob der überhaupt 16 Threads kann und wenn, wie er sie auslastet. Vielleicht wäre es richtiger, das Ergebnis vom 9900KS nur durch 8 zu teilen?
Die Rangehensweise im Bezug auf die "realen" Vorzüge von gesteigerten IPCs fand ich aber trotzdem interessant. Warum, vielleicht später in folgenden Beiträgen.

Es gibt aber noch z.B. 7-zip. Aktuell als 19.02alpha die ich selbst aber schon seit Anfang genauso nutze wie jede andere davor. Es rennt stressfrei.
Und beim 7-zip kann man beim Benchmark die Anzahl der Kerne auswählen (!)
Hat wer Lust da 4 Threads (32MB) zu wählen, um die IPC-MT gegenüber dem 2500k zu vergleichen?
Mit so einem kann ich nämlich noch selbst dienen. 30s laufen lassen, dann stoppen und Screenshot hierhin. BESTENS wäre es natürlich, wenn man den Multi bei der eigenen CPU für max. 4.5 Ghz begrenzt. Wer eh nicht soweit kommt, könnte mit Maxtakt testen und mit soviel weniger, wie ihm von Max nach 4.5 Ghz fehlen. Und den Unterschied zu seinem Max addieren. Wäre das wenigstens halbwegs realistisch? Beispiel:
Max 3.6Ghz - 34000, es fehlen 900Mhz zu 4.5Ghz. Zweiter Test mit (3600-900=) 2.7 Ghz - 25500. 900Mhz machen also 8500 aus. Bei "4.5" Ghz also 42500.

Der Rechner mit dem 2500k macht hier 25711
 

Anhänge

  • 7zip19-b.png
    7zip19-b.png
    18,9 KB · Aufrufe : 8
Also die IPC pro Thread zu berechnen ergibt in meinen Augen wenig Sinn, wenn man CPUs mit und ohne HT vergleicht. HT bringt in der Realität soweit ich weiß ca. 30 % Mehrleistung, je nach Anwendung. Außerdem weiß ich nicht, wie gut der Benchmark von Winrar über so viele Kerne skaliert und welchen Einfluss der RAM hat. Wenn man wirklich die IPC vergleichen will, dann sollte man bei beiden CPUs nur einen Kern aktivieren, HT ausschalten und den gleichen RAM verwenden (welcher allerdings auch wieder limitieren kann). Dann kann man nacheinander weitere Kerne aktivieren und gucken, ob die Abstände gleich bleiben.

Hier (https://www.computerbase.de/2017-11..._in_anwendungen_ist_sandy_bridge_abgeschlagen) ist ein Test, bei dem zumindest der 2600K und der 4770K mit gleichem RAM und fast gleichem Takt verglichen werden. Winrar ist nicht dabei, aber bei 7-zip liegt Haswell um 6 % vorne, über alle Tests getitelt sind es 17 %.

Andererseits besteht "technischer Fortschritt" mMn nicht nur in der Verbesserung der IPC bei gleichem Takt sondern auch darin, dass es nun möglich ist, bei gleichem Stromverbrauch mehr Kerne oder einen höheren Takt zu nutzen. Dazu kommt, dass andere Flaschenhälse (RAM, Cache, PCIe, ...) auch ausgemerzt werden sollten.
 
Dazu fällt mir was richtig altes ein, was es bisher noch nicht auf diese Seite geschafft hat:
 
Habe auch große Zweifel an der Vergleichbarkeit der "Testergebnisse". Vor allem RAM kann ein entscheidender Faktor sein.

Will aber kein Spielverderber sein, der 3960X mit Win10 in einer VM liefert Folgendes:

2977

3960X ca. 20% schneller als der 2500K.
 
Ok im Marketingsprech wäre das dann: ausgewählte Anwendungen :D
Ich sehe schon das für den Fall ist wirklich keine große Steigerung sichtbar. Der Test von GN zum Thema 2600k Revisited hat aber schon gezeigt das sich Intel weiterentwickelt, sowohl in Games und als auch in Anwendungen. Man muss ja auch betrachten das der 9900K bei 4,5 Ghz wahrscheinlich weniger Strom verbraucht als der deutlich übertaktete 2500k (vermute ich einfach mal so :) ). Von daher ist ein Takt-für-Takt-Vergleich (mmn.) nur bei Betrachtung der Watt sinnvoll. Aber coole Anregung!
 
Ou... Mist. Zwei Fehler meinerseits:
- nicht ausdrücklich drum gebeten, daß wer seinen Erstsenf dazu geben will, auch erst die Zahlen liefern sollte
- nicht klarer gebeten, daß Maxtakt und DDR-Speichertakt mit angegeben wird

Man kann sagen was man will, Besterino liefert :) Danke.
Speicher spielt hierbei natürlich ordentlich mit ein, gehört aber halt zur Architektur und wirkt sich letztendlich auch im RL aus. Ich wollte den Betreff auch nicht gleich ganz ausarten lassen. Wer ruhiger schlafen möchte kann das Thema als "System-IPC/MT" verstehen. Den Bench und die Methodik finde ich diesbezüglich fairer als den rein synthetischen Blödsinn.

@Dezor
Ich denke das Thema "Allgemeiner technischer Fortschritt der Architekturen und Platformen" wäre an der Stelle kleinwenig OT...
 
Zuletzt bearbeitet :
Ist halt ein sehr theoretisches Thema. Am Ende zählt was hinten raus kommt, und zwar in der konkreten Anwendung. Wenn es reicht, ist gut, wenn's nicht reicht, ist's Käse. Genauso ist's m.E. auch bei (relativer) Performancesteigerung: wenn ich hinten raus 25% mehr Bumms hab, ist's recht egal ob das über mehr Kerne, mehr Takt oder mehr IPC erreicht wird und ein Upgrade lohnt sich eben ggf. (oder ggf. auch nicht). Wenn ich nicht mehr Bumms hab, ist's auch egal, wenn eine CPU theoretisch 25% mehr Takt/Kerne/IPC hat...
 
Ist halt ein sehr theoretisches Thema.
Sehe ich ehrlich gesagt garnicht so. Ein sehr theoretisches Thema wird es, wenn man dafür Aida&Co. abfeuert.

Das was am Ende rauskommt muss ja nicht verhindern, daß man sich die Bestandteile dessen auch mal näher anschaut. Wenn die Hersteller in ihren Hochglanzfolien nicht auch über IPC jodeln würden, würde man auch nicht auf sowas kommen ;)
Neuancen ausgelassen, läuft die Entwicklung der CPUs halt als B x H x T. Breite x Höhe x Tiefe. Kernanzahl x Takt x IPC.

Wenn immer nur interessieren sollte was insgesamt am Ende rauskommt, wird es einerseits langweilig ;) Andererseits kann man in den Diskussionen darüber auch viele anderen Sachen auslassen. Wie den Verbrauch zum Beispiel. Wird die Leistung geliefert die man zu benötigen meint, mit einem 850W Netzteil? Na dann ist doch alles ok...

Für mich ist sowas nur interessant. Wenn ich einkaufen gehe wie auch einfach nur schaue, ob und was ich gut finde, schaue ich auch nur was mit meiner Soft dabei rauskommen würde.
Wenn z.B. ein 3600 die IPC vom Core2Duo hätte und trotzdem die Leistung wie jetzt auch, weil sie z.B. L4 integriert hätten, ich würde ihn genauso super finden wie ich es jetzt tue.
 
Zuletzt bearbeitet :
Wer schneller rechnet ist schneller fertig (und im stromsparenden idle-modus).

Bei normalem Misch-Einsatz ist daher die maximal-Last regelmäßig nicht der ausschlaggebende Faktor. Da schmerzt es eher, wenn ein System im idle überproportional Strom verbraucht.
 
Wer schneller rechnet ist schneller fertig (und im stromsparenden idle-modus).
Trotzdem vermute ich, die Ratios idle_power/load_power und idle_time/load_time spielen da schon entscheidend mit rein ;)

Wir schweifen aber mal wieder vom Thema ab. Apropos. Deine 20% sind nicht nach meinem Vorschalg taktbereinigt. Oder lief/läuft die CPU mit 4.5 Ghz?
 
Zuletzt bearbeitet :
Lässt sich leider nicht so einfach feststellen: in der VM funktionieren die gängigen Tools nicht. Ich kann mit ESXTOP zwar die Cores beobachten, aber nur mit 2s-Intervallen und ich kann nicht genau sehen, auf welchen der Kerne die VM bzw. der Benchmark rennt.

Ich sehe halt, dass laut ESXTOP wohl der Takt auf verschiedenen Cores von 3,8GHz bis hoch zu 4,3GHz (ganz selten max. 4,510) geht - das sind aber gerne mehr als 4 Kerne und ich vermute, das sich der Scheduler von ESXi da im Hintergrund fleißig austobt.

Was kann man also festhalten: tendenziell ist das Ergebnis noch nach oben zu korrigieren, da nach meiner Einschätzung die Kiste nicht dauerhaft bei 4,5GHz rennt, sondern schätzungsweise eher so bei 4,1-4,3.
 
@Gandalf_AwA
War das jetzt Sarkasmus oder Ironie?

Ich sehe schon das für den Fall ist wirklich keine große Steigerung sichtbar. Der Test von GN zum Thema 2600k Revisited hat aber schon gezeigt das sich Intel weiterentwickelt, sowohl in Games und als auch in Anwendungen.
"Anwendungen" bei einem GN Test ist eine kleine Übertreibung ;) Dazu schreibt der Experte nie die Takte dabei, man muss also die x86 Geschichte seit spätestens 2010 studiert haben, um immer aus dem FF zu wissen was "Stock" in einer Tabelle aus 20 CPUs jeweils meint. Völlig Banane.

Man muss ja auch betrachten das der 9900K bei 4,5 Ghz wahrscheinlich weniger Strom verbraucht als der deutlich übertaktete 2500k (vermute ich einfach mal so :) ). Von daher ist ein Takt-für-Takt-Vergleich (mmn.) nur bei Betrachtung der Watt sinnvoll.
Ich weiß nicht, ob das so hinhaut. Die 4.5Ghz macht ein 2500K, der nicht gleich ganz vom Rande des Waffers stammt, immer mit <1.4V. Ob ein 9900KS da weniger verbraucht? Da hatte Igor doch schon einiges zu geschrieben oder? ;)
 
Oben Unten