Hallo zusammen,
beruflich rechne ich gerade auf einem E5-2683 v4 @ 2.10GHz Knoten (2 Sockel, 64 logische Kerne). Ich nutze alle Kerne zur Approximation einer 3-dimensionalen Funktion (B-Spline). Für eine geringere Menge an Gitterpunkten (10^6) lässt sich die Berechnung gut parallelisieren (Fortran, Openmp), d.h. alle 64 Kerne werden 100% ausgelastet . Erhöhe ich die Anzahl der Gitterpunkte (z.B. auf 6 * 10^6) sinkt die Auslastung (z.B. auf 50%). Ich bin kein Informatiker und verstehe nicht, wo hier das Problem liegt. Die Berechnungen der einzelnen Gitterpunkte sind jedenfalls unabhängig voneinander (threadsicher). Ich vermute, es hat etwas mit der Speicheranbindung (RAM?, Cache?) zu tun. Kann das jemand bestätigen oder hat jemand eine andere Vermutung?
VG,
Matthias
beruflich rechne ich gerade auf einem E5-2683 v4 @ 2.10GHz Knoten (2 Sockel, 64 logische Kerne). Ich nutze alle Kerne zur Approximation einer 3-dimensionalen Funktion (B-Spline). Für eine geringere Menge an Gitterpunkten (10^6) lässt sich die Berechnung gut parallelisieren (Fortran, Openmp), d.h. alle 64 Kerne werden 100% ausgelastet . Erhöhe ich die Anzahl der Gitterpunkte (z.B. auf 6 * 10^6) sinkt die Auslastung (z.B. auf 50%). Ich bin kein Informatiker und verstehe nicht, wo hier das Problem liegt. Die Berechnungen der einzelnen Gitterpunkte sind jedenfalls unabhängig voneinander (threadsicher). Ich vermute, es hat etwas mit der Speicheranbindung (RAM?, Cache?) zu tun. Kann das jemand bestätigen oder hat jemand eine andere Vermutung?
VG,
Matthias
Zuletzt bearbeitet
: