Es ist endlich soweit: AMD hat sein lang erwartetes Versprechen eingelöst und die APU der Exascale-Klasse, der Instinct MI300A, geht in endlich Serie. In diesem Quartal beginnt die Serienproduktion und die APU wird voraussichtlich 2024 als die schnellste HPC-Lösung weltweit verfügbar sein. Man hat lange darauf gewartet und konnte es kaum erwarten, die Leistungsfähigkeit dieser neuen Technologie zu erleben.
Die AMD Instinct MI300A APU vereint unterschiedliche Architekturen und Verbindungstechnologien wie Zen 4, CDNA 3 und die neueste Generation der Infinity-Architektur. Die MI300A APUs bieten eine Reihe von Highlights.
Bis zu 61 TFLOPS FP64-Berechnung
Bis zu 122 TFLOPS FP32-Berechnung
Bis zu 128 GB HBM3-Speicher
Bis zu 5,3 TB/s Speicherbandbreite
146 Milliarden Transistoren
Die MI300A ähnelt stark der MI300X, jedoch mit dem Unterschied, dass sie auf speicher- und Zen-4-optimierte Kerne setzt. Nun wollen wir uns den Details dieser Exascale-Leistung für HPC der nächsten Generation und KI-Rechenzentren zuwenden.
Ein aktiver Chip hat zwei CDNA 3 GCDs entfernt und durch drei Zen 4 CCDs ersetzt, welche jeweils eigene Cache-Pools und Core IPs besitzen. Auf dem Chip sind nun insgesamt 24 Kerne und 48 Threads vorhanden, aufgeteilt in 8 Kerne und 16 Threads pro CCD. Zusätzlich gibt es einen separaten Cache-Pool pro CCD mit einer Größe von 32 MB sowie einen L2-Cache von 24 MB (1 MB pro Kern). Es ist zu beachten, dass auch die CDNA 3 GCDs über einen separaten L2-Cache verfügten.
AMD hat auf der GPU-Seite insgesamt 228 Compute Units aktiviert, die auf der CDNA 3-Architektur basieren. Dies entspricht 14.592 Kernen, was bedeutet, dass pro GPU-Chiplet 38 Compute Units vorhanden sind. Hier sind einige der herausragenden Merkmale der AMD Instinct MI300 Accelerators zusammengefasst:
Erstes integriertes CPU+GPU-Paket
Ziel Exascale-Supercomputer-Markt
AMD MI300A (integrierte CPU + GPU)
146 Milliarden Transistoren
Bis zu 24 Zen 4-Kerne
CDNA 3 GPU-Architektur 228 Compute Units (14.592 Kerne)
Bis zu 128 GB HBM3-Speicher
Bis zu 8 Chiplets + 8 Memory Stacks (5nm + 6nm Prozess)
AMD hat erneut den MI300A mit dem H100 verglichen, diesmal jedoch in HPC-spezifischen Workloads. In Bezug auf die Leistungszahlen konnte die Instinct MI300A APU in OpenFOAM eine bis zu 4-fache Leistungssteigerung erzielen. Dies ist hauptsächlich auf die vereinheitlichte Speicheranordnung, die GPU-Leistung sowie die insgesamt verfügbare Speicherkapazität und Bandbreite zurückzuführen. Im Vergleich zu NVIDIAs Grace Hopper Superchips bietet das System auch eine bis zu 2-fache Leistung pro Watt.
Es wurde bestätigt, dass die Instinct MI300A APUs nun ausgeliefert werden und auch für die Energieversorgung des kommenden El-Capitan-Supercomputers verwendet werden. Dieser wird voraussichtlich eine Rechenleistung von bis zu 2 Exaflops bieten. Es ist erwähnenswert, dass AMD das einzige Unternehmen ist, das bisher mit dem Frontier-Supercomputer die Grenze von 1 Exaflop durchbrochen hat und zudem das effizienteste System auf der Welt besitzt.
Quelle: AMD
15 Antworten
Kommentar
Lade neue Kommentare
Urgestein
1
Veteran
Urgestein
Urgestein
Veteran
Urgestein
Urgestein
Urgestein
Veteran
Urgestein
Urgestein
Urgestein
Veteran
Alle Kommentare lesen unter igor´sLAB Community →