Am Donnerstag verkündeten das Argonne National Laboratory und Intel den erfolgreichen Abschluss der Installation von 10.624 Blades für den Supercomputer Aurora. Dieses System wird voraussichtlich im Laufe des Jahres 2023 in Betrieb genommen. Der Aurora-Supercomputer, der von HPE entwickelt wurde, besteht aus 166 Racks, von denen jedes 64 Blades enthält, insgesamt also 10.624 Blades. Jedes dieser Blades basiert auf zwei Xeon Max “Sapphire Rapids” Prozessoren mit 64 GB On-Pack HBM2E-Speicher und sechs Intel Data Center Max “Ponte Vecchio” Compute GPUs. Um eine beeindruckende Leistung von über zwei FP64 ExaFLOPS zu erreichen, werden diese CPUs und GPUs mithilfe eines speziellen Flüssigkeitskühlsystems gekühlt.
Der Aurora-Supercomputer beeindruckt mit seinen umfangreichen Ressourcen. Er verfügt über insgesamt 21.248 Universal-CPUs, die mit über 1,1 Millionen Hochleistungskernen ausgestattet sind. Zudem besitzt er beeindruckende Speicherkapazitäten, darunter 19,9 Petabyte (PB) DDR5-Speicher und 1,36 PB HBM2E-Speicher, der direkt mit den CPUs verbunden ist. Darüber hinaus ist der Supercomputer mit 63.744 Compute-GPUs ausgestattet, die speziell für massiv-parallele KI- und HPC-Workloads entwickelt wurden. Diese GPUs verfügen über 8,16 PB HBM2E-Speicher. Um die Leistungsfähigkeit dieser Ressourcen optimal zu nutzen, sind die Blades des Aurora-Supercomputers über die Slingshot Fabric von HPE miteinander verbunden. Diese speziell für Supercomputer entwickelte Verbindungstechnologie gewährleistet eine effiziente Datenübertragung und Kommunikation zwischen den Komponenten des Systems.
Jeff McVeigh, Corporate Vice President und General Manager der Super Compute Group von Intel, erklärte, dass Aurora den ersten Einsatz des Grafikprozessors der Max-Serie von Intel darstellt. Zudem handelt es sich um das größte Xeon Max-basierte System und den weltweit größten Grafikprozessor-Cluster. Er betonte das stolze Gefühl, Teil dieses historischen Systems zu sein, und zeigte sich begeistert von den revolutionären Möglichkeiten im Bereich KI, Wissenschaft und Technologie, die Aurora ermöglichen wird. Der Aurora-Supercomputer besteht aus einem Netzwerk von 1.024 Speicherknoten. Diese Knoten umfassen Solid-State-Speichergeräte mit einer beeindruckenden Kapazität von 220 TB und einer Gesamtbandbreite von 31 TB/s.
Während die Installation der Aurora-Blades erfolgreich abgeschlossen wurde, stehen noch die Abnahmetests des Supercomputers aus. Nach der geplanten Inbetriebnahme später in diesem Jahr wird er eine theoretische Spitzenleistung von über 2 ExaFLOPS erreichen, was ihn zum ersten Supercomputer mit dieser Leistung macht und ihn in die Top500-Liste aufnehmen würde. Rick Stevens, stellvertretender Laborleiter am Argonne National Laboratory, erklärte: “Während wir uns auf die Durchführung der Abnahmetests vorbereiten, werden wir Aurora nutzen, um umfangreiche generative Open-Source-KI-Modelle für wissenschaftliche Zwecke zu trainieren. Mit mehr als 60.000 Intel Max Grafikprozessoren, einem äußerst schnellen I/O-System und einem Solid-State-Massenspeichersystem bietet Aurora die ideale Umgebung für dieses Training.”
Während der Aurora-Supercomputer noch in der Testphase steckt und das ANL seine Leistungsergebnisse noch bei Top500.org einreichen muss, nutzte Intel die Gelegenheit, um die überlegene Leistung seiner Hardware im Vergleich zu konkurrierenden Lösungen von AMD und Nvidia zu präsentieren. Laut Intel haben vorläufige Tests mit den GPUs der Max-Serie gezeigt, dass sie sich durch ihre herausragende Leistung bei “realen wissenschaftlichen und technischen Workloads” auszeichnen. Sie bieten eine doppelt so hohe Leistung wie AMDs Instinct MI250X-GPUs auf OpenMC und können nahezu perfekt über Hunderte von Knoten skalieren. Zusätzlich gibt Intel an, dass ihre CPUs der Intel Xeon Max Serie einen Leistungsvorteil von 40 % gegenüber ihren Konkurrenten in zahlreichen realen HPC-Anwendungen wie HPCG, NEMO-GYRE, Anerlastic Wave Propagation, BlackScholes und OpenFOAM bieten.
Quelle: TomsHardware
9 Antworten
Kommentar
Lade neue Kommentare
Urgestein
Veteran
1
Urgestein
Urgestein
Urgestein
Urgestein
Urgestein
Neuling
Alle Kommentare lesen unter igor´sLAB Community →