Intel stellt Gaudi 3 vor und will damit NVIDIAs H100-GPU-Beschleuniger angreifen

Erst vor einiger Zeit gab es einen Test zwischen Intels Gaudi 2 und NVIDIAs H100-Beschleuniger. Nun hab man mit Gaudi 3 seine neuste Generation vorgestellt, die noch besser ist, als die Vorgängerin.

Gaudi 3 ist mit der neusten, also 5. Generation der Tensor Core-Reihe ausgestattet und zwar in einer Strukturbreite von 5 nm. Gaudi 3 beinhaltet 64 Kerne und basiert auf der Architektur von Gaudi 2. Allerdings bietet Gaudi 3 eine erhebliche Verbesserung bei der Rechenleistung, der Speicherbandbreite und dessen Architektureffizienz. Der Prozessor besitzt zwei Compute Dies, die 8 MME-Engines und 24x200GBps RDMA NIC-Ports tragen.

Ausgestattet ist der Prozessor zudem mit 8 HBM2e-Chips, einen einheitlichen 128 GB-Speicher und er zeichnet sich auch anhand seiner Performance-Werte aus. Hierbei bietet der KI-Beschleuniger 1,8 PFlops FP8- und BF16-Rechenleistung und 3,7 TB/s-Bandbreite bei Training und Inferenz. Zudem hat der Beschleuniger 96 MB On-Board-SRAM und soll ausreichend Speicher für die Verarbeitung großer GenAI-Datensätze auf weniger Intel Gaudi 3s bieten.

Intel gibt an, dass Gaudi 3 MME in der Lage ist, 64.000 parallele Operationen auszuführen. Die Intel Gaudi Software integriert das PyTorch-Framework und soll optimierte, gemeinschaftsbasierte Hugging-Face-Modelle bieten. Die Modelle sind das derzeit am weitesten verbreitete KI-Framework für GenAI-Entwickler. Dies ermöglicht es GenAI-Entwicklern, auf einer hohen Abstraktionsebene zu arbeiten, um die Nutzung und Produktivität zu vereinfachen und die Portierung von Modellen auf verschiedene Hardwaretypen zu erleichtern.

Auch betont das Unternehmen seine Schnelligkeit gegenüber NVIDIAs H100-Beschleuniger sowie H200-Beschleuniger. Hierbei soll man eine um 1.7x durchschnittliche bessere Performance haben. Als Vergleich zieht man hierbei einmal das LLAMA2 Modell mit 7B-Parametern, den LLAMA2 mit 13B-Paramaetern und Falcon mit 180B-Parametern heran. Beim H100-GPU-Beschleuniger hat man auch das GPT 3-Modell mit 175 Parametern verwendet. In all diesen Modellen schlägt man wohl den NVIDIA H100-Beschleuniger sowie dem H200 beim Falcon-Modell. Auch beim Thema Powereffizienz hat man einen Vorsprung.

Gaudi wird in drei Ausfertigungen hergestellt. Einmal als Intel Gaudi 3 AI Accelerator 325-L OAM Mezzanine Card, der auf dem Papier mit 900 W angegeben ist. Die zweite Variante ist der Intel Gaudi 3 AI Accelerator HLB-325 Baseboard, der eine angegebene 7.6 KW TDP hat, auf dem aber auch 8 HL-325L OAMs besitzt. Als Letztes ist der Intel Gaudi 3 AI Accelerator HL-338 PCIe Add-In Card mit am Bord, der nur eine TDP von 600 W hat.

Die luftgekühlte Gaudi 3-Beschleuniger-Version wird im zweiten Quartal 2024 ausgeliefert und zwar für OEMs, also z.B. Dell Technologies, Hewlett Packard Enterprise, Lenovo und Supermirco, in branchneüblichen Konfigurationen von Univseral Baseboard und Open Accelerator Module. Für die allgemeine Verfügbarkeit ist der Start im dritten Quartal 2024 geplant. Die Intel Gaudi 3-PCIe-Add-in-Karte wird voraussichtlich im letzten Quartal 2024 erhältlich sein.

Quelle: Intel

6 Antworten

Zeige alle Kommentare an

Kommentar

Lade neue Kommentare

RazielNoir

Veteran

456 Kommentare 216 Likes

#1 Apr 11, 2024

7.6 KW TDP ??? :oops::eek:
Die passende Kühllösung dazu möchte ich gern mal sehen...

Antwort 1 Like

RazielNoir

Veteran

456 Kommentare 216 Likes

#2 Apr 11, 2024

Angesichts der Vorhaben der BigPlayer für Rechnenzentren für KI-Anwendungen sollte nicht nur die Energieeffizienz im Vordergrund stehen, sondern auch die Gesamtbilanz. Klar, der längste Benchmarkbalken ist schick, vor allem wenn die Energieaufnahme dafür noch geringfügig unter der des Mitbewerber liegt. Die Frage ist aber, ob es immer der Maximale Stromaufnahme und damit Takt sein muss. sein muss. Bei Nvidia sieht man es bei den RTX Ada ja, das die Profikarten näher am SweetSpot betrieben werden als die Gamingkarten mit ihrem OC. Und das Treiberoptimierungen eine wesentliche Komponente bei der Effizienzsteigerung sein kann

Antwort Gefällt mir

christoph1717

Mitglied

43 Kommentare 16 Likes

#3 Apr 11, 2024

auf der Bühne gab es wohl eine schöne Gaudi... und intel ist das Lachen auch bei den schlechten Geschäftszahlen neulich noch nicht vergangen.

Antwort Gefällt mir

8j0ern

Urgestein

2,789 Kommentare 881 Likes

#4 Apr 11, 2024

Eine Mitsubischi Kühl Lösung, kann 22 KWh bereit stellen.

Das ist nur die Einspeise-Leistung, die Kühlleistung liegt dann bei 33 kWh. :coffee:

Antwort Gefällt mir

RazielNoir

Veteran

456 Kommentare 216 Likes

#5 Apr 11, 2024

22kw fürs Kühlen und mindestens 7,6kw für den Hardwarebetrieb. Und das für nur eine davon….
Nur gut das wir Energie im Überfluss haben und Abwärme klimafreundlich für die nahe gelegenen Wohnhäuser genutzt wird…

Antwort Gefällt mir

8j0ern

Urgestein

2,789 Kommentare 881 Likes

#6 Apr 11, 2024

Dafür ist eine 32 Ampere Leitungsschutzschalter Notwendig mit der Auslöse Charakteristik C:

Bei 400 Volt.

Antwort Gefällt mir

Alle Kommentare lesen unter igor´sLAB Community →

Danke für die Spende

Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kannst Du per PayPal spenden.