AI/KI Computex News Professional

AMD Radeon AI PRO R9700: Neue Workstation-GPU für Local AI und LLMs mit 32 GB Speicher und RDNA4

Im Rahmen der Computex 2025 hat AMD mit der Radeon AI PRO R9700 eine neue GPU-Klasse für professionelle AI-Workloads vorgestellt. Die Karte richtet sich explizit an Entwickler, Data Scientists und Unternehmen, die auf lokale Rechenleistung setzen – ohne Abhängigkeit von Cloud-Infrastrukturen oder potenziell unsicheren API-Zugängen. AMD adressiert damit den steigenden Bedarf an Edge-Computing für generative Modelle, multimodale KI und spezialisierte Inferenzen.

Architektur und Leistung: RDNA 4 mit 128 AI Accelerators

Die Radeon AI PRO R9700 basiert auf der RDNA-4-Architektur, allerdings in einer für KI-Anwendungen optimierten Ausführung. Sie kombiniert 128 spezialisierte AI-Beschleuniger mit einer Rohleistung von bis zu 1531 TOPS (INT4 Sparse) bzw. 96 TFLOPS bei FP16. Die Karte nutzt 32 GB GDDR6-Speicher und ist für PCIe 5.0 x16 ausgelegt. Der TDP liegt bei 300 W. Im Gegensatz zu klassischen GPUs verzichtet AMD bei der R9700 auf Gaming-orientierte Renderfunktionen und fokussiert sich vollständig auf AI-Berechnung und Modellinferenz.

Arbeitsspeicher: Warum 32 GB zum neuen Standard werden

Ein zentrales Verkaufsargument ist der großzügig dimensionierte VRAM: 32 GB GDDR6 ermöglichen die lokale Ausführung anspruchsvoller KI-Modelle wie Mistral, DeepSeek oder Qwen in ihren 24B- bis 32B-Konfigurationen. Laut AMD liegt der typische Speicherbedarf dieser Modelle zwischen 24 und 28 GB – größere LLMs wie GPTQ-komprimierte 70B-Modelle benötigen sogar über 100 GB, was durch Multi-GPU-Setups adressiert wird. Anwendungen wie SD 3.5 oder Flux.1 Schnell für Text-to-Image belegen ebenfalls mehr als 17–24 GB – und überschreiten damit den Speicherrahmen gängiger Gaming-Karten wie der RTX 4080/5080 (16 GB) deutlich.

Skalierbarkeit: 4× R9700 für 112 GB nutzbare Kapazität

In Kombination mit Threadripper PRO und einem PCIe 5.0-System lassen sich bis zu vier R9700-Karten parallel betreiben. Damit skaliert der verfügbare VRAM auf 112–116 GB, was die Ausführung von 123B-Modellen wie Mistral Large oder LLaMA 70B mit vollem KV-Cache erlaubt. Die Karte ist damit auch für lokale Feinabstimmungen (Finetuning), Modellquantisierung, RAG-Szenarien oder Realtime-Inferenz mit niedriger Latenz geeignet.

Vergleich zur Radeon PRO W7800 und NVIDIA RTX 5080

Laut AMD liefert die R9700 in AI-Workloads wie DeepSeek R1 Distill LLaMA 8B bis zu doppelte Leistung im Vergleich zur Radeon PRO W7800 (ebenfalls mit 32 GB). Im direkten Vergleich mit der RTX 5080 (16 GB) wird die Leistung bei großen Modellen sogar mit einem Faktor von bis zu 4,96 beziffert. Besonders die dedizierten AI-Beschleuniger der R9700 sollen in hochparallelen Aufgaben gegenüber klassischen Shadern Vorteile bieten.

Edge-Performance und Datenschutz: ROCm und On-Premise-Vorteile

Ein weiterer Pluspunkt ist die Unterstützung von ROCm auf Radeon, was die Einbindung der Karte in bestehende Linux-basierte AI-Stacks erleichtert. Windows-Support soll in Kürze folgen. AMD bewirbt die Karte explizit als Alternative zu Cloud-Diensten, bei denen Datenhoheit und Kontrolle über sensible Inhalte eingeschränkt sind. Gerade für Unternehmens- oder Forschungsumgebungen mit regulatorischen Anforderungen bietet die R9700 damit einen entscheidenden Mehrwert.

Verfügbarkeit und Boardpartner

Die Radeon AI PRO R9700 soll ab Juli 2025 erhältlich sein. Zu den offiziellen Partnern zählen ASRock, ASUS, GIGABYTE, PowerColor, Sapphire, XFX und Yeston. Es ist davon auszugehen, dass diese Partner jeweils werkseitige Versionen mit angepasstem Kühlkonzept und optional auch passiver Belüftung für den Rackeinsatz anbieten werden.

Fazit: AMDs Angriff auf NVIDIAs AI-Dominanz beginnt am Edge

Mit der Radeon AI PRO R9700 unternimmt AMD einen ernstzunehmenden Vorstoß in den Markt für professionelle, lokal eingesetzte AI-GPUs. Die Karte ist durch ihr VRAM-Potenzial, die dedizierte AI-Hardware und den ROCm-Support bestens aufgestellt für Workstations, die LLMs oder Multimodell-Anwendungen mit hohen Anforderungen ausführen sollen.

Besonders in Zeiten wachsender Cloud-Skepsis und steigender Latenz- bzw. Datenschutzbedenken könnte AMD hier zur relevanten Alternative avancieren.

Kurz gesagt: Wer LLMs lokal trainiert, inferenziert oder integriert, kommt an der Radeon AI PRO R9700 kaum vorbei. Vorausgesetzt, die Software-Ökosysteme bleiben mit AMDs Fortschritt nicht zurück.

Kommentar

Lade neue Kommentare

Metallsonic

Veteran

390 Kommentare 32 Likes

Mich würde es brennend interessieren, wie sich diese Karte so im Gaming so schlägt!
Könnte man das BIOS einer RX9070XT auf diese Karte flashen?🤔

Antwort Gefällt mir

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kannst Du per PayPal spenden.

About the author

Igor Wallossek

Chefredakteur und Namensgeber von igor'sLAB als inhaltlichem Nachfolger von Tom's Hardware Deutschland, deren Lizenz im Juni 2019 zurückgegeben wurde, um den qualitativen Ansprüchen der Webinhalte und Herausforderungen der neuen Medien wie z.B. YouTube mit einem eigenen Kanal besser gerecht werden zu können.

Computer-Nerd seit 1983, Audio-Freak seit 1979 und seit über 50 Jahren so ziemlich offen für alles, was einen Stecker oder einen Akku hat.

Folge Igor auf:
YouTube   Facebook    Instagram Twitter

Werbung

Werbung