GPUs • Graphics • Pro • Reviews • Workstations

NVIDIA RTX A5000 Review – How good is the successor of the Quadro RTX 5000?

19. August 2021 07:00

Disclaimer: The following article is machine translated from the original German, and has not been edited or checked for errors. Thank you for understanding!

With the NVIDIA RTX A5000, I have a workstation graphics card in review today that should not only easily replace its predecessor, the Quadro RTX 5000, but can even beat the Quadro RTX 6000 in some areas. Plus, of course, the new features Ampere offers over Turing, as well as various tweaks that NVIDIA says make it more than just a more efficient replacement. This is exactly why I’ll be testing the RTX A5000 in a variety of workloads, not just pure raster graphics.

NVIDIA also offers NVLink on the RTX A5000 (similar to the RTX A6000), a 112 GB/s GPU interconnect that is a much faster alternative for multi-GPU systems than traditional PCI-E based solutions. By interconnecting two NVIDIA graphics cards with NVLink, memory and performance can be elegantly scaled to meet the demands of large visual computing tasks.

The RTX A5000 can also leverage NVIDIA RTX Virtual Workstation software (vWS), which provides space for visual computing to harness the power of virtual workstations from the data center or cloud on any device. This means that even the most demanding applications can be run on any device at the same level as a physical workstation, while still meeting the necessary security requirements. IT can virtualize any application from the data center, creating a work environment locally that is indistinguishable from a physical workstation. So in the end, each device offers the same performance as a workstation.

This is a feature for distributing a graphics card to several users in a virtual environment “portion by portion”. The appropriate profiles, in which the allocated resources are regulated, are distributed to the VMS. However, this product is subject to licensing and Enterprise Plus licences must be available, especially in the VMware environment. In addition, special Nvidia drivers are required, which are only available with a suitable account. The vGPU does not work without the licence server, which also increases the administrative effort.

Unboxing, look, feel and connectivity

The card weighs 1013 grams and is even almost 100 grams lighter than AMD’s Radeon Pro W6800 and thus not really a heavyweight. It is with its usual 27 cm well installable, is 10.5 cm high (installation height from PEG) and in addition 3.5 cm thick (dual slot design), whereby here no backplate is used, since also at the rear no memory was installed. The total of 12 modules GDDR6 with ECC functionality are all located on the front, which is an interesting solution in terms of design.

The card is supplied with a TBP of up to 230 watts via a standard 8-pin socket, so everything remains as known and expected. Interestingly, you can still see the free solder lugs for two 8-pin sockets at the right end of the upper edge of the board. As usual, NVIDIA also relies on the DHE principle (Direct Heat Exhaust) for cooling and a quite potent, but not too loud 6.5 cm radial fan. So the sucked air leaves the case on a direct way at the back, which is really convenient.

The slot bezel has a honeycomb grille for airflow and supports four DisplayPort (1.4) bays side by side. This creates space so that the hot exhaust air can really escape well.

Technical data

The GA102-850’s total of 8,192 CUDA cores (by NVIDIA’s count) can already handle larger workflows, and the card is only slightly more trimmed than a GeForce RTX 3080 with 8704 CUDA cores. With a total of 256 Tensor Cores, 64 RT Cores, 256 TMUs and 96 ROPs, the card with the trimmed GA 102 relies on a total of 64 Streaming Multiprocessors (SM), which have been completely redesigned at Ampere. The basis may still be similar to that of Turing, but important and above all decisive things have changed.

The SM have made a really big transformation which ultimately results in the increased performance. A single SM at Turing still consisted of 64 FP32-ALUs for floating point calculations and 64 INT32-ALUs for integer calculations, divided into four blocks of 16 FP32- and 16 INT32-ALUs each. The trick here is that the FP and INT ALUs can be addressed simultaneously. And amps? The 64 pure FP32-ALUs per SM are still available, but the 64 INT32-ALUs are increased by 64 additional ones, which are still able to perform floating point and integer calculations, with one restriction: this is no longer possible in parallel. The division into 4 blocks each remains, but with a separate data path.

While the base clock is specified with 1170 MHz, the boost clock is up to 1695 MHz, which isn’t always reached under absolute full load in practice, though. The card relies on a whopping 24GB of GDDR6 at 16Gbps, which is made up of 12 2GB sized modules on the front of the board. This includes the 384-bit memory interface (768 GB/s bandwidth).

nvidia-rtx-a5000-datasheet

PNY RTX A5000, 24GB GDDR6, 4x DP, Smallbox (VCNRTXA5000-SB)

	Lagernd im Außenlager, Lieferung 2-3 WerktageStand: 27.07.24 03:04	2318,99 €*Stand: 27.07.24 03:05
	Nicht lagernd, ab Bestellung versandfertig in 13 Tagen	2319,00 €*Stand: 27.07.24 02:49
	2-4 Tage	2374,97 €*Stand: 26.07.24 23:47

*Alle Preise inkl. gesetzl. MwSt zzgl. Versandkosten und ggf. Nachnahmegebühren, wenn nicht anders beschriebenmit freundlicher Unterstützung von geizhals.de

PNY Quadro RTX 5000, 16GB GDDR6, 4x DP, USB-C (VCQRTX5000-PB / VCQRTX5000-BSP)

	lagernd	1490,00 €*Stand: 26.07.24 09:28
Doll Computer	ab Lager	2798,00 €*Stand: 14.06.24 09:21

*Alle Preise inkl. gesetzl. MwSt zzgl. Versandkosten und ggf. Nachnahmegebühren, wenn nicht anders beschriebenmit freundlicher Unterstützung von geizhals.de

Pages:

29 Antworten

Zeige alle Kommentare an

Kommentar

Lade neue Kommentare

konkretor

Veteran

312 Kommentare 321 Likes

#1 Aug 19, 2021

Morgen Igor, Danke für den Test

Das Feature vWS habe ich hier mal verlinkt. Dabei handelt es sich um ein Feature in einer virtuellen Umgebungen eine Grafikkarte an mehrere Benutzer quasi in Scheiben zu schneiden. Man verteilt an die VMS Profile zum Beispiel jede VM bekommt 2 GB RAM. Die genauen Profile stehen in der zweiten PDF.
Zudem ist das Produkt Lizenz pflichtig.
Dazu müssen gerade im VMware Umfeld Enterprise Plus Lizenzen vorhanden sein.
Um das umzusetzen musst du einen speziellen Nvidia Treiber runterladen den es nur mit Account gibt. Dort trägt man einen Lizenz Server ein der das Feature freischalten. Besser gesagt die vGPU funktioniert nicht ohne den Lizenz Server. Der Lizenz Server ist ne VM mit Windows drauf auf dem ein Nvidia Lizenz Server installiert wird. Der Treiber in der VM frägt dann den Lizenz Server ab. Bekommt dann die Freischaltung.
Unter Linux brauchst auf allen VMS einen Desktop installiert um den Lizenz Server im Nvidia Treiber einzutragen. Total nervig und aus der Steinzeit. Ich wollte das ursprünglich bei mir in der Firma umsetzen. Der Aufwand ist doch extrem hoch und die Komplexität steigt extrem. Von den Lizenz Kosten die anfallen ganz zu schweigen....

https://images.nvidia.com/content/Solutions/data-center/nvidia-rtx-virtual-workstation-solution-overview.pdf

https://images.nvidia.com/content/Solutions/data-center/sizing-guide-nvidia-rtx-virtual-workstation.pdf

Antwort 1 Like

Klicke zum Ausklappem

Besterino

Urgestein

6,936 Kommentare 3,513 Likes

#2 Aug 19, 2021

Danke für den Test!

Auf Seite 15 scheint ein Textabschnitt von AMD noch nicht ganz angepasst zu sein:

„Betrachten wir nun die Temperaturen. Die AMD-intern als Edge-Temperatur bezeichnete “GPU-Diode” (kennen wir ja auch von NVIDIA) liegt mit den Werten bei meist 86 °C im 3D Loop. Wirklich kühl geht anders, das haben sogar leistungsstärkere Karten wie eine NVIDIA RTX Quadro A6000 mit einer TDP von 300 Watt sichtbar kühler lösen können. Die Platine ist ebenfalls reichlich heiß und die rückwärtige Backplate kühlt den auf der Rückseite verlöteten Speicher auch nur mit Ach und Krach.“

Vor allem hat die Karte doch rückseitig gar keinen Speicher, sitzt doch alles vorne?

Antwort Gefällt mir

Igor Wallossek

10,563 Kommentare 19,826 Likes

#3 Aug 19, 2021

Diesen einen Absatz habe ich dummerweise in der Ablage gehabt, ist schon gefixt. Leider zu spät gesehen, aber danke für den Tip! :)

Antwort 1 Like

Igor Wallossek

10,563 Kommentare 19,826 Likes

#4 Aug 19, 2021

Danke für die Ergänzung. Das kann ich hier ja leider mangels monetärer Ressourcen nicht selbst testen. Ein Kollege hat davon geschwärmt und... nun ja :D
Ich habs mal ergänzt: :D

Antwort 1 Like

Blubbie

Urgestein

809 Kommentare 275 Likes

#5 Aug 19, 2021

Hallo zusammen,
Ich würde das gerne verstehen :
Igor @Igor Wallossek schrieb im test "die Karte ist nur unwesentlich mehr beschnitten als eine GeForce RTX 3080 mit 8704 CUDA Cores."

D.h. Eine einzige rtx 3080/ti oder gar 3090 ist schon besser/schneller fürs rendern und auch deutlich günstiger so lange man keine Virtualisierung braucht und nicht mehrere dieser teuren Workstation Karten zusammen schließen und dann skalieren will?

Ich bin auch sehr über den geringen Strombedarf überrascht. 230 W bei Workstation im vgl. Zu > 340 Watt im Consumer Bereich. Und da sagt man die Industrie verbraucht viel Strom... Okay die laufen/rendern wahrscheinlich auch 24h/7 tage durch.

Einen performance Vergleich beim rendern zu einer normalen Consumer 3080/3090 wäre aber echt schon interessant gewesen. 😀

Antwort Gefällt mir

Deridex

Urgestein

2,226 Kommentare 859 Likes

#6 Aug 19, 2021

Ich frage mich noch immer, warum man sich eine Workstation Grafikkarte für Rendering (nicht Konstruktion!), Bildbearbeitung usw. kaufen sollte. Da sollte aus meiner Sicht eine Consumerkarte mit Studiotreiber mehr als ausreichend sein. Im CAD hingegen scheinen aus meiner Sicht beide Hersteller brauchbar zu sein.

Antwort 1 Like

Igor Wallossek

10,563 Kommentare 19,826 Likes

#7 Aug 19, 2021

Fürs Rendering... naja. Ich habe hier Maya und Rhino Projekte, die knallen schon mal weit über 20 GB in den VRAM, wenn sie dürfen. Da ist mir letztens sogar die 3090 verreckt. Nur die A6000 kam noch klar. :D

Sicher, den Bot bekomme ich auf jeder Consumer-Karte gedingst.

Antwort 1 Like

pintie

Veteran

186 Kommentare 134 Likes

#8 Aug 19, 2021

Danke für den Test. Sehr hilfreich.
wird auch noch was zur A6000 kommen ?

Antwort Gefällt mir

goch

Veteran

490 Kommentare 181 Likes

#9 Aug 19, 2021

Bezüglich der Lizenzen oder der (virtuellen) Hardware? Ansonsten gibt es von beiden Seiten (VMware / Nvidia) entsprechende Eval-Lizenzen.

Antwort Gefällt mir

Deridex

Urgestein

2,226 Kommentare 859 Likes

#10 Aug 19, 2021

@Igor Wallossek
Ich hoffe mit "verreckt" meinst du sehr langsam geworden und nicht abgestürzt oder defekt.

Antwort Gefällt mir

Igor Wallossek

10,563 Kommentare 19,826 Likes

#11 Aug 19, 2021

Mit verreckt meine ich: nicht ladbar. Overflow :D

Antwort Gefällt mir

Igor Wallossek

10,563 Kommentare 19,826 Likes

#12 Aug 19, 2021

Ja, liegt hier. :)

Antwort 1 Like

Besterino

Urgestein

6,936 Kommentare 3,513 Likes

#13 Aug 19, 2021

Find'sch mal wieder soopa, dass Nvidia dir diese hübschen Dinger zukommen lässt!

Zum Thema Virtualisierung: was will man da schon groß testen - das funktioniert halt einfach und wenn man eine ganze GPU durchreicht quasi auf bare-metal-Niveau. Kurioserweise bisweilen sogar BESSER als Windows 10 direkt auf'm blanken Blech - offenbar ist ESXi bei der Speicher- und CPU-Verwaltung bisweilen cleverer und virtualisiert läuft besser, als wenn Windows direkt an die Hardware ran darf... (so zumindest meine Erfahrungen mal vor ca. 4-5 Jahren).

Spannend wird dann allenfalls, wie sich ein Split der GPU über mehrere VMs auswirkt - aber was will man da denn groß testen? Da hängt so viel vom konkreten Setup ab (wie erfolgt die Zuteilung der Hardware-Ressourcen - auf wie viele VMs, wie aufgeteilt, wie genau genutzt und und und) - das kann kein Mensch testen und ist eine kleine Wissenschaft für sich, also was für das jeweilige Szenario das beste Setup ist. So kann man bei Nvidia allein 3 Methoden wählen, wie die Last verteilt wird: Fixed share, best effort, equal share:

Wer sich dafür interessiert, muss sich halt damit wohl oder übel auch beschäftigen - ich empfehle zum Beispiel mal dieses Dokumentchen und dort insbesondere das entwaffnende Kapitel 4 (Deployment Best Practices) und dort 4.3 - "Understand Your Users" - wo ausdrücklich ein POC angeraten wird um das beste Setup herauszufinden. ;) Genauso auch in dem von @konkretor bereits verlinkten Dokument (dort Kapitel 7).

Davon ab @Igor Wallossek : der Link auf Seite 1 zu Nvidia vWS ist kaputt. Richtig wäre der hier. :D

Wer Lust auf sowas hat, kann das ganz kostenlos auch mit Consumer-Hardware erste Erfahrungen sammeln. Nvidia legt einem immerhin treiberseitig keine Steine mehr in den Weg und das Durchreichen einer ganzen GPU geht z.B. unter ESXi und Hyper-V inzwischen ganz gut.

Aber eins ist auch klar: das macht nur Sinn, wenn mehrere Personen mit der Hardware arbeiten und aber auch KEINE dieser Personen die Hardware 24/7 VOLL auslastet (dann macht eine dedizierte Box mehr Sinn)! Klassische Einsatzszenarien sind Teams über verschiedene Zeitzonen hinweg, also Kollege 1 arbeitet von 8-18h Ortszeit in DE, Kollege 2 auch von 8-18h Ortszeit aber in Japan - also ca. 8h versetzt. Jeder hat seine eigene VM mit eigenem Profil, Programmen usw. und muss sich nie umgewöhnen, die hardware wird aber so mal eben 16h statt nur 8h genutzt. Auch wird pro PC (=VM) selten 100% der Arbeitszeit gerendert, sondern eben nur mal ab und an - dann können u.U. eben sogar mehrere gleichzeitig die Hardware (theoretisch) nutzen, aber während der eine nur stumpf auf dem Desktop herumclickt (GPU liegt quasi brach) läuft halt beim anderen schon der Renderjob. Oder mehrere Personen lassen ihre Renderjobs über Nacht laufen und brauchen dafür nicht die volle Nacht... dann kann jeder seinen Job easy anstoßen und die Hardware rödelt dann eben über Nacht ohne großen Verwaltungsaufwand, individuelles Scheduling & Co. die Jobs durch.

Will sagen: um sowas sinnvoll einzusetzen, muss man den Bedarf (=Nutzerverhalten) genau kennen. No shoe fits all. =) Und da kann auch Igor mit generellen Aussagen/Tests (fast) keinen Mehrwert leisten.

Antwort Gefällt mir

Klicke zum Ausklappem

krelog

Veteran

174 Kommentare 53 Likes

#14 Aug 19, 2021

hast du da ne Hausnummer was ne Lizens im Jahr kostet ( ich weis ist immer abhängig vom Vertriebspartner und den direkten Angeboten?

Zur not bewegt sich im Bereich von Creo oder Catia oder Ansys würde mir auch reichen

Antwort Gefällt mir

konkretor

Veteran

312 Kommentare 321 Likes

#15 Aug 19, 2021

Ich meine das wird pro GPU lizenziert.

Also unter 500$ sind es im Jahr pro Karte.
Preise können hier stark je nach Lizenz variieren. Will hier nicht meinen Lizenzpreis offen legen.

Antwort 1 Like

krelog

Veteran

174 Kommentare 53 Likes

#16 Aug 20, 2021

danke das reicht mir schon

Antwort 1 Like

ApolloX

Urgestein

1,687 Kommentare 955 Likes

#17 Aug 22, 2021

Bin überrascht, dass die Karte so bieder aussieht. Vorne nur rein schwarz. Hatte Industrial Design da keine Zeit oder keine Lust oder habens das so bewusst gemacht? Zumindest nen Aufkleber hättens draufklatschen können.

Antwort Gefällt mir

Tenchi Muyo

Mitglied

18 Kommentare 2 Likes

#18 Dec 13, 2021

Kann man die RTX A5000 bzw. A6000 (statt 3090) in jedem Desktop PC betreiben ?

Überlege ernsthaft für meinen AMD Threadripper 3970X - Danke!

Anwendung ist mehr Richtung:

AE, Boris FX > Sapphire, Continuum, Mocha Pro, Silhouette ,Optics und Blender (sowie die Adobe Substance Apps).

Antwort Gefällt mir

Igor Wallossek

10,563 Kommentare 19,826 Likes

#19 Dec 14, 2021

Ja, ich zocke sogar mit der A6000 😜

Antwort 2 Likes

Alle Kommentare lesen unter igor´sLAB Community →

Danke für die Spende

Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kannst Du per PayPal spenden.

Fractal Design Torrent RGB Review – Airflow of the superlative?

AMD’s Radeon RX 6600XT maximum overclock – with over 2.8 GHz into the TimeSpy best list | Practice | Update

About the author

View All Posts

Igor Wallossek

Editor-in-chief and name-giver of igor'sLAB as the content successor of Tom's Hardware Germany, whose license was returned in June 2019 in order to better meet the qualitative demands of web content and challenges of new media such as YouTube with its own channel.

Computer nerd since 1983, audio freak since 1979 and pretty much open to anything with a plug or battery for over 50 years.

Follow Igor:
YouTube Facebook Instagram Twitter