Vorwort zu den Applikations-Benchmarks
Warum wir die Quadro P6000 als Counterpart verwenden und nicht die Titan XP oder GeForce GTX 1080 Ti hat sicher mehrere Gründe, auf die wir auf der ersten Seite bereits teilweise eingegangen sind. Dazu kommt natürlich auch, dass auch im semi-professionellen Bereich ein Monitor, der 10-Bit Farbtiefe pro Farbkanal bietet, eigentlich eiserne Pflicht ist. Aus diesem Grund verwenden wir auch einen Eizo EV3237-BK und keinen ultrafixen Gaming-Monitor mit TN-Panel von der Stange.
Sowohl die Quadro P6000, als auch die Radeon Vega Frontier Edition bieten diese Option für DirectX und auch für das OpenGL-Overlay. So gern man auch in vielen Anwendungen eine TitanX vielleicht nutzen möchte und könnte, bei OpenGL und 10 Bit muss auch die Titan XP mangels passender Treiberunterstützung die Segel streichen. Will man der Radeon Vega Frontier Edition wirklich fair begegnen, muss man sie nun mal auch dort einsetzen, wofür sie geplant wurde.
Treiber-Durchsatz bei direkter Bildschirmausgabe
Seit die Grafikkarten auf eine Unified-Shader-Architektur setzen, sind spezielle 2D-Funktionen auf den Grafikkarten komplett verschwunden. Seit Windows Vista fehlt zudem auch noch jegliche Hardware-Beschleunigung (bis auf das direkte Kopieren von Bitmap-Inhalten) und jeder Pups muss erst komplett durch den Treiber bis ins D3D. So ärgerlich dieser Umstand als solcher sicherlich ist, umso hilfreicher ist es natürlich für uns, damit auch die Treiber etwas näher austesten zu können.
Wir setzen im Test für jede der gebräuchlichsten Grafikfunktionen eine Zeit, in der wir möglichst viele Objekte nacheinander direkt auf dem Anzeige-Device ausgeben lassen wollen. Der Ablauf und die Objekte werden zwar per Zufallsgenerator erzeugt, um einen Caching-Effekt ausschließen zu können, aber der Start ist exakt definiert und somit jeder Durchlauf in der Summe auch identisch. Alle geometrischen Objekte besitzen dabei eine farbige Umrisslinie und eine zufällig generierte Flächenfüllung.
Wir sehen sehr deutlich, dass AMDs Baustelle, neben einigen sehr ausgeglichenen Bereichen, vor allem beim Rendern von Texten und der Ausgabe von Polygonen, sowie den Ellipsen bzw. Kreisen liegt. Dafür schneidet man bei Linien, bzw. Splines, sowie beim Blitting deutlich besser ab als die Nvidia-Karte. Wir dürfen ja auch nicht vergessen, dass hier zusätzlich eine sehr hohe Prozessorlast anfällt, weil viele der Berechnungen zunächst in Teilen auf der CPU erfolgen müssen, was bereichsweise auch auf einen möglichen Treiber-Overhead schließen lassen könnte.
Treiber-Durchsatz bei direkter Bildschirmausgabe
Jetzt gehen wir die Sache komplett anders an und geben die gleichen Inhalte zunächst in eine virtuelle Bitmap im Arbeitsspeicher des Systems aus, bevor wir diese komplett in einem Rutsch in den Grafikspeicher kopieren lassen. Die Baustellen, über die wir gerade schrieben, treten nun noch viel deutlicher hervor.
Vor allem die Schwäche bei den Polygonen ist eklatant, denn mit knapp 11 Prozent der Performance einer Quadro P6000 muss man definitiv nachsitzen. Zumal diese Art der virtuellen Bitmaps vor allem beim Echtzeit-Verschieben grafischer Inhalte (Float) gern genutzt wird.
Natürlich lassen diese beiden vorangestellten Benchmarks noch keinen direkten Rückschluss auf die tatsächliche CAD-Performance zu.
Aber wir sehen auch, dass es durchaus Dinge gibt, die anwendungsspezifisch optimiert werden könnten, indem man spezielle Funktionen umbiegt, bzw. Objekte einfach abfängt und anders ausgeben/rendern lässt. Diese Art von (meist sehr zeit- und personalintensiven) Optimierungen findet man jedoch nur in den Radeon-Pro- bzw. Quadro-Treibern, was ja letztendlich auch ein Teil des hohen Preises dieser Hardware ausmacht.
Was natürlich ein Grund mehr ist, hier im weiteren Verlauf ehrlich Treiber gegen Treiber zu setzen.
AutoCAD 2017 – 2D-Performance
Abschließend lassen wir AutoCAD größere 2D-Workloads ausgeben. Da dieser Bereich weitgehend CPU-limitiert ist, fallen die Unterschiede kleiner aus, als man zunächst vermuten könnte. Damit ist zumindest in diesem Bereich eigentlich fast schon egal, mit welcher Karte man reine 2D-Konstruktionen realisiert, solange der Speicher nicht zu klein ausfällt. Selbst kleine Karten, wie eine Quadro P2000 schaffen da noch an die 130 Punkte, was gar nicht mal so schlecht ist.
- 1 - Einführung und Übersicht
- 2 - Details zu Architektur und HBM2-Speicher
- 3 - Demontage, Kühler und Interposer-Details
- 4 - Platinendesign und Detailinformationen
- 5 - Benchmark-Intro, 2D-Troughput und -Performance
- 6 - 3D Workstation- und Design-Benchmarks
- 7 - Gaming-Performance: DirectX 11
- 8 - Gaming-Performance: DirectX12
- 9 - Gaming-Performance: Vulkan/OpenGL 4.5
- 10 - Leistungsaufnahme im Detail
- 11 - Takt, Temperaturen und Geräuschemission
- 12 - Zusammenfassung und Fazit
Kommentieren