Da es schwer ist, eine ausgesprochene Server-CPU fürs Gaming optimal fit zu bekommen, hat AMD im Ryzen Master Tool einen sogenannten Game Mode vorgesehen, der den Ryzen Threadripper helfen soll, mehr Performance bei den aktuellen Spielen zu bieten. Denn sind wir mal ehrlich, mit derart vielen Kernen skaliert kaum einer der aktuellen Titel, von den älteren ganz zu schweigen. Doch auch die Art des Speicherzugriffs, der bei großen Workloads natürlich deutlich anders gestaltet sein muss, ist Gegenstand von AMDs interner One-Click-Optimierung.
Normalerweise setzt AMD bei der Infinity Fabric und der Kombination aus mehreren Dies auf UMA (Distributed Mode), bietet aber auch NUMA (Local Mode) an. Doch wo genau liegt nun der Unterschied für Gamer oder Workstation-Nutzer? Bei UMA (Uniform Memory Access) nutzen alle Dies einen globalen Speicher, auf den von allen aus auch einheitlich zugegriffen werden kann. Als Endkonsequenz fallen Zugriffszeiten und Latenzen sehr ähnlich aus, egal von wo aus auf Inhalte zugegriffen wird.
Unter NUMA (Non-Uniform Memory Access) verstehen wir eine spezielle Speicher-Architektur, bei der jeder Die zunächst eine Art lokalen Speicher nutzt, aber den anderen trotzdem zusätzlich über einen gemeinsamen Adressraum direkten Zugriff darauf gewährt. Die jeweiligen Speicherzugriffszeiten unterliegen dann dem Umstand, ob sich eine Speicheradresse im lokalen oder im fremden Speicher befindet. Es kann im Idealfall also deutlich schneller erfolgen als beim globalen Speicher, muss aber nicht.
Insgesamt hat man per Schalter vier verschiedene Optionen:
• Zwei aktive Dies und UMA
• Zwei aktive Dies und NUMA
• Ein aktiver Die und UMA
• Ein aktiver Die und NUMA
Der Creator Mode setzt auf zwei Dies und UMA (Default), der Game Mode nutzt nur einen aktiven Die und NUMA
Wir haben deshalb viele der uns als interessant erscheinenden Varianten für die interessantesten Einzelbenchmarks vorab mit den Ryzen Threadripper 1950X und 1920X einmal gegeneinander ausgetestet und wollen diese Ergebnisse quasi als Einführung voranstellen und die wichtigsten Möglichkeiten später auch in den Vergleichsbenchmarks nutzen, die wir in Spiele- und später auch Workstation-Benchmarks aufgeteilt haben.
Als Auflösung haben wir uns bei den Spielen mit Absicht und aufgrund der zur Verfügung stehenden Zeit für Full-HD mit 1920 x 1080 Pixeln entschieden. Erstens ist es die gebräuchlichste Auflösung, Zweitens kommt man auch hierbei mit einer schnellen Grafikkarte in mögliche CPU-Limits und Drittens ist das Benchmarken in Ultra-HD zwar ganz nett, aber die Limitierung der Grafikkarte interessiert in so einem Artikel eigentlich niemanden.
UMA vs. NUMA vs. SMT und One-Click Gaming-Mode
Der Idealfall, so wie ihn sich AMD sicher vorgestellt hat, zeigt der Benchmark von Warhammer 40K. Hier kann der Game Mode voll überzeugen, zumindest vorerst.
Die nächsten Beispiele zeigen allerdings, dass auch der Game Mode nicht der Weisheit letzter Schluss sein muss. Manchmal reicht auch schon die Umstellung des Speichers auf den Local Mode (NUMA), um schneller zu sein, als der vorgefertigte Gaming-Mode.
Doch während die Min-FPS eben noch enger beieinanderlagen, zeigt das nächste Beispiel, wie auch die Spielbarkeit und das subjektive Empfinden durch diese Speicher-Varianten deutlicher beeinflusst werden können:
Betrachten wir abschließend den Super-GAU, wie ihn sich AMD wohl nicht vorstellt. Der Creator Mode (BIOS Default) wird nur von der stark übertakteten Variante im Game Mode übertroffen und die anderen Varianten mit dem Speicher im Local Mode (NUMA) bleiben deutlich dahinter zurück. Nun muss man dazu sagen, dass AotS ziemlich gut über die Kerne skaliert und gerade parallelisierbare Aufgaben über die Die-Grenzen hinweg eher von der UMA-Zugriffsverwaltung profitieren.
- 1 - Einführung und Testsystem
- 2 - Game vs. Creator Mode: Was ist was?
- 3 - VRMark, 3DMark Fire Strike, Time Spy, API Overhead
- 4 - Civilization VI (DX12)
- 5 - Warhammer 40K: Dawn of War III (DX11)
- 6 - Grand Theft Auto V (DX11)
- 7 - Hitman 2016 (DX12)
- 8 - Ashes of the Singularity: Escalation (DX12)
- 9 - Battlefield 1 (DX11)
- 10 - Middle-earth: Shadow of Mordor (DX11)
- 11 - Project Cars (DX12)
- 12 - Far Cry Primal (DX11)
- 13 - Rise of the Tomb Raider (DX11)
- 14 - The Witcher 3: Wild Hunt (DX11)
- 15 - DTP, Office, Multimedia und Kompression
- 16 - Workstation 2D- und 3D-Performance
- 17 - CPU-Computing und Rendering
- 18 - Wissenschaftlich-technische Berechnungen und HPC
- 19 - Übertaktung, Kühlung und Temperaturen
- 20 - Leistungsaufnahme
- 21 - Zusammenfassung und Fazit
Kommentieren