Wichtiges Vorwort zu den Benchmark-Werten
Ein direkter Leistungsvergleich zwischen verschiedenen Boardpartnerkarten mag auf den ersten Blick sinnvoll erscheinen, führt aber bei genauer Betrachtung zu methodischen Ungenauigkeiten und letztlich, bei etwas Pech, auch zu ungerechten Fehlinterpretationen, solange die voreingestellten Taktraten nicht deutlich voneinander abweichen. Das liegt weniger an den Benchmarkverfahren selbst als vielmehr an der Art und Weise, wie moderne Nvidia-GPUs intern arbeiten. Insbesondere zwei eng miteinander verknüpfte Systeme, die Voltage Frequency Engine (VFE) und das Continuous Virtual Binning (CVB), sorgen dafür, dass selbst baugleiche Karten mit identischem BIOS und gleichem Kühlsystem unter Last deutlich voneinander abweichende Verhaltensweisen zeigen können – und das ohne jegliches Zutun des Herstellers oder Nutzers.
Das Continuous Virtual Binning (CVB) beschreibt bei Nvidia kein klassisches, diskretes Binning in Qualitätsklassen, wie es etwa bei CPUs oder früheren GPU-Generationen üblich war. Vielmehr handelt es sich um eine kontinuierliche, hardwareseitig hinterlegte Kurve, die für jeden einzelnen Grafikchip individuell bestimmt wird. Diese CVB-Kurve definiert, bei welcher Spannung welcher Takt als stabil und effizient gilt. Jeder Chip, der das Werk verlässt, besitzt damit eine eigene Signatur, die darüber entscheidet, wie hoch er boosten kann – unter welchen Bedingungen, mit welcher Spannung und bei welcher Temperatur.
Die Voltage Frequency Engine (VFE) greift diese Kurve auf und ist für die Echtzeitregelung im laufenden Betrieb verantwortlich. Sie prüft fortlaufend thermische, elektrische und leistungstechnische Parameter und entscheidet dynamisch, welcher Punkt auf der CVB-Kurve angesteuert wird. Dabei spielt nicht allein die Frage eine Rolle, ob ein höherer Takt möglich wäre, sondern ob es sich angesichts der aktuellen Rahmenbedingungen auch lohnt, ihn zu nutzen. Die VFE bevorzugt Punkte mit hoher Effizienz, also einem günstigen Verhältnis aus Leistungsgewinn und Stromverbrauch. Das bedeutet konkret: Zwei RTX 5060 Ti 16 GB mit identischer Nennleistung und ähnlichen Boost-Clock-Vorgaben können in der Praxis völlig unterschiedliche Frequenzverläufe zeigen – je nachdem, wie gut das einzelne Silizium innerhalb der GPU gefertigt wurde.
Diese Unterschiede, die im Rahmen der sogenannten „GPU-Lotterie“ auftreten, führen in der Praxis zu Leistungsschwankungen von bis mehreren Prozent – allein aufgrund der Fertigungstoleranzen und ohne Zutun des Boardpartners. Selbst innerhalb einer Serie wie der MSI Gaming Trio OC können sich zwei Karten um ein bis zwei Prozent in der realen Anwendungsleistung unterscheiden, obwohl sie formal das gleiche BIOS und dieselbe Kühlung nutzen. Dieser Effekt liegt vollständig im Einflussbereich von VFE und CVB – also in der Interaktion von Siliziumqualität und Boostregelung. Genau deswegen habe ich heute nur eine Karte getestet und nicht alle, die hier noch liegen.
Hinzu kommen systematische Unschärfen bei der Messung: Jede Benchmarkszene unterliegt natürlichen Schwankungen, sogenannte Lorenzgrenzen, die sich durch minimale Unterschiede im Frametiming, Hintergrundprozesse, RAM-Management oder gar BIOS-Revisionen des Testsystems ergeben. Diese Toleranzen liegen ebenfalls im Bereich von ein bis zwei Prozent und überschneiden sich damit direkt mit der durch CVB verursachten Streuung. Das macht präzise Leistungsvergleiche zwischen nahezu identischen Kartenmethodisch fragwürdig, zumal sie dem Leser eine Genauigkeit suggerieren, die faktisch nicht erreichbar ist.
Vor diesem Hintergrund ist es analytisch nicht nur vertretbar, sondern auch folgerichtig und sogar auch fair, bei der Beurteilung der Leistungsfähigkeit einer GPU-Generation wie der RTX 5060 Ti nur eine Karte zurückzugreifen. Diese wurde von Nvidia mit einem standardisierten Power-Limit konzipiert. Erfahrungswerte und einige Messungen zeigen, dass gut abgestimmte Custom-Modelle wie die Gaming Trio OC in der Praxis lediglich zwei bis drei Prozent oberhalb der “schlechtesten” Karte aus dem Bestand liegen – sofern der eingesetzte Chip entsprechend gut binnt.
Der Versuch, aus Benchmarkvergleichen zwischen Custom-Modellen weitreichende Aussagen zur Produktqualität oder Leistungsvorteilen abzuleiten, ist damit nicht nur irreführend, sondern verkennt die Funktionsweise moderner GPU-Architekturen. Relevanter für eine Bewertung bleiben Aspekte wie Lautstärkeverhalten, Temperaturentwicklung, elektrische Stabilität und Verarbeitungsqualität und Support – also jene Merkmale, die der Hersteller tatsächlich beeinflussen kann und auf die ich natürlich genauer eingehen werde bzw. eingegangen bereits bin. Die eigentliche Performance unterliegt dagegen heute einer Kombination aus interner Chipbewertung (CVB), intelligenter Laststeuerung (VFE) und äußeren Rahmenbedingungen.
Zusammenfassung und Übersicht aller Spiele in Full-HD
Die Full-HD-Auflösung (1920 x 1080 Pixel) bleibt im Gaming-Bereich relevant, da sie geringere Hardwareanforderungen stellt und hohe Bildwiederholraten ermöglicht, was besonders für kompetitives Gaming vorteilhaft ist. Die Zusammenführung der FPS-Werte aus 10 Spielen und die Berechnung eines Durchschnittswerts dienen meist dazu, eine allgemeine Einschätzung der Gaming-Leistung eines Systems zu ermöglichen. Hierbei werden die Bildwiederholraten der Spiele addiert und durch die Anzahl der Titel geteilt. Dieser Durchschnittswert bietet jedoch nur eine sehr begrenzte Aussagekraft, da er die unterschiedlichen Anforderungen und Leistungsprofile der einzelnen Spiele nicht berücksichtigt. Spiele weisen oft erhebliche Unterschiede in ihren Anforderungen an Prozessor, Grafikkarte und Arbeitsspeicher auf, was zu starken Schwankungen in der Performance führt. Ein hardwareintensives Spiel kann den Durchschnitt nach unten drücken, während einige weniger anspruchsvolle Titel den Wert unrealistisch anheben können. Aber es ist schon einmal ein erster Anhaltspunkt.
Deshalb habe ich natürlich noch eine andere, wesentlich exaktere Betrachtung. Das Normalisieren von FPS-Werten und Erstellen einer prozentualen Bewertung für jedes einzelne Spiel ist hier deutlich zielführender als kumulierte FPS-Werte. Die Zusammenfassung aller Indizes der verschiedenen Spiele zu einem gemeinsamen Durchschnitt dient dazu, die Leistung einer Hardware objektiv und vergleichbar darzustellen. Man erkennt solche Abweichungen sehr schnell an einer leicht geänderten Balkenreihenfolge, bei der einzelne Spiele weniger zur Verfälschung des Gesamteindrucks beitragen können. Diese Metrik verwende ich sowohl für die durchschnittlichen FPS als auch für das P1 Low, also das Perzentil mit den am langsamsten gerenderten Frames. Die neue RTX 5060 Ti in dieser Werks-OC-Variante ist fast 18 Prozent schneller, als die GeForce RTX 4060 Ti in der MSRP-Ausführung, von der leider keine OC-Karte aufzutreiben war. Ohne Werks-OC sollten es noch 15 bis 16 Prozent sein.
Vor allem die Min-FPS zeigen einen extremen Leistungsschub von fast 28 Prozent, was man auch sehen und spüren kann.
Einzelmetriken und Details
Natürlich gibt es wie immer auch noch die Einzelmetriken für alle getesteten Spiele:
- 1 - Technische Daten und wichtige Einführung zum Speicherausbau
- 2 - Testsystem und Equipment
- 3 - Teardown: Platine und Kühler
- 4 - Materialanalyse und Wärmeleitmaterialien
- 5 - Gaming: Full-HD 1920x1080 Pixels (Rasterization Only)
- 6 - Gaming: WQHD 2560x1440 Pixels (Rasterization Only)
- 7 - Gaming: WQHD 2560x1440 Pixels, Supersampling, RT & FG
- 8 - DLSS4 und MFG: Cyberpunk 2077 im Detail
- 9 - DLSS4 und MFG: Alan Wake 2 im Detail
- 10 - Leistungsaufnahme über alle Einsatzbereiche und Effizienz
- 11 - Lastspitzen und Netzteilempfehlung
- 12 - Takraten und OC, Temperaturen, Geräuschentwicklung
- 13 - Zusammenfassung und Fazit
32 Antworten
Kommentar
Lade neue Kommentare
Urgestein
Urgestein
Neuling
Urgestein
Veteran
1
Veteran
Urgestein
Urgestein
Mitglied
Mitglied
Urgestein
Urgestein
Veteran
Veteran
Urgestein
Urgestein
Urgestein
Urgestein
Alle Kommentare lesen unter igor´sLAB Community →