Grafikkarten Testberichte VGA

Turing Light: Nvidia GeForce GTX 1660 Ti Launch mit der MSI GTX 1060 Ti Gaming X und der MSI GTX 1660 Ti Ventus XS

Nvidia hat es also doch geschafft, einen Turing Chip neu aufzulegen, der herkömmliche Wege im altbekannten RTX-Off-Stil beschreitet und doch die Neuerungen der Architektur herüberretten kann. Wie viel davon in der GeForce GTX 1660 Ti ankommt, das werden wir noch sehen. Denn für jeden Spieler, der sich jetzt fragt, wie die Turing-Architektur von Nvidia funktionieren würde, wenn man die Tensor- und RT-Kerne herausnehmen würde, habe ich heute auch die Antwort in Form dieses Tests.

Nvidia hat es also doch geschafft, einen Turing Chip neu aufzulegen, der herkömmliche Wege im altbekannten RTX-Off-Stil beschreitet und doch wichtige Neuerungen der Architektur herüberretten kann. Wie viel davon in der GeForce GTX 1660 Ti ankommt, das werden wir noch sehen. Denn für jeden Spieler, der sich jetzt fragt, wie die Turing-Architektur von Nvidia funktionieren würde, wenn man die Tensor- und RT-Kerne herausnehmen würde, habe ich heute auch die Antwort in Form dieses Tests.

Die GeForce GTX 1660 Ti basiert auf dem TU116-400, einem völlig neuen Grafikprozessor, der die verbesserten Shader von Turing, die neue Cache-Architektur und die Unterstützung für adaptives Shading integriert. Die GPU ist zudem an schnelleren GDDR6-Speicher angebunden, also genauso, wie die teureren Modelle der GeForce RTX 20-Serie. Durch das Weglassen der RT-Kerne für beschleunigtes Raytracing und der Tensor-Kerne für Inferencing in Spielen ist der TU116 ein schlankerer Grafikprozessor, der aber eben auch auf Features verzichten muss (und kann).

Die von Nvidia angekündigte UVP von 299 Euro einschließlich Mehrwertsteuer ist das sicher ein gewisser Wermutstropfen, doch auf die Preisfrage gehe ich auf der letzten Seite noch einmal ausführlicher ein. Eine verbesserte Performance pro Euro ist also nicht das, was wir bisher von der Turing-Generation gesehen haben. Doch suchen wir erst einmal die Qualitäten dieser Full-HD-Karte und klären das mit den Kosten am Schluss.

 

Launch ohne Referenzkarten

Eine Referenzkarte gibt es nicht, deshalb geht der Launch diesmal direkt an die Boardpartner. Auch das hat seinen Charme, denn so kann man gleich am ersten Tag die Eigendesigns der Hersteller begutachten und testen. Für meinen Test habe ich mir als Hauptkarte die MSI GTX 1660 Ti Gaming X herausgepickt, da sie mit dem höchsten Werkstakt zum Kunden kommt. In den Benchmarks und einigen anderen Bereichen habe ich die Werte der beiden anderen Karten natürlich mitverwendet. Nur ist der Aufwand für Teardown und Platinenanalyse am Ende für zwei oder gar drei Karten einfach zu hoch, da bitte ich um Verständnis.

Die beiden anderen Karten sind die deutlich einfacher gehaltenere MSI GTX 1660 Ti Ventus XS (ohne RGB) und die EVGA GTX 1660 Ti XC Black Gaming, die mein US-Kollege besampelt bekam. Für letztere habe ich leider nur die Benchmark-Daten, da EVGA kein Sample zu uns geschickt hat. Schade, aber nicht zu ändern. Zumindest die MSI GTX 1660 Ti Ventus XS ist das Modell, welches MSI auch zu der von Nvidia kolportierten Preisempfehlung am Markt positionieren möchte. Die Gaming X ist da schon eher die Über-1660-Ti. Lustigerweise ist die Performance gar nicht so unterschiedlich, aber ich will da nicht spoilern.

 

Optik und Haptik der MSI GTX 1660 Ti Gaming X

Die 869 Gramm schwere Karte misst in Ihrer Länge 24,8 cm brutto von der Außenkante Slotblende bis zum Ende der Kühlerabdeckung. Sie ist 4,2 dick (zuzüglich der 5 mm für die Backplate auf der Rückseite) und 12 cm hoch (von der Oberkante des Mainboard-Slots bis zur Oberkante der Kühlerabdeckung). Die Anthrazit-farbene Kühlerabdeckung ist in der üblichen MSI-Edge-Stilistik gehalten und recht zurückhaltend. Bunt wird es erst mit Strom, denn man hat transluzente Kunststoffstreifen eingearbeitet, hinter den RGB-LEDs werken, die per Software auch gesteuert werden können

Die Backplate ist aus gebrushtem Aluminium und ist von der Front aus auch mit dem Kühlframe verschraubt. Für den Rest habe ich das komplette Tear Down in Text, Bild und diesmal auch Video.

 

Optik und Haptik der MSI GTX 1660 Ti Gaming X

Die nur 705 Gramm schwere und recht kurze Karte misst in Ihrer Länge nur 20,3 cm brutto von der Außenkante Slotblende bis zum Ende der Kühlerabdeckung. Sie ist 3,5 dick (zuzüglich der 4 mm für die Backplate auf der Rückseite) und 12 cm hoch (von der Oberkante des Mainboard-Slots bis zur Oberkante der Kühlerabdeckung). Die Silber-metallische Kühlerabdeckung konterkariert den matt-schwarzen Body und verzichtet auf den ganzen Leuchtkram.

Die Backplate ist aus schwarzen Kunststoff in Brush-Optik und ebenfalls von der Front aus mit dem Kühlframe verschraubt. Viel mehr gibt es an dieser Stelle auch nicht zu berichten, denn das erledigen schon die hochauflösenden Bilder der Galerie.

 

MSI GeForce GTX 1660 Ti Gaming X 6G, 6GB GDDR6, HDMI, 3x DP (V375-040R)

MindfactoryZentrallager: 5 Stück lagernd, Lieferung 1-3 Werktage Filiale Wilhelmshaven: 5 Stück lagerndStand: 05.08.20 00:45298,00 €*Stand: 05.08.20 00:42
CSV-Direct.deWare lagernd - versandfertig - Lieferzeit 1-3 Werktage301,96 €*Stand: 04.08.20 23:39
HiQ24Aachen: bei Vorbestellung in ca. 24h - 48h lagernd Alsdorf: bei Vorbestellung in ca. 24h - 48h lagernd Versandlager: bei Vorbestellung in ca. 24h - 48h lagerndStand: 05.08.20 00:45304,90 €*Stand: 05.08.20 00:37
*Alle Preise inkl. gesetzl. MwSt zzgl. Versandkosten und ggf. Nachnahmegebühren, wenn nicht anders beschriebenmit freundlicher Unterstützung von www.geizhals.de

 

Was macht Turing besser als Pascal?

Wir haben seit dem Herbst letzten Jahres zusehen können, wie Nvidia bisher vier verschiedene GPUs auf den Markt gebracht hat, die sich in der Hierarchie der Turing-Generation immer weiter nach unten hin orientierten. Mit jedem einzelnen der neuen Chips hat man zudem die Ressourcen clever ausgenutzt, um neue Preispunkte zu setzen, ohne seine eigenen Produkte selbst zu kannibalisieren. Das kann man natürlich auch sehen wie man möchte.

Eine GeForce RTX 2060 ist mit 44% der CUDA-Kerne und Textureinheiten einer RTX 2080 Ti ausgestattet, besitzt 54% der ROPs und der Speicherbandbreite, sowie 50% des L2-Cache. Nach allen Patches und Updates ließen sich sogar mit dieser Karte noch viele der RTX-Features noch gut nutzen, wenn man es bei der Bildschirmauflösung auf Full-HD belässt. Aber jeder wird es auch gemerkt haben, dass genau dort dann auch die Schmerzgrenze erreicht war, so dass Nvidia nun mit einer “normalen” Karte nachlegt, um das Portfolio weiter nach unten hin abzurunden.

Nach dem Entfernen der RT- und Tensor-Kerne verbleibt ein 284 mm² großer Chip, der aus 6,6 Milliarden Transistoren besteht, die im 12 nm FinFET-Verfahren von TSMC hergestellt werden. Aber trotz seiner kleineren Transistorzahl ist so ein TU116 immer noch 42% größer als der GP106-Prozessor der Vorgängerin! Ein Teil der gewachsenen Größe ist sicher auf die anspruchsvolleren Shader von Turing zurückzuführen. Denn wie die High-End-Karten der GeForce RTX 20-Serie, unterstützt nunmehr auch die die GeForce GTX 1660 Ti die gleichzeitige Ausführung von FP32-Arithmetikbefehlen (welche die meisten Shader-Workloads ausmachen) und INT32-Operationen (zum Adressieren/Fetchen von Daten, Floating Point Min/Max usw.).

Das erklärt dann auch weitgehend den Performance-Zuwachs von Turing gegenüber Pascal bei gleichem Takt. Die Streaming-Multiprozessoren von Turing bestehen aus weniger CUDA-Kernen als noch die von Pascal, aber das Design kompensiert dies zum Teil durch die Verteilung von mehr SMs auf jede GPU. Die neuere Architektur weist jedem Satz von 16 CUDA-Cores (doppelt so viel wie bei  Pascal) einen Scheduler sowie eine Dispositionseinheit pro 16 CUDA-Cores (wie Pascal) zu.

Vier dieser 16-Core-Gruppierungen umfassen den SM, 96KB Cache, der als 64KB L1/32KB gemeinsam nutzbarer Speicher konfiguriert werden kann oder umgekehrt, sowie vier Textureinheiten. Da Turing doppelt so viele Scheduler wie Pascal besitzt, muss nur eine Anweisung an die CUDA-Cores in jedem zweiten Taktzyklus ausgeben werden. Dazwischen ist genug Freiraum, eine andere Anweisung an jedes andere Gerät, einschließlich der INT32-Kerne, zu senden.

Nvidia verpackt 24 SMs in die TU116 und teilt sie auf drei Grafikverarbeitungscluster auf. Mit 64 FP32-Cores pro SM sind das 1.536 CUDA-Cores und 96 Textureinheiten für die gesamte GPU. Sechs 32-Bit-Speichersteuerungen verleihen dem TU116 einen aggregierten 192-Bit-Bus, der die sechs 12 Gb/s GDDR6-Module (Micron MT61K256M32JE-12:A) mit bis zu 288 GB/s bedient. Das sind 50% mehr Speicherbandbreite als die der GeForce GTX 1060 und hilft der GeForce GTX 1660 Ti, ihren Leistungsvorteil bei 2560×1440 mit aktiviertem Anti-Aliasing beizubehalten.

Jeder Speichersteuerung sind acht ROPs und ein 256KB großer Teil des L2-Cache zugeordnet. Insgesamt sind das 48 ROPs und 1,5 MB L2 für den TU116. Die ROP-Zahl der GeForce GTX 1660 Ti ist im Vergleich zur GeForce RTX 2060, die ebenfalls 48 ROPs nutzt, also erstaunlich hoch. Aber die L2-Cache-Einheiten sind nur halb so groß. Trotz des größeren Die, der 50% höheren Transistoranzahl und der aggressiveren GPU-Boost-Taktfrequenz, ist die GeForce GTX 1660 Ti für die gleiche TDP von 120W spezifiziert, wie die GeForce GTX 1060.

Leider bietet keine der beiden Grafikkarten eine Multi-GPU-Unterstützung. Nvidia bestätigt damit einmal mehr, dass Multi-GPU-Settings nur noch dazu gedacht sind, eine höhere, absolute Rechen-Leistung zu erzielen, anstatt den Spielern eine Möglichkeit zu geben, eine einzelne GPU-Konfiguration so zu gestalten, dass man damit vielleicht eine teurere Einzelkarte kannibalisieren könnte. Die Board-Partner werden allerdings zweifellos auch hohe Taktraten ab Werk anstreben, um wenigstens die Lücke zwischen der GeForce GTX 1660 Ti und der RTX 2060 etwas zu schließen. Die offizielle Basis-Taktfrequenz beträgt nämlich nur 1.500 MHz mit einer GPU-Boost-Spezifikation von 1.770 MHz.

 

Schnellers Rechnen auch ohne Tensor-Kerne

Zusätzlich zu den Shadern und dem vereinheitlichten Cache der Turing-Architektur unterstützt TU116 auch ein Algorithmenpaar namens Content Adaptive Shading und Motion Adaptive Shading, die zusammen als Shading mit variabler Rate bezeichnet werden. Dazu habe ich bereits zum Launch der GeForce RTX 2080 (Ti) eine längere Einführung geschrieben. Nvidia hat zudem auch durchblicken lassen, dass man die Tensor-Kerne durch dedizierte FP16-Kerne ersetzt, die es der GeForce GTX 1660 Ti ermöglichen sollen, Halbpräzisionsoperationen mit der doppelten Rate von FP32 zu verarbeiten.

Allerdings verfügen auch die anderen Turing-basierten GPUs über eine doppelt so hohe FP16-Performance, so dass unklar ist, wie einzigartig die GeForce GTX 1660 Ti innerhalb der Turing-Familie ist. Deutlich wird dies in der nachfolgenden Grafik, wo man sehr gut sieht, dass die GeForce 1660 Ti im Vergleich zur GeForce GTX 1060 und dem Pascal-basierten GP106-Chip eine massive Verbesserung des Durchsatzes bei halber Präzision bietet:

 

Technische Daten und Vergleichskarten

Zum Abschluss dieser Einführung noch einmal die Karten der neuen und die der alten Generation im direkten tabellarischen Vergleich:

 MSI GeForce GTX 1660 Ti Gaming XEVGA GeForce GTX 1660 Ti XC Black GamingMSI GeForce GTX 1660 Ti Ventus XS OCGeForce GTX 1060 FEGeForce GTX 1070GeForce RTX 2060 FE
ArchitekturTuring (TU116)Turing (TU116)Turing (TU116)Pascal (GP106)Pascal (GP104)Turing (TU106)
CUDA Cores153615361536128019201920
Tensor CoresN/AN/AN/AN/AN/A240
RT CoresN/AN/AN/AN/AN/A30
Textureinheiten96969680120120
FP16-Leistung (Peak)10,9 TFLOPS10,9 TFLOPS10,9 TFLOPS4,4 TFLOPS6,5 TFLOPS12,4 TFLOPS (51,7 TFLOPS Tensor)
FP32-Leistung (Peak)5,5 TFLOPS5,5 TFLOPS5,5 TFLOPS4,4 TFLOPS6,5 TFLOPS6,2 TFLOPS
Basistakt1500 MHz1500 MHz1500 MHz1506 MHz1506 MHz1365 MHz
Boost-Takt1875 MHz1830 MHz1830 MHz1708 MHz1683 MHz1680 MHz
Speicher6 GB GDDR66 GB GDDR66 GB GDDR66GB GDDR58GB GDDR56GB GDDR6
Speicher-Bus192-bit192-bit192-bit192-bit256-bit192-bit
Bandbreite288 GB/s288 GB/s288 GB/s192 GB/s256 GB/s336 GB/s
ROPs484848486448
L2 Cache1,5 MB1,5 MB1,5 MB1,5 MB2 MB3 MB
TDP120 W120 W120 W120 W150 W160 W
Transistoren Mrd.6,66,66,64,47,210,8
Die-Größe284 mm²284 mm²284 mm²200 mm²314 mm²445 mm²
SLINeinNeinNeinNeinJaNein

 

Testsystem und Messmethoden

Das neue Testsystem und die -methodik habe ich im Grundlagenartikel “So testen wir Grafikkarten, Stand Februar 2017” (Englisch: “How We Test Graphics Cards“) bereits sehr ausführlich beschrieben und verweise deshalb der Einfachheit halber jetzt nur noch auf diese detaillierte Schilderung. Wer also alles noch einmal ganz genau nachlesen möchte, ist dazu gern eingeladen.

Interessierten bietet die Zusammenfassung in Tabellenform schnell noch einen kurzen Überblick:

Testsysteme und Messräume
Hardware:
Intel Core i7-8700K
MSI Z370 Gaming Pro Carbon AC
16GB KFA2 DDR4 4000 Hall Of Fame @DDR4 3400
1x 1 TByte Toshiba OCZ RD400 (M.2, System SSD)
2x 960 GByte Toshiba OCZ TR150 (Storage, Images)
Be Quiet Dark Power Pro 11, 850-Watt-Netzteil
Kühlung:
Alphacool Eisblock XPX
5x Be Quiet! Silent Wings 3 PWM (Closed Case Simulation)
Thermal Grizzly Kryonaut (für Kühlerwechsel)
Gehäuse:
Lian Li PC-T70 mit Erweiterungskit und Modifikationen
Modi: Open Benchtable, Closed Case
Monitor:Eizo EV3237-BK
Leistungsaufnahme:
berührungslose Gleichstrommessung am PCIe-Slot (Riser-Card)
berührungslose Gleichstrommessung an der externen PCIe-Stromversorgung
direkte Spannungsmessung an den jeweiligen Zuführungen und am Netzteil
2x Rohde & Schwarz HMO 3054, 500 MHz Mehrkanal-Oszillograph mit Speicherfunktion
4x Rohde & Schwarz HZO50, Stromzangenadapter (1 mA bis 30 A, 100 KHz, DC)
4x Rohde & Schwarz HZ355, Tastteiler (10:1, 500 MHz)
1x Rohde & Schwarz HMC 8012, Digitalmultimeter mit Speicherfunktion
Thermografie:
Optris PI640, Infrarotkamera
PI Connect Auswertungssoftware mit Profilen
Akustik:
NTI Audio M2211 (mit Kalibrierungsdatei)
Steinberg UR12 (mit Phantomspeisung für die Mikrofone)
Creative X7, Smaart v.7
eigener reflexionsarmer Messraum, 3,5 x 1,8 x 2,2 m (LxTxH)
Axialmessungen, lotrecht zur Mitte der Schallquelle(n), Messabstand 50 cm
Geräuschentwicklung in dBA (Slow) als RTA-Messung
Frequenzspektrum als Grafik
BetriebssystemWindows 10 Pro (1803, alle Updates)

 

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kann Du per PayPal spenden.

About the author

Igor Wallossek

Chefredakteur und Namensgeber von igor'sLAB als inhaltlichem Nachfolger von Tom's Hardware Deutschland, deren Lizenz im Juni 2019 zurückgegeben wurde, um den qualitativen Ansprüchen der Webinhalte und Herausforderungen der neuen Medien wie z.B. YouTube mit einem eigenen Kanal besser gerecht werden zu können.

Computer-Nerd seit 1983, Audio-Freak seit 1979 und seit über 50 Jahren so ziemlich offen für alles, was einen Stecker oder einen Akku hat.

Folge Igor auf:
YouTube   Facebook    Instagram Twitter

Wir verwenden Cookies, um Ihnen das beste Nutzererlebnis bieten zu können. Wenn Sie fortfahren, diese Seite zu verwenden, nehmen wir an, dass Sie damit einverstanden sind. Datenschutzerklärung