Gaming Grafikkarten Hardware Testberichte

Nvidia GeForce GTX 1660 6GB mit Boardpartnerkarten von MSI – Es bewegt sich etwas (nicht nur die Pixel)

Neuer Baby-Turing, neue Chance? AMD macht mit niedrigen Polaris-Preisen Druck und Nvidia zieht nach. Leistungstechnisch und - man wird sich die Augen reiben - auch beim Preis. Wie schnell jetzt die GeForce GTX 1060 in Vegessenheit geraten könnte, muss (und wird) dieser Test zeigen. Es ist also richtig spannend...

Neuer Chip, neuer Anlauf, neues Glück? Eigentlich kann es den Kunden ja nur freuen, dass AMD mit den aktuellen Preisen der Radeon RX 590 und RX 580 so biegsam nach unten hin ist. Denn mit einer UVP ab 225 Euro inklusive Mehrwertsteuer ist man beim Straßenpreis für die neuen Karten in ein paar Wochen sicher auch nicht mehr weit von der magischen 200-Euro-Marke entfernt. Und genau dort sollen die neuen Modelle der Nvidia GeForce GTX 1660 ohne das Ti nicht nur kräftig herumräubern, sondern auch die GeForce GTX 1060 obsolet machen, die noch einen Tag vor dem Launch ab ca. 200 Euro (und mehr) zu haben war.

Die GeForce GTX 1660 basiert, wie schon die große Schwester mit dem Ti-Kürzel, auf dem TU116, genauer dem TU116-300, einem neuen Grafikprozessor, der die verbesserten Shader von Turing, die neue Cache-Architektur und die Unterstützung für adaptives Shading integriert. Die GPU besitzt weniger Shader als der TU116-400 und ist im Vergleich zum Ti-Modell nur an den langsameren GDDR5-Speicher angebunden, was auf Grund der Bandbreitennachteile ein Kannibalisieren der Ti durch eine übertaktete Non-Ti sehr sicher unterbindet. Aber auch das ist ja nichts Neues.

Durch das Weglassen der RT-Kerne für beschleunigtes Raytracing und der Tensor-Kerne für Inferencing in Spielen, ist der TU116 ein schlankerer Grafikprozessor, der aber eben auch auf Features verzichten muss (und kann). Die von Nvidia angekündigte UVP von 225 Euro einschließlich Mehrwertsteuer ist da allerdings wohl eine kleine Entschädigung, die für den Kunden in die richtige Richtung zeigt. Jetzt muss nur noch die Leistung stimmen und genau das werde ich herausfinden.

 

Launch ohne Referenzkarten

Eine Referenzkarte gibt es nicht, deshalb geht der Launch diesmal direkt an die Boardpartner. Auch das hat seinen Charme, denn so kann man gleich am ersten Tag die Eigendesigns der Hersteller begutachten und testen. Für meinen Test habe ich mir als Hauptkarte wiederum die MSI GTX 1660 Gaming X herausgepickt, auch wenn diesmal der Takt bei allen getesteten Karte faktisch gleich hoch ist. Nur ist der Aufwand für Teardown und Platinenanalyse am Ende für zwei oder gar drei Karten einfach zu hoch, da bitte ich um Verständnis.

Die beiden anderen Karten sind die deutlich einfacher gehaltene MSI GTX 1660 Ventus XS (ohne RGB und Ti) und die Gigabyte GTX 1660 OC, die mein US-Kollege besampelt bekam. Für letztere habe ich zum Vergleich zwar nur die Benchmark-Daten, da Gigabyte ein Sample zu uns geschickt hat, aber es ändert auch nichts daran, dass alle drei Karten gleich schnell agieren. Zumindest die MSI GTX 1660 Ventus XS ist das Modell, welches MSI auch in Deutschland zu der von Nvidia kolportierten Preisempfehlung von 225 Euro am Launchtag am Markt positionieren möchte.

 

Optik und Haptik der MSI GTX 1660 Gaming X

Die ebenfalls ca. 870 Gramm schwere Karte misst in Ihrer Länge 24,8 cm brutto von der Außenkante Slotblende bis zum Ende der Kühlerabdeckung. Sie ist 4,2 dick (zuzüglich der 5 mm für die Backplate auf der Rückseite) und 12 cm hoch (von der Oberkante des Mainboard-Slots bis zur Oberkante der Kühlerabdeckung). Die Anthrazit-farbene Kühlerabdeckung ist in der üblichen MSI-Edge-Stilistik gehalten und recht zurückhaltend. Bunt wird es erst mit Strom, denn man hat transluzente Kunststoffstreifen eingearbeitet, hinter den RGB-LEDs werken, die per Software auch gesteuert werden können

Die Backplate ist aus gebrushtem Aluminium und ist von der Front aus auch mit dem Kühlframe verschraubt. Für den Rest verweise ich auf das komplette Tear Down in Text, Bild und dem Video der fast baugleichen Ti-Schwester.

 

Optik und Haptik der MSI GTX 1660 Ventus XS

Die etwas über 700 Gramm schwere und recht kurze Karte misst in Ihrer Länge nur 20,3 cm brutto von der Außenkante Slotblende bis zum Ende der Kühlerabdeckung. Sie ist 3,5 dick (zuzüglich der 4 mm für die Backplate auf der Rückseite) und 12 cm hoch (von der Oberkante des Mainboard-Slots bis zur Oberkante der Kühlerabdeckung). Die Silber-metallische Kühlerabdeckung konterkariert den matt-schwarzen Body und verzichtet auf den ganzen Leuchtkram.

Die Backplate ist aus schwarzen Kunststoff in Brush-Optik und ebenfalls von der Front aus mit dem Kühlframe verschraubt. Viel mehr gibt es an dieser Stelle auch nicht zu berichten, denn das erledigen schon die hochauflösenden Bilder der Galerie.

 

Was macht Turing besser als Pascal?

Wir haben seit dem Herbst letzten Jahres zusehen können, wie Nvidia bisher vier verschiedene GPUs auf den Markt gebracht hat, die sich in der Hierarchie der Turing-Generation immer weiter nach unten hin orientierten. Mit jedem einzelnen der neuen Chips hat man zudem die Ressourcen clever ausgenutzt, um neue Preispunkte zu setzen, ohne seine eigenen Produkte selbst zu kannibalisieren. Das kann man natürlich auch sehen wie man möchte.

Eine GeForce RTX 2060 ist mit 44% der CUDA-Kerne und Textureinheiten einer RTX 2080 Ti ausgestattet, besitzt 54% der ROPs und der Speicherbandbreite, sowie 50% des L2-Cache. Nach allen Patches und Updates ließen sich sogar mit dieser Karte noch viele der RTX-Features noch gut nutzen, wenn man es bei der Bildschirmauflösung auf Full-HD belässt. Aber jeder wird es auch gemerkt haben, dass genau dort dann auch die Schmerzgrenze erreicht war, so dass Nvidia nun mit einer “normalen” Karte nachlegt, um das Portfolio weiter nach unten hin abzurunden.

Nach dem Entfernen der RT- und Tensor-Kerne verbleibt ein 284 mm² großer Chip, der aus 6,6 Milliarden Transistoren besteht, die im 12 nm FinFET-Verfahren von TSMC hergestellt werden. Aber trotz seiner kleineren Transistorzahl ist so ein TU116 immer noch 42% größer als der GP106-Prozessor der Vorgängerin! Ein Teil der gewachsenen Größe ist sicher auf die anspruchsvolleren Shader von Turing zurückzuführen. Denn wie die High-End-Karten der GeForce RTX 20-Serie, unterstützt nunmehr auch die die GeForce GTX 1660 die gleichzeitige Ausführung von FP32-Arithmetikbefehlen (welche die meisten Shader-Workloads ausmachen) und INT32-Operationen (zum Adressieren/Fetchen von Daten, Floating Point Min/Max usw.).

Das erklärt dann auch weitgehend den Performance-Zuwachs von Turing gegenüber Pascal bei gleichem Takt. Die Streaming-Multiprozessoren von Turing bestehen aus weniger CUDA-Kernen als noch die von Pascal, aber das Design kompensiert dies zum Teil durch die Verteilung von mehr SMs auf jede GPU. Die neuere Architektur weist jedem Satz von 16 CUDA-Cores (doppelt so viel wie bei Pascal) einen Scheduler sowie eine Dispositionseinheit pro 16 CUDA-Cores (wie Pascal) zu.

Vier dieser 16-Core-Gruppierungen umfassen den SM, 96KB Cache, der als 64KB L1/32KB gemeinsam nutzbarer Speicher konfiguriert werden kann oder umgekehrt, sowie vier Textureinheiten. Da Turing doppelt so viele Scheduler wie Pascal besitzt, muss nur eine Anweisung an die CUDA-Cores in jedem zweiten Taktzyklus ausgeben werden. Dazwischen ist genug Freiraum, eine andere Anweisung an jedes andere Gerät, einschließlich der INT32-Kerne, zu senden.

Nvidia verpackt 22 SMs in den eingekürzten TU116-300 und teilt sie auf drei Grafikverarbeitungscluster auf. Mit 64 FP32-Cores pro SM sind das 1.408 CUDA-Cores und 88 Textureinheiten für die gesamte GPU. Sechs 32-Bit-Speichersteuerungen verleihen dem TU116 einen aggregierten 192-Bit-Bus, der die sechs GDDR5-Module mit bis zu 192,1 GB/s bedient. Das ist gegenüber der GTX 1660 Ti allerdings ein eheblicher Bandbreitennachteil und man liegt auf dem gleichen Niveau wie auch die alte GeForce GTX 1060.

Jeder Speichersteuerung sind acht ROPs und ein 256KB großer Teil des L2-Cache zugeordnet. Insgesamt sind das 48 ROPs und 1,5 MB L2 für den TU116-300. Die ROP-Zahl der GeForce GTX 1660 ist im Vergleich zur GeForce RTX 2060, die ebenfalls 48 ROPs nutzt, also erstaunlich hoch. Aber die L2-Cache-Einheiten sind nur halb so groß. Trotz des größeren Die, der 50% höheren Transistoranzahl und der aggressiveren GPU-Boost-Taktfrequenz, ist die GeForce GTX 1660 für die gleiche TDP von 120W spezifiziert, wie schon die GeForce GTX 1060.

Leider bietet keine der beiden Grafikkarten eine Multi-GPU-Unterstützung. Nvidia bestätigt damit einmal mehr, dass Multi-GPU-Settings nur noch dazu gedacht sind, eine höhere, absolute Rechen-Leistung zu erzielen, anstatt den Spielern eine Möglichkeit zu geben, eine einzelne GPU-Konfiguration so zu gestalten, dass man damit vielleicht eine teurere Einzelkarte kannibalisieren könnte.

 

Schnellers Rechnen auch ohne Tensor-Kerne

Zusätzlich zu den Shadern und dem vereinheitlichten Cache der Turing-Architektur unterstützt TU116 auch ein Algorithmenpaar namens Content Adaptive Shading und Motion Adaptive Shading, die zusammen als Shading mit variabler Rate bezeichnet werden. Dazu habe ich bereits zum Launch der GeForce RTX 2080 (Ti) eine längere Einführung geschrieben. Nvidia hat zudem auch durchblicken lassen, dass man die Tensor-Kerne durch dedizierte FP16-Kerne ersetzt, die es der GeForce GTX 1660 Ti ermöglichen sollen, Halbpräzisionsoperationen mit der doppelten Rate von FP32 zu verarbeiten. Allerdings verfügen auch die anderen Turing-basierten GPUs über eine doppelt so hohe FP16-Performance, so dass unklar ist, wie einzigartig die GeForce GTX 1660 innerhalb der Turing-Familie ist.

 

Technische Daten und Vergleichskarten

Zum Abschluss dieser Einführung noch einmal die Karten der neuen und die der alten Generation im direkten tabellarischen Vergleich:

  MSI GeForce GTX 1660 Gaming X MSI GeForce GTX 1660 Ti Gaming X GeForce GTX 1060 FE GeForce GTX 1070 GeForce RTX 2060 FE
Architektur Turing (TU116-400) Turing (TU116-400) Pascal (GP106) Pascal (GP104) Turing (TU106)
CUDA Cores 1408 1536 1280 1920 1920
Tensor Cores N/A N/A N/A N/A 240
RT Cores N/A N/A N/A N/A 30
Textureinheiten 88 96 80 120 120
FP16-Leistung (Peak) 10 TFLOPS 10,9 TFLOPS 4,4 TFLOPS 6,5 TFLOPS 12,4 TFLOPS (51,7 TFLOPS Tensor)
FP32-Leistung (Peak) 5 TFLOPS 5,5 TFLOPS 4,4 TFLOPS 6,5 TFLOPS 6,2 TFLOPS
Basistakt 1530 MHz 1500 MHz 1506 MHz 1506 MHz 1365 MHz
Boost-Takt 1860 MHz 1875 MHz 1708 MHz 1683 MHz 1680 MHz
Speicher 6 GB GDDR5 6 GB GDDR6 6GB GDDR5 8GB GDDR5 6GB GDDR6
Speicher-Bus 192-bit 192-bit 192-bit 256-bit 192-bit
Bandbreite 192.1 GB/s 288 GB/s 192 GB/s 256 GB/s 336 GB/s
ROPs 48 48 48 64 48
L2 Cache 1,5 MB 1,5 MB 1,5 MB 2 MB 3 MB
TDP 120 W 120 W 120 W 150 W 160 W
Transistoren Mrd. 6.6 Mrd. 6,6 4,4 7,2 10,8
Die-Größe 284 mm² 284 mm² 200 mm² 314 mm² 445 mm²
SLI Nein Nein Nein Ja Nein

 

Testsystem und Messmethoden

Das neue Testsystem und die -methodik habe ich im Grundlagenartikel “So testen wir Grafikkarten, Stand Februar 2017” (Englisch: “How We Test Graphics Cards“) bereits sehr ausführlich beschrieben und verweise deshalb der Einfachheit halber jetzt nur noch auf diese detaillierte Schilderung. Wer also alles noch einmal ganz genau nachlesen möchte, ist dazu gern eingeladen.

Interessierten bietet die Zusammenfassung in Tabellenform schnell noch einen kurzen Überblick:

Testsysteme und Messräume
Hardware:
Intel Core i7-7700K
MSI Z270 Gaming Pro Carbon AC
16GB KFA2 DDR4 4000 Hall Of Fame @DDR4 3200
1x 1 TByte Toshiba OCZ RD400 (M.2, System SSD)
2x 960 GByte Toshiba OCZ TR150 (Storage, Images)
Be Quiet Dark Power Pro 11, 850-Watt-Netzteil
Kühlung:
Alphacool Eisblock XPX
5x Be Quiet! Silent Wings 3 PWM (Closed Case Simulation)
Thermal Grizzly Kryonaut (für Kühlerwechsel)
Gehäuse:
Lian Li PC-T70 mit Erweiterungskit und Modifikationen
Modi: Open Benchtable, Closed Case
Monitor: Eizo EV3237-BK
Leistungsaufnahme:
berührungslose Gleichstrommessung am PCIe-Slot (Riser-Card)
berührungslose Gleichstrommessung an der externen PCIe-Stromversorgung
direkte Spannungsmessung an den jeweiligen Zuführungen und am Netzteil
2x Rohde & Schwarz HMO 3054, 500 MHz Mehrkanal-Oszillograph mit Speicherfunktion
4x Rohde & Schwarz HZO50, Stromzangenadapter (1 mA bis 30 A, 100 KHz, DC)
4x Rohde & Schwarz HZ355, Tastteiler (10:1, 500 MHz)
1x Rohde & Schwarz HMC 8012, Digitalmultimeter mit Speicherfunktion
Thermografie:
Optris PI640, Infrarotkamera
PI Connect Auswertungssoftware mit Profilen
Akustik:
NTI Audio M2211 (mit Kalibrierungsdatei)
Steinberg UR12 (mit Phantomspeisung für die Mikrofone)
Creative X7, Smaart v.7
eigener reflexionsarmer Messraum, 3,5 x 1,8 x 2,2 m (LxTxH)
Axialmessungen, lotrecht zur Mitte der Schallquelle(n), Messabstand 50 cm
Geräuschentwicklung in dBA (Slow) als RTA-Messung
Frequenzspektrum als Grafik
Betriebssystem Windows 10 Pro (1803, alle Updates)

 

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kann Du per PayPal spenden.

About the author

Igor Wallossek

Chefredakteur und Namensgeber von igor'sLAB als inhaltlichem Nachfolger von Tom's Hardware Deutschland, deren Lizenz im Juni 2019 zurückgegeben wurde, um den qualitativen Ansprüchen der Webinhalte und Herausforderungen der neuen Medien wie z.B. YouTube mit einem eigenen Kanal besser gerecht werden zu können.

Computer-Nerd seit 1983, Audio-Freak seit 1979 und seit über 50 Jahren so ziemlich offen für alles, was einen Stecker oder einen Akku hat.

Folge Igor auf:
YouTube   Facebook    Instagram Twitter