Gigabyte GT 1030 Low Profile und Low Profile Silent
Wir haben uns bewusst für den Low-Profile Form-Faktor entschieden, da diese Art von Karten wohl überwiegend im Bereich kleiner und Kleinst-PCs verwendet werden dürfte. Und genau hier werden wir auch im Detail ansetzen, denn mit diesen beiden Karten von Gigabyte, deren Platine völlig identisch ist, können wir sowohl die aktiv, als auch die passiv gekühlte Variante testen und direkt miteinander vergleichen. Ob diesmal der Passivbetrieb wirklich möglich und sinnvoll ist? Wir werden es natürlich herausfinden!
GeForce GT 1030 im Detail
Während die GeForce GTX 750 Ti immerhin noch über fünf SMX (Streaming Multiprocessors) verfügt, ist die GT 1030 mit lediglich drei solcher SMX ausgestattet. Mit 128 CUDA-Cores pro SM/SMM in den Pascal- und Maxwell-Architekturen sind das unterm Strich dann 384 Kerne für die GT 1030 und 640 Kerne für die GTX 750 Ti. Beide Entwürfe verfügen über acht Textureinheiten pro SM, also insgesamt 24 auf GeForce der GT 1030, während die GTX 750 Ti noch derer 40 besitzt.
Die beiden GPUs verfügen über ein Paar ROP-Partitionen und verarbeiten bis zu 16 32-Bit-Integer-Pixel pro Takt. Allerdings sind diese Partitionen mit ganzen 256KB L2 Cache auf dem GP108 und 1MB L2 Cache auf dem auf GM107 angebunden. Das bedeutet am Ende, dass die GeForce GT 1030 über nur 512KB L2 Cache verfügen kann, was einen riesigen Rückschritt zur GTX 750 Ti bedeuted. Und während die GeForce GTX 750 Ti zwei 64-Bit-Speicher-Controller besitzt, sind es bei der GT 1030 für den den Speicher-Bus nur noch ein Paar 32-Bit-Controller, was eine 64-Bit-Schnittstelle ergibt. Hier büßt die GT 1030 jede Menge Ressourcen ein, was in keinem Verhältnis zur um lediglich ca. 4% verringerten Komplexität des Chips als solchem steht.
Nvidia versucht natürlich wie üblich, diese Defizite der GT 1030 mit höheren Taktraten zu kompensieren. Unser Testmuster verwendet einen Basistakt von 1227 MHz und boostet mit mindestens 1468 MHz. Im Gegensatz dazu startet die GeForce GTX 750 Ti bei 1020 MHz Basistakt und steigert sich im Boost nur auf ca. 1085 MHz. Natürlich beschneidet ein schmaler 64-Bit-Speicherbus die Peak-Bandbreite der GT 1030 auf 48 GB/s mit 6Gb/s GDDR5. Die breitere Schnittstelle der GTX 750 Ti ermöglicht im Gegensatz dazu bis zu 86,4 GB/s. Die Folgen sieht man im Diagramm nur allzu deutlich. Doch womit können wir die GT 1030 dann vergleichen, wenn nicht mit der GTX 750 Ti?
Die GT 730 als Bruder im Geiste?
Erinnern wir uns: die GTX 750 (Ti) ist ja seinerzeit als 130- bis 150-Euro-Karte gestartet un man bekommt Restbestünde immer noch für bis zu 100 Euro angeboten. Ausgewählt hatten wir sie ja anfangs, weil die Anzahl an Transitoren des verwendten GM107 in etwa der Anzahl des GP108 auf der GT 1030 entspricht. In Wirklichkeit sind aber die GeForce GT 1030 und die GT 730 die echten Brüder im Geiste, weil Nvidia nie ein 900er-Produkt unterhalb der GeForce GTX 950 veröffentlicht hat. Am Ende besitzt nämlich die Kepler-basierte GeForce GT 730 eine viel engere Übereinstimmung mit ihren 384 CUDA-Kernen und 16 Textureinheiten (über zwei SMX), den acht ROPs, den 512KB L2-Cache und einer 64-Bit-Schnittstelle.
Auch die Leistungsaufnahme der GT 730 liegt mit 38W nicht weit von dem, was Nvidia nun bei der GT 1030 mit 30W angibt. Immerhin ist die GeForce GTX 750 Ti eine 60W- bis 75-Watt-Karte, die nie wirklich als Passivkarte auf den Markt kam. Warum ist der aber nun GP108 so viel komplexer als noch der GK208? Die Architekturen sind einfach nicht mehr die gleichen, so viel erst einmal als Ausgangspunkt.
Der GP108 der GT 1030 nutzt einen einzigen Graphics Processing Cluster mit drei SMX. Jeder der SMX besitzt 128 CUDA-Kerne, acht Textureinheiten, 24KB L1-/Textur-Cache und 64KB gemeinsamen Adressraum. Der GK208 der GT 730 besitzt zwei SM mit jeweils 192 CUDA-Cores, acht funktionalen Textureinheiten, 64KB Shared Memory und L1-Cache, sowie einem separaten Textur-Cache. Der GP108 verügt über 16 ROP-Einheiten, der GK208 über acht.
Am Ende bietet somit der GP108 eine viel höhere Pixel-Füllrate als noch der GK208 (19,8 GP/s gegenüber 7,2 GP/s), doch auch die Textur-Rate ist deutlich gewachsen (29,8 GT/s vs. 14,4 GT/s). Nvidia hat die höhere Anzahl an Transistoren auch damit begründet, dass man für die viel aggressiveren Taktraten, sowie die korrekte asynchrone Rechenunterstützung über die dynamische Lastverteilung deutlich mehr Ressourcen benötige. Die GeForce GT 1030 verwendet einen kompletten, unbeschnittenen GP108-Prozessor – es sind somit auch keine deaktivierten Ressourcen vorhanden, die man zuschalten könnte. Nur die Dichte un Komplexität ist somit deutlich höher.
Die Konkurrenz von AMD landet mit der Radeon RX 550 technisch gesehen also irgendwo zwischen GM107 und GK208. Die Radeon RX 550 ist ein wenig teurer und benötigt etwas mehr elektrische Leistung als die GeForce GT 1030. Wir haben auch bei der Radeon RX 550 Low-Profile und „Single-Slot“ Versionen am Markt, aber nicht beides in einem. Und auch keine ernsthafte Karte mit passiver Kühlung. Auf der anderen Seite enthalten die Radeon RX 550 ja sogar 512 Stream Prozessoren, 32 Textureinheiten und 16 ROPs im Polaris-12-Chip, der 2,2 Milliarden Transistoren in sich vereint.
Damit erreicht die Radeon RX 550 eine Pixel-Füllrate von 17,6 GP/s und einer Textur-Rate von 35,2 GT/s. Schnellere GDDR5-Module mit 7 Gb/s an einem viel breiteren 128-Bit-Speicher-Bus geben der AMD-Karte zudem einen theoretischen Bandbreitenvorteil von satten 233%! Wie Mvidia beim GK108 hat aber auch AMD PCIe-3.0-Unterstützung reduziert. So findet man anstelle der 16 Lanes nunmehr nur noch vier Lanes.
Doch Nvidia ist sich sicher, mit der GT 1030 die AMD-Karte schlagen zu können, bzw. zumindest einen Gleichstand zu erreichen. Ob diese doch sehr selbstbewusste Ansage aufgeht, müssen unsere Tests beweisen. Außerdem ist sich Gigabyte sicher, auch mit der passiven Lösung den Nerv der Zeit getroffen zu haben. Zu den Benchmarks und Messungen, die diese Aussagen im Detail klären können, kommen wir natürlich gleich.
Gigabyte GeForce GT 1030 Low Profile (Silent) |
AMD Radeon RX 550 (Referenzangaben) |
|
---|---|---|
Chip: | GP108 | Polaris 12 |
Transistoren: | ca. 2,2 Mrd. | ca. 2,2 Mrd. |
Shader-Einheiten: | 384 | 512 |
GPU Basis-Takt: | 1.228 MHz | 1.100 MHz |
GPZ Boost-Takt: | 1.468 MHz | 1.183 MHz |
TMUs/ROPs: | 24/16 | 32/16 |
Pixelfüllrate: | 26.7 GPix/s | 18.9 GPix/s |
Texelfüllrate: | 40.1 GTex/s | 37.9 GTex/s |
Speichermenge: | 2.048 MB GDDR5 | 4.096 MB GDDR5 |
Speichertakt: | 3.000 MHz | 3.500 MHz |
Speicherinterface: | 64 Bit | 128 Bit |
Speicherbandbreite: | 48 GB/s | 112 GB/s |
Leistungsaufnahme: |
30 Watt | 50 Watt |
Testsystem umd Messungen
Das neue Testsystem und die -Methodik haben wir im Grundlagenartikel „So testen wir Grafikkarten, Stand Februar 2017“ ja bereits sehr ausführlich beschrieben und so verweisen wir deshalb der Einfachheit halber jetzt nur noch auf diese detaillierte Schilderung, die in leicht abgewandelter Form auch für die CPUs gelten kann. Wer also alles noch einmal ganz genau nachlesen möchte, ist dazu gern eingeladen.
Abweichend ist in diesem Falle nur die Hardwarekonfiguration mit CPU, RAM, Mainboard, sowie die neue Kühlung, so dass die Zusammenfassung in Tabellenform schnell noch einen kurzen Überblick über das hier und heute verwendete System gibt:
Testsysteme und Messräume | |
---|---|
Hardware: |
Intel Core i3-6320 MSI Z270 Gaming Pro Carbon G.Skill F4-3200C14Q-32GTZ @ 2133 MT/s (16GB installed) 1x 1TB Toshiba OCZ RD400 (M.2, System) 2x 960GB Toshiba OCZ TR150 (Storage, Images) Be Quiet Dark Power Pro 11, 850-Watt-Netzteil Windows 10 Pro (Creators Update) |
Kühlung: |
Noctua NH-D15 Thermal Grizzly Kryonaut (für Kühlerwechsel) |
Monitor: | Eizo EV3237-BK |
Leistungsaufnahme: |
berührungslose Gleichstrommessung am PCIe-Slot (Riser-Card) berührungslose Gleichstrommessung an der externen PCIe-Stromversorgung direkte Spannungsmessung an den jeweiligen Zuführungen und am Netzteil 2x Rohde & Schwarz HMO 3054, 500 MHz Mehrkanal-Oszillograph mit Speicherfunktion 2x Rohde & Schwarz HZO50, Stromzangenadapter (1 mA bis 30 A, 100 KHz, DC) 2x Rohde & Schwarz HZ355, Tastteiler (10:1, 500 MHz) 1x Rohde & Schwarz HMC 8012, Digitalmultimeter mit Speicherfunktion |
Thermografie: |
Optris PI640, Infrarotkamera PI Connect Auswertungssoftware mit Profilen |
Kommentieren