Prozessor System Testberichte

TIM-Gate, VRM-Desaster oder einfach zu viel Polemik? Skylake-X und mögliche Mängel bei X299-Mainboards

Was gab es nicht in den letzten Wochen an Rauschen im Blätter- und Videowald. Da war stellenweise sogar von einem VRM-Desaster oder einem TIM-Gate (Wärmeleitpaste statt Lot) die Rede, doch wenn man alles einmal genau und abgekärt betrachtet, ist das G...Wärmeleitpaste statt Lot Einer der Gründe für die ganze Kühlproblematik liegt an Intels Einsatz von unzweckmäßiger (aber wohl deutlich billigerer) Wärmeleitpaste anstelle eines sinnvollen Lotes auf Indium-Basis. Man kann nun über die Haltbarkeit solc...Default-Einstellungen Out-of-the Box, Cheats und Hitze Die erste Kritik, die uns bereits lange vor dem Launch zu Ohren kam, vernahmen wir aus der Richtung der Mainboardhersteller. Man nehme eine normale All-in-One Kompaktwasserkühlung, wie sie dutzen...Wir nehmen die Mainboardhersteller mit in die Pflicht Allein die Schuld eines sich anbahnenden Hitze-Infernos jetzt nur auf Intel und die bis an ihre Schmerzgrenze ab Werk getaktete CPU zu schieben, wäre in der Summe sicherlich auch zu kurz gesprunge...

Was gab es nicht in den letzten Wochen an Rauschen im Blätter- und Videowald. Da war stellenweise sogar von einem VRM-Desaster oder einem TIM-Gate (Wärmeleitpaste statt Lot) die Rede, doch wenn man alles einmal genau und abgekärt betrachtet, ist das Ganze nichts anderes als eine ellenlange kausale Kette, bei der eine extrem hitzköpfige CPU den eigentlichen Ausgangspunkt markiert. Doch was schreiben wir eine, es sind ja im Prinzip sogar gleich derer drei. Aber immer schön der Reihe nach, denn wir versuchen es nämlich auch so leicht verständlich wie möglich zu halten.

Eine kurze Bestandsaufnahme am Anfang kann nicht schaden, sodass wir einfach einmal kurz die zwei der Kernpunkte zusammenfassen, die in den aktuellen Diskussionen immer wieder hochschwappen und nach denen wir dann auch unseren Test gegliedert haben:

(1) Skylake-X ist bereits im Normalbetrieb Out-of-the Box kaum kühlbar, da die Leistungsaufnahme in einzelnen Situationen bereits extrem hoch ist und die Wärmeleitpaste zusätzlich eine optimale und zweckmäßige Wärmeabfuhr verhindert.

(2) Es besteht kaum noch Übertaktungsspielraum für den Normalanwender und viele Mainboards sollen durch Konstruktionsmängel, wie z.B. unzureichende Kühlung der externen Spannungswandler, bereits von sich aus die CPU unangemessen limitieren. Extremübertakter können mit der aktuellen Hardware kaum noch etwas anfangen.

Das Ganze ist dann meist gewürzt mit viel zu viel Polemik, die aber dem bzw. vielleicht sogar den eigentlichen Problemen der potentiellen Käufer kaum gerecht wird.

Testaufbau und Mess-Methoden

Deshalb schnappen wir uns eines der einfacheren Mainboards für den Sockel 2066, bauen einen neuen Benchtable für den vertikalen Betrieb und testen, was dran ist (oder vielleicht auch nicht). Wir werden einserseits auf die Sensorwerte der jeweiligen Bereiche, sowie deren Herkunft eingehen und andererseits durch unsere berührungslosen Messungen mit der Infrarot-Wärmebildkamera die Erwärmung der Platine im Bereich um Sockel und Spannungswandler auf Plausibilität prüfen.

Zusätzlich können wir damit sogar die Auf- und Durchwärmung dokumentieren, sowie den Vorgang in speziellen Zeitraffer-Videos darstellen. Denn uns interessiert ja auch, ob nicht vielleicht auch noch andere Komponenten durch die entstehenden Hotspots bzw. die Wärmeübertragung im Mainboard negativ beeinflusst werden könnten.

Für das sichere Auslesen der Sensoren und den möglichst reibungslosen Betrieb des Testaufbaus nutzen wir natürlich das aktuellste BIOS für unser Mainboard, sowie HWinfo in der derzeit neuesten Beta-Version ab v5.53-3190 (beim Download auf Beta-Version klicken!).

[Update vom 11.07.2017] Nach genauerer Nachkontrolle, der Rückfrage mit dem Hersteller und auch Hinweisen aus dem Forum haben wir nachfolgend einige Details korrigiert bzw. vertieft.

Das Board verfügt über insgesamt 5 + 1 Phasen für die CPU-Spannungsversorgung, die von einem IR35201 von International Rectifier bereitgestellt und gesteuert werden. Dieser mehrphasige Buck Controller unterstützt Intels VR12 und ganz offensichtlich auch VR13. Wer für Vccin mehr Spannungswandler-Kreise anhand der Spulen vermutet, liegt völlig richtig, denn durch das sogenannte Doubling kann man bei fünf Phasen gleich zwei Kreise pro Phase realisieren und somit auch die einzelnen VRM entlasten und die Hotspots flächenmäßig entzerren. Auf diesen Chip, sowie dessen abgreifbaren Daten wie Spannungen und Ströme, kommen wir später noch einmal zurück.

Als Spannungswandler dient pro Regelkreis jeweils ein IR3555 von International Rectifier. Diese hochintegrierten Power-Stage-Chips vereinen jeweils die notwenigen Gate-Treiber, synchrone MOSFETs für die High- und Low-Side, sowie die Schottky-Diode in einem Package. Sie besitzen zusätzlich, im Gegensatz zu dem meisten der üblichen MOSFETs, auch noch integrierte analoge Temperatursensoren. Doch wie kann man dann die Temperaturen dieser Spannungswandler sonst noch exakt ermitteln, wenn man nicht gerade eine passende IR-Kamera nutzen kann?

MSI verwendet auf dem getesteten Mainboard den Nuvoton NC6795D als sogenannten Super-IO-Chip, der eine Vielzahl von Sensorwerten erfassen und bereitstellen kann. Dazu gehört auch der Temperaturwert der Spannungswandler, den man mittels eines mittig zwischen den Power-Stage-Chips platzierten Thermistors ermittelt (Bild unten). Wir haben deshalb den Messpunkt für unsere Video-Erfassung rückseitig genau unterhalb dieses Thermistors gewählt.

Darüber hinaus prüfen wir auch noch die Temperaturen der Spulen und Kondesatoren dieser Spannungswandlerkreise, sowie im weiteren Verlauf die Platinentemperaturen bis hin zur CPU.

Zwangsweises Heruntertakten und Notabschaltung

Um die weiteren Tests, sowie die aufgetretenen und in Foren oft viel zu polemisch diskutierten Probleme besser verstehen zu können, müssen wir wissen, dass die Mainboardhersteller einige Sicherheitsmechnismen verwenden. Dazu gehört zum Beispiel auch, dass unser Testboard die Skylake-X bei exakt 105°C gemessener Temperatur am Thermistor (HWinfo unter Zeile MOS, Nuvoton NCT6795D) auf 1,2 GHz heruntertaktet und diesen Zustand so lange erhält, bis die Temperatur auf unter 90°C gesunken ist. Dann erst wieder gibt es Vollgas.

Das ergibt durchaus einen Sinn, wenn man weiß, dass zwar der Flammpunkt für das verwendete Platinenmaterial (FR4) deutlich höher liegt, die Empfehlungen für eine Maximaltemperatur im Dauerbetrieb jedoch nur bei Werten zwischen 95 und 105°C liegen, weil besonders Multilayer-Platinen sonst vom Dry-Out (Austrocknen), Bending und möglichen Haarrissen der Leiterbahnen betroffen sein könnten. Das ist zu begrüßen, denn Grafikkartenhersteller haben in dieser Problemzone meist die (unnötig) besseren Nerven.

Wer Intels Extreme Tuning Utility (XTU) nutzt, bekommt dieses Heruntertakten als Thermal Throttling: Yes in Gelb angezeigt. Doch was ist dort mit Statusanzeigen wie z.B. Motherboard VR throttling?

[Update vom 11.07.2017] Auch an dieser Stelle müssen wir noch eine kleine Ergänzung einfügen, welche die von HWInfo ausgelesenen Werte betrifft. Was nämlich weit weniger bekannt ist: auch der  IR35201 liefert Temperaturwerte zurück. Diese Werte für VR T1 und VR T2 sind deutlich höher und auf den ersten Blick auch erst einmal ziemlich widersprüchlich zu denen des externen Sensors.

Es lag zunächst auf der Hand, dass hier wie so oft nur eine Art Chiptemperatur des Controllers ausgegeben wird. Das entspräche dann in etwa dem, was man z.B. bei Grafikkarten mit diesen PWM-Controllern in diversen Tools dann angeblich als Spannungswandler-Temperaturen  VRM1 und VRM2 angezeigt bekam (meist setzten AMD-Karten auf diese Controller). Da maß sich der Chip nämlich faktisch fast immer selbst.

Bei der hier auftretenden Kombination von IR35201 und den IR3555 ist jedoch davon auszugehen, dass auch die vom IR3555 ausgegebeben und im Verhältnis zur Temperatur im Inneren stehenden Spannungswerte, verwendetet werden

Für diese Werte setzt man eine Obergrenze von 125°C, bevor im XTU gelb vor Motherboard VR throttling: yes gewarnt und die CPU ebenfalls auf 1,2 GHz heruntergetaktet wird. Ab 135°C wird das Mainboard sogar ohne Vorwarnung einfach abgeschaltet, weil die erzeugten Spannungen sonst außerhalb der Spezifikationen gefährlich abdriften und die Hardware schädigen könnten.

Weree exemplarisch für einen CPU-KernWeree exemplarisch für einen CPU-Kern

Doch auch die CPU schützt sich selbst. Basierend auf verschiedenen integrierten digitalen Temperatur-Sensoren (DTS), werden die Temperaturen der Rechenkerne und des Packages ermittelt. Hierbei handelt es sich um Rechenwerte, deren Genauigkeit mit steigender Temperatur zunimmt. Alles unter 40°C kann man eigentlich vergessen, ab ca. 80°C, also dem Bereich, wo es dann darauf ankommt, wird es schon recht exakt. Wir sehen aber auch, dass sowohl die Temperaturen der Kerne, als auch die des Packages zu einer thermisch bedingten Drosselung des Taktes führen können.

Gerade die Package-Temperaturen beinhalten auch die Verlustleistung der IVR, also der in der CPU integrierten Spannungswandler für die Bereitstellung der einzelnen Teilspannungen einer CPU. Hier kann es, vor allem bei hoher Übertaktung und manueller Spannungsanhebung, schnell zu unerwarteten Limit-Überschreitungen kommen, die nicht jedes Tool gleich sicher erfassen kann. Dann throttelt die CPU, ohne dass der Nutzer die Ursache sehen kann. Zu den IVR gibt es aber gleich noch mehr. Zunächst jedoch fassen wir noch einmal zusammen:

Merkblatt #1
Eine Taktverringerung der CPU kann sowohl von zu hohen Kern- bzw. Package-Temperaturen innerhalb der CPU ausgelöst werden (was am bekanntesten ist), als auch vom Super-IO Chip wegen der zu hohen VRM-Temperaturen bzw. dem PWM-Controller wegen zu hoher, eigener Chiptemperatur und der Gefahren einer instabilen Spannungsversorgung. Dass der PWM-Controller aber VRM-Temperaturen liefern kann, ist eine Urban Legend.

Das Testsystem im Detail

Wir haben alle benutzen Hardwarekomponenten, Messgeräte und Tools noch einmal tabellarisch zusammengefasst:

Testsystem und Messgeräte
Hardware:
Intel Core i9-7900X
MSI X299 Gaming Pro Carbon AC
4x 4 GB G.Skill RipJaws IV DDR4-2600
Nvidia Quadro P6000 (Workstation)

1x 1 TByte Toshiba OCZ RD400 (M.2, System SSD)
2x 960 GByte Toshiba OCZ TR150 (Storage, Images)
Be Quiet Dark Power Pro 11, 850-Watt-Netzteil
Windows 10 Pro (Creators Update)

Kühlung:
Alphacool Eiszeit 2000 Chiller + Alphacool Eisblock XPX
Alphacool Eisbär 240 (AiO)
Noctua NH-D15 (Luft)
Thermal Grizzly Kryonaut (für Kühlerwechsel)
Monitor: Eizo EV3237-BK
Leistungsaufnahme:
Direkte Gleichstrommessung über Shunts (Spannunsgabfall)
Direkte Gleichspannungsmessung an den Messpunkten
Berührungslose Gleichstrommessung am EPS-Versorgungsanschluss

2x Rohde & Schwarz HMO 3054, 500 MHz Mehrkanal-Oszillograph mit Speicherfunktion
4x Rohde & Schwarz HZO50, Stromzangenadapter (1 mA bis 30 A, 100 KHz, DC)
4x Rohde & Schwarz HZ355, Tastteiler (10:1, 500 MHz)
1x Rohde & Schwarz HMC 8012, Digitalmultimeter mit Speicherfunktion

Thermografie:
Optris PI640, Infrarotkamera
PI Connect Auswertungssoftware mit Profilen
Standbilder und radiometrische Videos

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kann Du per PayPal spenden.

About the author

Igor Wallossek

Chefredakteur und Namensgeber von igor'sLAB als inhaltlichem Nachfolger von Tom's Hardware Deutschland, deren Lizenz im Juni 2019 zurückgegeben wurde, um den qualitativen Ansprüchen der Webinhalte und Herausforderungen der neuen Medien wie z.B. YouTube mit einem eigenen Kanal besser gerecht werden zu können.

Computer-Nerd seit 1983, Audio-Freak seit 1979 und seit über 50 Jahren so ziemlich offen für alles, was einen Stecker oder einen Akku hat.

Folge Igor auf:
YouTube   Facebook    Instagram Twitter