GPUs Reviews

Groundhog Day: The 12V2X6, melting contacts and unbalanced loads – what we know and what we don’t know

Foreword

The measurements on the RTX 5090 Founders Edition and the MSI RTX 5090 Suprim show remarkable similarities in the power distribution, which point to a fundamental problem. Both cards exhibit minimal unbalanced loads in terms of power consumption, although these are not caused directly by the cards themselves, but arise somewhere between the power supply unit and the cards. It is interesting to note that the measurements were later repeated with two other different 12VHPWR cables. However, there were hardly any extreme deviations.

The cause of the slight unbalanced loads appears to lie in the combination of cables, connectors and the shared power supply unit, as the cards themselves do not actively distribute the load or balance it on the input side. Certain pins of the 12V2X6 connector are loaded more heavily than others, which leads to a slightly uneven distribution of the currents. These curves can be observed regardless of the choice of cable or card, which indicates that the current distribution is influenced by the mechanical and electrical properties of the overall system or the power supply unit.

The effect occurred on a be quiet! Dark Power Pro 13 with 1600 watts of rated power, whereby the power supply had to be set to OC mode with a switch so that it did not switch off when the spikes of the gaming load came. However, it managed the Furmark in both modes. This is precisely why I use the multi-rail mode for this measurement, as I can supply and measure cables 1 to 3 and 4 to 6 separately. However, these measurements show that the combination of power supply, cable and plug can have a considerable influence on the load distribution and that the weaknesses of the 12VHPWR design become more apparent in practice. Here we go.

Symbol image Furmark-Torture

 

Measurements in the visible range of the power supply units (supervisor)

Let’s measure at 10 ms intervals and play with the supervisor chip in the power supply unit. It is precisely these intervals that a supervisor chip still ‘sees’ for monitoring and in which it leads to switch-off if they are exceeded (trigger point). The first measuring clamp covers lines 1 to 3, the second covers lines 4 to 6. While the Founders Edition deviates a full 400 mA at around 590 watts on average over a minute, the peak of the 10 ms intervals is only 1.3 amps. Neither of which is anything to worry about. The original native cable of the power supply unit (be quiet! Dark Power Pro 13 1600 Watt) is used here, which is also connected to the 12V2X6 connector on the power supply unit.

NVIDIA RTX 5090 FE

If I go to 10 µs, there is still an average difference of 400 mA in the currents (that’s nothing) and the peaks are again 1.3 amps.

NVIDIA RTX 5090 FE

The thermography is also completely unsuspicious. No connector glows even after 30 minutes.

Now I’m measuring the MSI RTX 5090 Suprim with the same cable (but newly plugged in) at 10 ms intervals and I can already see a difference of 1.3 amps in the average value. That’s actually not much either, but a little more. What I have noticed, however, is that the voltage with the card suddenly drops to 11.7 or 11.8 volts.

MSI RTX 5090 SUPRIM

If you resolve a little higher, it is a maximum of 1.7 amps, which is also not very much on average from 3 cables. But it is more than the first time, even if the currents are now slightly higher overall.

MSI RTX 5090 SUPRIM

Of course, I checked the IR image again to double-check: nothing to be afraid of:

What can be concluded from this? If something goes wrong, then at most it is the cable and connector. Two plugs, four results? It’s not quite that extreme, but another cable change shows: The values change slightly each time they are plugged in, which indicates the general deficiencies of the plug connection (clamping surface, contact). Added to this is the voltage drop, which also depends on chance.

Ground on the wrong track: Why only certain power connector pins melt and we should rethink PCs

Summary and conclusion

The shortcomings of the 12VHPWR connector, in particular the uneven current distribution through the cable and connector, can cause unbalanced loads where individual pins are loaded more than others. These local overloads lead to increased contact resistance and heat generation, which under certain conditions can cause thermal damage to contacts and cables. In addition, by dispensing with active balancing and splitting the power supply across several rails in the board topology, NVIDIA has itself abandoned possible protective and corrective measures. As the cards directly take over the faulty distribution of the input side, the power load remains uncontrolled, which can lead to escalation under the wrong conditions.

This situation shows how several factors can interact: The inadequate plug connection as a starting point, the resulting thermal issues as a potential symptom, and the lack of protection measures on the board as an untapped opportunity to remedy the situation. Although such problems do not necessarily have to occur, the system remains susceptible to this concatenation if the load and the external conditions coincide unfavorably.

The symptoms of melting contacts and overheated cables in modern GPUs can be explained as a chain of unfortunate circumstances that do not necessarily have to occur. On the contrary, it will probably remain the exception. But it can happen.

 

377 Antworten

Kommentar

Lade neue Kommentare

z
zass

Mitglied

77 Kommentare 24 Likes

Und wie wird der Stromrückfluss (also die "Massen" am Kabel und Stecker) auf die Pins und Kabel verteilt?

Zum abfackeln ist es egal in welcher Richtung der Strom fließt, und irgendwo wird man die Massepins von der Stromversorgung verbinden müssen um ein brauchbares Bezugspotenzial zu bekommen.

Fazit: Auch mit dem ganzen Aufwand der dort betrieben wird wird das grundsätzliche Problem der zu hohen Stromstärken bei völlig unzulänglichen Kontakten/Buchsen/Steckern nicht beseitigt.

Antwort Gefällt mir

Igor Wallossek

1

12,114 Kommentare 23,918 Likes

Masse geht zu 50% außenrum. Das hatten wir schon 😉

Antwort Gefällt mir

z
zass

Mitglied

77 Kommentare 24 Likes

Wo ist drinnen und wo ist draußen?

Antwort Gefällt mir

Igor Wallossek

1

12,114 Kommentare 23,918 Likes

Basics und ausgemessen:

Mit außenrum meine ich den depperten Pömpel, da fließt ja nicht viel zurück. Da hätten auch 3 Leitungen gereicht. Vor allem bei der FE mit ihrem bescheuerten externen PCB sehe ich da echt schwarz.

Antwort 2 Likes

Klicke zum Ausklappem
z
zass

Mitglied

77 Kommentare 24 Likes

Na dann fröhliches weiterfrickeln am eigentlichen Problem vorbei bis als nächstes die Slots abfackeln.

Antwort 1 Like

Igor Wallossek

1

12,114 Kommentare 23,918 Likes

MIR musst Du das nicht sagen, ich bin Kritiker der ersten Stunde. Selbst GN hat das ja anfangs geleugnet, die User in die Haft genommen und meine Kritik als laienaften Clickbait abgetan. Du solltest dich schon bei denen beschweren, die so einem Murks entwerfen und bei denen, die ihn dann schön finden oder in Schutz nehmen. Ich mag den Pömpel nämlich auch nicht.

Dass der Strom eher über den PEG (34 Masseleitungen) abfließt, als dass er wieder brav und mühsam herauf zum 12V2X6 krabbelt, um sich dann über nichtsnutzige Klemmverbinder und dünne Leitungen wieder zum Netzteil zu quälen, wusste schon der gesetzgebende Herr Kirchhoff.

Antwort 11 Likes

echolot

Urgestein

1,309 Kommentare 1,057 Likes

"Die Symptome schmelzender Kontakte und überhitzter Kabel bei modernen GPUs lassen sich als Verkettung unglücklicher Umstände erklären, die jedoch nicht zwingend auftreten müssen. Im Gegenteil, es wird wohl eher die Ausnahme bleiben. Aber es kann auftreten."
Wann endlich zeigt man Einsicht, dass dieser grenzwertige Murks einen Reset braucht? Umbenennen reicht nicht aus. Gerade die hochlastigen Karten, die auch noch entsprechendes Geld kosten sind dann für die Tonne. Hier gilt der Spruch: "Besser ein Ende mit Schrecken als ein Schrecken ohne Ende."

Antwort 3 Likes

z
zass

Mitglied

77 Kommentare 24 Likes

Wer oder was ist das?

Antwort Gefällt mir

Igor Wallossek

1

12,114 Kommentare 23,918 Likes

Gamersnexus, der Hardwareprophet :)

Ganz meine Meinung, denn allein der Umstand, dass ein Schaden auftreten könnte, macht so eine Umsetzung bereits obsolet.

Intel lacht sich insgeheim tot, denn die haben den Käse ja mit initiiert. Und AMD hat das auch forciert, um NV dann ins offene Messer rennen zu lassen. Blau-Rote Verschwörung gegen Grün. Mal was Neues... :D

Antwort 8 Likes

S
SpotNic

Urgestein

1,373 Kommentare 630 Likes

Vielleicht löst sich das Problem erst wieder, wenn die Karten wieder weniger verbrauchen, wird einfach später ein BiosUpdate geben wie bei Intel und man drossel sie auf 450 Watt ein :D

Die HF Probleme hatte VW auch, als man anfing die Glühlampenrücklichter per PWM zu regeln weils so toll war, leider waren die Kontakte von Lampe und Fassung dafür absolut nicht ausgelegt und man hatte ständig Lampenstörungen mit richtig ausgefressenen Kontakten an den Lampen...

Antwort 3 Likes

L
LGTT

Mitglied

34 Kommentare 16 Likes

Bedeutet das für mich als Laien das das Problem das der8auer so versucht hat nachzubilden so eindeutig wenn überhaupt nur mit einem SingleRail Netzteil zu sehen ist da hir im Test durch das Multiraildesign ja schon Zeangsweise eine gewisse Aufteilung auf der Netzteilseite stattfindet? Vielleicht hab ich aber auch alles falsch verstanden. Ich finde den Stecker immer noch Murks entweder zurück ans Reißbrett oder auf max 400 Watt begrenzen sollte beides irgendwie helfen.

Antwort 1 Like

DrDre

Veteran

356 Kommentare 195 Likes

Da bin ich glatt froh, das ich zu geizig für diese Karten bin und mir meine bessere Hälfte auch gehörig die Ohren langziehen würde 😂

Antwort 3 Likes

Igor Wallossek

1

12,114 Kommentare 23,918 Likes

Nein, er zeigt, dass er einen Einzelfall, dafür aber extremer Ausprägung gefunden hat. Es kann passieren, muss aber nicht. Ich wollte eigentlich nur testen, was bei getrennt gespeisten Kabeln anders sein könnte. Aber es war de facto nichts Anderes, wobei ich die ganzen Unterschiede wirklich auf die Klemmverbinder reduzieren würde.

Genau da war ich aber schon 2023 und bin dafür von der üblichen Besserwisserblase immens verprügelt worden. Der damalige Artikel ist ja im heutigen Artikel mit verlinkt worden. Und mal im Ernst, ich freue mich nicht mal, dass ich Recht behalten habe, weil das Problem die Falschen trifft: die zahlenden Kunden. Da ist Häme fehl am Platz. Alledings warte ich schon seit Monaten mal auf eine Entschuldigung eines unrasierten Herren, der mich 2022 in seinem Video öffentlich als Deppen hingestellt hat. Aber das wird genausowenig passieren, wie der sofortige Ersatz des ekligen Pömpels durch etwas Besseres. :D

Antwort 5 Likes

Roland83

Urgestein

982 Kommentare 779 Likes

Ich bin gespannt wie AMD das auf seinen kommenden Partnerkarten löst, da wird ja u.a. von ASROCK eine XT mit dem neuen Verbinder kommen. Ich lasse mich überraschen ob man dort dann auf Kartenseite auch alles zusammenfasst oder den "konservativen" Weg mit mehreren Rails geht wie das bei Nvidias ersten Produkten der Fall war.

Antwort Gefällt mir

Ext3h

Mitglied

35 Kommentare 33 Likes

Was in anderen Foren noch aufgekommen ist, scheinbar sollte man die Balancing-Probleme durch variierende Anschlusswiderstände doch ziemlich einfach eliminieren können wenn man einfach nur die Molex-Plugs vermeidet, und stattdessen die Alternativmodelle nutzt die innerhalb vom Plug ebenfalls erst Mal eine gemeinsame Rail bilden.

Es verbleibt zwar das selbst vollständig innerhalb der Spezifikation dann trotzdem noch bis zu 16A statt der erwarteten 9.2A über einen einzelnen Pin fließen können, aber wenigstens geht dann nicht auch noch in Folge dessen der effektive Widerstand über den Kabelanteil ebenfalls noch in die Höhe. Die Kabel sind eh schon so knapp bemessen dass da nicht viel Abweichung mehr ein darf bis Luftkühlung nicht mehr reicht.

@Igor Wallossek Gerüchten zufolge nutzen die Netzteile auch zum Teil bereits Plugs mit Brücken. (Also explizit nicht Original-Molex-Design mit isolierten Terminals.) Ist das irgendwas dran?

Ich weiß nur bei den Adapter-Kabeln anhand von Photos zerlegter Stecker dass das dort auf jeden Fall Quasi-Standard geworden ist, auch bei denen mit Nvidia-Branding.

Antwort Gefällt mir

Gurdi

Urgestein

1,504 Kommentare 1,062 Likes

Schöner Artikel Igor, danke dass du dich der Sache wieder Willen trotzdem nochmal angenommen hast.
Einige Fragen dazu:
-Der IC-Chip, z.B. bei den MSI Karten, kann doch in der Regel mehrere Phasen steuern. Wird dies nicht genutzt und wenn ja warum? Theoretisch liese sich doch so durch Messung via Shunt zumindest 2-3 Rails zusammengefasst messen und abriegeln oder sehe ich da was falsch?

- Die Referenzplatinen für die Boardpartner verwenden zwei Shunts, offenbar parallel geschaltet um gegeneinander zu messen. Bringt dieses Konzept eine zusätzliche Absicherung?

View image at the forums

- Kann ich, ähnlich wie du bei deinen Messungen, via Monitoring der Rails des Netzteils (meins (HX1000i) kann das Auslesen, wenn auch natürlich in keiner Weise so genau wie dein Equipment) eine derart ungleiche Verteilung erkennen? Zumindest zwischen den Kabeln. Ich nutze ein auf drei Stecker aufgeteiltes CAbleMod Kable für den 12VHPWR und hab mich bewusst für drei Eingangsstränge entschieden zwecks Redundanz. Macht das Sinn? Es gibt ja z.B. von CaleMod auch ein Kabel mit vier Strängen (auch das mit zwei kann 600 Watt!), würde dies die Absicherung weiter erhöhen? Nach meiner Überlegung käme das ja im Grunde dem Prinzip des Adaptersteckers der den Karten beiliegt gleich oder?

Danke schon mal für deine Mühe.

Antwort Gefällt mir

Klicke zum Ausklappem
echolot

Urgestein

1,309 Kommentare 1,057 Likes

Naja wenn GPU und CPU ordentlich Strom ziehen, würde ich zumindest ein Dualrail Netzteil bevorzugen, um Überlagerungen von Spitzen zu vermeiden. Wie wahrscheinlich das ist 🤷‍♂️. Hatte @Igor Wallossek nicht mal was dazu geschrieben?

Antwort Gefällt mir

S
SpotNic

Urgestein

1,373 Kommentare 630 Likes

Da alle 3 zusammen erst die benötige Leistung zur Verfügung stellen hast du keine Redundanz, Redundanz bedeutet, dass jeder Teil der doppelten Ausführung alleinig die volle Leistung übernehmen könnte.

Antwort 2 Likes

grimm

Urgestein

3,528 Kommentare 2,566 Likes

Das ist schon echt eine traurige Entwicklung: Man setzt auf KI (DLSS, MFG), merkt, dass die KI-Modelle mit der gebotenen Rasterleistung (40X0er Gen) nicht ausreichend performen, dann hebt man diese an (Mehr Power!) und vergisst dabei das bei der letzten Gen aufgrund der guten Effizienz zusammengesparte Design anzupassen (liegt ja innerhalb der Specs 🤷‍♂️). Und um dem ganzen noch eins oben drauf zu setzen, erhöht man nochmal die Preise 🤣 Der User zahlt hier wirklich alles: die Karte, den Strom, den Schmorbraten.

Antwort 11 Likes

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kannst Du per PayPal spenden.

About the author

Igor Wallossek

Editor-in-chief and name-giver of igor'sLAB as the content successor of Tom's Hardware Germany, whose license was returned in June 2019 in order to better meet the qualitative demands of web content and challenges of new media such as YouTube with its own channel.

Computer nerd since 1983, audio freak since 1979 and pretty much open to anything with a plug or battery for over 50 years.

Follow Igor:
YouTube Facebook Instagram Twitter

Werbung

Werbung