Schmorende Header an NVIDIAs GeForce RTX 4090 - Neue Erkenntnisse, Messungen und (un)bekannte Ursachen zum 12VHPWR und 12V-2x6 Problem

Öhm, hab ich was verpasst?

Aus dem Artikel:
Unter Berücksichtigung all dieser Erkenntnisse hier im Labor, ist es interessant zu sehen, dass die neuen Adapter mittlerweile selbst nach über 8000 verkauften Einheiten keine höhere Ausfallrate mehr aufweisen als die normalen, nativen Kabel der Netzteilanbieter.

Ich dachte, man holt(e) sich so einen Cablemod Adapter, insbesondere um WENIGER Probleme mit dem da draußen sonst so verfügbaren Kabelgedöns zu haben - der Satz liest sich aber jetzt so, als wäre man jetzt erst überhaupt mal auf dem gleichen Niveau?

Hab das aber auch wegen Prinzip Hoffnung, passendem nativem BeQuiet-Kabel (Dark Power 13) und bisher bei mir notorisch abwesender Rauchentwicklung bei meiner 4090 nicht bis ins letzte Detail mitverfolgt - oder wo ist mein Verständnisfehler?
 
Ja ja, das allseits beliebte Toleranzthema... Ich habe mich, dank der von @Igor Wallossek beigestellten Zeichnungen aus der PCI SIG Norm auch ein wenig mit der Themaik beschäftig.

Die alte (erste Fassung) der Norm war ein Witz... da hätten die Pins für das Maß 0,64 eine Toleranz von 0,2 /0,25 mm +/- haben dürfen, und zusätzlich noch einen Pos.-Toleranz von 0,2. Auf diese Zeichnung kann man nur den Stempel machen: Gesehen und Gelacht!

Mit anderen Worten: Klemmfläche des Cable Plugs wird einzig über den Zufall entschieden. Man hätte auch auf die Zeichnungen schreiben können:

Toleranz nach wahl des Herstelles, oder DZE (Durch Zufall Entstanden), oder was die Fertig so ergibt...

Was viele von euch vermutlich nicht wissen, was genau bedeutet Pos. 0,2 zu ABC (CBA o. CAB) - ohne, dass man sich auf den Durchmesser bezieht?

In dem Fall muss der Hersteller sicherstellen, dass die Pins pro Achse (quasi zu A und B) maximal 0,07 mm abweichen. Also in X max. 0,07 mm und Y dito. Eine Fertigungsgenauigkeit bzw. Wiederholbarkeit von 0,07 mm ist extrem sportlich. Die dritte Achse also Z, oder in Sinne der Zeichnung der PCI SiG der C Bezug, hat man zwar zur Messbarkeit (Ausrichung) mit angegeben, aber sie spielt keine Rolle zur Betrachtung der Pos.Toleranz 0,2

Würde man die Positionstoleranz auf den Pin-Durchmesser beziehen, dann würde auch die dritte Achse (Z) bzw. der Bezug C eine Rolle spielen. Aber, das würde bedeuten, dass man in Bezug auf die Fertigungstoleranzen pro Achse nur noch 0,03 mm Fehler haben darf --> das prozessfähig abzubilden halte ich für nicht machbar!

Was die PCI SiG jetzt mit der neuen Zeichnung gemacht hat , ist am Ende nur Augenwicherei. Es fehlen aus meiner Sicht essentielle Angaben:

1. Die Rechtwinkligkeit der Pins zum Bezug C

2. Die Parallelität der Pin-Flächen zu A und B (Thema Verdrehung)

3. Die Ebenheit oder Flächeform der Pin-Klemmflächen (Thema Balligkeit)

4. Kantenbruchvorgaben (Radien an den Pins)

5. Die Min.-Klemmfläche der Buchsen [Cable Plug] (Öffnungsmaß min. im ungeklemmten Zustand) - Sicherstellung der Klemmung bzw. Kontaktfläche für den Stromfluss

Bei mir Büro liegen auch ein paar Stecker rum, leider kommen wir mit unserer 3D Messmaschine (300.000 €) nicht so einfach die Pins ran. Es besteht die Gefahr, dass der Messtaster kaputt geht. Schwierig und nicht billig! Eigentlich möchte ich die Positionstoleranzen messen. Denn das kann man nicht so einfach mit Igors Messtechnik machen. Vielleicht finde ich ja noch einen Möglichkeit. Jetzt will ich es auch wissen.

Nach den nun vorliegenden Erkenntnissen, hat sich mein Anfangsverdacht bestätigt, dass es nicht die Eine Urache gibt. Das war mir von Tag eins klar, als das Thema zu ersten Mal aufgetreten ist. Wer sich jetzt fragt, warum das alles solange gedauert hat?

Selbst NVIDIA kann so ein Problem nicht auf eine Urache reduzieren. Das sagen mir schon die statischen Zahlen der RMA-Quoten (im einstelligen Prozentbereich). Das sind Peak-Fehler und da sind meisten Kausale-Ketten am Werk. Sonst wäre es auch einfach zu lösen und man bräuchte so Leute wie Igor nicht... Da muss man mit Sinn und Verstand gucken - genau messen... Herr Hübenbecker lässt Grüßen.

Aus meiner Sicht wäre das alles Vermeidbar gewesen. Ich denke, dass hier der Fehler bereits in der Planung und Umsetzung gemacht wurde. Fehlende bzw. unzureichende FMEA und Manager: die Entscheidungen treffen, die nicht der Logik - shape follows function - entsprechen. Nach dem Motto - hauptsache der Stecker ist klein und kostet nix! Anders kann mir diese "Meisterwerk" der Nicht-Ingenieurskust nicht erklären...

In diesem Sinne, danke an Igor für seine Hartneckigkeit...

Update:

Igor hat meine Anmerkungen sogar mit in den Artikel aufgenommen... Seite 1... das war die Kurzfassung via Skype-Chat heute Mittag
 
Zuletzt bearbeitet :
Thanks for the informative article. I have only one question....

From the article @Igor Wallossek write.... In addition, CableMod made a significant contribution to gaining knowledge, because the countless test patterns that I was able to examine here also led me to the results . Taking all of these findings into account here in the lab, it is interesting to see that even after over 8,000 units have been sold , the new adapters no longer have a higher failure rate than the normal, native cables from the power supply providers.

Where did you get these figures from? Cablemod support? Or from some of their sales team? And what types of adapters is this so called +8000 numbers sold from? From the 90° v1.1 adapter? Or total amount v1.1 angled adapters? From this reply below the Cablemod reps said only a couple of thousands new adapters have been shipped. This was for 3 days ago. In short... I would take everything of claims/numbers coming from Cablemod with a grain of salt. They aren't trustworthy.

We shipped a "couple thousands" already and haven't had a single melt yet - knock on wood!:)

 
Where did you get these figures from? Cablemod support?
From the upper floor... I'm directly connected. No marketing, but technicians and managing ppl. The amount is for all shipped 1.1

Or with my own words:
If the header can't follow the specs, the cable plug must be able to follow the idiotism :D
 
Meine Güte. Hier mal am Rande der Norm, da mal am Rande der Toleranz... Hier mal am Material gespart, da mal ein paar Cent. Dann hier mal noch ein paar Cent bei der Materialverarbeitung.

Im Endeffekt ein sehr komplexes Versagen an vielen Stellen. Und der schmerzhaftetste Eindruck: Nur weil die Karte beim ersten Einstecken läuft, muss das beim zweiten und dritten Einbau nicht so bleiben.

Da schlummern also durchaus noch ein paar potentielle Defekte bei den Endverbrauchern.

Man sieht aber an der Analyse, dass wenn ein paar klüge Köpfe kooperieren und tief einsteigen, dass die Fakten wesentlich komplexer sind, als mancher Schnellschuss uns Glauben machen wollte.

Respekt vor der Analyse. Hier sehen wir wieder Igors Alleinstellungsmerkmal. Und den Mehrwert, den seine Arbeit bietet.

Da hätte NV mal direkt eine Analyse beauftragen können, um Ruhe in das Thema zu bekommen
 
Bei der Gelegenheit mal noch ein Teaserchen:
Ich plane für demnächst mal eine Art Homestory mit KrisFix - also etwas mehr Einblick in die Firma, die das alles repariert. Interessiert?
 
Respekt vor der Analyse. Hier sehen wir wieder Igors Alleinstellungsmerkmal. Und den Mehrwert, den seine Arbeit bietet.
Das sehen ein paar Reddit-Spezialisten zwar mal wieder anders, aber daran habe ich mich noch nie gestört. Die werfen mir heute noch das POSCAP Drama vor, als hätte noch niemals einer dieser Deppen zum Dampfdruckreiniger umgangssprachlich Kärcher gesagt :D
 
Wenn ich mir was wünschen dürfte, dann wäre das ein Test aller ( oder einiger) auf dem Markt käuflich erwerbaren Fremdanbieterlösungen. Ich steig da ernsthaft nicht durch und weiss nicht, welche ich kaufen soll?
 
Das sehen ein paar Reddit-Spezialisten zwar mal wieder anders, aber daran habe ich mich noch nie gestört. Die werfen mir heute noch das POSCAP Drama vor, als hätte noch niemals einer dieser Deppen zum Dampfdruckreiniger umgangssprachlich Kärcher gesagt :D
Reddit ist ein ekelhafter Schlund menschlicher Abgründe.

Und Neider hat gute Arbeit immer. Das gepaart mit dem latenten Gefühl intellektueller Unterlegenheit erklärt locker 20 % der Beiträge. Und das ist liebevoll geschätzt
 
Öhm, hab ich was verpasst?

Aus dem Artikel:


Ich dachte, man holt(e) sich so einen Cablemod Adapter, insbesondere um WENIGER Probleme mit dem da draußen sonst so verfügbaren Kabelgedöns zu haben - der Satz liest sich aber jetzt so, als wäre man jetzt erst überhaupt mal auf dem gleichen Niveau?

Hab das aber auch wegen Prinzip Hoffnung, passendem nativem BeQuiet-Kabel (Dark Power 13) und bisher bei mir notorisch abwesender Rauchentwicklung bei meiner 4090 nicht bis ins letzte Detail mitverfolgt - oder wo ist mein Verständnisfehler?
Kann man so betrachten. Positiv gesehen würde ich sagen, dass Cablemod die gleiche Qualität bietet, wie ein durch Versagen belehrter Hersteller.


Im Endeffekt kochen alle nur mit Wasser.
 
Bei der Gelegenheit mal noch ein Teaserchen:
Ich plane für demnächst mal eine Art Homestory mit KrisFix - also etwas mehr Einblick in die Firma, die das alles repariert. Interessiert?
Das wird spannend. Guck dem KrisFix mal mit dem Mikroskop auf die Lötstellen.

Verfolge seine Arbeit schon lange. Und manchmal fassungslos, wenn er in eine Platine bohrt. Angst hat der Mann vor wenigen Herausforderungen.
 
Meine Güte. Hier mal am Rande der Norm, da mal am Rande der Toleranz... Hier mal am Material gespart, da mal ein paar Cent. Dann hier mal noch ein paar Cent bei der Materialverarbeitung.

Im Endeffekt ein sehr komplexes Versagen an vielen Stellen. Und der schmerzhaftetste Eindruck: Nur weil die Karte beim ersten Einstecken läuft, muss das beim zweiten und dritten Einbau nicht so bleiben.

Da schlummern also durchaus noch ein paar potentielle Defekte bei den Endverbrauchern.

Man sieht aber an der Analyse, dass wenn ein paar klüge Köpfe kooperieren und tief einsteigen, dass die Fakten wesentlich komplexer sind, als mancher Schnellschuss uns Glauben machen wollte.

Respekt vor der Analyse. Hier sehen wir wieder Igors Alleinstellungsmerkmal. Und den Mehrwert, den seine Arbeit bietet.

Da hätte NV mal direkt eine Analyse beauftragen können, um Ruhe in das Thema zu bekommen
Das Material hat bei zu geringer Elastizität bzw. bei Überschreiten der Streckgrenze eine plastische, also bleibende Verformung erfahren. Kann sein, dass bei mehrmaligem Einstecken der Kontakt leidet. Dass dann auch noch das Material über Glück oder Pech entscheidet hätte ich jetzt nicht gedacht. Alleine diese Information aus Igors Analyse ist schon sehr aufschlussreich. Da reiht sich eine Sollbruchstelle an die nächste.

@Igor Wallossek
Ist Deine Nachfrage zu Igor@Krisfix rhetorischer Natur?
 
From the upper floor... I'm directly connected. No marketing, but technicians and managing ppl. The amount is for all shipped 1.1

Or with my own words:
If the header can't follow the specs, the cable plug must be able to follow the idiotism:D
Thanks. So in short... Avoid any of the PCB mounted connectors that have no self adjustments for each separate terminal like the vanilla cables from Nvidia/OEM/PSU manufacurers? It's for a reason the older CM v1.0 adapters had a melting statistic like 9:1 vs vanilla 12VHPWR cables. Their new v1.1 adapters may be better than the old but not an option I would jump on.
 
The 1.1 is more flexible, the housing sits perfect and the cooling inside works better. I does a littele bit quality control for them. But the main issue is the stupid header. The RMA quote is so far not worse than with a native cable.

I'm using this 90° adapter on my KFA2 (Galax) since months without any issue. First the 1.0, then a protoptype with temp control inside an now the final 1.1. My card uses a special BIOS and I can also deliver above 520 Watts to the header. No problems so far and I'm also in contact with KrisFix, who is repairing the cards for CableMod and others.

IMG_1603.JPG
 
Das Material hat bei zu geringer Elastizität bzw. bei Überschreiten der Streckgrenze eine plastische, also bleibende Verformung erfahren. Kann sein, dass bei mehrmaligem Einstecken der Kontakt leidet. Dass dann auch noch das Material über Glück oder Pech entscheidet hätte ich jetzt nicht gedacht. Alleine diese Information aus Igors Analyse ist schon sehr aufschlussreich. Da reiht sich eine Sollbruchstelle an die nächste.

@Igor Wallossek
Ist Deine Nachfrage zu Igor@Krisfix rhetorischer Natur?
Mein Ansinnen war weniger, Igors detaillierte Erkenntnisse darzustellen, sondern die Gesamtheit für mich selbst zusammenzufassen. Und den daraus resultierenden Eindruck zu reflektieren.

Es wäre vermessen, 70 Minuten Video und einen sorgfältig ausgearbeiteten Artikel in wenige Worte zu fassen.
 
Ich bin über diesen Teil gestolpert:

Schiefes Einsetzen der Cable PlugsKann die Header-Pins verbiegen (vor allem die äußeren)Anwender
Abziehen der Cable Plugs (Querbewegung beim Lösen)Kann die Header-Pins verbiegen (vor allem die äußeren)Anwender

Da war ich etwas fassungslos.
Die Steckverbindung würde ich als eher "filigran" in Bezug zu den Kabeln bezeichnen.
Das Einsetzen beim ersten Mal kann schon fummelig sein, da die Toleranzen... etwas Torsion, Kippen beim Einstecken benötigen.
Für Consumer-Ware damit ... herausfordernd.
Wer schon mal versucht hat, die Arretierung mit den Fingern zu lösen, kann mir vielleicht folgen, da besteht akute Verletzungsgefahr an den vielen scharfen Kanten, auch wegen des erfordelichen Drucks auf die Arretierung, bis sie sich löst. (übrigens auch bei den CableMod-Adaptern. Ich behelfe mir mit einem Schraubenziere zum Entriegeln. Dann ist es ein leichtes, dabei den Stecker versehentlich in einem Rutsch schräg abzuziehen.
Ich habe höllisch dabei aufgepasst, und bisher Glück gehabt.
Daher sind das vordergründig Anwenderfehler, in Wirklichkeit Designfehler der SIG und klar von NVIDIA, (und Intel, wie wie wissen).
Dann kommt noch der Biegeradius von 4 cm dazu, gleiches Trauerspiel, und vorher nicht mit angegeben (= neues Gehäuse oder Winkeladapter)
 
Man kann sich an der Kühlerfinnen schnell schneiden, davon kann ich mittlerweile ein Lied singen. Bei einer Karte, die ich für Tests genutzt hatte, habe ich sogar ein paar davon weggedremelt. Muss man denn als Endanwender immer alles selbst passend machen?

Morgen nehme ich mir eine kleine Auszeit und lasse die KI im Dialog mit mir für mich mal etwas zeichnen. NVIDIA-Ingenieurs-Comics inklusive. Bissl Ironie muss nach solviel pupstrockener Theorie dann auch mal sein. Da habe ich dann endlich mal Zeit, eine schneeweiße Karte (auch die Platine) zu testen. Sowas gibts ja auch noch. Da komme ich mal auf andere Gedanken :D
 
Ja ja, das allseits beliebte Toleranzthema... Ich habe mich, dank der von @Igor Wallossek beigestellten Zeichnungen aus der PCI SIG Norm auch ein wenig mit der Themaik beschäftig.

Die alte (erste Fassung) der Norm war ein Witz... da hätten die Pins für das Maß 0,64 eine Toleranz von 0,2 /0,25 mm +/- haben dürfen, und zusätzlich noch einen Pos.-Toleranz von 0,2. Auf diese Zeichnung kann man nur den Stempel machen: Gesehen und Gelacht!

Mit anderen Worten: Klemmfläche des Cable Plugs wird einzig über den Zufall entschieden. Man hätte auch auf die Zeichnungen schreiben können:

Toleranz nach wahl des Herstelles, oder DZE (Durch Zufall Entstanden), oder was die Fertig so ergibt...

Was viele von euch vermutlich nicht wissen, was genau bedeutet Pos. 0,2 zu ABC (CBA o. CAB) - ohne, dass man sich auf den Durchmesser bezieht?

In dem Fall muss der Hersteller sicherstellen, dass die Pins pro Achse (quasi zu A und B) maximal 0,07 mm abweichen. Also in X max. 0,07 mm und Y dito. Eine Fertigungsgenauigkeit bzw. Wiederholbarkeit von 0,07 mm ist extrem sportlich. Die dritte Achse also Z, oder in Sinne der Zeichnung der PCI SiG der C Bezug, hat man zwar zur Messbarkeit (Ausrichung) mit angegeben, aber sie spielt keine Rolle zur Betrachtung der Pos.Toleranz 0,2

Würde man die Positionstoleranz auf den Pin-Durchmesser beziehen, dann würde auch die dritte Achse (Z) bzw. der Bezug C eine Rolle spielen. Aber, das würde bedeuten, dass man in Bezug auf die Fertigungstoleranzen pro Achse nur noch 0,03 mm Fehler haben darf --> das prozessfähig abzubilden halte ich für nicht machbar!

Was die PCI SiG jetzt mit der neuen Zeichnung gemacht hat , ist am Ende nur Augenwicherei. Es fehlen aus meiner Sicht essentielle Angaben:

1. Die Rechtwinkligkeit der Pins zum Bezug C

2. Die Parallelität der Pin-Flächen zu A und B (Thema Verdrehung)

3. Die Ebenheit oder Flächeform der Pin-Klemmflächen (Thema Balligkeit)

4. Kantenbruchvorgaben (Radien an den Pins)

5. Die Min.-Klemmfläche der Buchsen [Cable Plug] (Öffnungsmaß min. im ungeklemmten Zustand) - Sicherstellung der Klemmung bzw. Kontaktfläche für den Stromfluss

Bei mir Büro liegen auch ein paar Stecker rum, leider kommen wir mit unserer 3D Messmaschine (300.000 €) nicht so einfach die Pins ran. Es besteht die Gefahr, dass der Messtaster kaputt geht. Schwierig und nicht billig! Eigentlich möchte ich die Positionstoleranzen messen. Denn das kann man nicht so einfach mit Igors Messtechnik machen. Vielleicht finde ich ja noch einen Möglichkeit. Jetzt will ich es auch wissen.

Nach den nun vorliegenden Erkenntnissen, hat sich mein Anfangsverdacht bestätigt, dass es nicht die Eine Urache gibt. Das war mir von Tag eins klar, als das Thema zu ersten Mal aufgetreten ist. Wer sich jetzt fragt, warum das alles solange gedauert hat?

Selbst NVIDIA kann so ein Problem nicht auf eine Urache reduzieren. Das sagen mir schon die statischen Zahlen der RMA-Quoten (im einstelligen Prozentbereich). Das sind Peak-Fehler und da sind meisten Kausale-Ketten am Werk. Sonst wäre es auch einfach zu lösen und man bräuchte so Leute wie Igor nicht... Da muss man mit Sinn und Verstand gucken - genau messen... Herr Hübenbecker lässt Grüßen.

Aus meiner Sicht wäre das alles Vermeidbar gewesen. Ich denke, dass hier der Fehler bereits in der Planung und Umsetzung gemacht wurde. Fehlende bzw. unzureichende FMEA und Manager: die Entscheidungen treffen, die nicht der Logik - shape follows function - entsprechen. Nach dem Motto - hauptsache der Stecker ist klein und kostet nix! Anders kann mir diese "Meisterwerk" der Nicht-Ingenieurskust nicht erklären...

In diesem Sinne, danke an Igor für seine Hartneckigkeit...

Update:

Igor hat meine Anmerkungen sogar mit in den Artikel aufgenommen... Seite 1... das war die Kurzfassung via Skype-Chat heute Mittag

zu den Pos. Toleranzen von ⌀0,2 darf der Pin schon mehr wie 0,07mm abweichen weil du betrachstet X und Y gleichzeitig aber wenn es nur eine Achse betrifft sind es radial schon 0,1mm. Grundsätzlich muss isch die Achse in dem Kreis von 0,2mm Durchmesser befinden
1699293561727.png

Warum sie zu ABC toleriert haben wird den Hintergrund haben das sie damit die Einstecktiefe mit sicherstellen wollen (ob das so Sinn macht ist einer anderes Thema)

die Rechtwinkligkeit der Pins sehe ich nciht so kritisch an im Rahmen der Toleranzen da die sich durch die Form anlegen

Flächenform kann man reinbringen aber mit welcher Toleranz weil man will ja nicht 50% Ausschuss produzieren und ich finde die Toleranzangeben schon mutig für die Herstellungsverfahren die sie gewählt haben.

Kantenbruch wird meist allgemeint über Zeichnungsrahmen oder Werksnorm definiert müsstet ihr mal in den Zeichnungen schauen ob das was vermerkt wurde


und ob das Stecker jetzt gut oder schlecht designt wurde können wir nicht beurteilen weil wir das Lastenheft nach dem gearbeitet wurde nicht kennen
 
Das ist im Grunde genommen ein sehr mutig aufgeblasener Microfit-Stecker. Ich kann einen Polo natürlich auch auf 1000 PS pimpen, aber wie lange hält der dann? Genau da kommt die Frage, denn es ist ja keine eigenständige Neuentwicklung, sondern nur ein mehrfach gepimpter 350-Watt-Stecker. Allein die vielen Versionen, wo kein Adapter auf andere Karten passte... Das ist eigentlich die Analogie des Grauens. Frickelei.
 
Interessante Analyse.
 
Oben Unten