Frage GTX1070 8Pin Power Draw Monitoring fehlerhaft

Pollock

Mitglied
Mitglied seit
Sep 15, 2020
Beiträge
21
Bewertungspunkte
2
Punkte
2
Hey, hab aktuell ein Problem einer gebraucht gekauften GTX1070 welche eigentlich im PC meiner Freundin platz finden soll. GPU-Z zeigt selbst im Idle einen absurd hohen und nicht repräsentativen PowerDraw am 8-Pin Anschluss von meheren 100 W an, weswegen die Karte umgehend ins Power Limit läuft und massiv herunter taktet.
Kenne mich nur grundlegend mit den verwendeten Monitoring-Schaltungen aus, soweit ich weiß wird der Spannungsabfall über einem Messwiderstand (Shunt) gemessen um die Leistungsaufnahme zu bestimmen und es durch Überbrückung des Widerstandes auch möglich ist, die gemessene Eingangsleistung auf nahezu Null zu setzen. Gehe ich richtig in der Annahme, dass sich somit der Widerstandswert dieses Shunts erhöht haben muss, damit die Karte eine überhöhte Leistungsaufnahme misst? Kenn sich jemand ggf. mit solchen Schaltungen besser aus und kann mir sagen, über welchem Widerstand des PCBs der Spannungsabfall gemessen wird, sodass ich diesen ggf. überprüfen kann?
Karte ist eine ASUS Dual GeForce GTX 1070 OC, hier mal ein Bild des PCB um den 8-Pin Anschluss:

20230110_230519.jpg
20230110_230505.jpg
 
Das ein Shunt einen Defekt hat, ist eher unwahrscheinlich, und ist bei mir noch nie vorgekommen. Eher wahrscheinlich ist, das der Shunt mies verlötet ist, oder einfach jemand einen Shunt mit falschem Widerstandswert oder Belastbarkeit eingelötet hat. Aber das müsstest du ja auch schon nach einer Sichtkontrolle der Leiterplatte erkennen können. Natürlich könnte auch die Auswertung des Spannungsanfalls über dem Shunt defekt sein.

Mach Mal ein Foto von deiner Leiterplatte, um auch feststellen zu können, ob die Stromaufnahme tatsächlich per externen Shunt am 8pin Stecker gemessen wird. Moderne Grafikkarten messen die Stromaufnahme eigendlich eher direkt per Spannungsabfall an den FETs des Spannungsregler.
 
Das ein Shunt einen Defekt hat, ist eher unwahrscheinlich, und ist bei mir noch nie vorgekommen. Eher wahrscheinlich ist, das der Shunt mies verlötet ist, oder einfach jemand einen Shunt mit falschem Widerstandswert oder Belastbarkeit eingelötet hat. Aber das müsstest du ja auch schon nach einer Sichtkontrolle der Leiterplatte erkennen können. Natürlich könnte auch die Auswertung des Spannungsanfalls über dem Shunt defekt sein.

Mach Mal ein Foto von deiner Leiterplatte, um auch feststellen zu können, ob die Stromaufnahme tatsächlich per externen Shunt am 8pin Stecker gemessen wird. Moderne Grafikkarten messen die Stromaufnahme eigendlich eher direkt per Spannungsabfall an den FETs des Spannungsregler.
Hey, danke für Deine Rückmeldung :) Wenn ich Igors Bericht über die TBP richtig verstanden habe, misst eine (aktuellere?) nVidia Karte tatsächlich die Eingangsleistung (TBP) mithilfe von Strommessungen an den Eingangsleitungen, AMD Karten bis zur 6. Generation nutzen den Spannungsabfall an den FETs um die Leistungsaufnahme der GPU und des Rams zu bestimmen. GPU-Z zeigt mir auch zwei getrennte Leistungen für 8-Pin und PCIe an, daher bin ich recht guter Dinge, dass hier wirklich per Shunt gemessen wird :) Ein Bild hab ich schon im Spoiler beigefügt :) Die Karte hat auch keine Backplate, es könnte also auch sein, dass der Vorbesitzer die Karte mal etwas unsanft am Shunt angestoßen und damit die Lötverbindung beeinträchtigt hat :)
 
Auf der Rückseite ist ja nur die Auswertung zu sehen. Ist der Jumper PJP3 gerückt, bzw war der Jumper im Original mal gebrückt(Zinnreste)?


Die beiden Shunts sind nur auf der Vorderseite zu sehen. Da muss die wohl den Kühler Mal abnehmen, um einen Blick drauf werfen zu können.
 
Auf der Rückseite ist ja nur die Auswertung zu sehen. Ist der Jumper PJP3 gerückt, bzw war der Jumper im Original mal gebrückt(Zinnreste)?


Die beiden Shunts sind nur auf der Vorderseite zu sehen. Da muss die wohl den Kühler Mal abnehmen, um einen Blick drauf werfen zu können.
Ah, da hätte ich auch drauf kommen können danke Dir!! Jetzt erkenne sogar ich sie (; Hier die Bilder von der Vorderseite:

20230111_010618.jpg
20230111_010613.jpg
 
Diese beiden Shunts und Lötstellen sehen gut und original aus. Warum das jetzt scheinbar zwei Messkreise sind kann ich nicht sagen. Eventuell wird die Stromaufnahme vom Speicher und GPU getrennt erfasst. Knapp über den Shunts sind zwei bis vier leere Lötpositionen zu sehen, auf den eigentlich noch ein paar Keramikkondensator gehören, die aber wohl aus Kostengründen vom Hersteller eingespart wurden. Je nachdem wie verrauscht deine 12V Stromversorgung aus deinem NT ist, kann das fehlen der Kondensatoren auch die Leistungsmessung verfälschen.

Unten an dem PCIe Slot Kontaktleiste sind in der Regel auch noch Shunts vorhanden, die die Stromentnahme aus dem Mainboard überwachen(max. 75W).

Hast du die Karte/Idle-Leistungsaufnahme mal in einem anderen PC getestet? Ist noch das Original BIOS auf der Grafikkarte geflasht?
 
Wenn die Karte bereits im Idle permanent Volllast zieht, befürchte ich eher einen Defekt im Bereich der Spannunsgwandler. Also de facto einen Feinschluss ein einem oder mehreren Regelkreisen. Der MOSFET ist nicht komplett hin, aber permenent offen. Entweder hat der/die MOSFET(s) einen Durchbruch, oder aber die PWM-Regelung läuft Amok. Man müsste mal mit dem Oszi die PWM Nodes auf die Phasenverschiebungen hin messen. Wenn dort nur ein Strich ist, ist meist der Controller hin.

Ich halte die Karte für einen wirtschaftlichen Totalschaden.
 
Guten Morgen und vielen Danke Euch beiden für die Hilfe :) Hab die Karte gerade mal in einem offenen Testaufbau betrieben (mit einem anderen Netzteil) und einige Tests gemacht, hier erstmal ein Screenshot der Telemetrie:

Vorhe.png

Die Messung der PCIe Leistungsaufnahme scheint mir mit etwa 20 W realistisch, der Fehler scheint in der zweiten Messschaltung des 8-Pin Anschlusses zu liegen (im Spoiler ist ein beispielhafter Screenshot, die (ausgelesenen) Werte variieren aber stark).

@Igor Wallossek: Hast Du natürlich absolut recht, die Karte rechtfertigt aktuell kaum den Aufwand, aber ich möchte dennoch versuchen die Karte weiterhin zu verwenden da ich ungern Sachen so schnell wegwerfe und lieber instand setze wenn es mir möglich ist :) Die Karte scheint sich im Idle nicht nur das volle PowerLimit, sondern erheblich mehr zu genehmigen (siehe Screenshot im Spoiler). Wenn ich dich richtig verstehe sollte bei einem (teilweise) defekten Spannungswandler die reale Leistungsaufnahme der Karte steigen und somit auch die Temperatur der betroffenen Komponente. Die Karte bleibt im Idle aber recht Kühl, von einem Verbrauch in der Nähe oder jenseits der default PowerLimit würde ich daher nicht ausgehen und eher ein Fehler in der Messung vermuten. Ich habe gerade auch mal den Spannungsabfall an den beiden Shunts gemessen, der liegt nahe Null (0,000 V und 0,001 V), der Monitoring Chip sollte doch daraus dann auch keine exorbitanten Werte errechnen können, wenn das Bezugspotential korrekt bzw. der Chip selbst einwandfrei funktioniert, oder? Ich könnte in den nächsten Tagen auch mal ein Oszi an der Arbeit ausleihen, dann könnte ich auch mal den Ausgang des PWM Controllers messen :)
 
Hallo Pollock

Für eine solche Anzeige sehe ich 3 mögliche Ursachen:
- falsche Auslesung durch GPU-z
- falsche Messung durch die Grafikkarte
- extremer aber richtig gemessener Strombedarf

Dass hier wirklich 1 kW verheizt wird, würde ich mal ausschliessen. Da würde man recht schnell Rauch aufsteigen sehen oder zumindest merken wie sie heizt.

Da die Karte nur einen Stromanschluss hat, könnte es sein, dass der Wert nur unsinnig ausgelesen wird. Tools wie GPU-z müssen für die Eigenheiten jeder Grafikkarte angepasst werden. Da kann schon mal was falsch erkannt werden.

Der Takt um 400 MHz ist im Leerlauf eigentlich üblich. Der Ram dürfte auch herunter takten. Hast du mehr als einen Bildschirm? Mit welchem Takt laufen die? Mehrere Bildschirme oder hoher Takt sind manchmal ein Grund, dass eine Karte nicht ganz herunter taktet. Ausser dem einen Wert sehen eigentlich alle Werte normal aus.

Wie sieht es aus, wenn du die Karte belastest? Dreht sie dann erst auf und drosselt dann? Kannst du davon auch noch ein Bild von GPU-z machen?

Shuntwiderstände sind bei Nvidia seit langem die normale Messmethode. Der Widerstand ist sehr klein und der Spannungsabfall auch. Durch den Widerstand fliesst ja der ganze Strom an diesem Anschluss. Der Widerstand soll aber nicht unnötig Strom verheizen sondern nur die Messung des Spannungsabfalls möglich machen. Um den Shunt zu kontrollieren würde ich bei ausgeschalteter Grafikkarte am Widerstand selbst den Widerstand in mOhm messen. Die müssten beide den selben Wert haben. Höher wird der Widerstand vor allem, wenn sich die Lötstelle ablöst. Um das zu kontrollieren müsste man zwei Messpunkte neben den Shunts finden, bei denen man die Anschlüsse abgreiffen kann.
 
Seltsam ist ja , das gpu-z trotz hoher Leistungswerte den Powerstatus(PerfCap reason) mit grün anzeigt. Außerdem ist noch seltsam, das zwischen der PCI slot Spannung und 8pin Spannung 0.5V Unterschied liegen.

Lies Mal die Telemetrie Wert mit HWinfo aus. Da wird idR Spannung und Strom weit aufgeschlüsselt angezeigt. Dann wäre es auch sinnvoll, mit einem Amperemeter den tatsächlichen fließenden Strom auf der 8pin Leitung zu messen. Oder zur Not auch einfach nur die Leistungsaufnahme des Netzteils mit einem PowerMonitor an dem externen Netzkabel überprüfen. Hat ja nicht jeder ein 20A Multimeter oder 20A LaborNetzteil.

Wenn die FETs tatsächlich schon im Idle soviel Strom aufnehmen würden, müsste sich das ja auch deutlich in der erhöhten Wärmeabgabe der FETs bemerkbar machen. Wenn du kein IR Thermometer oder IR Kamera hast, kannst du ja mal ein kleines Stück Wärmeleitpad an den Stellen der Spannungsregler und ShuntAuswertung auf die Leiterplattenrückseite drücken, um die Stelle mit der größten Verlustwärme zu finden.
 
Nimm bitte mal HWInfo als Gegentest
 
Hallo ihr drei, danke für Eure Hilfe :)

Bin heute mal wieder etwas zum Testen gekommen. Habe die Karte heute ohne Shroud mit einem 120mm Lüfter unter Last gesetzt und mit HWInfo, GPUz und dem Afterburner die Telemetrie ausgelesen. Hier die Screenshots:

Idle:
Idle.png
Last nach einigen Sekunden:
Last 15s.png
Last nach einigen Minuten ohne Lüfter:
last2min.png
Dass die Karte tatsächlich dauerhaft eine so hohe Leistungsaufnahme hat, würde ich aufgrund der wirklich geringen Temperatur ausschließen, welche sich, selbst wenn ich den Lüfter von Kühler nehme nur sehr sehr langsam erhöht. Das PerfCap Reason der Karte schwankt (im Idle und unter Last) zwischen "Idle" und "Pwr", daher ist die Abbildung des Screenshots der Ausgabe der Tools zufällig. Ein Labornetzteil dieser Leistungsklasse habe ich leider nicht, auch aktuell kein Amperemeter welches einen Strom von ~10 A messen könnte. Ich habe derzeit nur ein sehr günstiges Multimeter, dessen Anzeige zumindest Spannung im einstelligen mV Bereich darstellen kann (wahrscheinlich bietet es aber keine derart gute Messgenauigkeit). Dennoch sollte ja bei einem Strom von (150W (TBP) - 25W (P_PCIe ) / 12 V ~10,5 A an den Shunts ein Spannungsabfall von
Shunt1: 0,002 Ohm * 10,5 A = 21 mV
Shunt2: 0,005 Ohm * 10,5A = 53 mV
gemessen werden können, das sollte das Gerät doch zumindest grob schaffen, selbst wenn beide Shunts nur jeweils einen Teil des Gesamtstroms messen (sehr wahrscheinlich werden die beiden Shunts ja nicht beide denselben Strom, vollständigen Strom messen, ich vermute mal, dass hier zwei Schaltungen realisiert sind, um die Leistungsaufnahme der GPU getrennt messen zu können, wird ja schließlich auch in der Telemetrie getrennt ausgegeben).
 
(sehr wahrscheinlich werden die beiden Shunts ja nicht beide denselben Strom, vollständigen Strom messen, ich vermute mal, dass hier zwei Schaltungen realisiert sind, um die Leistungsaufnahme der GPU getrennt messen zu können, wird ja schließlich auch in der Telemetrie getrennt ausgegeben).
Davon gehe ich auch aus. Ein weiterer Shunt ist üblicherweise unten beim PCIe-Slot. Von dort wird ja auch ein Teil der Spannungswandler versorgt. Der wird ja auch ausgelesen. Alle zusammen ergeben dann den gesamten Stromverbrauch. Anders würde keinen Sinn machen.

Ich denke, dass eigentlich nur die eine Messung komplett falsch. Es kann gut sein, dass sonst alles normal funktioniert.
 
Für mich schauen die Werte ja normal aus, bis auf die WattWerte die um vermutlich eine Zehnerpotenz zu hoch angezeigt werden. Das der Prozessortakt nicht stabil gleich hoch bleibt, ist auch etwas seltsam, kann aber mit dem Benchmark zu tun haben. Kannst ja Mal den Lasttest von GPU-z während dem Log laufen lassen. Wie hoch sollte denn im Normalfall die GPU bei einer 1070 maximal takten?
 
Was zeigen die beiden LEDs an, und tun sie das auch richtig?

Der Spannungsabfall des 2mΩ Shunts wird ja schein bar an der Stelle abgenommen. Kannst ja Mal schauen, ob du das Datensheet/Beschaltung von diesem IC irgendwo in Google finden kannst.

Mach nochmal ein hochauflösendes Foto von dem ganzen Bereich, damit man vielleicht etwas mehr von den Leiterplattenwegen erkennen kann.
 

Anhänge

  • sketch-1673614095744.jpg
    sketch-1673614095744.jpg
    121,9 KB · Aufrufe : 14
Heyhey, so, bin mal wieder am Basteln heute und habe mir ein präziseres Voltmeter besorgt. Das Problem an der Karte ist, dass sich der Takt aufgrund des festgestellten Powerlimits massiv senkt und die Karte im 3d-Betrieb erhebliche Leistungsverluste aufweist. Wenn es nur die Anzeige beträfe, wäre das völlig in Ordnung für mich, nur nutzt die Karte wohl den fehlerhaft ausgemessenen Wert und senkt entsprechend den Takt.

Was zeigen die beiden LEDs an, und tun sie das auch richtig?

Der Spannungsabfall des 2mΩ Shunts wird ja schein bar an der Stelle abgenommen. Kannst ja Mal schauen, ob du das Datensheet/Beschaltung von diesem IC irgendwo in Google finden kannst.

Mach nochmal ein hochauflösendes Foto von dem ganzen Bereich, damit man vielleicht etwas mehr von den Leiterplattenwegen erkennen kann.
Die beiden LEDs funktionieren und zeigen im Betrieb, ob der 8-PIN PCIe Stecker eingesteckt ist (linke, weiße LED) oder fehlt (rechte, rote LED).

Der verbaute Leistungswächter ist ein Dreikanal Texas Instruments INA3221.
LeistWaecht.jpg

Mit dem Multimeter habe ich die beiden Spannungen über den drei Shunts im Idle gemessen, diese Betragen:

PCIe-Slot (R005, 5 mOhm) : 8,37 mV -> p1 = 11,9 V * I = 11,9 V * 8,37 mV / 5 mOhm = 11,9 * 8,37 / 5 W ≈ 19,9 W und entspricht dem in GPUz angezeigten wert, der I²C-Kanal und dieser Eingang des Spannungswächster scheinen also zu funktionieren.

#1 Stecker (R005, 5 mOhm) : 0,66 mV -> p2 ≈1,6 W, GPUz zeigt willkürliche dreistellige Leistungen
#2 Stecker (R002, 2 mOhm : 1,59 mV -> p3 ≈ 9,5 W, GPUz zeigt dreistellige Leistungen.

Das Brücken beider Shunts mithilfe von Lötzinn
RemovePT.jpg
brachte erwartungsgemäß keine Abhilfe, das Problem sollte mMn also der Leistungswächer sein, dessen beide Eingänge hier defekt sind, aber was sagt ihr?

Meine Idee wäre nun, den defekten Leistungswächter zu tauschen (könnte noch im Rahmen des Möglichen sein den zu verlöten, ist auch kein teures Bauteil) oder aber, falls möglich, das Powertarget der Karte mithilfe eines BIOS-Mods zu entfernen.
 
Zuletzt bearbeitet :
Bevor du den ina3221 wechselst, würde ich erst nochmal die Filter zwischen Shunt und ShuntmessEingängen prüfen(wenn vorhanden). Vieleicht sind die Filter vor den Eingängen nur defekt, und somit zu viel "Wechselspannung" auf den IC Eingängen.
Screenshot_20230120-171740.pngScreenshot_20230120-173038.pngScreenshot_20230120-172715.png
 
Hab schonmal einen INA bestellt, die gibts zum Glück für sehr kleines Geld in der Bucht. Ich möchte vor dem Tausch aber noch auf den Hinweis von S.nase eingehen, der Jumper PJP3 sieht wirklich sehr verdächtig aus, als ob da etwas korrodiert ist (siehe nachfolgender Screenshot). Weiß jemand, wofür dieser dient?
1674560954581.png
 
Zuletzt bearbeitet :
habe in einem andern Forum diesen Screenshot des PCBs gefunden:

1674564751770.png
Mein Jumper scheint schon sehr verändert zu sein, scheint im Original auch geöffnet zu sein.
 
Zuletzt bearbeitet :
Oben Unten