Allgemein Grafikkarten Praxis Professional Testberichte VGA Workstation

AMD Radeon Pro W7600 mit Blackout ab Werk – Eine Modifizierung schafft Abhilfe und wirft Fragen auf

Eigentlich sah alles so gut aus, als ich unlängst mit dem großen Roundup der Workstation-Grafikkarten begonnen und auch den ersten Teil mit allen vier neuen Radeon Pro Grafikkarten bereits veröffentlicht habe. Schlecht schnitten die Karten nicht ab, im Gegenteil. Aber ich habe mir damals schon beim Benchmarken Dinge notiert, die ich unbedingt noch einmal nachtesten wollte. Vor allem bei einem längeren Rendervorgang mit HIP, aber auch einem 3D-Loop zur Ermittlung der Leistungsaufnahme, hatte ich mit dieser Karte bereit vereinzelt Blackscreens, schob es aber zunächst auf ein möglicherweise defektes DP-Kabel (das sich dann auch wirklich als Wackel-Kandidat herausstellte).

Aber irgendetwas war trotzdem anders. Denn die normalen Aussetzer und Blackscreens werden normalerweise entweder von einem Aufheulen der Lüfter oder gleich mit einem Reboot begleitet. Oder aber es freezt alles. Hier aber lief der Rechner normal weiter, nur eben ohne Bild an der Grafikkarte. Ein Test mit einem zweiten Bildschirm an der iGP zeigte mir, dass das System noch regiert. Es ließ sich auch alles normal herunterfahren und danach gleich wieder neu starten. Damit verschiebt sich das Follow-Up mit den vier Einzelkarten natürlich erneut, denn ich habe mich erst einmal um die Radeon Pro W7600 kümmern müssen. Denn eines steht auch fest: Bei Workstation-Grafikkarten steht die Zuverlässigkeit im Mittelpunkt und genau diese war hier nicht gegeben. Stichwort Reliability.

Die besten Workstation-Grafikkarten von AMD und NVIDIA 2023 – Wie schlägt sich die Radeon Pro W7000 Reihe gegen Ada und Ampere in Benchmarks?

Protokoll des Blackouts

Ich habe, mit dem nötigen Gottvertrauen, den Blackout mit verschiedenen Applikationen reproduzieren können. Egal ob Lightwave, Horizon Zero Dawn oder Furmark, irgendwann  wurde es dunkel. Mit Furmark hielt die Karte übrigens keine 6 Minuten durch, so dass ich mich fürs Protokoll für die ganz harte, aber dafür kürzere Tour entschieden habe. Das Ganze habe ich mit einer internen Beta von HWInfo64 getestet (Danke an Martin Malik für das Mitmachen!) und beispielsweise gelernt, Dass die SMU vier verschiedene Temperaturen pro Speichermodul ausgibt (bei den 2 GB Modulen), obwohl diese eigentlich offiziell gar keine Register dafür besitzen. Aber AMD liefert da was, das nur mal als Info nebenbei.

Der Durchschnitt der Speichertemperaturen lag zum Zeitpunkt des Abbruchs bei 94 bis 95 °C. Das liegt zwar bereits an der Obergrenze des spezifizierten Temperaturfensters, ist aber nicht so kritisch, dass es zum Blackout führen könnte. Wir sehen auch die anderen Temperaturen, die sehr hoch, aber noch nicht lebensbedrohlich sind. Und nun? Irgendetwas musste ja faul sein.

Ich habe mir danach die Lüfterkurve angeschaut, denn die Lüfter kleben normalerweise an Tjunction, also dem Hotspot der GPU. Allerdings war das Ganze schon reichlich komisch. Also habe ich fürs bessere Verständnis einmal radiometrische Videos der Rückseite während des Erwärmungsvorganges gemacht und das mit den Charts verbunden. Beachtenswert ist auch das Delta von rund 5 Kelvin zwischen der PCB-Messfläche und der GPU-Temperatur, denn das ist normalerweise maximal 1 Kelvin groß, nicht mehr.

Zunächst noch einmal das Video mit den Temperaturen bis zum Blackout:

Und jetzt das Ganze noch einmal als Vergleich zwischen GPU-Temperatur und der Lüftergeschwindigkeit. Diese Kurve muss man allerdings nicht verstehen:

Also bleibt mir nichts anderes übrig, als die Karte zu zerlegen. Auf geht’s!

Kommentar

Lade neue Kommentare

Brxn

Veteran

257 Kommentare 71 Likes

Wirklich erschreckend für ne Profi Workstation Karte. Kann ja nicht sein, dass da immer erst n Igor kommen muss, der denen aufzeigt, was die für Dreck auf die Karte schmieren usw ...

Antwort 1 Like

O
Ole

Mitglied

30 Kommentare 9 Likes

da fällt mir direkt der Telekom business-DSL-Vertrag ein, wo man da als Arztpraxis plötzlich auch mehrere Tage ohne Internet und Telefon dasteht und sich am Ende fragt, warum man denn "pro" kauft, wenn "normal" irgendwie besser ist...

Antwort 1 Like

M
Macces

Mitglied

27 Kommentare 22 Likes

Hallo Igor,

ich bin zwar meist nur ein stiller Mitleser und nicht so reich an Foreneinträgen aber ab und zu melde ich mich auch mal zu Wort.

Gerade weil hier oft die Fehler der Hersteller aufgedeckt werden und diese auch ungeschönt veröffentlicht werden, bin ich gern Gast hier auf der Seite.
Weil die Reichweite hier groß genug ist, hat diese Fehlersuche und Beseitigung ja auch oft genug ein Resultat und führt zum Umdenken bei den Herstellern. Manche sind leider ein wenig lernresistenter als andere und man muss sie mehrmals darauf hinweisen.

Da ich auch ein wenig Geschick im aufschrauben und modifizieren von Hardware habe, nehme ich viele der Beispiele hier auch als Anleitung für mich, um die vorhandene Hardware "zu verbessern". Manchmal auch erst, wenn die vorhandene Wärmeleitpast oder die Pads zu alt werden.

Ich sehe es eher als positive Werbung für die Webseite, auch wenn dadurch einige andere Artikel ggf. später veröffentlicht werden.

Gruß

Macces

Antwort 9 Likes

e
eastcoast_pete

Urgestein

1,476 Kommentare 833 Likes

Schon bei Consumer Karten ist sowas schon sehr schräg (in jedem Sinn), aber bei Profi Karten, die ja auch noch mal eine ganze Ecke mehr kosten, ist's unverzeihlich. Da springt AMD den verbliebenen Kunden mit dem nackten Hintern ins Gesicht. Bessere Werbung für Nvidia kann man gar nicht machen. Wenn ich mir morgen eine GPU für den professionellen Einsatz kaufen müsste, wär spätestens jetzt klar, daß es was Grünes wird.

Antwort 3 Likes

ipat66

Urgestein

1,357 Kommentare 1,355 Likes

Auch wenn es sich um eine der kleinen Profi-Karten handelt, ist die Umsetzung
in wichtigen Details wieder einmal nicht preiswert sondern billig.
Schon wieder...
Es wird an guter Paste und weichen Pads gespart.
Ein sich wiederholendes NO-GO.
Wie kann es sein,das es bei diesen wichtigen Montageschritten,weiterhin keine Besserung gibt ?

Auf Antworten kann man (Igor) anscheinend auch länger warten....
Schade.

Antwort 1 Like

echolot

Urgestein

932 Kommentare 723 Likes

@Igor Wallossek Na immerhin generierst Du damit ein paar Klicks. Spaß bei seite. Die Community ist froh wenn der faule Zauber auffliegt. Bitte weiter so.

Antwort Gefällt mir

Igor Wallossek

1

10,198 Kommentare 18,815 Likes

Solche Pads kann man machen, wenn die Balance stimmt. Dass es Probleme geben kann und man sich dessen bewusst ist, zeigt die Metallplatte um den Sockel herum. Aber wenn es sogar die Boardpartner schaffen, Abstandshalter zu verbauen, weil diese 4-Module-Lösung kippelig ist, dann frage ich mich echt nach der Praxiserfahrung des Engineerings.

MSI macht das richtig:

View image at the forums

Mir ist die Chamber beim Losschrauben gleich ganz rausgefallen. Die Paste war bretthart und gerissen. Auch das kann man mit solcher Paste /Pads machen, aber dann muss auch alles plan sitzen.

Naja, ich würde lieber mal was loben, als immer nur Fehler anzumahnen. Aber das sind solche Basics... NVIDIA ist da eher zweigleisig. Bei der RTX 2080 Ti hatte man wegen das asymmetrisch befestigten Kühlers Lötperlenabrisse unterm Speichermodul. Das hatte ich ja auch als Ursache aufgedeckt. Komischerweise hatten sowohl die Titan als auch die RTX 6000 bereits den Underfill vom ersten Tag an, nur bei den Consumer-Karten hat man gespart. Dummheit in Tüten.

Aber dass man jetzt beim OEM solche Fehler wiederholt, will sich mir nicht erschließen. Schade, dass das 3D-Profilometer erst heute kommt und noch kalibriert werden muss, sonst häte ich auch mal die gebogene Platine gezeigt. Ich weiß schon, warum ich mir solche "Spielzeuge" kaufe. Sonst glaubt es ja wieder keiner. Wenn ich da mit dem Haarlineal ankomme, lachen sich die Herren Konstrukteure vor Überheblichkeit eine Schaumblase auf den Kaffee. :D

Antwort 14 Likes

Klicke zum Ausklappem
big-maec

Urgestein

831 Kommentare 478 Likes

Für mich ist das kein Rätsel, wenn du extern Karten fertigen lässt, arbeitet der Auftragsfertiger voll und ganz in Eigenverantwortung. Denke mal das wird auch alles dem Auftragsfertiger überlassen.
Es wird, zwar Vorgaben geben und so gut es geht umgesetzt, aber wie das so ist mit der Theorie und Praxis, es sind zwei unterschiedliche Welten.
Im Grunde funktioniert die Karte ja aber nur nicht so wie geplant.

Antwort Gefällt mir

Igor Wallossek

1

10,198 Kommentare 18,815 Likes

Wenn sie bei normaler Last nach ein paar Stunden einfach ausgeht oder unter harter Last nach nicht einmal 6 Minuten, hat das mit "funktionieren" nichts mehr zu tun. Nein, sie funktioniert eben nicht. Im Übrigen hatte nicht nur ich diesen Fehler, also scheint es auch kein Einzelfall zu sein. Sonst hätte ich nicht so einen Aufwand betrieben, den mir eh keiner zahlt. :(

Antwort 5 Likes

Igor Wallossek

1

10,198 Kommentare 18,815 Likes

Dass MSI jetzt stabilisiert, hat auch was mit der RTX 4070 Ventus 3X zu tun, bei der ich ein Review verweigert hatte. Die war sowas von instabil und wabbelig. Das war eine harte Diskussion mit dem R&D, aber man hat gelernt.

Antwort 4 Likes

echolot

Urgestein

932 Kommentare 723 Likes

Liegt es daran, dass die Gewinnmarge immer weiter schrumpft oder sind die alle so rücksichtslos geldgeil? Wer hat bei soviel outsourcing überhaupt noch den Überblick und wie leicht bekommt man heute ISO 9001 Zertifikate? Alles sehr grenzwertige ausgelegt.

Antwort Gefällt mir

P
Phoenixxl

Veteran

159 Kommentare 121 Likes

Was mich wundert:
Die Damen und Herren, bzw. die zuständigen Damen und Herren können doch auch rechnen.
Die paar Cent mehr für besser Pads und richtig platziert dürften doch viel günstiger sein, als regelmäßige RMAs.

Dazu kommt, dass das schlechte Presse bringt.
Dagegen wäre eine Karte zu einem vernünftigen Preis mit sehr guter (Verarbeitungs-) Qualität doch recht attraktiv.

Eine etwas krumme Analogie:
Baldurs Gate 3 zeigt sich gerade, dass die Kunden ein großartiges Produkt wollen, auf das man auch gerne länger wartet. Und Geld lässt sich damit offensichtlich auch verdienen!

Antwort Gefällt mir

Igor Wallossek

1

10,198 Kommentare 18,815 Likes

Haha, man kauft es sich. So wie die ganzen TÜV-Siegel. :D

Antwort 7 Likes

konkretor

Veteran

298 Kommentare 301 Likes

Da ist man schon mit der Software hinten dran. Jetzt liefert man noch schlechte Hardware, so wird das nichts AMD

Antwort Gefällt mir

Igor Wallossek

1

10,198 Kommentare 18,815 Likes

Die glauben auch nur, was denen das Engineering erzählt, das selbst unter Druck steht, weil der Finanzrahmen schon arg knapp gehalten wurde. Der OEM lässt die Kühler von Drittunternehmen fertigen, da gibt es dann wieder die leidige Befehlkette, die ohne straffes QM nicht zu beherrschen ist.

Antwort 3 Likes

echolot

Urgestein

932 Kommentare 723 Likes

Ich beschreibe es mal so. Die Qualität des Engineering hat in den letzten Jahren auch stark gelitten. Man bewegt sich bei der Auslegung sehr grenzwertig was den Materialeinsatz angeht. Im Projektgeschäft schon lange so. Die rechnerischen Reserven verhinderten Einiges. Dann ging man auch noch an diese Reserven und irgendwann ist nichts mehr da, woran man noch sparen könnte. Wird dann zum Schluß auf den Kunden abgewälzt. Et Voilà! Ähnliches beim QM.

Antwort 1 Like

D
Deridex

Urgestein

2,213 Kommentare 846 Likes

Aus meiner Sicht hat keiner der beiden GPU Hersteller eine weiße Weste.

Antwort Gefällt mir

M
Moeppel

Urgestein

863 Kommentare 312 Likes

Sofern wir nicht davon ausgehen, dass hier ein Montagsmodell vorliegt:

Also eine RMA Produkt, was durch ein RMA Produkt getauscht wird, was RMA'ed wird, um durch ein RMA Produkt getauscht zu werden?

Irgendwie hat man den Gelddruckzug verpasst :p

Antwort Gefällt mir

Ghoster52

Urgestein

1,412 Kommentare 1,068 Likes

QM, das ich nicht lache.... :ROFLMAO:
Wer bei uns zu blöd zum arbeiten ist (geht beim Hammer in die Hand nehmen los), darf in der QM arbeiten.
(Ich habe die letzten Jahre einige kommen und gehen gesehen, einige waren nicht in der Lage einen Messschieber richtig zu benutzen)
Das "Fachpersonal" was die Anlage nicht im Griff hat (z.B. Zeichnungen richtig lesen) geht in die Arbeitsvorbereitung.
(ist das Bindeglied zwischen Kunden und Produktion) Seit Jahren ärgert sich unsere Produktion mit "Pro Lean" rum.
Die Liste ist sehr lang und man fragt sich echt wo das noch enden soll.... :(

Antwort 3 Likes

Danke für die Spende



Du fandest, der Beitrag war interessant und möchtest uns unterstützen? Klasse!

Hier erfährst Du, wie: Hier spenden.

Hier kannst Du per PayPal spenden.

About the author

Igor Wallossek

Chefredakteur und Namensgeber von igor'sLAB als inhaltlichem Nachfolger von Tom's Hardware Deutschland, deren Lizenz im Juni 2019 zurückgegeben wurde, um den qualitativen Ansprüchen der Webinhalte und Herausforderungen der neuen Medien wie z.B. YouTube mit einem eigenen Kanal besser gerecht werden zu können.

Computer-Nerd seit 1983, Audio-Freak seit 1979 und seit über 50 Jahren so ziemlich offen für alles, was einen Stecker oder einen Akku hat.

Folge Igor auf:
YouTube   Facebook    Instagram Twitter

Werbung

Werbung