Da auch ich mich über die hohen Speichertemperaturen auf vielen (aber nicht allen) bisher getesteten RDNA4-Karten gewundert habe und diverse Nachfragen von Lesern im Postfach lagen, war dies der Auslöser dafür, mich doch noch einmal eingehender mit dem Problem zu beschäftigen. Der Grund war so trivial wie verwunderlich, aber es ist auch ein guter Grund, sich einmal etwas näher mit den Grundlagen und den in der Firmware hinterlegten Daten zu beschäftigen. Es wird also für die meisten sicher auch eine interessante Lektüre, denn Vieles dürfte so noch gar nicht allgemein bekannt sein. Und es soll auch ein wenig beruhigen, denn Panik muss wirklich niemand schieben.
Womit fangen wir am besten an? Die thermische Verwaltung von modernen Grafikkarten ist ein zentraler Aspekt der Systemstabilität, Leistungsentfaltung und Langlebigkeit. AMDs RDNA4-Architektur bringt im Vergleich zu den Vorgängergenerationen einige Optimierungen im Bereich des thermischen Monitorings und der internen Temperaturlimits mit sich. Dieser heutige Artikel betrachtet insbesondere die sogenannten Tjunction-Temperaturen – also die maximal zulässigen Hotspot-Werte und das, was AMD für die Lüftersteuerung als Vorgabe vorsieht. Und wer die ganzen Reviews der Kollegen durchgelesen hat, der wird auch bemerkt haben, dass Karten von XFX eher lauter und die von Sapphire eher leiser waren. Genau deshalb basiert dieser Artikel auf zwei exemplarischen Modellen der Partnerhersteller XFX und Sapphire, die in Bezug auf Speichertemperaturen und Lüftergeräusch sehr unterschiedlich waren. Mein Dank geht hier explizit auch an Hellm, der mal wieder tiefer in die Firmware angetaucht ist. Also: auf geht’s!
Übersicht der Temperaturgrenzwerte aus dem BIOS und Interpretation
Die BIOS-Einträge der Karten „XFX Mercury RX 9070XT“ und „Sapphire RX 9070XT Nitro+“ zeigen identische Konfigurationen hinsichtlich der Temperaturgrenzwerte. Diese Werte legen fest, bei welchen thermischen Bedingungen verschiedene Komponenten einer GPU ihre Betriebsparameter anpassen, Leistung reduzieren oder notfalls abgeschaltet werden, um Schäden zu verhindern. Soweit, so restriktiv und notwendig. Die Werte sind wie folgt codiert:
uint16_t TemperatureLimit[12]; // In Grad Celsius
6E 00 = 110°C TEMP_EDGE
6E 00 = 110°C TEMP_HOTSPOT
6C 00 = 108°C TEMP_MEM
69 00 = 105°C TEMP_VR_GFX
69 00 = 105°C TEMP_VR_SOC
69 00 = 105°C TEMP_VR_MEM0
69 00 = 105°C TEMP_VR_MEM1
Zusätzlich finden sich dedizierte Temperaturgrenzen für bestimmte Speichertypen:
6C 00 = 108°C TemperatureLimit_Hynix
69 00 = 105°C TemperatureLimit_Micron
73 00 = 115°C TemperatureFwCtfLimit_Hynix
71 00 = 113°C TemperatureFwCtfLimit_Micron
Die beiden wichtigsten Werte für die GPU-spezifische Temperaturüberwachung sind „TEMP_EDGE“ und „TEMP_HOTSPOT“. Während TEMP_EDGE die klassische Gehäusetemperatur (Case Temperature) beschreibt – also den Sensorwert nahe der GPU-Oberfläche – erfasst der HOTSPOT die höchste lokal auftretende Temperatur auf dem Die (Tjunction). Dieser Wert ist entscheidend für die thermische Schutzlogik. Die maximal zulässige Hotspot-Temperatur beträgt hier 110 °C, was dem typischen Grenzwert moderner AMD-GPUs entspricht. Diese Obergrenze ist nicht als empfohlene Dauertemperatur zu interpretieren, sondern markiert den Punkt, ab dem das Power- und Taktratenmanagement in aggressivere Schutzmechanismen übergeht.
Die Temperaturen für den Speicherbereich (TEMP_MEM) sind mit 108 °C ebenfalls hoch angesetzt, was in diesem Fall auch auf die Verwendung von Hynix-Modulen hinweist. Ich kann an dieser Stelle auch verraten, dass dieser Wert von HwInfo64 genutzt wird, um das prozentuale Verhältnis zum Temperatur-Grenzwert anzuzeigen. Teilt man den für die Grenzschicht des Speichers angezeigte Temperaturwert durch den angezeigten Grenzwert und multipliziert man das mit 100 Prozent, dann weiß man (gerundet) auch, ob man bei 105 °C Module von Micron oder bei 108 °C welche von SK Hynix auf der Karte hat. Die differenzierten Limits für die Spannungswandlerbereiche (VR_GFX, VR_SOC, VR_MEMx) liegen mit 105 °C gleich bzw. geringfügig niedriger, was der thermischen Empfindlichkeit dieser Komponenten Rechnung trägt.
FwCtfLimit: Einordnung und Bedeutung
Besonders hervorzuheben sind die Einträge „TemperatureFwCtfLimit_Hynix“ und „TemperatureFwCtfLimit_Micron“ mit 115 °C bzw. 113 °C. Diese Parameter sind zwar nicht näher dokumentiert, allerdings lassen sich durchaus plausible Rückschlüsse ziehen. Es handelt sich mit hoher Wahrscheinlichkeit um firmwareinterne thermische Schwellenwerte („Firmware Critical Temperature Fail Limit“), bei deren Überschreitung eine besonders drastische Maßnahme ausgelöst wird, etwa ein harter Leistungseinbruch oder eine sofortige Taktabsenkung. Der höhere Wert im Vergleich zum allgemeinen „TemperatureLimit“ (z. B. 108 °C für Hynix) deutet darauf hin, dass dies ein kritischer Sicherheitswert ist, der über der regulären thermischen Betriebsgrenze liegt. Solche Grenzwerte sind nicht als Zieltemperatur zu verstehen, sondern als „Notaus“-Punkte im thermischen Managementpfad. Sie dienen dem Schutz vor unkontrollierten thermischen Eskalationen, etwa bei Lüfterausfall oder bei extremer Umgebungstemperatur in geschlossenen Gehäusen.
Die Tjunction-Temperaturen in RDNA4-basierten AMD-Grafikkarten spiegeln eine ausgeklügelte thermische Kontrollarchitektur wider, die nicht nur die GPU selbst, sondern auch Speicher und Spannungswandler mit differenzierten Grenzwerten überwacht. Die in den BIOS-Daten gefundenen Schwellen ermöglichen also durchaus auch einen tieferen Einblick in die Sicherheitsarchitektur der Karten. Insbesondere die höheren FwCtf-Limits markieren eine Art „absolute Obergrenze“, die nicht überschritten werden darf, ohne dass unmittelbare Schutzmechanismen greifen. Diese Herangehensweise zeigt, dass AMD bei RDNA4 nicht nur die Energieeffizienz und Rechenleistung, sondern auch die thermische Robustheit im Detail adressiert hat.
87 Antworten
Kommentar
Lade neue Kommentare
Veteran
Moderator
Urgestein
Mitglied
Veteran
Veteran
1
Urgestein
1
Urgestein
Mitglied
Urgestein
Veteran
Veteran
Urgestein
Mitglied
Urgestein
Mitglied
Veteran
Alle Kommentare lesen unter igor´sLAB Community →