Frage WS X570 ACE ohne WHEA Meldung bei ECC Fehler. Was mache ich falsch?

Genie_???

Veteran
Mitglied seit
Jan 13, 2019
Beiträge
219
Bewertungspunkte
69
Punkte
30
Hallo zusammen.
Ich wollte nun einmal die ECC Funktion überprüfen.
Dabei ist mir aufgefallen, das ich überhaupt keine WHEA Meldungen bekomme.
Ich habe zu diesem Zweck zuerst die Timings herunter gesetzt und anschließend den Takt stufenweise erhöht.
Leider habe ich überhaupt keine WHEA Meldungen bekommen.
Das Spiel ging solang, bis ich bei 3200 nach 20 Min Prime und >50° Speichertemperatur "endlich" einen UECC Bluescreen bekommen habe. Ohne vorherige WHEA Meldung.
Jetzt stellt sich natürlich die Frage, was mache ich falsch?
Ich gehe im Moment von irgendwelchen Bios Einstellungen aus, könnte allerdings auch an meinem Board liegen, da es ein wenig herumzickt und ich deswegen schon einen Garantietausch angeleiert habe. (Es lässt sich z.B. nach einiger Betriebszeit nicht mehr kalt starten und braucht dann eine RTC Löschung.

Vielleicht könnte mir jmd mal die Grundvoraussetzungen für eine sichere WHEA Meldung sagen?

Ich besitze das Asus Pro WS X570, Speicher ist Kingston KSN26ED8/16ME, CPU 3700x
Ich hab mal noch einen Printscreen von Aida dran gehangen
Aida Speicher__1.png
 
Das weiß ich nicht. Ich wollte den Speicher jedenfalls überlasten und zu Fehlern provozieren.
Bei hardwarecanucks.com haben sie es so gemacht.

Edit: Ich habe mal die Textstelle mit google übersetzt und kopier sie mal hier rein.
Vor diesem Hintergrund haben wir uns entschlossen, absichtlich einige Speicherfehler zu verursachen, um festzustellen, ob die allgemeinen Fehlererkennungs- und Korrekturfunktionen dieser Plattform tatsächlich wie beabsichtigt funktionieren. Da wir keinen eigenen Teilchenbeschleuniger haben, mit dem wir die Speichermodule bombardieren können, um strahlungsbasierte Fehler zu verursachen, haben wir uns für eine einfachere Lösung entschieden: Übertakten. Anstatt die Speicherfrequenz zu erhöhen, haben wir uns entschlossen, durch Verschärfen der Timings Instabilität zu verursachen. Zu unserer großen Überraschung erwiesen sich die ECC-Module Crucial DDR4-2400 als bemerkenswert. Um Instabilität zu verursachen, mussten wir die Zeiten von 17-17-17-17-39 bis 14-14-12-11-21 festziehen. Wir haben uns vorerst an Ubuntu gehalten und das Dienstprogramm 'Stress' (sudo apt-get install stress) ausgeführt, um den Speicher mit 50 Prozessen zu belasten, die jeweils 256 MB erfordern, was einer Gesamtsumme von 12 entspricht.

Oder sollte ich schlicht nur ultrascharfe Timings verwenden? Ich bin doch schon von 19 auf 14 runter.
Meine Speicheriegel sind mir da schon ein wenig unheimlich. ;)
 
Zuletzt bearbeitet :
Ich habe mich wg den Timings an den Speicherkalkulator for Ryzen von 1usmus gehalten. Leider spuckt der in der aktuellen Version keine Extremwerte aus, da er überarbeitet wird.
Wenn mir jmd. mal Extremwerte sagt, lass ich den Speicher auch damit mal laufen. ;)
 
So. wegen dieser unnormalen Frequenzen bin ich schon mal schlauer geworden.
Micron/Kingston geben meine Riegel jetzt ganz aktuell und hochoffiziell bis 3200 MHz frei. Wow!
Dann wäre das schon mal geklärt.
Wenn ich nächste Woche irgendwann den Garantietausch meines Boards zurück erhalte, werde ich mich mal um den Rest kümmern.
Aber vielleicht hat ja noch jmd. eine kluge oder auch "dumme" Idee, warum ich keine WHEA Meldung bekommen habe?
 
Wow, das dürfte wohl die höchste Frequenz sein, die bei ECC-Ram gegenwärtig offiziell unterstützt wird.
 
Jau. Hab ganz überrascht auch zufällig heute festgestellt, das es 3200 ECC RAM gibt. Sogar RDIMMs. Krass. Und cool. :)
 
Wow, das dürfte wohl die höchste Frequenz sein, die bei ECC-Ram gegenwärtig offiziell unterstützt wird.
Jepp.
Ich musste auch erst zwei mal lesen und habs mir zur Sicherheit noch einmal mit deepl.com übersetzt, bevor ichs endgültig geglaubt habe.
2933 hätte mir eigentlich auch gereicht. Aber ich nehm es gerne mit. :D
 
@Besterino
So wie ich das hier auffasse, hast Du doch einen ganz guten Plan von der Materie.
Könntest Du mir die Frage beantworten, ob es für eine WHEA Fehlermeldung zu korrigierten Speicherfehlern unter Windows, bestimmter Voraussetzungen bedarf? Oder muss das grundsätzlich selbstständig funktionieren?
Wenn ich also wie ganz oben beschrieben den RAM (über)strapaziere, müssen die Meldungen von selbst kommen, oder bedarf es noch besonderer Einstellungen im Bios oder OS?
Ein UECC mit Stop war ja da. Dazu hatte ich auch einen Schalter im Bios gefunden. Es hätte dann aber doch vorher in der Ereignisanzeige auch schon Einträge geben müssen. Da war bei mir aber nichts.
Ich hatte mir dazu eine benutzerdefinierte Ansicht erstellt, um nicht groß suchen zu müssen.
Wäre echt nett, wenn Du mich da etwas erhellen könntest. ;)
 
Sorry, damit kenne ich mich leider nicht aus. :( Da wo’s bei mir drauf ankommt lüppt alles unter ESXi und allenfalls Windows-VMs
(die davon nichts mitkriegen).
 
Oben Unten