[lug-ld] RAM-Probleme bei Dell Poweredge 2900
Pahle Heinz
heinz.pahle at gmx.de
Sa Aug 8 22:53:29 CEST 2015
Lieber Christian,
es gab mal eine North und eine South Bridge (bezüglich Chipsatz) - und so
ist auch Deine Frage zu beantworten - wie ich denke. Beim Chipsatz hatte der
gezeichnete "Kasten" oben (im Norden) eine bestimmte Aufgabe, der unten (im
Süden) eine andere. Bei Deinem RAM-Riegel ist bei einer bestimmten Art den
zu zeichnen auch möglich von Norden und Süden zu sprechen. Links und rechts
vom, bzw. oben und unten vom Bufferbaustein (ABM) ist jeweils die Hälfte der
Speicherchips zu finden. Mit der Suchanfrage
"Fully-Buffered DIMM Memory Architectures: Understanding Mechanisms,
Overheads and Scaling"
kriegst Du eine Pdf, die meine Vermutungen hochwahrscheinlich bestätigt. Zum
Kringeln ist, dass darin Norden und Süden über Links und rechts erklärt
wird.
Zusammenfassung: Ich denke, dass, wenn ein RAM-Riegel kaputt ist (Bit "hängt
fest" - CRC merkt das), Dir es gleich sein kann, wo sich genau der Fehler
auf dem Riegel befindet.
Vielleicht hilft Dir meine Überlegung/Nachforschung
Gruß
Heinz (Pahle Offenbach)
----- Original Message -----
From: "Christian Boltz" <lug-ld at cboltz.de>
To: <lug-ld at lists.lug-ld.de>
Sent: Saturday, August 08, 2015 7:46 PM
Subject: [lug-ld] RAM-Probleme bei Dell Poweredge 2900
Hallo zusammen,
kann mir jemand eine Fehlermeldung bei einem Dell Poweredge 2900 in
verständliches deutsch übersetzen? ;-)
Ich hatte vor ein paar Tagen schonmal eine Fehlermeldung zum RAM auf dem
eingebauten Display (und "nebenbei" hat er das System angehalten - ist
schlauer als mit RAM-Fehlern weiterzumachen).
Heute hatte ich etwas Zeit und hab mal memtest86 laufen lassen. Das sah
erstmal ganz gut aus, hing aber nach ein paar Stunden, und das Server-
Display meldete
E2119 Fatal SB Mem CRC
Laut Handbuch heißt das:
Eine der Verbindungen im FBD-Spechersubsystem (Fully Buffered DIMM)
auf der Southbound-Seite ist ausgefallen.
Kann mir das jemand in ein weniger technisches deutsch übersetzen? ;-)
Sprich: Ist eins der RAM-Module (der Server hat 8 x 2 GB) kaputt? Oder
irgendwas anderes? Und was/wo ist die "Southbound-Seite"? (Es gibt auch
eine Northbound-Seite, die hat dann E2118 statt E2119.)
Derzeit (nach dem stundenlangen memtest-Durchlauf) schafft er es
übrigens nichtmal durch den BIOS-Selbsttest - ich wäre also nicht
überrascht, wenn die Temperatur auch eine Rolle spielt. (Die Lüfter
laufen alle, aber der Server steht in einem recht kleinen Raum und dient
dort durchaus als Heizung ;-)
Ich werde wohl morgen mal mit jeweils der Hälfte des RAMs testen - da
memtest86 aber erst nach Stunden den Fehler getriggert hat, bin ich für
Vorschläge, wie man das Problem schneller eingrenzt, dankbar ;-)
Gruß
Christian Boltz
--
Will ich mich demnaechst mal ranmachen,
allerdings momentan zuviel extrem unwichtige Sachen zu tun.
[Marcel Schmedes in suse-linux] ^^
_______________________________________________
lug-ld mailing list
lug-ld at lists.lug-ld.de
http://lists.lug-ld.de/mailman/listinfo/lug-ld