[lug-ld] RAM-Probleme bei Dell Poweredge 2900

Pahle Heinz heinz.pahle at gmx.de
Sa Aug 8 22:53:29 CEST 2015


Lieber Christian,

es gab mal eine North und eine South Bridge (bezüglich Chipsatz) - und so 
ist auch Deine Frage zu beantworten - wie ich denke. Beim Chipsatz hatte der 
gezeichnete "Kasten" oben (im Norden) eine bestimmte Aufgabe, der unten (im 
Süden) eine andere. Bei Deinem RAM-Riegel ist bei einer bestimmten Art den 
zu zeichnen auch möglich von Norden und Süden zu sprechen. Links und rechts 
vom, bzw. oben und unten vom Bufferbaustein (ABM) ist jeweils die Hälfte der 
Speicherchips zu finden. Mit der Suchanfrage
"Fully-Buffered DIMM Memory Architectures: Understanding Mechanisms, 
Overheads and Scaling"
kriegst Du eine Pdf, die meine Vermutungen hochwahrscheinlich bestätigt. Zum 
Kringeln ist, dass darin Norden und Süden über Links und rechts erklärt 
wird.
Zusammenfassung: Ich denke, dass, wenn ein RAM-Riegel kaputt ist (Bit "hängt 
fest" - CRC merkt das), Dir es gleich sein kann, wo sich genau der Fehler 
auf dem Riegel befindet.

Vielleicht hilft Dir meine Überlegung/Nachforschung
Gruß
Heinz (Pahle Offenbach)


----- Original Message ----- 
From: "Christian Boltz" <lug-ld at cboltz.de>
To: <lug-ld at lists.lug-ld.de>
Sent: Saturday, August 08, 2015 7:46 PM
Subject: [lug-ld] RAM-Probleme bei Dell Poweredge 2900


Hallo zusammen,

kann mir jemand eine Fehlermeldung bei einem Dell Poweredge 2900 in
verständliches deutsch übersetzen? ;-)

Ich hatte vor ein paar Tagen schonmal eine Fehlermeldung zum RAM auf dem
eingebauten Display (und "nebenbei" hat er das System angehalten - ist
schlauer als mit RAM-Fehlern weiterzumachen).

Heute hatte ich etwas Zeit und hab mal memtest86 laufen lassen. Das sah
erstmal ganz gut aus, hing aber nach ein paar Stunden, und das Server-
Display meldete
    E2119 Fatal SB Mem CRC

Laut Handbuch heißt das:
    Eine der Verbindungen im FBD-Spechersubsystem (Fully Buffered DIMM)
    auf der Southbound-Seite ist ausgefallen.

Kann mir das jemand in ein weniger technisches deutsch übersetzen? ;-)
Sprich: Ist eins der RAM-Module (der Server hat 8 x 2 GB) kaputt? Oder
irgendwas anderes? Und was/wo ist die "Southbound-Seite"? (Es gibt auch
eine Northbound-Seite, die hat dann E2118 statt E2119.)

Derzeit (nach dem stundenlangen memtest-Durchlauf) schafft er es
übrigens nichtmal durch den BIOS-Selbsttest - ich wäre also nicht
überrascht, wenn die Temperatur auch eine Rolle spielt. (Die Lüfter
laufen alle, aber der Server steht in einem recht kleinen Raum und dient
dort durchaus als Heizung ;-)

Ich werde wohl morgen mal mit jeweils der Hälfte des RAMs testen - da
memtest86 aber erst nach Stunden den Fehler getriggert hat, bin ich für
Vorschläge, wie man das Problem schneller eingrenzt, dankbar ;-)


Gruß

Christian Boltz
-- 
Will ich mich demnaechst mal ranmachen,
allerdings momentan zuviel extrem unwichtige Sachen zu tun.
[Marcel Schmedes in suse-linux]   ^^

_______________________________________________
lug-ld mailing list
lug-ld at lists.lug-ld.de
http://lists.lug-ld.de/mailman/listinfo/lug-ld