PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Fehlermeldung seit Kernel 2.6



floschuh
22.12.03, 16:23
Hallo Leute,

ich hab seit dem 2.6er Kernel gelegentlich eine Fehlermeldung, die sich mit Kwrite öffnet.

=============================
Message from syslogd@flo at Mon Dec 22 15:37:58 2003 ...
flo kernel: MCE: The hardware reports a non fatal, correctable incident occurr
M
Message from syslogd@flo at Mon Dec 22 17:18:13 2003 ...
flo kernel: MCE: The hardware reports a non fatal, correctable incident occurred on CPU 0.

Message from syslogd@flo at Mon Dec 22 17:18:13 2003 ...
flo kernel: Bank 0: e600000000000135

Message from syslogd@flo at Mon Dec 22 17:18:28 2003 ...
flo kernel: MCE: The hardware reports a non fatal, correctable incident occurred on CPU 0.

Message from syslogd@flo at Mon Dec 22 17:18:28 2003 ...
flo kernel: Bank 0: e656000000000135

Message from syslogd@flo at Mon Dec 22 17:18:57 2003 ...
flo kernel: MCE: The hardware reports a non fatal, correctable incident occurred on CPU 0.

Message from syslogd@flo at Mon Dec 22 17:18:58 2003 ...
flo kernel: Bank 0: e666800000000135
essage from syslogd@flo at Mon Dec 22 17:02:43 2003 ...
flo kernel: MCE: The hardware reports a non fatal, correctable incident occurred on CPU 0.

Message from syslogd@flo at Mon Dec 22 17:02:43 2003 ...
flo kernel: Bank 0: a679800000000135
ed on CPU 0.

Message from syslogd@flo at Mon Dec 22 15:37:58 2003 ...
flo kernel: Bank 0: e657000000000135

Message from syslogd@flo at Mon Dec 22 15:44:28 2003 ...
flo kernel: MCE: The hardware reports a non fatal, correctable incident occurred on CPU 0.

Message from syslogd@flo at Mon Dec 22 15:44:28 2003 ...
flo kernel: Bank 0: a600000000000175
Message from syslogd@flo at Mon Dec 22 17:00:43 2003 ...
flo kernel: MCE: The hardware reports a non fatal, correctable incident occurred on CPU 0.

Message from syslogd@flo at Mon Dec 22 17:00:43 2003 ...
flo kernel: Bank 0: e62a800000000135
============================================

Was soll denn das sein??
Hab im Hintergrund KSetiwatch laufen!!! Verträgt der CPU mit dem neuen Kernel keine Volllast mehr, oder hab ich beim Kernel was vergessen??

Danke schonmal!!

Greets
Flo

Spoonful
22.12.03, 17:03
hi,

wie hast du denn deinen neuen kernel configuriert? ich meine da gäbe es eine option, die dir nicht schwerwiegende fehler ausgibt. musst du mal genau gucken, wie die option heisst, ich hab sie deaktiviert, als ich bei make oldconfig danach gefragt wurde. vielleicht hast du ausversehen yes gesagt. soweit ich weiss macht die option aber nichts anderes als unwichtige fehler zu berichten, also kein grund zur panik.

Frohes Fest

floschuh
22.12.03, 17:50
Wenn du mir auch noch sagen kannst, wie diese Option heisst wär mir damit seehr geholfen!!

Flo

PS. Ich hab des ganze mit xconfig gmacht, drum war die nie so ne Frage!!

keeney
02.01.04, 16:45
bei mir taucht gerade ein aehnlicher log auf

MCE: The hardware reports a non fatal, correctable incident occurred on CPU 0.
Bank 2: 940040000000017a

gibts schon fortschritte?

toku
02.01.04, 17:36
Hi,

damit die Fehler nicht mehr angezeigt werden kannst du in der Kernelconfig unter "processor type and features" -> "Check for non-fatal errors on AMD Athlon/Duron / Intel Pentium" ausschalten.

Es gibt ein Tool um den Fehler Code zu decodieren. Zu finden ist es hier
ftp://ftp.kernel.org/pub/linux/kernel/people/davej/tools/parsemce.c

Einfach mit gcc parsmce.c -o parsemce kompilieren danach kann man es mit
./parsemce -e <fehlercode> -b <banknr.>
ausführen. Das sollte dann eine etwas aussagekräftigere Fehlermeldung ausgeben.

keeney
05.01.04, 21:35
vielen dank!

dabei kommt raus:

keeney@noisy keeney $ ./parsemce
usage: parsemce [options]
options: -V <version number>
-e <MCE status code>
-b <bank number>
-s <bank status code>
-a <bank address>
-f <filename, with MCE dump inside>
-i <get MCE dump from stdin>
keeney@noisy keeney $ ./parsemce -e 0 -b 2 -s 940040000000017a -a 0
Status: (0) Restart IP invalid.
parsebank(2): 940040000000017a @ 0
External tag parity error
Correctable ECC error
Address in addr register valid
Error enabled in control register
Memory heirarchy error
Request: Generic error
Transaction type : Generic
Memory/IO : I/O

und wer soll daraus jetzt schlau werden? :(