[linux-l] Informationen zu Kernel-Failure

olafBuddenhagen at gmx.net olafBuddenhagen at gmx.net
Mi Mär 2 11:50:07 CET 2011


Hallo,

On Sat, Feb 26, 2011 at 10:52:02AM +0100, Pascal Hasko Bernhard wrote:

> ich durfte heute morgen auf meinem Debian Sid (Kernel 2.6.32-5) mal
> wieder ein Kernel-Failure erleben.
[...]
> Da erfahrungsgemäß nach einem solchen Vorfall, nichts mehr wirklich
> rund läuft, das heißt viele Programme stürzen plötzlich ab,
> installiere ich das System danach dann immer komplett neu.

Wenn verschiedene Programme öfters Mal abstürzen, dann deutet das -- wie
Michael schon geschrieben hat -- meist auf einen Speicherfehler hin;
oder eventuell einen anderen Hardware-Fehler. Die Kernel-Panics sind
dann technisch gesehen genau das gleiche Phänomen -- nur dass in dem
Fall das abstürzende Programm halt der Kernel ist.

Neuinstallieren hilft da gar nix.

> Wo könnte ich denn noch nachschauen?

Nirgends. Die von Dir bereits gepostete Panic-Meldung ist das Einzige
was man bei einem Kernel-Panic bekommt.

> Allzu viel sagt  mir der Output vom Syslog jetzt nicht.

Nun, interessant ist hier vor allem, ob Du immer den gleichen Backtrace
bekommst. Wenn nein, dann deutet das wieder auf Speicherfehler hin. Wenn
ja, dann ist es vermutlich ein Bug im Kernel.

(Wenn nur ein Mal alle paar Jahre ein Panic kommt, dann ist es
wahrscheinlich weder fehlerhafte Software, noch defekte Hardware,
sondern schlicht kosmische Strahlung... Es ist erstaunlich, wie häufig
einzelne Bits im Speicher umkippen. Von wegen Computer machen keine
Fehler :-) )

> Feb 26 10:31:20 honeymman-debian kernel: [129028.246557] Call Trace:
> Feb 26 10:31:20 honeymman-debian kernel: [129028.246565]  [<c10303fd>] ? 
> warn_slowpath_common+0x5e/0x8a
> Feb 26 10:31:20 honeymman-debian kernel: [129028.246570]  [<c1030433>] ? 
> warn_slowpath_null+0xa/0xc
> Feb 26 10:31:20 honeymman-debian kernel: [129028.246576]  [<c108bd43>] ? 
> __alloc_pages_nodemask+0x149/0x4d9
> Feb 26 10:31:20 honeymman-debian kernel: [129028.246581]  [<c108c0df>] ? 
> __get_free_pages+0xc/0x17
> Feb 26 10:31:20 honeymman-debian kernel: [129028.246586]  [<c10ae8d1>] ? 
> __kmalloc+0x30/0x128
> Feb 26 10:31:20 honeymman-debian kernel: [129028.246592]  [<c108df96>] ? 
> put_page+0x28/0x81
> Feb 26 10:31:20 honeymman-debian kernel: [129028.246597]  [<c10c6ae2>] ? 
> seq_read+0x200/0x360
> Feb 26 10:31:20 honeymman-debian kernel: [129028.246602]  [<c10c68e2>] ? 
> seq_read+0x0/0x360
> Feb 26 10:31:20 honeymman-debian kernel: [129028.246609]  [<c10e5baf>] ? 
> proc_reg_read+0x58/0x6b
> Feb 26 10:31:20 honeymman-debian kernel: [129028.246613]  [<c10e5b57>] ? 
> proc_reg_read+0x0/0x6b
> Feb 26 10:31:20 honeymman-debian kernel: [129028.246618]  [<c10b37d0>] ? 
> vfs_read+0x7b/0xd3
> Feb 26 10:31:20 honeymman-debian kernel: [129028.246623]  [<c10b38c0>] ? 
> sys_read+0x3c/0x63
> Feb 26 10:31:20 honeymman-debian kernel: [129028.246628]  [<c10030fb>] ? 
> sysenter_do_call+0x12/0x28

So weit ich das richtig lese, sagt uns dieser Trace, dass ein Problem
bei dem Versuch aufgetreten ist, zusätzlichen Speicher zu allozieren,
während einer Leseoperation vom /proc-Dateisystem. Und was folgern wir
daraus? Nichts.

In manchen Fällen können nützliche Hinweise enthalten sein: Wenn zum
Beispiel Panics öfters im Treiber für eine bestimmte Hardware-Komponente
auftauchen, dann ist es wahrscheinlich, dass dieser Treiber fehlerhaft
ist. Aber generell gesehen können nur die Linux-Entwickler mit den Daten
was anfangen.

-antrik-



Mehr Informationen über die Mailingliste linux-l