[linux-l] temporäre Dateifehler

Jan-Benedict Glaw jbglaw at lug-owl.de
Do Aug 7 16:41:37 CEST 2003


On Thu, 2003-08-07 12:49:42 +0200, Stefan Bund <sbund at artec-berlin.com>
wrote in message <87u18tkaih.fsf at bruni.artec-berlin.com>:
> 
> Also hier mal eine neue Nuss zum knacken :-)
> 
> Ich erlebe jetzt seit geraumer Zeit auf meinem Laptop tempor?re
> Lesefehler bei Festplattenzugriffen. Jetzt nicht vorschnell einfach
> auf kaputte Festplatte schlie?en, ich denke nicht, dass das so einfach
> ist.

Da gibt's dann bestimmt doch auch Fehlermeldungen, die Du abschreiben
könntest, oder?

> Der Fehler tritt, so weit ich das bis jetzt feststellen konnte, *nur*
> w?hrend des Bootvorganges auf und, zumindest bis jetzt, nur bei
> einzelnen Dateien unter /lib. Der Fehler betrifft immer die selben
> Dateien, jedoch nicht immer genau die gleichen Dateien in einem
> einzelnen Bootvorgang: So sind z.Bsp. librt.so, libresolv.so und
> libpthread.so betroffen, aber bei einem Bootvorgang tritt der Fehler
> z.Bsp. nur in librt.so auf, nach einem Reboot vielleicht in
> libresolv.so. Ich hoffe, das ist soweit verst?ndlich.

Fehlermeldungen? Was für eine Platte ist das genau? Was für ein
IDE-Controller? Welchen IDE-Treiber benutzt Du? Welche Kernel-Version?
Was für ein Dateisystem?

> Der Fehler ?u?ert sich *nicht* in einem Festplattenzugriffsfehler
> sondern darin, dass fehlerhafte Daten gelesen werden. Die
> Fehlermeldungen reichen von 'invalid ELF header' ?ber 'error loading
> shared library: invalid arguments' bis hin zu SIGSEGV oder SIGILL.

Schonmal versucht, die Libs aus eine bekannt-guten Quelle neu zu
installieren (-> Vorsicht, da das bei der libc u.U. etwas komplizerter
ist, als bei anderen libs :-)

> Dieses Verhalten l?sst f?r mich auf folgendes schlie?en: Beim ersten
> Zugriff auf die betroffene Datei werden fehlerhafte Daten in den
> buffer-cache gelesen. Dieser Lesefehler wird *nicht* bemerkt. Von da
> an, werden s?mtliche Zugriffe vom buffer-cache befriedigt. Daher tritt
> der Fehler dann konsistent bei dieser Datei immer wieder auf.

Möglicherweise. RAM-Größe?

> Was ich nicht verstehe ist, wie es sein kann, das *manchmal*
> fehlerhafte Daten gelesen werdem, *ohne* das dies von der Festplatte
> bemerkt wird: Soweit ich wei?, werden die Festplattensektoren ja mit
> einer Pr?fsumme versehen. Ist ein Sektor defekt, wird dies anhand der

Das ist von den Platten abhängig, bzw., wie sie das handhaben. Denkbar
ist auch, daß DMA-Datenübertragung bei Dir kaputt ist, die Platte also
richtige Daten sendet, diese aber als Bröseln ankommen.

Auch sind RAM-Fehler denkbar, mal ein kaputter IDE-Treiber, ...

> Pr?fsumme vom Festplattentreiber (bzw. auf der Hardwareebene)
> bemerkt. Das sich *manchmal* *zuf?llig* sowohl die Daten als auch die
> Pr?fsumme genau so ?ndern, das die Pr?fsumme wieder stimmt halte ich
> f?r exorbitant unwarscheinlich ...

Das könnten durchaus auch Kernel-Fehler sein, aber Du verrätst ja Deine
ganzen Versionen und Hardware-Umstände nicht.

> Ich habe keine Ahnung, was ich mit diesem Fehler machen soll... heute
> morgen war es so krass, das ich meinen Laptop wohl 20 mal booten
> und dann hatte ich pl?tzlich einen Fehler beim fsck ... und zwar genau
> diese Dateien betreffend. Die exakte Fehlermeldung war zu lang, als
> das ich es jetzt noch wei?, aber irgend was mit kaputten
> inode-Zuordnungen.

Geraten: Dateiinhalt noch da, aber kein Name mehr dafür. Wird sich dann
in lost+found wiederfinden, wenn Du nicht neu bootest (wo die meist
leergeräumt werden).

> Was habe ich bis jetzt gemacht:
>   o Ich habe meinen Speicher mit memtest86 ?berpr?ft.
>   o Ich habe die Platte mehrmals mit dd nach /dev/null geschrieben,
>     aber es gibt ja keine Zugriffsfehler sondern kaputte Daten ...

..."mit dd nach /dev/null geschrieben"? Na, was denn nun? Platte gelesen
oder Platte geschrieben?

> Ich habe mir schon den Kopf zerbrochen, woran dieser Fehler liegen
> kann, und bin nicht wirklich weiter gekommen: Defekter
> Festplattencontroller? Aber warum dann nur genau diese Dateien
> bzw. Festplattenbereiche? Defekte Platte, aber warum dann keine
> Fehlermeldung vom Festplattentreiber?

Verrat' erstmal, was Du an relevanten Versionen (bei Software) bzw. an
Hardware in Deinem Laptop hast... Ich hab' meine Kristallkugel nämlich
gerade gestern zum Polieren weggegeben:-(

MfG, JBG

-- 
   Jan-Benedict Glaw       jbglaw at lug-owl.de    . +49-172-7608481
   "Eine Freie Meinung in  einem Freien Kopf    | Gegen Zensur | Gegen Krieg
    fuer einen Freien Staat voll Freier Bürger" | im Internet! |   im Irak!
      ret = do_actions((curr | FREE_SPEECH) & ~(IRAQ_WAR_2 | DRM | TCPA));
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : nicht verfügbar
Dateityp    : application/pgp-signature
Dateigröße  : 189 bytes
Beschreibung: nicht verfügbar
URL         : <https://mlists.in-berlin.de/pipermail/linux-l-mlists.in-berlin.de/attachments/20030807/3bf55755/attachment.sig>


Mehr Informationen über die Mailingliste linux-l