[linux-l] temporäre Dateifehler

Stefan Bund sbund at artec-berlin.com
Do Aug 7 23:17:41 CEST 2003


Jan-Benedict Glaw <jbglaw at lug-owl.de> writes:
> Da gibt's dann bestimmt doch auch Fehlermeldungen, die Du abschreiben
> könntest, oder?

s.u. 

> Fehlermeldungen? Was für eine Platte ist das genau? Was für ein
> IDE-Controller? Welchen IDE-Treiber benutzt Du? Welche Kernel-Version?
> Was für ein Dateisystem?

Du stellst aber komplizierte Fragen :-) OK, hätte ich wirklich genauer
was dazu schreiben können. Das habe ich im eifer des Gefechtes mein
Problem verständlich zu machen einfach vergessen. Also: Das ganze ist
ein Dell Inspiron 8200 Laptop. cat /proc/pci sagt mir:

  IDE Controller ist ein Intel 82801CAM IDE U100 (rev 2)

Die Festplatte hat eine Kapazität von 18G. hdparm -I ist leider nicht
so sehr Informativ:

        Model Number:           IC25N020ATCS04-0
        Serial Number:                CSH204DMHG96DB
        Firmware Revision:      CA2OA72A

Mehr weiß ich über die Platte auch nicht. Die Festplattenkonfiguration
ist (/dev/hdparm /dev/hda):

        /dev/hda:
         multcount    = 16 (on)
         I/O support  =  3 (32-bit w/sync)
         unmaskirq    =  1 (on)
         using_dma    =  1 (on)
         keepsettings =  0 (off)
         nowerr       =  0 (off)
         readonly     =  0 (off)
         readahead    =  8 (on)
         geometry     = 2432/255/63, sectors = 39070080, start = 0
         busstate     =  1 (on)

Kernel-Version ist 2.4.20 mit low-latency und usbdnet patch. Der IDE
Driver ist der standard linux treiber des obigen Kernels.

Das Dateisystem unter /, wo sich sämtliche Fehler abspielen ist ext2.

> Schonmal versucht, die Libs aus eine bekannt-guten Quelle neu zu
> installieren (-> Vorsicht, da das bei der libc u.U. etwas komplizerter
> ist, als bei anderen libs :-)

*g* ich weiß das mit der libc ... erinnere mich noch zu gut an den
libc->glibc umstieg ... vor ein paar jahren? Kein Ahnung mehr, wie
lange das her ist. Na egal.

Also ich habe es nicht mit einer externen Quelle versucht, nur mit
meinen Backups. Und eigentlich glaube ich auch nicht, das die Dateien
wirklich permament defekt sind, die Fehlermeldungen sind ja nur
sporadisch, manchmal klappt es ja. Aber ich kann nochmal das
entsprechende debian paket runterladen und nachsehen.

[download] [md5sum]

Habe gerade nochmal das Paket von security.debian.org
runtergeladen. librt, libresolv und libpthread sind identisch.

> Möglicherweise. RAM-Größe?

256MB

> Das ist von den Platten abhängig, bzw., wie sie das handhaben. Denkbar
> ist auch, daß DMA-Datenübertragung bei Dir kaputt ist, die Platte also
> richtige Daten sendet, diese aber als Bröseln ankommen.

Letzteres habe ich auch schon überlegt, nur: wie testen? Stimmt, ich
könnte mal DMA ausschalten und nachsehen, was passiert ...

Und es ist mir neu das es Platten *ohne* Fehlerkorrektur geben
soll. Wirklich? Finde ich aber *sehr* erschreckend ...

> Auch sind RAM-Fehler denkbar, mal ein kaputter IDE-Treiber, ...

Also memtest86 lief nun wirklich lange problemlos und die üblichen
unmotivierten SEGV's habe ich (abgesehen vom Bootvorgang) auch
nicht. Daher bin ich ziemlich sicher, das mein RAM in Ordnung
ist. IDE-Treiber: kann schon sein, aber es ist der standard Linux
treiber und eine Zeitlang lief alles Problemlos ...

> Das könnten durchaus auch Kernel-Fehler sein, aber Du verrätst ja Deine
> ganzen Versionen und Hardware-Umstände nicht.

Ich hoffe, ich habe jetzt wirklich alle relevanten Daten angegeben.

> Geraten: Dateiinhalt noch da, aber kein Name mehr dafür. Wird sich dann
> in lost+found wiederfinden, wenn Du nicht neu bootest (wo die meist
> leergeräumt werden).

Schon klar. Meine Gedanke war eher folgender: Wenn sich der Fehler
jetzt plötlich in einem defekten Dateisystem äußert, dann ist auch der
ursprügnliche Fehler möglicherweise nicht auf defekte Dateidaten
sondern auf defekte allokationslistem (oder wie diese Dinger in ext2,
welche einer Datei die blöcke zuordnen auch heißsen...) oder defekte
inodes hin.

> ..."mit dd nach /dev/null geschrieben"? Na, was denn nun? Platte gelesen
> oder Platte geschrieben?


gelesen. Unter der Annahme, das die Platte dann bei einem Lesefehler
die falsche Prüfsumme bemerkt. So war das bis jetzt zumindestens
immer, wenn ich Festplattenfehler hatte: irgend wann gibts input/ouput
Fehler.

> Verrat' erstmal, was Du an relevanten Versionen (bei Software) bzw. an
> Hardware in Deinem Laptop hast... Ich hab' meine Kristallkugel nämlich
> gerade gestern zum Polieren weggegeben:-(

:-) Sagst du bescheid, wann sie wieder da ist? Ich hätte da vieleicht auch
noch ein paar andere interessante Fragen ...

Ich hoffe, jetzt sind meine Angaben vollständig ... sonst bitte
einfach nochmal nachfragen,

Stefan




Mehr Informationen über die Mailingliste linux-l