[linux-l] Platte oder Controller am Abrauchen?

Steffen Dettmer steffen at dett.de
Sa Mär 6 22:20:05 CET 2004


* Dani Oderbolz wrote on Thu, Mar 04, 2004 at 11:37 +0100:
> Liebe Liste,
> ich bin derzeit etwas verzweifelt, denn einer unserer Server 
> machte gestern Nacht auf Panik:
> 
> Mar  3 19:46:20 ecoserv01 kernel: hde: irq timeout: status=0xd0 { 
> Busy }
> Mar  4 07:42:01 ecoserv01 kernel: PDC202XX: Primary channel reset.
> Mar  4 07:42:01 ecoserv01 kernel: hde: drive not ready for command
> Mar  4 07:42:31 ecoserv01 kernel: ide2: reset timed-out, status=0x80
> Mar  4 07:42:31 ecoserv01 kernel: end_request: I/O error, dev 
> 21:00 (hde), sector 2009535
> Mar  4 07:42:31 ecoserv01 kernel: end_request: I/O error, dev 
 [...] 
> Der Kernel ist  2.4.19-4GB (Standard Suse 8.1).
> Wir betreiben daruf ein Promise FastTrak 100 (RAID 1 aud 2 Platten).
> Das Filesystem ist Reiserfs mit 3.6  er Journal.

Schade, gerade reiser ist bei sowas wohl recht empfindlich...

> Nun ist meine grosse Frage: Ist der Controller schuld oder die 
> Platten?
> (Ich denke mal, dass die WS grösser ist, dass es der Controller 
> ist, denn ich habe ja 2 Platten drin).

meckert doch bloss hde an, also würde ich hde als Problemkind
vermuten. IDE Platten sind eben Verschleissteile. Oder ist hde
ein richtiges, transparentes Hardware-RAID-1 auf zwei ganz
anderen Platten? Ach nee, würde dann wohl wie ein SCSI Device
aussehen...

> Nach einem beherzen Reboot eines Kollegen läuft die Machine im 
> Moment ohne Mucken, ich habe aber ein ganz schlechtes Gefühl...
> Was würdet ihr ausser reiserfsck noch machen?

Ein Backup natürlich. 

Platten notfalls prophylaktisch wechseln (also: wechseln,
notfalls war das prophylaktisch und man verbaut die später
woanders). Vielleicht noch ein sync auf ne nackte IDE Platte ohne
Promise, vorzugsweise ohne viele reboots nach Fehlern, weil man
Pech haben kann, und man ne kaputte Platte manchmal bloss noch
bis zu einem Reset verwenden kann. Hatte so einen Fall mal: nach
dem (von mir glücklicherweise gemachten) Notbackups bootete ein
Kollege einen Server.Das BIOS fand nicht mal mehr die Platte,
nix, tot, ende...  Also vielleicht ein oder mehrere rsync's übers
Netz.
 
oki,

Steffen

-- 
Dieses Schreiben wurde maschinell erstellt,
es trägt daher weder Unterschrift noch Siegel.



Mehr Informationen über die Mailingliste linux-l