Raid1, Festplatte kaputt?

2006-03-02 Diskussionsfäden R . Schade
Hallo,

ich habe einen Rechner mit einem Raid1-System am laufen, dessen Festplatten
(hda und hdc) von smartctrl überwacht werden. Auf den Festplatten existieren
4 verschiedene Partitionen.

Nun habe folgende Mails vom mdadm bekommen:

1)
A Fail event had been detected on md device /dev/md3.

It could be related to component device /dev/hda7.

2)
A Fail event had been detected on md device /dev/md2.

It could be related to component device /dev/hda5.

Dazu eine halbe Stunde später Mails vom smartctrl-Daemon:
1)
Device: /dev/hda, 1 Offline uncorrectable sectors
2)
Device: /dev/hda, Self-Test Log error count increased from 0 to 1
3)
Device: /dev/hda, 3 Currently unreadable (pending) sectors
4)
Device: /dev/hda, ATA error count increased from 0 to 2

Bevor ich jetzt die Festplatte tausche, möchte ich gern sichergehen, dass
ich hier nix falsch verstehe. Im Raid sind die angegebenen 2 Partitionen mit
der hda-Platte aus dem Raid entfernt. Deutet obiges Szenario auf eine
defekte Festplatte hin? Oder kann das ein irgendwie-Fehler sein (kurzzeitige
Unterspannung) und ich sollte versuchen, die Partitionen nochmals irgendwie
in das Raid zu integrieren.

Danke für die Tipps bei der Interpration der Meldungen.

Ciao, Ralf



Re: Raid1, Festplatte kaputt?

2006-03-02 Diskussionsfäden Sven Hartge
[EMAIL PROTECTED] wrote:

 ich habe einen Rechner mit einem Raid1-System am laufen, dessen Festplatten
 (hda und hdc) von smartctrl überwacht werden. Auf den Festplatten existieren
 4 verschiedene Partitionen.

 Nun habe folgende Mails vom mdadm bekommen:

 1)
 A Fail event had been detected on md device /dev/md3.
 It could be related to component device /dev/hda7.

 2)
 A Fail event had been detected on md device /dev/md2.
 It could be related to component device /dev/hda5.

 Dazu eine halbe Stunde später Mails vom smartctrl-Daemon:
 1)
 Device: /dev/hda, 1 Offline uncorrectable sectors
 2)
 Device: /dev/hda, Self-Test Log error count increased from 0 to 1
 3)
 Device: /dev/hda, 3 Currently unreadable (pending) sectors
 4)
 Device: /dev/hda, ATA error count increased from 0 to 2

 Bevor ich jetzt die Festplatte tausche, möchte ich gern sichergehen,
 dass ich hier nix falsch verstehe. Im Raid sind die angegebenen 2
 Partitionen mit der hda-Platte aus dem Raid entfernt. Deutet obiges
 Szenario auf eine defekte Festplatte hin? Oder kann das ein
 irgendwie-Fehler sein (kurzzeitige Unterspannung) und ich sollte
 versuchen, die Partitionen nochmals irgendwie in das Raid zu
 integrieren.

Ich würde die Platte tauschen. Du kannst sie zwar meist dadurch
wiederbeleben, in dem du einen kompletten resync der jeweiligen RAIDs
machst (weil dabei alle Sektoren neu geschrieben werden und die Platte
diese damit remappen kann), aber ich persönliche traue keiner Platte,
bei der die Sektoren anfangen, zu zerbröckeln.

S°

-- 
Sven Hartge -- professioneller Unix-Geek
Meine Gedanken im Netz: http://www.svenhartge.de/


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)