Rebuild eines Software-RAID

Hallo Freunde der Sonne,
nach dem ich den iSCSI-Host auf einem…naja minderwertigeren Server als sonst installiert hatte kam die große Frage…
Wie kann ich eigentlich einen Rebuild eines Software-RAID’s anstoßen?
Komische Frage, aber nur die Mail zu erhalten, ey Admin, Platte is off, nix bunt reicht einem meist nicht aus.
Also wie nachschauen und wieder in Ordnung bringen?

Rebuild eines Software-RAID

Und so geht es, erstmal wollen wir die Daten des Volumens vom RAID-Manager-Tool erfragen. (Status)
mdadm –detail /dev/md127
Falls einem dieses Tool fehlen sollte:
yum install mdadm
Nun kommt eine schön formatierte Ausgabe mit allen Daten die uns interessieren könnten, dazu am Ende ein Beispiel…
Aber wie läuft das mit den Rebuild’s?
Wenn eine Platte durch Fehler intern oder extern die Funktion nicht mehr ausführen kann, muss diese manuell dem RAID neu hinzugefügt werden.
Daher lohnt es sich in der Mail zu schauen: welche Platte wurde den als Defekt gemeldet. (/dev/sdd1)
Sobald diese gegen einen Ersatz ausgetauscht wurde kann mit dem Rebuild begonnen werden:
mdadm /dev/md127 –add /dev/sdd1
Wieso werden eigentlich Partitionen und keine ganzen Festplatten angegeben?
Dies liegt an der Natur des Software-RAIDs, hierfür werden bei der Erstellung Partitionen mit dem Typ-Software-RAID erstellt, dementsprechend werden diese Partitionen am Ende auch wieder in den Verbund integriert…
Nach erfolgreichem Hinzufügen sollte die Ausgabe von:
mdadm –detail /dev/md127
So aussehen:
Version : 1.1
Creation Time : Tue Sep 25 15:56:28 2012
Raid Level : raid10
Array Size : 1953518592 (1863.02 GiB 2000.40 GB)
Used Dev Size : 976759296 (931.51 GiB 1000.20 GB)
Raid Devices : 4
Total Devices : 4
Persistence : Superblock is persistent

Intent Bitmap : Internal

Update Time : Tue Sep 25 19:12:24 2012
State : active, degraded, recovering
Active Devices : 3
Working Devices : 4
Failed Devices : 0
Spare Devices : 1

Rebuild Status : 41% complete

Name : <Servername>:4  (local to host <Servername>)
UUID : f3c3c342:559b369f:bb8250ae:84fc4fb0
Events : 324

Number   Major   Minor   RaidDevice State
       0       8        1        0      active sync   /dev/sda1
       1       8       49        1      spare rebuilding   /dev/sdd1
       2       8       65        2      active sync   /dev/sde1
       3       8       81        3      active sync   /dev/sdf1
Ich glaube man kann sich vorstellen, dass ohne entsprechende Festplatte einfach an der Stelle nur: removed gestanden haben könnte. (angenehmer Weise findet man im Protokoll /var/log/messages oder in der Mail das verloren gegangene Gerät)