Himmelarsch, meine Fresse! Die oben genannte Festplatte steckt derzeit gleich fünf mal in meinem Server. Zwei teilen sich das RAID1 mit System und wichtigen beruflichen sowie privaten Daten, die anderen drei balgen sich im RAID5-Verbund um andere Userdaten.
Nun hat mein RAID-Controller in letzter Zeit verstärkt fehlerhafte Sektoren gemeldet, und zwar an gleich drei der Platten. So war ichs leid und habe mit Samsung telefoniert. Ein sehr freundlicher Hotline-Agent hat mir in Windeseile ein paar RMAs und Anweisungen zum reibungsfreien Garantietausch gemailt.
Nun bin ich, gerade was meine Daten angeht, ein vorsichtiger Mensch, außerdem brauchte ich ja ein bißchen Kapazität, um meine Daten zwischenzuspeichern. Also bin ich gleich am nächsten Tag, nämlich dem vergangenen Freitag, in den Münchner K&M-Shop gerannt und habe nochmal zwei Exemplare der Baureihe HE103UJ erstanden.
Beide auch gleich am Freitag eingebaut, dem RAID5 als Hot Spare gemeldet und eine der fehlerhaften Platten entfernt. Nach kurzem aber lauten Gepiepe des Controllers (“harddisk an port sowieso failed, hot spare took over”) legte selbiger auch schon los und kaum 6 Stunden später war das Array wieder “rebuilt”.
Heute Nachmittag wollte ich dann das selbe Spielchen mit der zweiten Platte durchziehen: Platte raus, Hot Spare springt ein, rebuilding, supi. Ein paar Stunden später, gerade auf dem Weg ins Bett, noch schnell den Rechner ausschalten… Hoppla, watt is das? RAID-Status CRITICAL? Rebuilding abgebrochen? Gut, nochmal anstoßen. Klick, ratterdiklack, “rebuilding failed. an error occurred on disk bla tüt”. WTF..?! Die Platte hab ich doch erst VORGESTERN gekauft?!?!
Dieser verfickte Drecksplatte ist doch tatsächlich gerade mal 48h am Stück gelaufen, bevor sie sich mit irreparablen Fehlern gemeldet hat! Und das allerschlimmste: Das ist exakt in dem Zeitfenster passiert, in dem sich das RAID im Rebuilding befunden hat, sprich: Null Toleranz bei Fehlern! 3 Stunden vorher – kein Problem, hätte ich halt das Rebuilden sein lassen und nur ein bißchen gekotzt! 3h später – kein Problem, dann wären alle Daten schon vollständig auf die neue Platte synchronisiert gewesen und der RAID-Verbund hätte – seinem Zweck entsprechend – gehalten.
Wie groß ist die verdammte Wahrscheinlichkeit, daß eine NAGELNEUE Platte nach so kurzer Zeit das zeitliche segnet und dann auch noch zu dem denkbar ungünstigsten Zeitpunkt, an dem NULL Datenredundanz herrscht, für die so ein blödes RAID nunmal entwickelt und in meinem Server eingerichtet wurde?!?!
Ich kann in diesem Leben niemals so viel fressen, wie ich KOTZEN möchte!
Ich habe nun ein RAID5-Array, das aus folgenden Platten besteht:
- alte, funktionstüchtige Platte mit Daten
- neue, funktionstüchtige Platte ohne Daten (da die Synchronisierung nicht komplett war)
- neue Platte mit Fehlern und Daten
Ich sitze nun seit gut 6 Stunden vor der Kiste, habe eine der alten 1TB-Platten mit reparierten Sektorfehlern reaktiviert und schaufele Daten drauf. Da die Daten nun teilweise von einer defekten Platte gelesen werden, kann ich hier schön fast jedes Verzeichnis einzeln kopieren. Und wenn wir über einen defekten Sektor stolpern, ist in der Regel Reboot angesagt, da der Controller das RAID dann deaktiviert.
Und das alles mache ich bei dem penetranten Gepiepe meiner USV, deren Akku vor ein paar Tagen ebenfalls den Geist aufgegeben hat. Und ich trau mich auch nicht, mich sinnlos zu besaufen, weil ich Angst habe, Flüchtigkeitsfehler zu machen.
Letzte Kommentare