Feb 26

Mei, schkrich the fucking Crysis!

Vor einigen Wochen hatte ich ja zunächst mal die Idee, mein Daten-RAID zu vergrößern. Da der RIAD-Controller außerdem noch bei zwei Platten (teilweise massig) fehlerhafte Sektoren gemeldet hat, bin ich schnell zu K&M Eletronik hier vor Ort in München gewandert und habe zwei identische Platten der Serie SAMSUNG HE103UJ erworben und die defekten ausgetauscht.

DAS hätte ich mal besser bleiben lassen, denn mitten im Array-Rebuilding fiel die erste neue Platte aus. Und ich hatte eine 20h-Schicht am Rechner, während der ich ca. 80% der Daten retten konnte. War leider von Sonntag Abend bis Montag Nachmittag, also hatte ich einen ganzen Tag Verdienstausfall.

Die Katastrophenplatte hat mir K&M glücklicherweise anstandslos vor Ort ausgetauscht, ich musste lediglich ein paar Tage warten, bis die Platte den Weg vom Zentrallager in den Laden geschafft hatte. Die beiden “bißchen kaputten” Platten habe ich zum deutschen Samsung-Partner eingeschickt und vorgestern nach ca. 2 Wochen Bearbeitungszeit wiederbekommen. Juhu.

Ab in die Wechselrahmen und ran an den Controller. Schaden macht Klug, dachte ich mir, und habe die beiden Platten gleich mal einem Burn-In unterzogen. Wie übrigens auch schon der K&M-Austauschplatte.

UND WAS IS?!?!?

Der Controller hat die eine Scheißplatte gleich zweimal wegen Fehler gekickt. Das erste Mal gestern Abend um 23:30 (danke “audible alarm”, ich hatte schon gepennt), das zweite Mal laut Logfile und tausend Error-Mails um 4 Uhr nochwas. Zum Glück hatte ich den nervtötenden Piepsealarm gestern noch abgeschaltet.

Gerade läuft badblocks das dritte Mal an, aber selbst wenn es tatsächlich durchlaufen sollte, habe ich jetzt schon erhebliche Hemmungen, der Platte jemals irgendwelche Daten anzuvertrauen. Leider liefert kein Log brauchbare Fehlermeldungen, der RAID-Controller meldet nur einen “I/O error”, aber nix mit fehlerhaften Sektoren oder sowas. Also tippe ich auf den Plattencontroller.

Falls der dritte Lauf fehlschlägt, werde ich die Platte nochmal an einem anderen Port testen, aber ich vermute schon jetzt, daß ich die Platte kommende Woche mit Anlauf zurück zu EDC nach Kelsterbach treten werde. Und nochmal drei Wochen warte, bis der Garantietausch endlich abgeschlossen ist…

Der Controller loggt übrigens wie folgt:

Feb 26 04:35:02 capoeira kernel: [1962364.950527] rr232x:[0,2] completion error, flags=84
Feb 26 04:35:02 capoeira kernel: [1962364.950530]
Feb 26 04:35:02 capoeira kernel: [1962364.950539] rr232x:ATA regs: error 40, sector count f4f4, LBA low 4480, LBA mid 8e, LBA high 70, device 40, status 41
Feb 26 04:35:02 capoeira kernel: [1962364.950542]
Feb 26 04:35:02 capoeira kernel: [1962364.962581] rr232x:start channel [0,2]
Feb 26 04:35:02 capoeira kernel: [1962364.962615] sd 0:0:2:0: [sdj] Result: hostbyte=DID_ABORT driverbyte=DRIVER_INVALID,SUGGEST_ABORT
Feb 26 04:35:02 capoeira kernel: [1962364.962620] end_request: I/O error, dev sdj, sector 1148227200
Feb 26 04:35:03 capoeira kernel: [1962365.504998] rr232x:channel [0,2] started successfully

Das ein paarmal hintereinander, danach gibt er auf und das Log wird von badblocks zugespammed, das pro Sekunde zehntausende (!) Fehler beim Beschreiben des Device meldet. Zum Glück ist Linux schlau und sagt nur:

Feb 26 04:37:42 capoeira kernel: [1962524.884689] printk: 63681 messages suppressed.

Feb 25

Ich mag Linux und seine Entwickler. Während Mac OS und Windows dem User selten ein Werkzeug geben, mit dem dieser etwas wirklich Destruktives tun kann (Letzteres hat dies bis vor kurzem nur über den Umweg über Viren gestattet), drückt Dir Linux gnadenlos eine entsicherte Pistole in die Hand und läßt Dir die freie Wahl, was Du damit anstellst. Also kannst Du entweder in Zielnähe treffen oder Dir mächtig in den eigenen Fuß schießen.

Hier ein Auszug der Manpage zum Programm badblocks, das eine Festplatte auf fehlerhafte Sektoren prüft. Das kann auf mehrere Arten geschehen, abhängig davon, ob bspw. schon Daten auf der Platte liegen. Die Option -f sagt dem Programm, wirklich genau das zu tun, was der User sagt. Egal, ob es sinnvoll ist oder nicht.

Normally, badblocks will refuse to do a read/write or a non-destructive test on a device which is mounted, since either can cause the system to potentially crash and/or damage the filesystem even if it is mounted read-only.  This can be overridden using the -f flag, but should almost never be used — if you think you’re smarter than  the  badblocks  program, you almost certainly aren’t.  The only time when this option might be safe to use is if the /etc/mtab file is incorrect, and the device really isn’t mounted.

Feb 20

True… true…

Das Ding hängt seit Jahren ausgedruckt an meiner Pinnwand, bin neulich durch Zufall mal wieder im Netz drüber gestolpert… :D

Feb 16

demMatthias sein Artikel kam mir ein bißchen bekannt vor und ich habe mal resümiert, was bei mir alles an PC-Hardware rumkreucht und -fleucht.

Also zunächst wäre da mal mein Hauptrechner im Arbeitszimmer. Das ist ein P4 SingleCore mit irgendwas um die knapp 3 GHz. Im Jahr 2004 ad habe ich dieses Prunkstück angeschafft. War damals ein guter Kompromiß aus Preis und Leistung, also schon nicht mehr das allerneueste Board, etc. Den habe ich zwischendrin mal mit einer neueren GraKa gepimped. War damals schon schwierig, noch ne ansatzweise schnelle AGP-Karte zu kriegen. Ja, richtig gelesen: AGP. Seit ich mit meinem Notebook wieder mehr in der Bude und in Deutschland unterwegs bin, habe ich auch mal ein kleines Speicherupdate gemacht. Der uralte DDR1-Speicher kostet glatt das doppelte vom ebenfalls schon betagten DDR2! Das Gehäuse ist übrigens schon ein Dinosaurier, knapp 10 Jahre alt. Würde jeden Modding-Wettbewerb übelst runterziehen. Ist aber scheiße funktional und hat sogar nen Griff.

Das besagte Notebook, ein Dell XPS m1330 aus dem Jahre 2007 mit 2GHz DualCore-Prozessor hatte für einige Zeit als Desktop-Replacement den Hauptrechner verdrängt. Rein leistungstechnisch, aber auch weil ich mit dem sowohl bei den Kunden vor Ort als auch im Hohm-Office gearbeitet hatte. Nur zocken ging auf dem Ding nicht so gut, daher die neue GraKa für den anderen. Alles in allem ist der also mit seinen zwei Rechenkernen und 2GB RAM noch recht aktuell.

Ein älteres Notebook mit SingleCore Celeron (1,4GHz glaube ich) habe ich neulich für Steffi zurechtgemacht, mit dem surft die nun endlich weierless und flott durchs Netz.

Mein Server ist auch ein SingleCore Celeron – hier habe ich bei Board und CPU gespart und außerdem auf den Stromverbrauch geachtet. Nur für den (oder die?) Storage habe ich auf Qualität geachtet. Naja, wenn man von einer fehleranfälligen Festplattenserie mal absieht. :-|

Im Keller stehen noch ein paar alte Komplettsysteme sowie diverse Eingeweide alter Rechner – ein paar P4 SingleCore und ein paar P3s. Immerhin sparsam.

Alles in allem: Tach Matthias, mein Hauptrechner ist auch nicht viel neuer als Deiner. :D