Kilka awarii

(post pisany jakiś czas temu, ale nieopublikowany. Publikuję, bo a nóż się komuś coś przyda ;)

Jak zapewne niektórzy zauważyli – zdażyło się ostatnio kilka awarii ;)

Od początku:

  1. W sobotę(8.12.2007), po zawodach mwpz – padł sobie dysk w kronosie. Cóż – po prostu padł. Podobnie jak i poprzedni dyszczek nagle przestał się kręcić. Można by sie temu dziwić, gdyby nie to że kronos ma już kilka swoich latek, a blisko 7 lat nieprzerwanej pracy to dosyć nawet jak dla dysku scsi.
  2. Na kronosie stało kilka maszyn wirtualnych (opartych o linux-vserver), a na tym miedzy innymi sprawdzarka acm-u jak również vserver z wiki.

Z tego też powodu przez jakiś czas część usług była niedostępna. Co prawda starałem się wszystko jak najszybciej przywrócić, ale.. wyszło jak zwykle.

Szczegóły pominę – w każdym razie obecnie wszystko zostało z kronosa wyniesione na hypnosa i jak na razie działa.

Dlaczego na razie?

Przyszła nowa, długo oczekiwana macierz z dyskami. Tak, problem z brakującym miejscem zmierza ku końcowi. Mniej przyjemnym aspektem tego była konieczność rekonfiguracji obecnego systemu. Z uwagi na problemy z windows(atlas), nowa macierz została podłączona przed starą macierzą z dyskami systemowymi. Efektem tego jest niestety to, że linuksowe serwery, do tej pory korzystające z starej macierzy – obecnie przed dyskami z niej wykrywają dyski z nowej macierzy. Co wyklucza możliwość korzystania z nazw typu /dev/sda itepe.

Rozwiązanie jest niby proste – użycie LABEL-i albo UID-ów. Tylko że:

  • pld używany na hypnosie i omedze nie obsługuje  przy starcie użycia root=LABEL ani root=UID. Nikt tego jeszcze nie miał okazji zaimplementować – wymaga toto wykrycia przez blkid albo coś w tym stylu etykiet dysków i użycia ich… Albo bootowanie tegoż w inny sposób (jeszcze się może kiedyś bardziej na ten temat rozpiszę…)
  • centos na najnowszym jajku nie wykrywa dysku. hgw dlaczego, nieszczegolnie jak mam to diagnozować… po downgradzie do 2.6.18-8.1.15 jakoś działa (obsługując labele/uidy).

Potencjalne problemy typu konflikt labeli jak gdzieś indziej jakiś inny dysk wykryje – pomijam…

Obecnie calosc jest jako tako poskejana i do rebootu chodzi. A jak się rebootnie – to się zobaczy ;) W każdym razie wszystko co stoi na hypnosie – może się zdażyć że przez kilka h będzie niedostępne.

Oczywiście w wolnych chwilach pracuję nad rozwiazaniem problemu, ale – wolnych chwil za dużo nie ma, więc całość się może przeciągnąć….

One thought on “Kilka awarii

  1. 83Chauncey

    Hi blogger, i must say you have hi quality content here.
    Your website can go viral. You need initial traffic boost only.
    How to get it? Search for: Mertiso’s tips go viral

    Reply

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Możesz użyć następujących tagów oraz atrybutów HTML-a: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>