(post pisany jakiś czas temu, ale nieopublikowany. Publikuję, bo a nóż się komuś coś przyda
Jak zapewne niektórzy zauważyli – zdażyło się ostatnio kilka awarii
Od początku:
- W sobotę(8.12.2007), po zawodach mwpz – padł sobie dysk w kronosie. Cóż – po prostu padł. Podobnie jak i poprzedni dyszczek nagle przestał się kręcić. Można by sie temu dziwić, gdyby nie to że kronos ma już kilka swoich latek, a blisko 7 lat nieprzerwanej pracy to dosyć nawet jak dla dysku scsi.
- Na kronosie stało kilka maszyn wirtualnych (opartych o linux-vserver), a na tym miedzy innymi sprawdzarka acm-u jak również vserver z wiki.
Z tego też powodu przez jakiś czas część usług była niedostępna. Co prawda starałem się wszystko jak najszybciej przywrócić, ale.. wyszło jak zwykle.
Szczegóły pominę – w każdym razie obecnie wszystko zostało z kronosa wyniesione na hypnosa i jak na razie działa.
Dlaczego na razie?
Przyszła nowa, długo oczekiwana macierz z dyskami. Tak, problem z brakującym miejscem zmierza ku końcowi. Mniej przyjemnym aspektem tego była konieczność rekonfiguracji obecnego systemu. Z uwagi na problemy z windows(atlas), nowa macierz została podłączona przed starą macierzą z dyskami systemowymi. Efektem tego jest niestety to, że linuksowe serwery, do tej pory korzystające z starej macierzy – obecnie przed dyskami z niej wykrywają dyski z nowej macierzy. Co wyklucza możliwość korzystania z nazw typu /dev/sda itepe.
Rozwiązanie jest niby proste – użycie LABEL-i albo UID-ów. Tylko że:
- pld używany na hypnosie i omedze nie obsługuje przy starcie użycia root=LABEL ani root=UID. Nikt tego jeszcze nie miał okazji zaimplementować – wymaga toto wykrycia przez blkid albo coś w tym stylu etykiet dysków i użycia ich… Albo bootowanie tegoż w inny sposób (jeszcze się może kiedyś bardziej na ten temat rozpiszę…)
- centos na najnowszym jajku nie wykrywa dysku. hgw dlaczego, nieszczegolnie jak mam to diagnozować… po downgradzie do 2.6.18-8.1.15 jakoś działa (obsługując labele/uidy).
Potencjalne problemy typu konflikt labeli jak gdzieś indziej jakiś inny dysk wykryje – pomijam…
Obecnie calosc jest jako tako poskejana i do rebootu chodzi. A jak się rebootnie – to się zobaczy W każdym razie wszystko co stoi na hypnosie – może się zdażyć że przez kilka h będzie niedostępne.
Oczywiście w wolnych chwilach pracuję nad rozwiazaniem problemu, ale – wolnych chwil za dużo nie ma, więc całość się może przeciągnąć….