The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]




Версия для распечатки Пред. тема | След. тема
Новые ответы [ Отслеживать ]
ГРУСТНО! Умирает роутер, или какие могут быть мысли...., !*! hobot, 10-Июн-05, 09:57  [смотреть все]
Ситуайия следующая....
Что-то не доброе начало твориться на роутере (FreeBSD) началочь все после внезапного отключения электричества (спасибо Чубайсу) - тачка начала просто после не продолжительной работы 3-4-5-6 часов просто зависает и не реагирует ни на что кроме кнопки reset - естественно после таких перезагрузов появилочь огромное количество ошибок на дисках .
Ядро после перезагрузки падало в панику по поводу не возможности проверки одного из дисков и перегружало машину - пришлось отключить фоновую проверку fsck после загрузки - перегружать перестало - но зависания участились причем в логах ВАЩЕ ничего нет как так и надо - стал грешить на винт поставил другой - 0 результат
ЧО ДЕЛАТЬ УЖЕ И НЕ ЗНАЮ SOS!!!  СПАСИТЕ ...


  • ГРУСТНО! Умирает роутер, или какие могут быть мысли...., !*! Moralez, 10:12 , 10-Июн-05 (1)
    "естественно после таких перезагрузов появилочь огромное количество ошибок на дисках"...

    Неестественно. Особенно, если в /boot/loader.conf:
    hw.ata.wc=0
    в /etc/sysctl.conf:
    kern.filedelay=5
    kern.dirdelay=5
    kern.metadelay=5

    сейчас только cvsup, make builduniverse, make installuniverse.....

  • ГРУСТНО! Умирает роутер, или какие могут быть мысли...., !*! lavr, 10:27 , 10-Июн-05 (3)
    >Ситуайия следующая....
    >Что-то не доброе начало твориться на роутере (FreeBSD) началочь все после внезапного
    >отключения электричества (спасибо Чубайсу) - тачка начала просто после не продолжительной
    >работы 3-4-5-6 часов просто зависает и не реагирует ни на что
    >кроме кнопки reset - естественно после таких перезагрузов появилочь огромное количество
    >ошибок на дисках .
    >Ядро после перезагрузки падало в панику по поводу не возможности проверки одного
    >из дисков и перегружало машину - пришлось отключить фоновую проверку fsck
    >после загрузки - перегружать перестало - но зависания участились причем в
    >логах ВАЩЕ ничего нет как так и надо - стал грешить
    >на винт поставил другой - 0 результат
    >ЧО ДЕЛАТЬ УЖЕ И НЕ ЗНАЮ SOS!!!  СПАСИТЕ ...


    fsck в background на рутере или сервере - это НОНСЕНС, видимо от большого
    ума (sorry, без обид).

    1) загрузка в single user-mode
    2) ручками fsck -y все FS
    3) mount -a
    4) dd if=/dev/диск of=/dev/null - смотрим ошибки ЧТЕНИЯ на всех дисках
    если есть: пробуем реаллокировать используя mhdd32, если нет:
    5) переходим в multi-user mode и наблюдаем работу сервера
    6) если непонятки продолжаются - ПЕРЕСОБИРАЕМ СИСТЕМУ, бог его знает
    мб на диске что-то запортилось.
    7) если ВСЕ верхнее НЕ ПОМОГЛО - менять железо, ЧТО-ТО поплыло - к гадалке
    не ходи

    • ГРУСТНО! Умирает роутер, или какие могут быть мысли...., !*! Moralez, 10:41 , 10-Июн-05 (4)
      lavr, почему fsck в background - НОНСЕНС?
      • ГРУСТНО! Умирает роутер, или какие могут быть мысли...., !*! lavr, 11:23 , 10-Июн-05 (5)
        >lavr, почему fsck в background - НОНСЕНС?

        у тебя сервер после загрузки сразу должен в стабильном боевом режиме
        работать? Если да и если на ем есть дисковые операции: работа с базами,
        с почтой, squid и тд и тп - в этом случае выдай команду ps -axuww | grep fsck и потом в логах ищи когда завершится проверка.
        А I/O на дисках БОЕВОГО сервера уже вовсю пилит, а fsck еще не завершился,
        а если сбои были и они superblock не поправлен, а работа с FS уже по полной
        программе. Ну возможно НЕ ТАК страшно если тупой РУТЕР - только рутит себе,
        а если он НЕ ТОЛЬКО РУТИТ, а еще логи собирает - это уже IO, fsck еще чекает, но IO уже в параллель вовсю пишут логи.
        После чего глупые вопросы в разных форумах: fsck НЕ ПРАВИТ информацию,
        не освобождаются блоки, или запустил fsck на живую смонтированную систему,
        НЕ ИСПРАВЛЯЕТ ошибки - дичь.
        Вроде доходчиво получилось. fsck в background хорошо для личных WKS.
        Попробуй найти в списках рассылки freebsd хоть одну рекомендацию
        пускать fsck в background'е на боевом сервере.

        • ГРУСТНО! Умирает роутер, или какие могут быть мысли...., !*! секрет, 12:07 , 10-Июн-05 (6)
          всё верно, только в первую очередь если ошибки тучами и зависоны = из бэкапа сделайся
          • ГРУСТНО! Умирает роутер, или какие могут быть мысли...., !*! hobot, 12:32 , 10-Июн-05 (7)
            >из бэкапа сделайся

            и всеж про cvsup если можно поподробнее - ниразу не пересобирал ядро не хотелось бы ошибиться именно на этой тачке, а делать надо

            • ГРУСТНО! Умирает роутер, или какие могут быть мысли...., !*! lavr, 13:09 , 10-Июн-05 (8)
              >>из бэкапа сделайся
              >
              >и всеж про cvsup если можно поподробнее - ниразу не пересобирал ядро
              >не хотелось бы ошибиться именно на этой тачке, а делать надо
              >

              зачем тебе cvsup? хотя, если ошибки, то и sources могли попортится.

              Либо сперва попробовать ПЕРЕСОБРАТЬ СИСТЕМУ и ЯДРО без cvsup, если
              все OK, то переустановить ПОВЕРХ рабочей. Если НЕ СОБИРАЕТСЯ, возможно
              побились не только бинарники, но и sources - вот тогда:

              # uname -rs
              и cvsup по новой ТОГО что у тебя стабильно стояло прежде.

              Про cvsup и пересборку МИРА/ЯДРА - все расписано в handbook и переведено
              на русский:

              http://www.freebsd.org/doc/ru_RU.KOI8-R/books/handbook/index...

              • ГРУСТНО! Умирает роутер, или какие могут быть мысли...., !*! hobot, 13:37 , 10-Июн-05 (9)
                >Про cvsup и пересборку МИРА/ЯДРА - все расписано в handbook и переведено
                >
                >на русский:
                >
                >http://www.freebsd.org/doc/ru_RU.KOI8-R/books/handbook/index...

                скажите
                -что даст пересборка ядра в смысле какие проблемы могут решиться при этом
                -пересобирать ядро (как я понимаю в данном случае) надо со старыми параметрами

                • ГРУСТНО! Умирает роутер, или какие могут быть мысли...., !*! lavr, 14:50 , 10-Июн-05 (10)
                  >>Про cvsup и пересборку МИРА/ЯДРА - все расписано в handbook и переведено
                  >>
                  >>на русский:
                  >>
                  >>http://www.freebsd.org/doc/ru_RU.KOI8-R/books/handbook/index...
                  >
                  >скажите
                  >-что даст пересборка ядра в смысле какие проблемы могут решиться при этом
                  >
                  >-пересобирать ядро (как я понимаю в данном случае) надо со старыми параметрами
                  >

                  господи, неужели нужно РАЗЖЕВЫВАТЬ:

                  дано: стабильно работающий сервер (например freebsd 4.10), после страшного
                  сбоя питания работает НЕНОРМАЛЬНО.

                  выполнить: выяснить и устранить причины и привести к стабильной работе.

                  рассматриваем риски:

                  1) проблемы железа с вытекающими проблемами работы софта/os
                  - плавающие ошибки: что-то не до конца погорело и проявляется при
                  нагреве или других причинах...
                  - ошибки дисковых операций, результатом которых могут быть битые бинарники, sources
                  2) проблемы OS, если ранее работала стабильно - выяснить проблемы и
                  решить, связано 1) дисковые проблемы

                  Логика: железные проблемы отлавливать трудно и особенно плавающие:
                  кондеры, блоки питания, вентиляторы, битые куски памяти, "плывут отдельные" микрухи...

                  С чего в этом случае начать?

                  1) прежде всего попробуем определиться с дисками и разумеется софтом на них.

                  Если раньше ВСЕ работало нормально и устойчиво:

                  a) прогоняем fsck в single-user mode и правим все ошибки
                  b) после исправления ошибок (fsck НИ В КОЕМ случе не в background)
                  смотрим как работает система, следим по логам за сообщениями о дисковых
                  сбоях
                  c) допустим в логах появились ошибки, перегружаемся в single-user mode
                  и выполняем dd на чтение - смотрим наличие проблем
                  d) если проблемы есть - пытаемся устранить mhdd32

                  Если проблемы остались или неразрешенные, МЕНЯЕМ диск НА ЗАВЕДОМО НОРМАЛЬНЫЙ (НОВЫЙ != ХОРОШИЙ). И если в этом случае сервер РАБОТАЕТ
                  НЕ СТАБИЛЬНО -> КИРДЫК ЖЕЛЕЗУ, задача решена - все выяснили.

                  Если после любого из верхних пунктов, диски работают НОРМАЛЬНО, а система
                  НЕ СТАБИЛЬНО, далее проверяем ЦЕЛОСТНОСТЬ бинарников, ядра и sources:

                  a) выясняем версию или релиз текущей системы и:
                  - либо делаем upgrade БИНАРНИКОВ с CD (на нем заведомо ЦЕЛЫЕ binaries и
                  ядро GENERIC)
                  - либо ПЕРЕСОБИРАЕМ СИСТЕМУ и ЯДРО из sources (имеем вероятность нарваться
                  на то что sources БИТЫЕ), чтобы не иметь проблемы с sources для RELEASE
                  можем их заново залить с установочного CD

                  b) если ПОСЛЕ пересборки система стала работать СТАБИЛЬНО - проблема
                  ясна (диски) и решена, в ином случае ИМЕЕМ четко установленные проблемы
                  с ЖЕЛЕЗОМ, что делать - понятно.

                  Ну что тут сложного или непонятного, все как всегда: "Разделяй и Властвуй"!




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру