The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Открытые системы на сервере (Файловые системы, диски / Linux)
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Умерло 4 диска: Constellation ES + Barracuda ES.2 , zeiter (ok), 17-Май-11, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


7. "Умерло 4 диска: Constellation ES + Barracuda ES.2 "  +/
Сообщение от zeiter (ok), 18-Май-11, 12:57 
К чему все-это я спрашиваю. Диски на гарантии — нужно решить ехать в СЦ и настаивать на замене или не ехать. Если проблема в дисках, то в СЦ обычно ссылаются на тесты производителя SeaTools, которые были успешно пройдены последними дисками #3 и #4. При этом диск #3 намертво отвалился с ошибкой:

end_request: I/O error, dev sda, sector 757879
end_request: I/O error, dev sda, sector 757879
end_request: I/O error, dev sda, sector 757879

Количество reallocated секторов с последного отчета по SMART увеличилось (в первом посте на недельку устаревшие данные по сравнению со временем демонтажа и ошибки I/O error).

Так вот по опыту могу сказать, что данные SMART (в частности Reallocated_Sector_Ct) в СЦ в качестве основания для гарантийного ремонта или замены дисков не принимают как правило.

Мне же нужно 100% уверенность, что проблема в дисках, чтобы гнуть свою линию и потребовать замену.

> Может блок питания виноват?

Версия с блоком питания, как и версия с материнкой требуют дополнительной проверки. И в домашних условиях или на коленке в офисе сложно подтвердить или опровергнуть. Руководство же вряд ли выделит средства для проверки железа в СЦ. Вот и хочу понять природу и причины возникновения этих reallocated секторов. Кто же виноват?

Ответить | Правка | Наверх | Cообщить модератору

8. "Умерло 4 диска: Constellation ES + Barracuda ES.2 "  +/
Сообщение от zeiter (ok), 18-Май-11, 13:04 
Забыл сказать, что эта ошибка возникла все-таки под нагрузкой. Но нагрузка была тестовая, запустили тесты bonniee++. Где-то с недельку гонялись они без перерыва до самого момента возникновения ошибки:

end_request: I/O error, dev sda, sector 757879 
end_request: I/O error, dev sda, sector 757879
end_request: I/O error, dev sda, sector 757879

Когда сервер наглухо встал и только горячий ребут мог привести его в чувства.

Остается только опытным путем проверять? Диски или железо? Воткнуть диски и запустить на выходные bonnie++ еще разок)))

Ответить | Правка | Наверх | Cообщить модератору

9. "Умерло 4 диска: Constellation ES + Barracuda ES.2 "  +/
Сообщение от lavremail (?), 18-Май-11, 21:21 
> Забыл сказать, что эта ошибка возникла все-таки под нагрузкой. Но нагрузка была
> тестовая, запустили тесты bonniee++. Где-то с недельку гонялись они без перерыва
> до самого момента возникновения ошибки:
>
end_request: I/O error, dev sda, sector 757879 
> end_request: I/O error, dev sda, sector 757879
> end_request: I/O error, dev sda, sector 757879

> Когда сервер наглухо встал и только горячий ребут мог привести его в
> чувства.
> Остается только опытным путем проверять? Диски или железо? Воткнуть диски и запустить
> на выходные bonnie++ еще разок)))

1) посмотрите реально ли у вас SATA контроллер поддерживает SATA-300
2) диски Seagate ES.2 как впрочем и ES ненадежные и вероятно это зависит от партии

если контроллер в SR1530 - SATA150, переводите диски в SATA150, если SATA300,
то переводите FreeBSD на ahci и тестируйте под нагрузкой.

Совет, под рейды используйте либо Hitachi Ultrastar линейку, либо WD RE3, в крайнем
случае WD RE4. (первая линейка лучшая из перечисленных, затем вторая)

прим: Seagate ES.2 в RAID5 приходится менять по диску раз в неделю-две, суммарно
в рейдах 5'ого уровня ~750 дисков, выводы из этой статистики можете сделать сами
Возможно проблема со связкой: контроллер <-> firmware Seagate'ов

И последнее, попробуйте диски на самом обычном desktop'е но с ICH9, лучше с ICH10,
если все Ok (включая под нагрузкой), значит дело в backplane сервера, такое бывает,
вот почему совет проверить на desktop'е с прямым подключением к контроллеру, без
переходников и backplane'ов.

Ответить | Правка | Наверх | Cообщить модератору

10. "Умерло 4 диска: Constellation ES + Barracuda ES.2 "  +/
Сообщение от zeiter (ok), 19-Май-11, 11:40 
> 1) посмотрите реально ли у вас SATA контроллер поддерживает SATA-300

Судя по спецификации — поддерживает

http://www.intel.com/cd/channel/reseller/asmo-na/eng/product...

http://www.nix.ru/autocatalog/server_systems_intel/Intel_1U_...

> 2) диски Seagate ES.2 как впрочем и ES ненадежные и вероятно это
> зависит от партии
> если контроллер в SR1530 - SATA150, переводите диски в SATA150, если SATA300,
> то переводите FreeBSD на ahci и тестируйте под нагрузкой.

Перед миграцией на CentOS оба режима проверяли. Изначально на FreeBSD использовался Lecacy режим (IDE). Были проблемы с обнаружением дисков в режиме AHCI когда-то давно, когда устанавливалась ОС. CentOS уже ставился на AHCI. Непосредственно перед миграцией на CentOS был ре-сетап FreeBSD 7 на диски с контроллером в режиме AHCI. Т.е. можно сказать, что перепробовали все доступные варианты режимов.

> Совет, под рейды используйте либо Hitachi Ultrastar линейку, либо WD RE3, в
> крайнем
> случае WD RE4. (первая линейка лучшая из перечисленных, затем вторая)

Благодарю за рекомендацию.

>  Возможно проблема со связкой: контроллер <-> firmware Seagate'ов

Подобная мысль меня посещала. Думаю, что эта версия имеет основания быть заявленной.

> И последнее, попробуйте диски на самом обычном desktop'е но с ICH9, лучше
> с ICH10,

Эти мероприятий запланированы. Только под рукой пока имеется только контроллер Promise SATA.

> если все Ok (включая под нагрузкой), значит дело в backplane сервера, такое
> бывает,
> вот почему совет проверить на desktop'е с прямым подключением к контроллеру, без
> переходников и backplane'ов.

Печально или нет то, что данная модель платформы не имеет никаких backplane'ов. И диски были подключены напрямую через шлейфы. SATA шлейф менял, порты тоже менял.

Ответить | Правка | Наверх | Cообщить модератору

11. "Умерло 4 диска: Constellation ES + Barracuda ES.2 "  +/
Сообщение от lavremail (?), 19-Май-11, 17:00 
>> если все Ok (включая под нагрузкой), значит дело в backplane сервера, такое
>> бывает,
>> вот почему совет проверить на desktop'е с прямым подключением к контроллеру, без
>> переходников и backplane'ов.
> Печально или нет то, что данная модель платформы не имеет никаких backplane'ов.
> И диски были подключены напрямую через шлейфы. SATA шлейф менял, порты
> тоже менял.

замечательно, одно исключение уже есть.

Еще одно примечание, опыт использования показал что временной предел использования
дисков в рейд массивах 3года, после этого срока как правило начинаются проблемы с дисками
любых производителей. Те при условии что у нас в рейде надежные диски, можно с уверенностью
сказать что проблемы начнутся по истечении 3лет работы, далее обычно все сыпется.
Да, бывают исключения - 4года, иногда больше, но в целом, ждать проблем после 3лет.


Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру