>> Средняя плотность выделения тепла AFAIK выше
> иии что?Иии соответственно охлаждать приходится интенсивней[, мониторить оперативней].
> во-первых, не загруженные на 100% серверы в ДЦ - это не нормально, КМК
Интересно, я до сих пор сталкивался только с народом, который предпочитает оперативный запас порядка хотя бы 10--20%. (без подковырок, сам-то не ДЦ-шник)
> ага, спасибо, интересная штука. а бывает и так:
Сурово :)
> что касается той системы, на которую вы кинули ссылку, то у меня
> на второй странице сложилось четкое ощущение, что система предназначена для мониторинга
> любой системы, генерящей большое количество ивентов, будь то суперкластер, или например
> какой-нибудь 5ess.
В принципе да; см. тж. слайд 12 вот здесь: http://ftp.linux.kiev.ua/pub/conference/peers/foss-sea/2011/...
> там есть какая-то HPC специфика, которую я упустил?
Возможно, имеющая отношение -- в модели установки описываются платформы, которые в точности (до сенсора) соответствуют установленному оборудованию.Соответственно если оно относительно однообразное (на "Ломоносове" в итоге набралось штук пять или шесть вариаций, помнится -- благодаря шестиядерникам и теслам), то ещё более-менее; а если совсем разношёрстное, то подход придётся в лучшем случае адаптировать.
Ещё одна специфика (не HPC-, а данной реализации) -- кодирование физического положения объекта (location); здесь лучше Валика расспросить, но изначальная задумка оперировала стойками/коридорами/рядами, помнится.
Ну и опосредованная -- через латентность -> длину линков -> плотность размещения -> плотность тепловыделения: при ~70 кВт на шкаф типичная минута на реакцию оказывается непозволительной роскошью, здесь решение об аварийном складывании установки по IPMI/на UPS может быть принято за единицы секунд.