Подготовлен (https://sourceforge.net/p/cacti/mailman/cacti-announce/?view...) релиз системы мониторинга Cacti 1.2.0 (http://www.cacti.net), отображающей изменения отслеживаемых параметров в виде наглядных графиков. Данные могут собираться как с локальной системы, так и с удалённых серверов. Система написана на языке PHP и распространяется (https://github.com/Cacti/cacti) под лицензией GPLv2. Для построения графиков применяется RRDTool (http://oss.oetiker.ch/rrdtool/).
Основные новшества (https://www.cacti.net/release_notes.php?version=1.2.0):
- Расширены средства сбора данных с внешних хостов. В Remote Data Collector добавлена поддержка часовых поясов. Реализованы настройки таймаутов для Remote Agent;
- На страницу с общим отчётом добавлена поддержка агрегированных графиков;
- Проведена оптимизация производительности интерфейса пользователя для систем с большим числом отслеживаемых сервисов;
- Сокращено число опросов состояния за счёт адаптивной оценки ситуаций, когда действительно требуется переиндексация;
- Добавлена новая секция Graph Tree Site, позволяющая просматривать графики в привязке к определённому хосту;
- Добавлен новый мастер установки, позволяющий определить конфигурацию основного сервера мониторинга и удалённых агентов;- Устранена старая уязвимость CVE-2009-4112 (https://security-tracker.debian.org/tracker/CVE-2009-4112), которая вновь всплыла (https://github.com/Cacti/cacti/issues/1072) в свежих выпусках. Проблема позволяет пользователю, имеющему доступ к интерфейсу системы мониторинга, повысить свои привилегии через манипуляцию с параметрами "Data Input Method" для отчёта "Linux - Get Memory Usage". Кроме того, в новом выпуске устранены 4 XSS-уязвимости (межсайтовый скриптинг).
URL: https://sourceforge.net/p/cacti/mailman/cacti-announce/?view...
Новость: https://www.opennet.ru/opennews/art.shtml?num=49894
Наконец-то часовые пояса. 10 лет ждал ))
нахрена козе баян, когда есть zabbix?
заббикс в 2k19? серьезно?
А какие альтернативы?
icinga?
prometeus + grafana
Пожалуй единственная здравая альтернатива, но зачем прометеус если большенство используют заббикс? (Вывод основан на том что редко можно встретить систему мониторинга на hh.ru не zabbix)
Чтобы использовать нормально Прометей, его нужно пилить под себя весьма и весьма усиленно. В Заббиксе всё готово из коробки.
Надо же, всё готово их коробки, а на форуме опеннета дети рекомендуют научиться программировать под заббикс.
Волнуюсь.
Как же так?
В заббикс нужно допиливать, а в прометеус прям пилить с нуля всея чувствуешь разницу
Дяденька, вы не те грибы кушаете. Это заббикс с его упртым хранением данных в бд надо пилить (чтобы он нормально умел в шардинг, ts-хранилки, НЕ-DML housekeeping, кеширование в kv). Прометей (если у вас НЕ 100+ хостов с двумя десятками сервисов на каждом и разрядностью метрик больше 8 на каждый сервис и разрешением в секунду) тянет среднегабаритные окружения в одно жало даже на SAS raid10. Главное, памяти не пожалеть и raid-контроллер с батарейкой поставить. Если есть деньги, не зажимать и ставить raid на ssd.
Ой, знаток грибочков пришкандыбал!Цать лет назад у чувака метрики собирались с 30к узлов вполне себе легко и просто.
И вообще, какие нахрен рейды, какой бейрметалл, какой он-перм тебе снится в 2019?
фигассе, легко и просто... или это вы кактей их когтили? Так у нее функционала на фоне жабикса около нуля.
А с жабиксом...сколько у меня там было... чуть поболее полутысячи э... "узлов" ("допустим, в засаде") конечно, не по "восемь метрик", а как бы не по несколько сотен, но и не раз в секунду, конечно - что-то и раз в минуту можно проверять, чему-то хватает пяти - понадобился дцать лет назад полноценный жабикс-кластер (прокси тогда еще была толком неживая) и определенный тюнинг mysql, отдельно выделенного только под этот жаббикс.И тыкать пальчиком в эту конструкцию было низзя-низзя, удалить какую-нибудь ставшую ненужной хистори - только темной ночью и под присмотром dba.
Но свои задачи оно решало, а сколько труда и сил ушло бы то же самое с нуля наковырять в современнном прометеусе (и, вероятно, еще и +графана, где кроме мышекликанья на пол-дня вариантов не предусмотрено вовсе) - не хочется даже считать, это при том что в том жабиксе не было ни автодискавери, ни snmp.
> И вообще, какие нахрен рейды, какой бейрметалл, какой он-перм тебе снится в 2019?
а, вот это да, правильный подход, ящетаю! Какие настройки чего-то из коробки тебе мнятся в 2019, надо просто посмотреть ценники monitoring-as-a-service, сравнить, отбросить не проходящие по фичам, оформить как положено, заявку, и наслаждаться красивыми картинками.
"этих денег нам в зарплату все равно не попадет".P.S. интересно, кто-то может объяснить этот нонсенс - почему графана умеет ДАЖЕ жаббикс-апи (пусть и левым плагином), хотя он и довольно криво в ее концепцию ложится, но не умеет - банальный rrd? Недостаточно моден-молодежен?
Стоит Prometheus+Grafana без бд стэк 3 сервера метрики от Netdata и Zabbix+PostgreSQL стэк 28 серверов метрики от нативного агента1. Генерит почти 2 гига в день с 3х серверов...
2. 2гига накопилось только за неделю с 28 серверовПилить промитей очень и очень накладно по времени
Вместо одного сервиса предлагаете использовать два сервиса? А если я захочу уведомления отправлять мне надо будет ещё чтонибудь втыкать.
Таки да, unix way.
Зачем нужен мониторинг без уведомлений?
Для разбора полётов с наказанием невиновных и награждением непричастных.
В жопу такой юниксвей ))) Поэтому и 1% пользователей в отличии от винды с 99%
Для уведомлений у тебя будет что-то типа PagerDuty или VictorOps.
А лучше полноценный ITIL с инцидент-менеджментом.
> prometeus + grafanaмы юзаем и то и то. что-то удобнее сделать в прометее, что-то в заббиксе. оба сейчас друг друга отлично дополняют.
check-mk мы используем (2к+ девайсов).
TICK. А cacti конечно отстой, просто все привыкли и им нравится.
Ну т.е. кактус в 2019 норм?))
Вполне себе.
2k19 и 2019, где экономия в написании количества символов?
Скажу больше, он ещё и языковую раскладку менял
Нахрена ты пасёшься здесь, если есть форум zabbix?
Заббикс использует реляционную БД для метрик, это тупик.
> Заббикс использует реляционную БД для метрик, это тупик.Обоснуй почему?
Ну потому, что не модно, не стильно. И вообще в плохо. И пусть метрики отлично ложатся в таблицы, которые изначально проектировались для хранения именно таких данных, но раз все говорят, что носкл лучше - будет нужно хранить в носкл.
Потому что SQL не может эффективно обращаться с TS. Потому что хранение метрик в табличном виде не эффективно. Потому что статистическая обработка данных требует отдельной подсистемы. Потому что нет встроенных средств агрегации. Потомучто, потомучто, потомучто.... Но PHP-парням это всё нравится, потому как даёт им работу.
Пруфы-то будут? А то вы сейчас рекламный буклет по любой носкл базе зачитали. А хочется не маркетинга а цифр увидеть
Вопервых не NoSQL а TSDB. Во вторых, если вас количество интересует, а не качество, тут помочь не могу, не сравнивал, я как-то пережил тот момент, когда впечатлялся кол-ом узлов или длинной истории хранения, как-то мне стало понятно, что 99% собранных метрик я просто никогда не смотрю.
Не модно и не стильно ?! ))) Смузи не сочитается ))) Хороша аргументация )))
вообще-то это был прорыв - когда, внезапно, оказалось что реляционные бд (бешплатные) уже достаточно эффективны, чтобы забыть, как о страшных снах, о всяких rrd и прочих writeonly недоразумениях "зато с агрегацией" (а по факту с отбрасыванием 90% информации, потомушта нивлазит/ниуспеваем - поэтому давайте ее агрегировать)но, как обычно, девляпсам это было слишком сложно - вот накрутить какую-нибудь жаба-бэйзед tsdb отдельно, собиралку отдельно, и отдельно вручную-рисовалку (а потом пытаться героически это все вручную же написанными скриптами автоматизировать) - это по ихнему, это правильный подход.
а, ну да - зато на go, а не этом-вашем-там-пехепе.
Отстали от жизни батенька, вручную давно крутить ничё не надо, если не хочется конечно.
ну расскажите отсталым, как получить то, что у жабикса из коробки- положим, нам нужен банальный мониторинг банальных параметров линукс-серверов, +- стандартных, с парой стандартных же сервисов.Как получить этот результат с жабиксом, понятно - поставить, если не автопоставлен, агента, на все сервера, и либо чохом их добавить в конфигурацию, либо включить автодискавери, она в таких простых случаях даже, наверное, работает.
Остальное доделает стандартный шаблон "linux".Как получить тот же самый результат в случае связки prometheus+grafana+хз что еще понадобится для этой несложной задачки?
Или вы имели в виду - "надо просто купить готовый сервис мониторинга"?
Telegraf->InfluxDB->Grafana
|
Kapacitor
так я не понял - все сотни айтимов мне что - сперва самому описывать, потом самому же вручную сотни графиков по ним рисовать?я вроде задачу обрисовал вполне банальную и вполне понятную - собирать обычную статистику с, предположим, банального линукса, уметь ее показать на сейчас и как оно выглядело неделю назад, уметь поднять шум, если что-то не так, и уметь убрать лишние детали (плохая идея, скажем, начать мерять содержимое всего, найденого в /proc/mounts - мне даром не сдалось "свободное место в /var/lib/docker/shmoker/aabbbcccdddeeeяхз/..." раз в секунду проверять. Его вообще быть в списке метрик не должно - это жабиксоразработчикам на заметку).
Задача такая есть абсолютно у всех, какие бы вы ни были модные-молодежные-aaas'ные-контейнероводы, где-то в самом низу у вас лежит обычная операционная система, и их, обычно, довольно много.
Рисование графиков и сбор статистики не одно и то же. Telegraf по определению работает только в активном режиме, по сему проблема конфигурации не стоит. Ну а графики рисовать дело творческое - хочешь панели с параметрами делай, хочешь размножай, тока лично я предпочитаю иметь меньше графиков и больше алертов, потому как пялится на сотни графиков как-то не реально.
повторяю для больных девопсятиной: эту, кажущуюся вам архисложной задачу, решает заббикс - из коробки, вообще с около-нулем телодвижений (ок, с fs discovery беда-беда, надо либо добавить фильтр на докерные недоразумения, либо вручную потом удалять, запретив заново перепроверять - в зависимости от числа хостов)> потому как пялится на сотни графиков как-то не реально.
ну так это вот ровно потому, что вы используете кривые и неэффективные этажерки из игогошных игрушек не умеющих взаимосвязи между собой, вместо нормальных продуктов (их и кроме жабикса есть, но, увы, подорого)
мне не нужно пялиться на "сотни графиков". Мне пришел алерт - мне нужно понять - это состояние системы действительно неправильное, или это случайность, или мы плавно разгоняемся уже несколько недель.
Для этого обычно достаточно открыть график по нужному айтиму, поглядеть, как оно себя ведет сейчас, как выглядит нормальная картина на это время дня - вчера, месяц, год назад, и для этого ничего не надо создавать вручную.Вручную создаются интегральные картинки, по которым можно угадывать состояние сложных взаимосвязанных систем - это, действительно, сейчас удобнее делать в графане (в жабиксе немое кино уже запретили, а эпоха звукового что-то никак не наступит - кто в теме, поймет) - один чорт, руками, никто кроме меня не знает, что и как нужно нарисовать, чтобы одним взглядом охватить ситуацию.
К алертам это все имеет очень опосредованное отношение - у меня нет алерта "в системе после изменений происходит неведомая хня" - а когда пойдут конкретные алерты на таймауты и исчерпания ресурсов, у нас уже будет проблема, которую видят юзеры, поэтому среагировать надо раньше.
Про Заббикс я знаю, я его всего два месяца как окончательно снёс, после лет 7 использования. Кто кроме Заббикса ничем не пользовался, тому сложно объяснить в двух словах, надо пересказывать всю документацию и описание. А пытаться вместить в категории Заббикса что-то вроде Прометея или TICK я не берусь. Вкратце: хранение данных там собсно никак не связано с графиком, но получение нужного графика(при наличии данных ессно) занимает секунд 10, даже если он вобще никогда не рисовался(если таки вдруг приспичило посмотреть). Конфигурирования на стороне сервера нет(ну за исключением общих вещей), конфигурится только агент. Собсно и сервера-то в TICK нет, есть БД. А насчёт алертов, у меня лично приоритет отдаётся приложениям, потом сервисам и только потом системным делам, так что неведомая хня очень даже сигналит. Переполнения диска случаются очень редко, как-то я умею их предупреждать, впрочем и на них алерт есть, а вот на загрузку процессора почти нету, я алертов такого типа не видел уже лет 5. Ну и по большому счёту метрики вторичны, первичны логи и статусы, чего я лично имею посредством Fluend и SENSU. Статусы в Заббиксе вобще тупо мониторить, это как печенье на БелАЗе возить, ну а с там логами полная фигня, т. е. этажерка светит по-любому. Есть неудобство с массовым изменением в конф. агентов, но коли у вас хренова туча контейнеров, чего-то типа ANSIBLE должно быть. Вы уж не обижайтесь, но Заббикс хорош для тех, кто больше работает пальцами, чем головой, впрочем в наше время это больше ценится.
> надо пересказывать всю документацию и описаниеесли для той ерундовой задачи что я описал (я специально выбрал простую и даже девопу понятную, в реальности у меня полно специфичных), вам нужно пересказывать всю документацию - это означает ровно то самое, что ее решения в виде "поставил агент, нажал одну кнопку в интерфейсе" не существует.
> Вкратце: хранение данных там собсно никак не связано с графиком, но получение нужного
> графика(при наличии данных ессно) занимает секунд 10мы график чем рисуем - непосредственно прометеусом или графаной? Если второе - это нифига не 10 секунд (первое и тем более), ты сперва найди эту метрику в куче. Про tick не скажу, не видел.
Забавно что это уже третий (или четвертый?) вариант этажерки - что как бы говорит нам о качестве изделий.> Переполнения диска случаются очень редко, как-то я умею их предупреждать
вот для того чтобы их _предупреждать_, надо каким-то образом a) получить аларм ДО того как ситуация станет серьезной b) не получить стотыщалармов от систем, где диск или раздел забит на 90% и это совершенно нормальная ситуация, иначе на них перестаешь обращать внимание c) не делать все это вручную пристальным вглядыванием в цифры процентов.
И после этого посмотреть - это случайный хаотический всплеск, место как подожралось, так и освободилось задолго до критичных отметок, мы плавно росли-росли и вот доросли, дальше надо думать что менять в консерватории, пока есть время, или что-то сошло с ума и меры надо принимать немедленно. Вот для этого - нужны графики, причем без всякого дурацкого усреднения "за год".> Вы уж не обижайтесь, но Заббикс хорош для тех, кто больше работает пальцами, чем головой
он и для них конечно тоже хорош (в смысле, там можно поручить обезьянью работу по рисованию скринов техподдержке, потому что она на самом деле достаточно хорошо понимает, что и как должно там быть видно, а никаких специальных умений для этого не требуется. В интерфейс графаны я никого не пущу, они ж там все сломают нафиг), но я в нем крайне редко что-то "пальцами" трогаю - пальцами пишутся скрипты, для собирания необычных метрик, и рисуются шаблоны, раз в сотню лет.
Ну дак а чё тогда обсуждать. Вам же нужно "как Заббикс", а как Забикс уже больше ничего, кроме Заббикса не будет, впрочем и он ещё проживёт лет 7. Так что ваши замечания по этому поводу носят чисто теоретический характер. Разные парадигмы - разные методы. Коли вас устраивает то, что Владышев прописал, ок, в этом есть свои плюсы, а мы пойдём другим путём.
Да, и кстати, вопрос с дисками, где > 90 - норма, в нашем случае решается очень просто, их метрики помечаются метками(типа "90_OK"), дальше вопрос выборки. И ещё, при помощи Графаны испортить метрики не возможно, так что боятся нечего.
Этой затейей колега возился месяцев 5-6 так и не допилил для авс сервисов.Я развернул мониторинг на забиксе для 28 железок в течении рабочего дня без пота и нервов...
"Мыши плакали и кололись, но продолжали писать на PHP".
Хейтить пыху мы не бросим. А если серьезно то писать под удачным релизом продукта написанного на php глупо, поищи лучше новости где нашли уязвимости или где описывают проблемы при разработке на php. А тут сооовсем не в тему.
> поищи лучше новости где нашли уязвимостиЭээ... буковки CVE и XSS точно ничего не говорят?
PS: для небольших задач (или для крупных, но однообразных -- вроде кластеров) хорош collectd, как по мне: сишный, лёгонький, заточенный.
Прочитай ещё раз что я писал, ты неверно меня понял, я указал что человек хейтит пхп не в том месте, уместнее в тех темах где описываются уязвимости или сложности разработки.
Зато теперь ты достиг просветления, и знаешь как одним словом начать хейт в любом месте. :)
…и однопоточный
Заплатите ваши денежки, напишем на том, на чём вы пожелаете.
Ну это же не новый софт. Сейчас его переписать на что-то другое трудозатратно.
Текущая версия просто огонь, хоть и не очень дружит с php 7.2 из-за чего появляются пробелы в графиках, но это можно легко исправить выключив модуль php snmp, но после этого перестают собираться данные ifDescr... которые можно дособрать временно активировав php snmp, который потом надо быстро отключить ))).
так он вроде официально с 7.2 совместим
Это отличный вариант (с быстренько переключить) xD
> Текущая версия просто огоньда-да. божественная хрень. вот прямо начиная с отсутствия кавычек в global_settings.php...
интересно - ей вообще тестовую установку делали перед релизом, или "и так сойдет"?цветовая схема вырвиглазная, на дешманских мониках между темно- и светло-зеленым вообще разницы не видно. надписи разными шрифтами, съезжают-наползают-переползают.
при попытке включить "classic" схему все становится еще хуже.в дизайн теперешние разработчики совершенно не умеют (только не говорите, что это старый решил тряхнуть... стариной). в юзабилити - тоже не очень. полный отстой. древняя 0.8.8h - наше всё.
"Поддерфиваемые Языки"это сообщение полностью характеризует отношение разработчиков к продукту.