|
|
|
Мониторинг сервера
|
|||
|---|---|---|---|
|
#18+
Какие программы можно использовать для мониторинга работы сервера на Linux? Нужно измерять и хранить (например в БД или файле) данные о: 1. Загрузке процессора (раз в минуту или 5 минут) 2. Нагрузке на файловую систему 3. Мониторинг сервисов (время последнего перезапуска) 4. Частота перезагрузок сервера (время последней перезагрузки) 5. Считывание SMART данных с винчестера 6. Загрузка сети Нужно все это делать постоянно, а не разово и желательно на удаленной машине просматривать это графически через web-интерфейс. С помощью каких программ это возможно? Что можно реализовать с помощью Nagios? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.11.2006, 08:05:51 |
|
||
|
Мониторинг сервера
|
|||
|---|---|---|---|
|
#18+
posttКакие программы можно использовать для мониторинга работы сервера на Linux? Нужно измерять и хранить (например в БД или файле) данные о: 1. Загрузке процессора (раз в минуту или 5 минут) 2. Нагрузке на файловую систему 3. Мониторинг сервисов (время последнего перезапуска) 4. Частота перезагрузок сервера (время последней перезагрузки) 5. Считывание SMART данных с винчестера 6. Загрузка сети Нужно все это делать постоянно, а не разово и желательно на удаленной машине просматривать это графически через web-интерфейс. С помощью каких программ это возможно? Что можно реализовать с помощью Nagios? nagios AppManager Oracle Enterprise Manager (серверы он тоже мониторит) Cricket Сети я мониторю с snmpstat.sf.net но тут тулзов хватает ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.11.2006, 08:44:52 |
|
||
|
Мониторинг сервера
|
|||
|---|---|---|---|
|
#18+
Господа, а просто прикрутить MRTG к SNMP сервису мало? (может я что упустил?) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.11.2006, 13:34:14 |
|
||
|
Мониторинг сервера
|
|||
|---|---|---|---|
|
#18+
ОсяГоспода, а просто прикрутить MRTG к SNMP сервису мало? (может я что упустил?) Насколько понимаю, MRTG+SNMP позволяет мониторить загрузку сети (канала) или можно по SNMP мониторить что-то еще и если можно дайте ссылку на описание как это делается. Вообще в виде графиков mrtg очени неплохо бы видеть перечисленные выше параметры или часть из них. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.11.2006, 16:59:52 |
|
||
|
Мониторинг сервера
|
|||
|---|---|---|---|
|
#18+
Сюда: http://www-128.ibm.com/developerworks/aix/library/au-analyze_aix/ Не пугайся слова "AIX", там и для Linux-а есть... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.11.2006, 19:07:11 |
|
||
|
Мониторинг сервера
|
|||
|---|---|---|---|
|
#18+
postt ОсяГоспода, а просто прикрутить MRTG к SNMP сервису мало? (может я что упустил?) Насколько понимаю, MRTG+SNMP позволяет мониторить загрузку сети (канала) или можно по SNMP мониторить что-то еще и если можно дайте ссылку на описание как это делается. Вообще в виде графиков mrtg очени неплохо бы видеть перечисленные выше параметры или часть из них. Надо MIB посмотреть, сеть всего лишь дефолтный параметр. К примеру у меня есть девайс в, котором можно мерять температуру, загрузку CPU, память и т.п. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.11.2006, 14:45:09 |
|
||
|
Мониторинг сервера
|
|||
|---|---|---|---|
|
#18+
zabbix netxms ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.11.2006, 11:24:42 |
|
||
|
Мониторинг сервера
|
|||
|---|---|---|---|
|
#18+
посмотрел zabbix opennms и nagios последний стабильнее, несморя на свою архаичность ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.12.2006, 23:01:27 |
|
||
|
Мониторинг сервера
|
|||
|---|---|---|---|
|
#18+
Осяпосмотрел zabbix opennms и nagios последний стабильнее, несморя на свою архаичностьВ смысле стабильнее? А кто нестабилен? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.12.2006, 09:04:52 |
|
||
|
Мониторинг сервера
|
|||
|---|---|---|---|
|
#18+
Осяпосмотрел zabbix opennms и nagios последний стабильнее, несморя на свою архаичность не знаю, что такое zabbix. opennms пользуем несколько лет. вполне стабилен. кроме того, для любителей nagios ============================ 2.1. Changes in OpenNMS 1.2.8 2.1.1. New Features Nagios Support Even though OpenNMS was started only a couple of years after Net-Saint, everywhere we go people want to compare us to Nagios. While we compete with Nagios, they aren't our enemy, and if anything they help drive us to build a better product. Since the goal of OpenNMS is to become a platform, we hope to integrate with as many tools as possible. In this release we have back-ported the Nagios support that was introduced into the development release last year. There are two ways to use OpenNMS with Nagios. Using the NRPE Plugin and Monitor The Nagios Remote Plugin Executor (NRPE) allows Nagios check scripts to be run on remote systems. With the NRPE agent correctly installed on a device, OpenNMS is now able to query that agent and run a particular command. If the command executes without errors, the NRPE service is considered "up", otherwise it is considered "down". No parameters are passed with the NRPE query, just the name of the command to run. This is useful if it is desired to have different thresholds configured on different devices. For example, if the "check disk" query is run, it may pass if the disk is less that 90% utilized on some systems, but it may be less than 80% on others. No change needs to be made to OpenNMS since the thresholds are set at the agent level. ... Using the NSClient Plugin and Monitor The Net-Saint Client provides a method from monitoring statistics on a Windows server. As with NRPE, OpenNMS can query the remote agent and based upon its response mark the service as being "up" or "down". To configure monitoring the space on the "C:" drive, first edit capsd-configuration.xml as follows: ============================ ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.12.2006, 10:44:39 |
|
||
|
Мониторинг сервера
|
|||
|---|---|---|---|
|
#18+
a398 Осяпосмотрел zabbix opennms и nagios последний стабильнее, несморя на свою архаичность не знаю, что такое zabbix. Это система мониторинга (gpl), умеет простые icmp, snmp (1,2,3), есть собственный агент (скомпилен под "все" операционки). Собираемые значения (и их тренды) сохраняются в бд (mysql, pg, oracle). Поэтому имеем во первых очень умные триггера, плюс графики (т.е cacti, mrtg не нужны). Все настройки через веб-интерфейс, есть шаблоны (создаем шаблон Сиско_т, добавляем в него датчики, триггера, затем добавляем хост(роутер), говорим шаблон такой-то, все, три клика мышой). Агент позволяет очень многое, плюс позволяет расширение собственными скриптами. Есть maps. Есть зачатки подсчета SLA. Вообщем дофига чего. Про нестабильность это вообще непонятно. У меня на сусе серверная часть работает по четыре месяца, только из-за обновлений перегружаю. У меня есть например есть такой триггер {exchange_t:smtp.min(1200)}=1&{exchange_t:pop.max(1200)}<1 , в переводе на руский это шаблон exchange_t срабатывает если pop3 ни разу не ответил за последние 1200s, а smtp всегда отвечал за последние 1200s. По срабатыванию этого триггера на хостах входящих в группу EMAIL почту получают люди входящие в группу пользователей EMAIL_ADMINS (причем только с 8:30 до 17:30, мне похер что в нерабочее время pop3 не работает). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.12.2006, 12:25:03 |
|
||
|
Мониторинг сервера
|
|||
|---|---|---|---|
|
#18+
Да еще в бд заббикса 48 таблиц. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.12.2006, 12:32:19 |
|
||
|
Мониторинг сервера
|
|||
|---|---|---|---|
|
#18+
Журавлев Денис Собираемые значения (и их тренды) сохраняются в бд (mysql, pg, oracle). Поэтому имеем во первых очень умные триггера, плюс графики (т.е cacti, mrtg не нужны). Что-то мне не кажется хорошим решением отказ от rrd в пользу баз. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.12.2006, 11:12:59 |
|
||
|
Мониторинг сервера
|
|||
|---|---|---|---|
|
#18+
a398Что-то мне не кажется хорошим решением отказ от rrd в пользу баз.С одной стороны это из пушки по воробью, но с другой получаем все плюшки sql. У заббикса все настройки вообще все хранится в sql, поэтому никаких конфигов, никаких рестартов. Меня например не напрягает абсолютно: nag:~ # cat zabbix_server.log |grep Deleted |tail 013990:20061208:011824 Deleted 11534 records from history and trends 013990:20061208:021927 Deleted 11610 records from history and trends 013990:20061208:032030 Deleted 11669 records from history and trends 013990:20061208:042133 Deleted 11789 records from history and trends Это конечно немного -- 3 значения в секунду, но судя по нагрузке точно также я бы не заметил и 30 и 300. На форуме заббикса я видел сообщения людей у которых удалялось 400 тыс. значений каждый час. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.12.2006, 11:54:28 |
|
||
|
Мониторинг сервера
|
|||
|---|---|---|---|
|
#18+
Журавлев Денис a398Что-то мне не кажется хорошим решением отказ от rrd в пользу баз.С одной стороны это из пушки по воробью, но с другой получаем все плюшки sql. речь скорее о том, как быстро можно получить нужную картинку. в случае с rrd можно за несколько секунд (в opennms с помощью мышки) от годового графика детализироваться до нужного интервала времени (до нужных нескольких дней, часов). подобное, при хранении в sql-базе, думается мне будет с пребольшими тормозами. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.12.2006, 14:43:28 |
|
||
|
Мониторинг сервера
|
|||
|---|---|---|---|
|
#18+
a398речь скорее о том, как быстро можно получить нужную картинку. в случае с rrd можно за несколько секунд (в opennms с помощью мышки) от годового графика детализироваться до нужного интервала времени (до нужных нескольких дней, часов). подобное, при хранении в sql-базе, думается мне будет с пребольшими тормозами.Это как раз не проблема, тренды хранятся (дневные, месячные, недельные), поэтому все мнгновенно, другое дело в у заббикса вебинтерфейс, там мышкой пока не потыкаешь. Удаление устаревших данных и трендов -- вот проблема, которой нет у rrd. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.12.2006, 16:58:29 |
|
||
|
Мониторинг сервера
|
|||
|---|---|---|---|
|
#18+
Еще конечно не очень удобно через в заббикс создавать первоначальные шаблоны, есть у 8-ми портового san свича десять видов ошибок, значит придется создать 80 похожих датчиков и 80 очень похожих триггеров. С другой стороны можно скриптом с помощью sql заинсертить в таблицу. К счастью только один раз. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.12.2006, 17:07:14 |
|
||
|
Мониторинг сервера
|
|||
|---|---|---|---|
|
#18+
Журавлев Денис a398речь скорее о том, как быстро можно получить нужную картинку.Это как раз не проблема, тренды хранятся (дневные, месячные, недельные), т.е., как я могу предположить, там хранятся еще и некие снапшоты за день, неделю и месяц? а если хочешь получить за полтора дня, четыре месяца, восемь часов? относительно хранения в базе вообще всего что только возможно, вплоть до конфигов. текстовые конфиги едва ли труднее генерить, чем sql-крипты по засовыванию настроек в базу. и совсем не обязательно при этом что-то глобально перегружать. opennms - это куча модулей, а не один общий бинарь как в заббиксе. из недостатков opennms. считается прожорлив. писан на яве. в ранних версиях, например, были проблемы с незакрытием сокетов. для рисования своих красивых графиков надо разобраться с snmp (а теперь еще и с nagios) и rrdgraph. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.12.2006, 09:31:00 |
|
||
|
Мониторинг сервера
|
|||
|---|---|---|---|
|
#18+
a398 т.е., как я могу предположить, там хранятся еще и некие снапшоты за день, неделю и месяц? а если хочешь получить за полтора дня, четыре месяца, восемь часов?Zabbix собирает значения с той периодичностью с какой укажешь, 10sec, 110sec, 3601sec и хранит столько сколько укажешь например 60 дней. Дальше заббикс считает тренд --, среднее, макс и мин, значение за 3 часа, за день, за неделю, месяц, и хранит тренды сколько укажешь (365 дней к примеру). Т.е. спустится в детали фигня вопрос. Другое дела вебинтерфейс неудобен. Но графики это вторично, мониторит он сам, тригерами, админ отдыхает. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.12.2006, 15:56:38 |
|
||
|
|

start [/forum/topic.php?fid=25&msg=34182813&tid=1488696]: |
0ms |
get settings: |
8ms |
get forum list: |
14ms |
check forum access: |
2ms |
check topic access: |
2ms |
track hit: |
70ms |
get topic data: |
5ms |
get forum data: |
1ms |
get page messages: |
32ms |
get tp. blocked users: |
1ms |
| others: | 249ms |
| total: | 384ms |

| 0 / 0 |
