check_ganglia_metric

Скриншот программы:
check_ganglia_metric
Детали программы:
Версия: 2012.02.28
Дата загрузки: 15 Apr 15
Разработчик: Michael T. Conigliaro
Тип распространения: Бесплатная
Популярность: 1

Rating: 3.0/5 (Total Votes: 1)

check_ganglia_metric плагин Nagios, что позволяет оповещений на любой ганглиев метрической.
check_ganglia_metric был сильно вдохновлен check_ganglia_metric.php Владимира Vuksan, но это приходит с рядом улучшений.

Установка

# Пункт установить check_ganglia_metric
...или:
# Easy_install check_ganglia_metric
Конфигурация Ганглии
Если ваш сервер Nagios и Ganglia Мета Демон работают на том же хосте, Вы, наверное, не нужно редактировать gmetad.conf для удаленных подключений с сервера Nagios.
Чтобы соединений из nagios-server.example.com:
trusted_hosts nagios-server.example.com
Чтобы соединениям со всех машин (вероятно, риск для безопасности):
all_trusted на
Тестирование в командной строке
Во-первых, давайте посмотрим, если check_ganglia_metric может общаться с Ганглии Meta Daemon:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com \
& NBSP; - metric_host = host.example.com --metric_name = cpu_idle
Статус Ладно, процессор холостого = 99,3% | cpu_idle = 99,3% ;;;;
«ОК Статус" сообщение означает, что check_ganglia_metric работает. Если у вас возникли проблемы с получением этого на работу, попробуйте еще раз с ведением подробного журнала включено (--verbose), чтобы получить лучшее понимание того, что происходит не так.
Теперь давайте попробуем установка пороговых значений для оповещения:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com \
& NBSP; - metric_host = host.example.com --metric_name = cpu_idle --critical = 99
Статус Критический, процессор холостого = 99,6% | cpu_idle = 99,6% ;; ;; 99
Мы сказали check_ganglia_metric вернуть "критический" статус, если ожидания процессора была больше, чем 99. "Критическая Статус" сообщение означает, что он работал. Обратите внимание, что check_ganglia_metric разбирает диапазоны и пороговые значения в соответствии с официальными руководящими принципами развития плагин Nagios.
Чтобы увидеть полный список опций командной строки с краткими пояснениями, работающих check_ganglia_metric с опцией --help.
Конфигурация Nagios
Во-первых, создать определение команды:
определить команду {
& NBSP; имя_команды check_ganglia_metric
& NBSP; command_line /usr/bin/check_ganglia_metric.py --gmetad_host = gmetad-server.example.com --metric_host = $ HOSTADDRESS $ --metric_name = $ ARG1 $ --warning = $ АРГ2 $ --critical = $ arg3 $
}
Теперь вы можете использовать эту команду в определениях услуг:
определить службы {
& NBSP; service_description процессора простоя - Ганглии
& NBSP; использование some_template
! & NBSP; check_command check_ganglia_metric cpu_idle 0: 20 0: 0!
& NBSP; имя_хоста host.example.com
}
Это будет прекрасно работать, пока что-то пойдет не так с check_ganglia_metric (например, кэш-файл не может быть прочитан / записывать, ганглиях Мета Демон не может быть достигнут, и т.д.). В тот момент, каждая услуга, которая опирается на check_ganglia_metric удастся, возможно, затопив вас с предупреждениями. Мы можем допустить этого путем использования услуг зависимостей.
Первое, что нам нужно, это определение команды для проверки возраста файла:
определить команду {
& NBSP; имя_команды check_file_age
& NBSP; command_line / USR / Lib / Nagios / плагины / check_file_age -f $ ARG1 $ -w $ АРГ2 $ -с $ arg3 $
}
Далее, мы определяем услугу, которая проверяет возраст файла кэша в check_ganglia_metric. Обратите внимание, что для того, чтобы быть по-настоящему эффективной, эта служба должна быть проверена по крайней мере, (желательно больше) чаще, чем всех других проверок, которые полагаются на check_ganglia_metric:
определить службы {
& NBSP; service_description Кэш check_ganglia_metric
& NBSP; использование some_template
120 check_command check_file_age /var/lib/nagios/.check_ganglia_metric.cache 60; & NBSP!!
& NBSP; имя_хоста локальный
& NBSP; check_interval 1
и NBSP; max_check_attempts 1
}
И, наконец, мы создали реальную зависимость службы. Обратите внимание, что я включен в use_regexp_matching Nagios, который позволяет мне использовать регулярные выражения в моих директив. Придерживаясь "- Ganglia" в конце каждой службы, которая опирается на check_ganglia_metric, я могу спасти себя много усилий:
определить servicedependency {
& NBSP; имя_хоста локальный
& NBSP; service_description Кэш check_ganglia_metric
& NBSP; dependent_host_name *.
& NBSP;. dependent_service_description * \ - $ Ганглии
& NBSP; execution_failure_criteria с, р
}
Теперь, если что-то пойдет не так с check_ganglia_metric, только одно предупреждение будет разослано о файле кэша, и все зависимые проверяет услуг будет приостановлено до тех пор, пока исправить проблему, вызвавшую check_ganglia_metric на провал. После того, как проблема будет устранена, вам нужно обновить метку на кэш-файл для того, чтобы поставить "кэш для check_ganglia_metric" сервис обратно в состоянии ОК (что позволит зависимые проверяет сервис продолжать):
& NBSP; сенсорный /var/lib/nagios/.check_ganglia_metric.cache
Советы и хитрости
Это возможно, чтобы получить полный список доступных хостов и метрик, позволяя "более многословным" регистрация (-vv). Так требуется в metric_host и METRIC_NAME вариантов, у вас есть немного о «курице и яйце» проблемы здесь, но это нормально. Просто поставить некоторые фиктивные данные. Плагин будет ошибка в конце с "хозяина / метрики не найден" ошибка, но не раньше, чем свалки кэш:
& NBSP; check_ganglia_metric.py --gmetad_host = gmetad-server.example.com \
& NBSP; - metric_host = манекен манекен --metric_name = -vv

Что нового В этом выпуске:

  • Добавить - -metrics_max_age вариант
  • Merge CHANGELOG.rst в README.rst

Требования

  • Python
  • Nagios

Ограничения

  • Не работает с Python 2.4

Похожие программы

Munin
Munin

18 Feb 15

check_aaccli
check_aaccli

2 Jun 15

aerotools-ng
aerotools-ng

20 Feb 15

Комментарии к check_ganglia_metric

Комментарии не найдены
добавить комментарий
Включите картинки!