не удалось добавить узел munin в мониторинг

Я пытаюсь настроить несколько новых хостов в munin для мониторинга. Почему-то этого не происходит!

Вот что я пробовал до сих пор.

На сервере munin, который уже отслеживает несколько других хостов, я добавил нужный мне хост в /etc/munin/munin.conf.

[db1]
    address   10.10.10.25 # <- obscured the real IP address 
    use_node_name yes

И на хосте db1 я установил это в /etc/munin/munin-node.conf

host_name  db1.example.com
allow ^127\.0\.0\.1$
allow ^10\.10\.10\.26$
allow ^::1$
port 4949

И я обязательно перезапустил службы на обеих машинах.

С хоста мониторинга я могу подключиться по телнету к новому серверу, который я хочу отслеживать, через порт munin:

[root@monitor3:~] #telnet db1.example.com 4949
Trying 10.10.10.26...
Connected to db1.example.com.
Escape character is '^]'.
# munin node at db1.example.com

Подождите несколько минут.. и ничего! Новый сервер не будет отображаться на панели управления munin на хосте мониторинга munin.

В журнале /var/log/munin/munin-update.log на хосте db1 (тот, который я пытаюсь отслеживать) я нахожу это:

2015/11/30 03:20:02 [INFO] starting work in 14199 for db1/10.10.10.26:4949.

2015/11/30 03:20:02 [FATAL] Socket read from db1 failed.  Terminating process. at /usr/share/perl5/vendor_perl/Munin/Master/UpdateWorker.pm line 254.

2015/11/30 03:20:02 [ERROR] Munin::Master::UpdateWorker<db1;db1> died with '[FATAL] Socket read from db1 failed.  Terminating process. at /usr/share/perl5/vendor_perl/Munin/Master/UpdateWorker.pm line 254.

Что здесь может происходить? И как я могу это решить?


person bluethundr    schedule 01.12.2015    source источник
comment
Проверить, доступен ли порт?   -  person Somnath Muluk    schedule 15.02.2016
comment
Как насчет журналов узла? Они что-нибудь говорят об этом?   -  person muru    schedule 16.02.2016
comment
Джон Смит, вы поймали меня на попытке скрыть IP-адреса. Я просто исправил сообщение, чтобы оно имело логический смысл. Somnath Muluk — порты доступны на обоих хостах: monitor3: [root@monitor3:~] #lsof -i :4949 КОМАНДА PID ПОЛЬЗОВАТЕЛЬ ТИП FD УСТРОЙСТВО РАЗМЕР/ВЫКЛ ИМЯ УЗЛА munin-nod 31800 root 5u IPv6 31820297 0t0 TCP *:munin (СЛУШАТЬ) db1: [root@db1:~] #lsof -i :4949 КОМАНДА PID ПОЛЬЗОВАТЕЛЬ ТИП FD УСТРОЙСТВО РАЗМЕР/ВЫКЛ ИМЯ УЗЛА munin-nod 14164 root 5u IPv6 26604748 0t0 TCP *:munin (СЛУШАТЬ) muru журнал, который я разместил с хоста db1, который я пытаюсь отслеживать.   -  person bluethundr    schedule 16.02.2016
comment
@bluethundr, это очень удивительно. Журнал - это то, что я ожидал увидеть на мастере (в данном случае monitor3). Обратите внимание, что написано «начало работы…» для node/ip:port. Действительно, munin-update.log будет на мастере, а не на узле.   -  person muru    schedule 16.02.2016


Ответы (1)


Поскольку вы уже убедились, что с вашим сетевым подключением все в порядке, в качестве первого шага расследования я, безусловно, упростил бы файл munin-node.conf. В настоящее время у вас есть:

host_name  db1.example.com
allow ^127\.0\.0\.1$
allow ^10\.10\.10\.26$
allow ^::1$
port 4949

Из них я бы убрал:

  • host_name (вероятно, избыточно.)
  • Адрес петли IPv6. (Я не думаю, что вам это нужно, но вы можете добавить его позже, если вам это нужно)
  • Адрес петли IPv4. (то же, что и выше)

Если это все еще не работает, вы можете полностью устранить любую проблему с конфигурацией allow, заменив прямые IP-адреса на:

cidr_allow 10.10.10.0/24

Это позволит подключаться с полного диапазона IP-адресов, если ваш хост db1 подключается с другого IP-адреса.

person Gergely Bacso    schedule 16.02.2016
comment
Привет, хорошо, я попробовал все, что вы упомянули, кроме cidr_allow. Так как я знаю, с какого IP-адреса исходит мой сервер munin. Моя конфигурация на db1 выглядит так: [root@db1:/etc/munin] #egrep -v ^$|^# munin-node.conf log_level 4 log_file /var/log/munin-node/munin-node.log pid_file /var/run/munin/munin-node.pid background 1 setsid 1 пользователь корневая группа root файл_игнорирования [\#~]$ файл_игнорирования DEADJOE$ файл_игнорирования \.bak$ файл_игнорирования %$ файл_игнорирования \.dpkg-(tmp|new|old| dist)$ ignore_file \.rpm(save|new)$ ignore_file \.pod$ allow ^54\.174\.234\.136$ host * port 4949 И я перезапускал munin как на сервере, так и на клиенте - person bluethundr; 17.02.2016
comment
В порядке. Тогда несколько вещей: я бы все равно попытался использовать cidr_allow только для целей отладки. Параметр allow зависит от регулярного выражения. Так что могут быть драконы. И какая у тебя версия мунина? И наконец: вы забыли анонимизировать свой IP в предыдущем комментарии. - person Gergely Bacso; 17.02.2016
comment
Хорошо спасибо. Я попробовал cidr_allow в конфигурации munin-node на db1. Я попробовал сначала с диапазоном IP-адресов сервера munin, а затем снова с cidr_allow 0.0.0.0/24. Хотя я не уверен, что это разрешено: - person bluethundr; 17.02.2016
comment
Это моя конфигурация munin-node на db1 при моей последней попытке: [root@db1:/etc/munin] #egrep -v "^$|^#" munin-node.conf ` log_level 4` ` log_file /var/log/munin-node/munin-node.log` pid_file /var/run/munin/munin-node.pid ` background 1` `setsid 1` user root group root ignore_file [\#~]$ ` ignore_file DEADJOE$` ` ignore_file \.bak$` ignore_file %$ ` ignore_file \.dpkg-(tmp|new|old|dist)$` ignore_file \.rpm(save|new)$ ignore_file \.pod$ allow ^10\.10\.10\.26$ cidr_allow 0.0.0.0/24 host * port 4949 - person bluethundr; 17.02.2016
comment
Я переустановил его на свой компьютер, но не смог воспроизвести вашу ошибку. Итак, последнее предположение: в вашем munin.conf вы ссылаетесь на свой хост с простым именем хоста (db1), но он идентифицирует себя с полным доменным именем (db1.example.com). Это то, к чему мунин может быть чувствителен. Не могли бы вы также изменить munin.conf, чтобы использовать полное доменное имя? - person Gergely Bacso; 17.02.2016
comment
Я попытался изменить имя хоста в munin.conf на сервере на полное доменное имя хоста. Однако это, похоже, не имело никакого эффекта. Я думаю, что на данный момент проблема с сервером. Я все еще вижу эти строки в журнале munin-update, который у меня есть в OP: - person bluethundr; 17.02.2016
comment
2016/02/17 03:20:02 [INFO] starting work in 22254 for db1/10.10.10.25:4949. 2016/02/17 03:20:02 [FATAL] Socket read from db1 failed. Terminating process. at /usr/share/perl5/vendor_perl/Munin/Master/UpdateWorker.pm line 254. 2016/02/17 03:20:02 [ERROR] Munin::Master::UpdateWorker<db1;db1> died with '[FATAL] Socket read from db1 failed. Terminating process. at /usr/share/perl5/vendor_perl/Munin/Master/UpdateWorker.pm line 254. Я думаю, что ответ должен относиться к этой ошибке. Я просто не знаю, как это решить. - person bluethundr; 17.02.2016
comment
Socket read from db1 failed предполагает, что ваше изменение полного доменного имени не было принято во внимание. Он должен читаться как Socket read from db1.example.com, если изменение было применено правильно. - person Gergely Bacso; 17.02.2016
comment
Я думаю, что я смотрел слишком высоко в журналах на тот последний пост. Следующее, что я заметил после изменения имени на полное доменное имя, это то, что это происходит в журналах: pastebin.ca/3375467 не видел никаких ошибок в этом выводе. Но я до сих пор не вижу, чтобы узел появился в munin. - person bluethundr; 17.02.2016
comment
Судя по опубликованному вами лог-сообщению, теперь у вас есть правильное подключение к серверу узла. Это хороший знак. Плагины сообщают о предупреждениях о некоторых отсутствующих полях. Если вы уверены, что у вас нет готовых графиков (отметьте /var/cache/munin/www/index.html, чтобы быть уверенным), проверьте, пожалуйста, munin-html.log. - person Gergely Bacso; 17.02.2016
comment
Извините ребята. Я очень устал заниматься этой проблемой. Мне показалось, что проблема была на стороне сервера, а не клиента. Поэтому я попытался остановить проблемный сервер munin. Запустил новый на AWS. Снова установил munin и вуаля! Проблемные клиенты стали появляться на панели инструментов munin. Ламе В знай. Но эй, это работает! ;) Извините ребята. Но награда остается с вашим покорным слугой. Однако я ценю ваши мысли и вклад. Не пытаясь быть мудаком. Но я решил проблему. - person bluethundr; 18.02.2016
comment
Я наткнулся на ваше электронное письмо, отправленное в декабре, так что оно вполне понятно. :) Мне все еще интересно, в чем была проблема, но у вас все заработало, это самое главное. - person Gergely Bacso; 18.02.2016
comment
Круто спасибо Gergely. Я ценю ваше понимание. У меня есть пара других проблем с munin, о которых я могу опубликовать при переполнении стека. Список мунинов не получил столько помощи, сколько хотелось бы. Я предполагаю, может быть, это не то, что торгуют в этот момент? - person bluethundr; 18.02.2016
comment
Похоже, его слава медленно угасает: google.com/trends/explore#q=munin< /а> ... - person Gergely Bacso; 18.02.2016
comment
да чувак, жаль. Munin — один из моих любимых старых резервных инструментов для построения графиков RRD. Я буду продолжать использовать его, несмотря на отсутствие популярности! - person bluethundr; 18.02.2016