Почему Carbon не записывает точки данных Whisper в соответствии с обновленной схемой хранения?

Моя исходная конфигурация схемы углеродного хранилища была установлена ​​на 10 с: 1 нед, 60 с: 1 год и месяцами работала нормально. Я недавно обновил его до 1s: 7d, 10s: 30d, 60s, 1y. Я изменил размер всех моих файлов шепота, чтобы отразить новую схему хранения, используя следующий фрагмент bash:

collectd_dir="/opt/graphite/storage/whisper/collectd/"
retention="1s:7d 1m:30d 15m:1y"

find $collectd_dir -type f -name '*.wsp' | parallel whisper-resize.py \
--nobackup {} $retention \;

Я подтвердил, что они были обновлены с помощью Whisper-info.py с правильным хранением и точками данных. Я также подтвердил, что схема хранилища действительна, используя сценарий проверки схемы хранилища.

Службы углеродного кэша {1..8}, углеродного ретранслятора, углеродного агрегатора и сбора были остановлены перед изменением размера шепотом, а затем были запущены после завершения изменения размера.

Однако при проверке на панели управления Grafana я вижу пустые графики с правильными точками данных (в секунду, но без данных) на диаграммах подключаемых модулей collectd; но с графиками, которые предоставляют данные, он показывает данные и точки данных каждые 10 с (старое удержание) вместо 1 с.

/Var/log/carbon/console.log выглядит хорошо, а все собранные файлы шепота имеют доступ углеродного пользователя, поэтому при записи нет проблем с отказом в разрешении.

При запуске ngrep на порту 2003 на графитовом хосте я вижу подключения к реле вместе с отправляемыми метриками. Затем эти метрики передаются в пул из 8 кешей на их порт pickle.

Кто-нибудь еще сталкивался с подобными проблемами или может помочь мне диагностировать проблему дальше? Я что-то здесь пропустил?


person hobbes    schedule 12.07.2019    source источник


Ответы (1)


Так что мне потребовалось некоторое время, чтобы понять это. Он не имел ничего общего с файлом local_settings.py, как некоторые из старых ответов, но имел отношение к функции Interval в collectd.conf.

Во многих старых ответах упоминалось, что вам нужно включить «Интервал 1» в каждый контейнер плагина. Думаю, это было бы здорово благодаря контролю над каждой метрикой. Однако это создало бы ошибки конфигурации в моих журналах и нарушило бы метрику. Установка «Интервал 1» на верхнем уровне конфигурации решила мои проблемы.

person hobbes    schedule 16.07.2019
comment
Итак, определяем Интервал 1 в plugin_graphite из Collectd? - person hariszaman; 26.01.2021