Действия при ошибках сервиса статистики
-
Возможна ситуация ошибки хранилища статистики prometheus. Быстрым способом починки является очистка хранилища, перенастройка и перезапуск сервиса. Ниже показана последовательность из 3 действий:
-
system statistics clear
(Очистка БД prometheus. Необходимо выполнить в случае ошибки БД, делаетrm -rf /var/log/prometheus/metrics2/*
) -
system statistics reload
(Перенастройка конфигурации экспортеров prometheus согласно БД контроллера.) -
service restart prometheus
(Перезагрузка сервиса prometheus.) -
Также рекомендуется проверить состояние сервиса статистики (
services status prometheus
) и ошибки сервиса в syslog (ошибки, связанные с prometheus). На контроллере можно проверить работу сервиса статистики, перейдя через браузер по адресуhttp://{controller_ip}:9090/
. Список подключенных экспортеров узлов с их статусами к контроллеру можно увидеть по адресуhttp://{controller_ip}:9090/classic/targets
. На узле можно проверить работу сервисов сбора статистики узла и ВМ, перейдя через браузер по адресамhttp://{node_ip}:9100/
(статистика узла) иhttp://{node_ip}:9177/
(статистика ВМ). -
Можно включить grafana в CLI контроллера через
grafana start
и перейти в браузер по адресуhttp://{controller_ip}:3000/
(admin/admin).