Перейти к содержанию

Действия при ошибках сервиса статистики

  • Возможна ситуация ошибки хранилища статистики prometheus. Быстрым способом починки является очистка хранилища, перенастройка и перезапуск сервиса. Ниже показана последовательность из 3 действий:

  • system statistics clear (Очистка БД prometheus. Необходимо выполнить в случае ошибки БД, делает rm -rf /var/log/prometheus/metrics2/*)

  • system statistics reload (Перенастройка конфигурации экспортеров prometheus согласно БД контроллера.)

  • service restart prometheus (Перезагрузка сервиса prometheus.)

  • Также рекомендуется проверить состояние сервиса статистики (services status prometheus) и ошибки сервиса в syslog (ошибки, связанные с prometheus). На контроллере можно проверить работу сервиса статистики, перейдя через браузер по адресу http://{controller_ip}:9090/. Список подключенных экспортеров узлов с их статусами к контроллеру можно увидеть по адресу http://{controller_ip}:9090/classic/targets. На узле можно проверить работу сервисов сбора статистики узла и ВМ, перейдя через браузер по адресам http://{node_ip}:9100/ (статистика узла) и http://{node_ip}:9177/ (статистика ВМ).

  • Можно включить grafana в CLI контроллера через grafana start и перейти в браузер по адресу http://{controller_ip}:3000/ (admin/admin).