Перейти к содержанию

Стек статистики

Сбор статистики осуществляется через комплект ПО prometheus. На контроллере находится центральный сервис prometheus, который собирает метрики с сервисов node_exporter и domain_exporter с каждого узла.

Примечание

На основе сбора статистики работают сервисы распределения ВМ по узлам, то есть выбор узлов для создания, переноса, восстановления ВМ. Поэтому при отказе сервисов данные операции, возможно, будут недоступны.


Команды CLI для работы с сервисами

Для проверки статуса сервисов:

  • Проверка статуса prometheus на контроллере выполняется командой CLI services list.

  • Проверка статуса prometheus на узле (сервис node-statistics) выполняется командой CLI services list.

  • Проверка базы prometheus на контроллере выполняется командой CLI system statistics.


Порты сервисов

  • Центральный prometheus на контроллере: порт 9090.

  • prometheus статистики узла: порт 9100.

  • prometheus статистики ВМ: порт 9177.

  • Grafana: порт 3000.


Каталог хранения статистики на контроллере

/var/log/prometheus/metrics2


Просмотр и работа с графиками (Grafana)

Grafana — это платформа для визуализации, мониторинга и анализа данных. В рамках SpaceVM она является дополнительным обособленным инструментом, используемым при необходимости расширенного мониторинга элементов платформы виртуализации.

Преднастроенными являются приборные панели: SpaceVM Node Dashboard для мониторинга данных узла и SpaceVM Domains Dashboard для мониторинга данных виртуальных машин и SpaceVM PostgreSQL Dashboard.

По запросу пользователей команда SpaceVM может добавить базовые настроенные экспортёры prometheus или другие приборные панели, а также и сам пользователь может добавлять свои панели и источники данных. В дальнейшем планируется автоматическая настройка службы каталогов Grafana при настройке службы каталогов в SpaceVM.

  • Запуск/останов Web-интерфейса grafana на контроллере выполняется командами CLI grafana [start|stop]. Для просмотра преднастроенных Dashboards необходимо выполнить команды:
    grafana stop
    grafana start
    
  • Базовые логин/пароль: admin/admin.
  • Порт 3000 (пример http://192.168.20.120:3000, где 192.168.20.120 адрес контроллера)

Управление временем хранения статистики узлов на контроллере

Выполняется на контроллере командой CLI system statistics set_storage_time -t [X] -s [X].

[Х] - необходимо указать самостоятельно.

Базовое значение - 360 часов (15 дней).


Расчет размера каталога статистики на контроллере

1 вычислительный узел (ВУ) за 1 день при штатной работе условно займет 150 Мб.

Пример расчета для 20 ВУ с временем хранения 7 дней

Для 20 ВУ с временем хранения 168 часов (7 дней) каталог будет занимать примерно 21 Гбайт.

Пример расчета для 5 ВУ с временем хранения 15 дней

Для 5 ВУ с временем хранения 360 часов (15 дней) каталог будет занимать примерно 11.2 Гбайт.

Пример расчета для 30 ВУ с временем хранения 30 дней

Для 30 ВУ с временем хранения 30 дней каталог будет занимать примерно 135 Гбайт.

Итого примерный размер каталога равен

150 Мбайт * количество ВУ * количество дней.