Стек статистики
Сбор статистики осуществляется через комплект ПО prometheus. На контроллере находится центральный сервис prometheus, который собирает метрики с сервисов node_exporter и domain_exporter с каждого узла.
Примечание
На основе сбора статистики работают сервисы распределения ВМ по узлам, то есть выбор узлов для создания, переноса, восстановления ВМ, поэтому при отказе сервисов данные операции, возможно, будут недоступны.
Команды CLI для работы с сервисами
Для проверки статуса сервисов в CLI есть команды:
-
Проверка статуса прометеуса на контроллере выполняется командой CLI
services list
. -
Проверка статуса прометеуса на узле (сервис node-statistics) выполняется командой CLI
services list
. -
Проверка базы прометеуса на контроллере выполняется командой CLI
system statistics [list|clear|reload|set_storage_time|service]
.
Порты сервисов
-
Центральный прометеус на контроллере: порт 9090.
-
Прометеус статистики узла: порт 9100.
-
Прометеус статистики ВМ: порт 9177.
-
Grafana: порт 3000.
Каталог хранения статистики на контроллере
/var/log/prometheus/metrics2
Просмотр и работа с графиками (Grafana)
Grafana — это платформа для визуализации, мониторинга и анализа данных. В рамках SpaceVM она является дополнительным обособленным инструментом, используемым при необходимости расширенного мониторинга элементов платформы виртуализации. Преднастроенными являются 2 приборные панели: SpaceVM Node DashBoard для мониторинга данных узла и SpaceVM Domains DashBoard для мониторинга данных виртуальных машин. По запросу пользователей команда SpaceVM может добавить базовые настроенные экспортёры прометеуса или другие приборные панели, а также и сам пользователь может добавлять свои панели и источники данных. В дальнейшем планируется автоматическая настройка службы каталогов Grafana при настройке службы каталогов в SpaceVM.
- Запуск/останов Web-интерфейса grafana на контроллере выполняется командами CLI
grafana [start|stop]
. - базовые логин/пароль: admin/admin.
- порт 3000 (пример http://192.168.20.120:3000, где 192.168.20.120 адрес контроллера)
Управление временем хранения статистики узлов на контроллере
Выполняется на контроллере командой CLI system statistics set_storage_time
.
Базовое значение - 360 часов (15 дней).
Расчет размера каталога статистики на контроллере
1 вычислительный узел (ВУ) за 1 день при штатной работе условно займет 150 Мб.
Пример расчета
Для 20 ВУ с временем хранения 168 часов (7 дней) каталог будет занимать примерно 21 Гбайт.
Пример расчета
Для 5 ВУ с временем хранения 360 часов (15 дней) каталог будет занимать примерно 11.2 Гбайт.
Пример расчета
Для 30 ВУ с временем хранения 30 дней каталог будет занимать примерно 135 Гбайт.
Итого примерный размер каталога равен
150 Мбайт * количество ВУ * количество дней
.