Стек журналирования
Сбор журналов осуществляется с помощью комплекта ПО td-agent + Loki + Grafana. На контроллере находится центральный сервис Loki, который собирает журналы с сервисов td-agent с каждого узла. Сервис td-agent в свою очередь собирает журналы CLI, супервизора узла, Web-сервиса узла, супервизора контроллера, Web-сервиса контроллера, системные журналы. Grafana служит для удобного просмотра в одном месте всех журналов всех узлов.
Команды CLI для работы с сервисами
Для проверки статуса сервисов:
-
Проверка статуса loki на контроллере выполняется командой CLI
services list
. -
Проверка статуса td-agent на узле выполняется командой CLI
services list
.
Подробности настройки и фильтрации смотрите на официальном сайте Grafana.
Каталог хранения журналов на контроллере
/var/log/loki/
Управление временем хранения журналов узлов на контроллере
Выполняется на контроллере командой CLI loki [storage_retention|set_storage_retention]
.
Базовое значение - 2 недели.
Расчет размера каталога журналов узлов на контроллере
1 вычислительный узел (ВУ) за 1 день при штатной работе условно займет 200 Мбайт.
Пример расчета для 20 ВУ с временем хранения 7 дней
Для 20 ВУ с временем хранения 7 дней каталог будет занимать примерно 28 Гбайт.
Пример расчета для 5 ВУ с временем хранения 15 дней
Для 5 ВУ с временем хранения 30 дней каталог будет занимать примерно 30 Гбайт.
Пример расчета для 30 ВУ с временем хранения 30 дней
Для 30 ВУ с временем хранения 30 дней каталог будет занимать примерно 180 Гбайт.
Итого примерный размер каталога равен
200 Мбайт * количество ВУ * количество дней
.
Очистка журналов loki
Очистка журналов loki на контроллере выполняются командой CLI loki clear
.