Ответы на часто задаваемые вопросы по связности и ограждению
Узел был огражден без причин, в журнале об этом есть запись
Проверьте тип примененного ограждения. Ограждение типа VIRTUAL указывает на то, что произошел отказ севера или потеря доступности с ним.
Ограждения типа VIRTUAL не предусматривает выполнение каких-либо действий по выключению узла ни со стороны контроллера, ни со стороны самого узла.
Возможная последовательность событий, приведшая к ограждению:
- узел перестал быть доступен или отказал;
- контроллер пометил его сначала недоступным, затем огражденным.
Необходимо искать причину отказа узла или потери доступности:
- проверить сетевую связность;
- проверить работоспособность программных модулей;
- проверить логи узла на наличие записей об аварийном выключении/перезагрузке.
Узел самостоятельно перезагрузился без видимых причин. В журнале есть запись, что узел ограждался
Никакие типы ограждения реализации SpaceVM не предполагают перезагрузку узлов при ограждении. Проверьте какой у вас тип ограждения. Если VIRTUAL или NODE, то это значит, что узел был перезагружен по причине, несвязанной с ограждением узла. При остальных типах ограждения узел должен быть выключен, даже если он должен был быть явно перезагружен. Последовательность событий может быть следующая: сначала узел начал перезагрузку, затем контроллер пометил его сначала недоступным, затем огражденным. Затем узел опять стал доступен, и контроллер его перевел в активный. Необходимо искать причину перезагрузки узла: проверить логи узла на наличие записей о штатной или аварийной перезагрузке.
Пользователь перезагрузил узел, а он был огражден и выключен. В журнале есть запись, что узел оградился
Это может быть нормальным поведением при типах ограждения IPMI и SSH. Последовательность событий может быть следующая: узел начал перезагрузку, контроллер пометил его сначала недоступным, затем огражденным. Далее контроллер выключил узел форсированно по IPMI или по SSH до момента пока не восстановились программные модули SpaceVM. Необходимо до перезагрузки узла перевести его в сервисный режим либо включить тип ограждения VIRTUAL.
При настройках сети кластера или при переключении сетевых кабелей узел был огражден и выключен. В журнале есть запись, что узел оградился
Это может быть нормальным поведением при типах ограждения IPMI и NODE. Последовательность событий может быть следующая: после потери сетевой связности узла с контроллером контроллер пометил узел сначала недоступным, затем огражденным и выключил через IPMI, либо узел самооградился по типу NODE. Необходимо до операций с сетями кластера перевести его в сервисный режим либо включить тип ограждения VIRTUAL.