Ответы на часто задаваемые вопросы по связности и ограждению
Узел был огражден без причин, в журнале об этом есть запись
Проверить тип примененного ограждения. Ограждение типа VIRTUAL указывает на то, что произошел отказ севера или потеря доступности.
Ограждения типа VIRTUAL не предусматривает выполнение каких-либо действий по выключению узла ни со стороны контроллера, ни со стороны самого узла.
Возможная последовательность событий, которая привела к ограждению:
- узел перестал быть доступен или отказал;
- контроллер отметил его сначала недоступным, затем огражденным.
Необходимо проанализировать причину отказа узла или потери доступности:
- проверить сетевую связность;
- проверить работоспособность программных модулей;
- проверить журнал узла на наличие записей об аварийном выключении/перезагрузке.
Узел самостоятельно перезагрузился без видимых причин. В журнале есть запись, что узел ограждался
Примечание
Никакие типы ограждения реализации SpaceVM не предполагают перезагрузку узлов при ограждении.
Проверьте тип ограждения.
- VIRTUAL или NODE. Узел был перезагружен по причине, не связанной с ограждением узла.
- При остальных типах ограждения узел должен быть выключен, даже если он должен был быть явно перезагружен.
Возможная последовательность событий появления проблемы:
- узел начал перезагрузку;
- контроллер отметил его сначала недоступным, затем огражденным;
- узел вновь стал доступен;
- контроллер перевел его в активный.
Необходимо проанализировать причину: перезагрузку мог выполнить кластерный транспорт GFS2 (данное действие не заносится в журнал контроллера). Также необходимо проверить журнал узла на наличие записей о штатной или аварийной перезагрузке.
Пользователь перезагрузил узел, а он был огражден и выключен. В журнале есть запись, что узел оградился
Это является нормальным поведением при типах ограждения IPMI и SSH.
Возможная последовательность событий появления проблемы:
- узел начал перезагрузку;
- контроллер отметил его сначала недоступным, затем огражденным;
- контроллер выключил узел форсированно по IPMI или SSH до момента пока не восстановились программные модули SpaceVM.
Необходимо до перезагрузки узла перевести его в сервисный режим либо включить тип ограждения VIRTUAL.
При настройках сети кластера или при переключении сетевых кабелей узел был огражден и выключен. В журнале есть запись, что узел оградился
Это является нормальным поведением при типах ограждения IPMI и NODE.
Возможная последовательность событий появления проблемы:
- произошла потеря сетевой связности узла с контроллером;
- контроллер отметил узел сначала недоступным, затем огражденным;
- контроллер выключил узел через IPMI, либо узел оградился самостоятельно по типу NODE.
До операций с сетями кластера необходимо перевести узел в сервисный режим либо включить тип ограждения VIRTUAL.