Перейти к содержанию

Ответы на часто задаваемые вопросы по связности и ограждению

Узел был огражден без причин, в журнале об этом есть запись

Проверить тип примененного ограждения. Ограждение типа VIRTUAL указывает на то, что произошел отказ севера или потеря доступности.

Ограждения типа VIRTUAL не предусматривает выполнение каких-либо действий по выключению узла ни со стороны контроллера, ни со стороны самого узла.

Возможная последовательность событий, которая привела к ограждению:

  • узел перестал быть доступен или отказал;
  • контроллер отметил его сначала недоступным, затем огражденным.

Необходимо проанализировать причину отказа узла или потери доступности:

  • проверить сетевую связность;
  • проверить работоспособность программных модулей;
  • проверить журнал узла на наличие записей об аварийном выключении/перезагрузке.

Узел самостоятельно перезагрузился без видимых причин. В журнале есть запись, что узел ограждался

Примечание

Никакие типы ограждения реализации SpaceVM не предполагают перезагрузку узлов при ограждении.

Проверьте тип ограждения.

  • VIRTUAL или NODE. Узел был перезагружен по причине, не связанной с ограждением узла.
  • При остальных типах ограждения узел должен быть выключен, даже если он должен был быть явно перезагружен.

Возможная последовательность событий появления проблемы:

  • узел начал перезагрузку;
  • контроллер отметил его сначала недоступным, затем огражденным;
  • узел вновь стал доступен;
  • контроллер перевел его в активный.

Необходимо проанализировать причину: перезагрузку мог выполнить кластерный транспорт GFS2 (данное действие не заносится в журнал контроллера). Также необходимо проверить журнал узла на наличие записей о штатной или аварийной перезагрузке.


Пользователь перезагрузил узел, а он был огражден и выключен. В журнале есть запись, что узел оградился

Это является нормальным поведением при типах ограждения IPMI и SSH.

Возможная последовательность событий появления проблемы:

  • узел начал перезагрузку;
  • контроллер отметил его сначала недоступным, затем огражденным;
  • контроллер выключил узел форсированно по IPMI или SSH до момента пока не восстановились программные модули SpaceVM.

Необходимо до перезагрузки узла перевести его в сервисный режим либо включить тип ограждения VIRTUAL.


При настройках сети кластера или при переключении сетевых кабелей узел был огражден и выключен. В журнале есть запись, что узел оградился

Это является нормальным поведением при типах ограждения IPMI и NODE.

Возможная последовательность событий появления проблемы:

  • произошла потеря сетевой связности узла с контроллером;
  • контроллер отметил узел сначала недоступным, затем огражденным;
  • контроллер выключил узел через IPMI, либо узел оградился самостоятельно по типу NODE.

До операций с сетями кластера необходимо перевести узел в сервисный режим либо включить тип ограждения VIRTUAL.