Перейти к содержанию

Описание механизмов ограждения

IPMI ограждения

Основной частью отказоустойчивости является настройка ВД виртуальной машины в составе кластера. Важным моментом защиты ВМ, предотвращающим восстановление ВМ на новом сервере до полной остановки её копии на аварийном оборудовании, является управление сервером по IPMI.

Поэтому без получения от сервера сигнала об ограждении (отключении питания или перезагрузке), ВМ не будет перезапущена на новом сервере. Для серверов, не оборудованных IPMI, предусмотрена возможность признания сервера выключенным автоматически, что теоретически может привести к повреждению диска ВМ из-за попыток записи данных на один диск двумя экземплярами ОС ВМ.


Требования к реализации

Реализация механизмов по типу ограждения IPMI основывается на соблюдении ряда требований:

  • серверы в составе кластера должны поддерживать управление по протоколу IPMI v2 (LanPlus) по выделенному сетевому интерфейсу. Если IP-адреса управления находятся в сети, отделенной от сети управления SpaceVM, то в разделе Сети - Сетевые настройки основного меню для контроллера SpaceVM необходимо прописать маршрут для доступа к IP-адресам IPMI-интерфейсов. Также допускается настройка виртуального внутреннего интерфейса для контроллера с доступом в сеть управления IPMI. Это необходимо для возможности опроса серверов в составе кластера на предмет состояния питания сервера;

  • на основании состояния питания сервера (Power On/Off, Cycle) принимается решение о возможности запуска ВМ на другом сервере. Это связано с тем, что, если сервер, на котором выполняется ВМ, не был гарантированно выключен, то возможно, что восстановление работы ВМ на новом сервере начнется до окончания её функционирования на сервере, где произошел сбой.


GFS2 кворум

Реализация механизмов в случае наличия кластерного транспорта типа GFS2:

  • Кворум серверов GFS2 может самостоятельно принимать решение об ограждении узлов.

Подробное описание создания и управления кластерными транспортами.