Восстановление работы репликации
Действия при нарушении работы основного контроллера
При прекращении работы основного контроллера или с отсутствии связи основного контроллера и остальных серверов SpaceVM, для обеспечения полного функционирования инфраструктуры SpaceVM необходимо выполнить перевод резервного контроллера в основной.
После перевода резервного контроллера в основной будет восстановлена работа системы очередей постановки задач, а также работа сервисов Высокая доступность и Живой перенос.
-
Перевести резервный контроллер с ролью
slave
в основной с рольюmaster
, выполнив следующую команду в CLI резервного контроллера:controller role master
Внимание
Во избежание потери данных после восстановления работы аварийного контроллера недопустимо его использование в роли
master
. После восстановления аварийного контроллера необходимо отключить его от сети. -
В изолированном от сети состоянии перевести аварийный контроллер в режим резервного (
slave
), выполнив команду в CLI этого контроллера:controller role slave
После выполнения команды статус репликации перейдёт в состояние
inactive
из-за отсутствия связи сmaster
, а база данных переключится в режимread-only
. -
После успешного перевода в
slave
восстановить сетевую доступность контроллера. -
Повторно выполнить команду перевода в
slave
для активации репликации и убедиться, что статус изменился наactive
:controller role slave
Восстановление репликации из состояния inactive
Для восстановления работоспособности репликации находящейся в
состоянии inactive
рекомендуется выполнить следующие
действия:
-
Отключить связанность между контроллерами следуя инструкции.
Внимание
Команды по отключению репликации необходимо выполнить на обоих контроллерах, сначала на основном (
master
), затем на резервном (slave
). -
Восстановить связанность следуя инструкции.
-
Назначить роли для контроллеров следуя инструкции.
Внимание
Необходимо устанавливать роли в следующем порядке: задать роль
slave
на резервном контроллере, а затемmaster
на основном контроллере. Назначение ролей в обратном порядке приведёт к перезаписи базы данных на основном контроллере.
Проверить статус репликации на контроллерах можно с помощью команды:
controller status