Перейти к содержанию

Восстановление работы репликации

Действия при нарушении работы основного контроллера

При прекращении работы основного контроллера или с отсутствии связи основного контроллера и остальных серверов SpaceVM, для обеспечения полного функционирования инфраструктуры SpaceVM необходимо выполнить перевод резервного контроллера в основной.

После перевода резервного контроллера в основной будет восстановлена работа системы очередей постановки задач, а также работа сервисов Высокая доступность и Живой перенос.

  1. Перевести резервный контроллер с ролью slave в основной с ролью master, выполнив следующую команду в CLI резервного контроллера:

    controller role master
    

    Внимание

    Во избежание потери данных после восстановления работы аварийного контроллера недопустимо его использование в роли master. После восстановления аварийного контроллера необходимо отключить его от сети.

  2. В изолированном от сети состоянии перевести аварийный контроллер в режим резервного (slave), выполнив команду в CLI этого контроллера:

    controller role slave
    

    После выполнения команды статус репликации перейдёт в состояние inactive из-за отсутствия связи с master, а база данных переключится в режим read-only.

  3. После успешного перевода в slave восстановить сетевую доступность контроллера.

  4. Повторно выполнить команду перевода в slave для активации репликации и убедиться, что статус изменился на active:

    controller role slave
    

Восстановление репликации из состояния inactive

Для восстановления работоспособности репликации находящейся в состоянии inactive рекомендуется выполнить следующие действия:

  1. Отключить связанность между контроллерами следуя инструкции.

    Внимание

    Команды по отключению репликации необходимо выполнить на обоих контроллерах, сначала на основном (master), затем на резервном (slave).

  2. Восстановить связанность следуя инструкции.

  3. Назначить роли для контроллеров следуя инструкции.

    Внимание

    Необходимо устанавливать роли в следующем порядке: задать роль slave на резервном контроллере, а затем master на основном контроллере. Назначение ролей в обратном порядке приведёт к перезаписи базы данных на основном контроллере.

Проверить статус репликации на контроллерах можно с помощью команды:

controller status