Руководство пользователя
Для XRM версии 1.0
Автоматизация аварийного восстановления с помощью xrm
xrm
расположен в каталоге ./xrm-cli-install/
и предназначен для автоматизации следующих операций:
Создание файла маппинга переменных для основной и резервной площадки для аварийного восстановления (failover) и возврата (failback)
Проверка корректности файла маппинга переменных
Выполнение аварийного восстановления на резервную площадку
Выполнение возврата на основную площадку
Пример запускаxrm
:
Перейти в контейнер XRM-CLI (при необходимости):
Поддерживаются следующие опциональные настройки:
Установка параметров действий в конфигурационном файле dr.conf.
Изменение расположения конфигурационного файла с помощью параметра
--conf-file
Установка расположения файла журналов с помощью параметра
--log-file
Установка уровня детализации журналов с помощью параметра
--log-level
Создание файла маппинга переменных
Сценарий Ansible, используемый для создания файла маппинга переменных, предварительно заполняет файл сущностями основного сайта.
Затем вам необходимо вручную добавить в файл объекты резервного сайта, такие как IP-адреса, кластер, affinity-группы, affinity-метки, внешние диски LUN, домены авторизации, роли и профили vNIC.
Создание файла маппинга переменных завершится ошибкой, если у вас есть какие-либо диски виртуальных машин в домене хранения для self-hosted engine. Кроме того, сгенерированный файл маппинга переменных не будет содержать атрибут для этого домена хранения, так как он не должен быть перенесен.
Последовательность действий для создания файла маппинга переменных.
Создайте Ansible сценарий с использованием yaml файла (напримерd
dr_ovirt_setup.yml
) для выполнения процедуры генерации. Пример:Для дополнительной безопасности пароль Engine может храниться в зашифрованном виде в файле
.yml
.Запустите Ansible command to generate the mapping file. The primary site’s configuration will be prepopulated.
Настройте сгенерированный файл .yml в соответствии с конфигурацией резервной площадки. Более подробно см. раздел Атрибуты файла маппинга
Если используется несколько серверов, с которых предполагается выполнение операций аварийного восстановления и возврата, то скопируйте файл маппинга параметров на все необходимые серверы.
Создание сценариев восстановления (Failover) и возврата (Failback)
Перед созданием сценариев восстановления и возврата убедитесь, что вы создали и настроили файл маппинга переменных, который необходимо добавить в сценарии.
Для создания сценариев выполните следующие шаги:
Опционально, создайте файл паролей (например
passwords.yml
) для хранения паролей Engine основной и резервной площадки, пример:Для дополнительной безопасности пароли могут быть сохранены в файле в зашифрованном виде. В этом случае вам потребуется использовать параметр
--ask-vault-pass
при запуске сценариев.Создайте сценарий Ansible, используя failover файл yaml (например, dr-ovirt-failover.yml) для выполнения процедуры восстановления:
Создайте сценарий Ansible, используя failback файл yaml (например, dr-ovirt-failback.yml) для выполнения процедуры возврата:
Выполнение процедуры восстановления
Перед выполнением аварийного переключения убедитесь, что вы прочитали и поняли рекомендации по работе с сетью и хранилищами из Руководства администратора.
Необходимо также убедиться, что:
Engine и хосты на резервном сайте работают.
реплицированные домены хранения находятся в режиме чтения/записи.
к резервному сайту не подключены реплицированные домены хранения.
машина с запущенным сервером управления XRM и Ansible, которая может подключаться через SSH к Engine на основной и резервной площадке с необходимыми пакетами и файлами:
Пакет
ovirt-ansible-collection
Файл маппинга параметров и сценарии переключения.
SanLock должен снять все блокировки хранилища с реплицированных доменов хранения, до запуска процедуры аварийного восстановления. Эти блокировки снимаются автоматически примерно через 80 секунд после аварийного сбоя основной площадки.
Чтобы выполнить аварийное восстановление на резервную площадку, запустите сценарий на сервере управления с помощью следующей команды:
Когда основная площадка станет активной после аварийного сбоя, убедитесь, что была выполнена корректная ее очистка после сбоя перед выполнение процедуры возврата сервисов.
Last updated