Компания IBM
Опубликован: 01.02.2008 | Доступ: свободный | Студентов: 540 / 20 | Оценка: 4.60 / 4.40 | Длительность: 43:55:00
Специальности: Разработчик аппаратуры

Лекция 5: Миграция кластера на HACMP V5.3

< Лекция 4 || Лекция 5: 123456 || Лекция 6 >

Сценарий 2: AIX 5.2 и HA 5.1

Второй тестовый сценарий представлял собой миграцию двухузлового кластера AIX 5.2 / HA 5.1, настроенного на взаимный перехват ресурсов, на AIX 5.3 / HA 5.3. Мы использовали серверы p630 (7028-6C4) в конфигурации кластера. На рис. 5.3 представлена схема используемой конфигурации.

Топология была настроена на использование стандартных IP-синонимов. На каждом узле были сконфигурированы постоянные IP-адреса в той же подсети, в которой находятся и сервисные адреса. Хранилище содержало ESS LUN (2105-800) с подключением к коммутатору, а также скрипт подключения хоста (ibm2105.rte) и драйвер SDD. Каждый узел был настроен на использование собственных групп ресурсов, каждая из которых включает свою группу томов, сервисный IP-адрес и сервер приложения. Группы томов были сконфигурированы как группы томов с расширенным одновременным доступом, чтобы установить сеть пульса через диски, отличную от IP.

Сценарий 2: среда миграции с HA 5.1 на HA 5.3

Рис. 5.3. Сценарий 2: среда миграции с HA 5.1 на HA 5.3

Циклическая миграция: сценарий 2

Мы протестировали стабильность кластера и выполнение перемещения при сбое, прежде чем перейти к тестам миграции. Первым протестированным нами методом миграции для этого двухузлового кластера была циклическая миграция.

Мы выполнили следующие предварительные действия:

  1. Сохранение снимка с рабочего кластера (со всеми активными узлами).
    Внимание! Не сохраняйте снимок в каталог /tmp, так как при установке AIX содержимое каталога /tmp удаляется. Сохраните снимок в другой каталог или на другой сервер. Не забудьте также сохранить скрипты приложения в надежный каталог.
  2. Создание резервной копии ( mksysb ).
  3. Создание alt_disk_install как средства возврата к прежней конфигурации. Это было сделано с целью ускорения повторного тестирования.

Сценарий миграции

Сначала мы решили выполнить обновление узла cobra. Для этого мы выполнили следующие действия:

  1. Остановка HACMP на узле cobra (постепенная остановка с передачей ресурсов на резервный узел – graceful with takeover):
    • перемещение C10RG1 на узел viper;
    • проверка с использованием /usr/es/sbin/cluster/utilities/clRGinfo.
  2. Инициация миграции AIX 5.3/RSCT с использованием кода NIM вместе с последними исправлениями: smit remove sdd – должно быть выполнено удаление и замена:
    • stopsrc -s sddsrv;
    • rmdev -dl dpo -R;
    • деинсталляция драйвера SDD 5.2 с использованием smitty remove (devices. sdd.52.rte 1.6.0.2);
    • установка драйвера SDD 5.3 (devices.sdd.53.rte 1.6.0.0 и 1.6.0.2).
  3. Выполнение smit update_all для загрузки наборов файлов HA 5.3.
  4. Перезагрузка узла cobra.
  5. Реинтеграция узла cobra в кластер путем запуска служб кластера. Политика ресурсов была настроена на перемещение при сбое на узел с более высоким приоритетом, вследствие чего группа ресурсов C10RG1 возвратилась на узел cobra.
    Внимание. На этом этапе ODM-классы HACMP на узле cobra не были преобразованы и не соответствуют новой версии, тогда как наборы файлов соответствуют версии HA 5.3. На данном этапе кластер находится в смешанном режиме или, так называемом гибридном состоянии (hybrid state).
  6. Остановка HACMP на узле viper (постепенная остановка с передачей ресурсов на резервный узел – graceful with takeover). Группа ресурсов C10RG2 перемещается на узел cobra.
  7. Повтор операций установки AIX/RSCT и HACMP на узле viper.
  8. Перезагрузка узла viper.
  9. Реинтеграция узла viper в кластер путем запуска служб кластера.

Результаты циклической миграции: сценарий 2

Общее тестирование циклической миграции было успешным. Как и в сценарии 1, миграция AIX представляла самый медленный этап обновления. После ее выполнения мы протестировали перемещение при сбое в кластере и не обнаружили проблем. Реинтеграция последнего узла была успешной, и мы убедились в том, что изменения в ODM соответствовали новой версии HACMP.

В целях тестирования мы решили прервать миграцию, когда узлы были в смешанном режиме. Мы остановили узел cobra, когда на нем выполнялся HACMP 5.3 и он содержал обе группы ресурсов. В это время на узле viper выполнялся процесс установки HACMP 5.3. После перезагрузки узла cobra и перезапуска служб кластера, он подхватил свою группу ресурсов (C10RG1). После этого мы вручную подключили группу ресурсов узла viper:

#smit hacmp > System Management (C-SPOC) > HACMP Resource Group and Application Management (Управление группами ресурсов и приложениями HACMP) > Bring a Resource Group online (Подключение группы ресурсов) > выбор C10RG2 и нажатие Enter.

Группа ресурсов была подключена без каких-либо проблем. После этого мы выполнили обновление AIX и HACMP на втором узле, после чего смогли выполнить успешную интеграцию в кластер без каких-либо проблем. После завершения мы использовали инструмент тестирования кластера (Cluster Test Tool) для запуска различных тестов и не обнаружили каких-либо проблем. Мы снова выполнили тестирование миграции и не обнаружили проблем с функционированием кластера.

Миграция с использованием снимков: сценарий 2

В том же кластере из двух узлов мы проверили работу метода преобразования снимков. Мы использовали образы установки на резервных дисках для возврата к прежней среде, после чего перезапустили службы кластера на обоих узлах, на которых выполнялся HA 5.1. Тестирование содержало следующие действия:

  1. Остановка HACMP на всех узлах: cobra viper
  2. Выполнение команды smit remove и деинсталляция всех наборов файлов cluster.* со всех узлов.
  3. Миграция кода AIX/RSCT с использованием NIM.
  4. Установка пакетов HACMP с текущими уровнями PTF на всех узлах.
  5. Перезагрузка всех узлов кластера.
  6. Копирование файла snapshot.odm, предварительно сохраненного в процессе циклической миграции и имеющего расположение /usr/es/sbin/cluster/utilities/ snapshot.odm.
  7. Выполнение следующей команды для преобразования снимка: #/usr/es/sbin/ cluster/conversion/clconvert_snapshot -v 5.1 -s snapshot.odm.
  8. Применение снимка: smit hacmp > Extended Configuration (Расширенное конфигурирование) > Snapshot Configuration (Конфигурирование снимка) > Apply a Cluster Snapshot (Применение снимка кластера) > выбор снимка и нажатие Enter.
  9. Запуск служб кластера поочередно на каждом узле.

Результаты миграции с использованием снимков: сценарий 2

В целом миграция с использованием снимка также прошла успешно. Преобразование файла снимка заняло несколько секунд, и его применение на обоих узлах также произошло очень быстро. После завершения миграции мы убедились в корректности преобразования разделов HACMP ODM путем проверки версии кластера в объектных классах HACMPcluster и HACMPnode.

Также после завершения миграции мы использовали инструмент тестирования кластера (Cluster Test Tool) для выполнения нескольких тестов. После обновления не было обнаружено каких-либо проблем функционирования кластера.

Мы считаем, что, если ваша среда допускает перерыв в обслуживании в масштабе кластера, можно использовать этот быстрый и надежный метод, позволяющий полностью избежать функционирования узлов в смешанном режиме. Использование снимка для возврата конфигурации HACMP после обновления всех узлов позволяет избежать потенциальных проблем, которые могут возникнуть в процессе циклической миграции. Дополнительные сведения о потенциальных проблемах см. в разделе "Аспекты", в этой лекции.

< Лекция 4 || Лекция 5: 123456 || Лекция 6 >
Динар Валеев
Динар Валеев
Россия
Lichodedov Andrej
Lichodedov Andrej
Литва