Компания IBM
Опубликован: 01.02.2008 | Доступ: свободный | Студентов: 540 / 20 | Оценка: 4.60 / 4.40 | Длительность: 43:55:00
Специальности: Разработчик аппаратуры
Лекция 1:

Введение в HACMP

Лекция 1: 123456 || Лекция 2 >

Как работает процесс поузловой миграции

После установки HACMP на всех узлах кластера (когда все узлы находятся в гибридном состоянии) запуск служб кластера на последнем узле кластера автоматически вызывает передачу управления в HACMP V5.1 следующим образом:

  1. При установке HACMP V5.1 выполняется установка файла восстановления firstboot на узле кластера, а также происходит создание файла миграции (.mig), используемого в процессе миграции в качестве флага.
  2. Драйвер восстановления HACMP направляет сообщение диспетчеру кластера HACMP, сообщая о необходимости инициировать события waiting и waiting_complete.
    • HACMP использует службы групп RSCT для проверки стабильности и членства в кластере.
    • На каждом узле файл firstboot перемещается в активный каталог (/etc).
    • На всех узлах флаг миграции (файл .mig), созданный при установке, передается из каталога HACMP V5.1 в каталог HACMP V4.5. После перемещения файла firstboot в активный каталог и передачи файла .mig на всех узлах передача управления в HACMP продолжается инициированием события migrate.
  3. Драйвер восстановления HACMP инициирует событие migrate.
    • HACMP V5.1 останавливает демоны HACMP V4.5 с использованием опции принудительной остановки (режим forced).
    • Активизируются демоны HACMP V5.1 clinfoES и clsmuxpdES, используя порты, которые прежде применялись соответствующими демонами HACMP V4.5.
  4. Драйвер восстановления HACMP V5.1 инициирует событие migrate_complete.
    • Выполняется удаление HACMP V4.5. Файлы конфигурации, общие для обоих продуктов, не затрагиваются.
    • Выполняется повторная установка ссылок на базовые каталоги.
    • Происходит удаление файлов /etc/firstboot.
    • Выполняется удаление флага миграции (файл .mig) в каталоге /usr/sbin/cluster.
  5. Миграция завершена.

Снимки кластера, сохраненные во время миграции

Ранее существовавшие снимки HACMP сохраняются в каталоге /usr/es/sbin/cluster/ snapshots.

Обработка отказа узла в процессе миграции

При отказе узла в процессе миграции после перемещения файла firstboot в активный каталог он завершает процесс миграции во время перезагрузки узла. Однако после реинтеграции в кластер отказавший узел может иметь несинхронизированный HACMP ODM. В этом случае следует выполнить синхронизацию топологии и ресурсов кластера до реинтеграции отказавшего узла в кластер.

Процедура возврата

Если по какой-то причине вы решите не продолжать процесс миграции, вы можете удалить программное обеспечение HACMP V5.1 с узлов, на которых оно было установлено, в любой момент процесса до запуска HACMP на последнем узле.

Примечание. Удаление программного обеспечения HACMP следует проводить только на локальном узле. Во время миграции не следует выбирать вариант удаления программного обеспечения с нескольких узлов.

Удаление программного обеспечения HACMP

Для этого проделайте следующее:

  1. На каждом узле поочередно остановите службы кластера (остановка служб кластера показана в примере 1.3). Прежде чем продолжить, убедитесь в том, что службы кластера на узле остановлены и что соответствующие ресурсы кластера были переданы на резервные (takeover) узлы.
  2. После того как вы убедитесь в том, что ресурсы на узле были должным образом переданы на резервный узел, удалите программное обеспечение HACMP V5.1 (см. раздел "Как удалить программное обеспечение HACMP Classic (HAS)".
  3. Запустите HACMP на этом узле. Когда вы будете уверены в том, что ресурсы были должным образом переданы обратно на этот узел (если это необходимо), повторите эти действия на следующем узле.
  4. Продолжайте этот процесс, пока HACMP не будет удален на всех узлах в кластере.

Обработка отказов синхронизации при поузловой миграции

Если вы попытаетесь внести изменение в топологию или ресурсы кластера до завершения миграции, произойдет отказ процесса синхронизации. Возникнет следующее сообщение:

cldare: Migration from HACMP V4.5 to 
HACMP V5.1 Detected. cldare cannot be
run until migration has completed.

Для возврата после изменения необходимо восстановить активный ODM. Для этого нужно выполнить следующие действия:

  1. Запустите smitty hacmp.
  2. Перейдите в Problem Determination Tools.
  3. Выберите Restore HACMP Configuration Database from Active Configuration.

Опции обновления

В этом разделе мы обсудим обновления для HACMP.

Поддерживаемые обновления для HACMP V5.1

Утилиты преобразования HACMP предлагают простой путь обновления до версии V5.1 с нижеперечисленных версий:

  • с HACMP/ES V4.4.1 до HACMP V5.1;
  • с HACMP/ES V4.5 до HACMP V5.1.

Если вам потребуется выполнить преобразование на HACMP V5.1 с более ранних версий, чем указаны выше, необходимо сначала выполнить обновление до одной из поддерживаемых версий. Затем вы сможете выполнить преобразование на HACMP V5.1. Например, для преобразования с HACMP/ES 4.2.2 на HACMP V5.1 сначала нужно будет выполнить обновление установки до HACMP/ES 4.4.1 или выше и затем выполнить обновление до HACMP V5.1.

Чтобы выполнить обновление до HACMP V5.1, нужно выполнить следующие действия:

  1. Если необходимо, выполните обновление до AIX 5L V5.1 Maintenance Level 5 или выше.
  2. Если необходимо, выполните проверку установки AIX.
  3. Переведите текущее программное обеспечение HACMP на всех узлах в состояние commited.Остановите HACMP/ES на одном узле (gracefully with takeover – постепенная остановка с передачей ресурсов на резервные узлы) с использованием команды clstop.
  4. После успешного перемещения ресурсов с остановленного узла на резервный узел установите новое программное обеспечение HACMP (инструкции по установке программного обеспечения HACMP V5.1 см. в разделе 1.7, "Установка программного обеспечения HACMP"). Проверьте установку программного обеспечения с использованием команды AIX lppchk, после чего проверьте установленные каталоги на наличие требуемых файлов:
    lppchk -v or lppchk -c "cluster.*"
    Если установка прошла без ошибок, обе команды выполняются без выдачи сообщений.
  5. Перезагрузите первый узел.
  6. Запустите программное обеспечение HACMP на первом узле командой smitty clstart и убедитесь в успешном подключении первого узла к кластеру.
  7. Повторите предыдущие действия для остальных узлов кластера поочередно.
  8. Убедитесь в том, что устройство tty сконфигурировано как последовательная сеть (serial network).
  9. Убедитесь в том, что с первого узла доступны все внешние диски (с помощью команды lspv проверьте PVID для каждого диска). Если PVID для дисков не выводятся, может потребоваться удалить диск и выполнить повторное конфигурирование.
  10. После обновления всех узлов выполните синхронизацию конфигурации узлов и топологии кластера с первого узла на все узлы, как описано в следующем разделе, "cl_convert и clconvert_snapshot". Не пропускайте проверку во время синхронизации. Важно! Во время обновления не следует выполнять синхронизацию с обновленного узла, если необновленный узел остается в кластере со смешанными версиями. Утилита cl_convert назначает идентификаторы узлов (node ID) последовательно для всех узлов в кластере. Эти новые идентификаторы могут конфликтовать с уже существующими.
  11. Восстановите объектный класс ODM событий HACMP, чтобы сохранить все скрипты обработки событий, сконфигурированные для вашего кластера.
  12. Если нужно, внесите дополнительные изменения в кластер.
  13. Проведите тестирование кластера прежде, чем перевести его в рабочую среду.

cl_convert и clconvert_snapshot

HACMP содержит утилиты преобразования cl_convert и clconvert_snapshot.

Обновление программного обеспечения HACMP/ES до последней версии HACMP включает преобразование ODM с предыдущей версии до текущей версии. При установке HACMP утилита cl_convert запускается автоматически. Однако в случае сбоя при установке необходимо запустить cl_convert из командной строки.

В случае сбоя при преобразовании следует выполнить cl_convert с флагом -F. Например, чтобы выполнить преобразование с HACMP/ES V4.5 на HACMP V5.1, следует использовать флаги -F и -v (version) следующим образом (обратите внимание на добавление "0" к номеру версии V4.5):

# /usr/es/sbin/cluster/conversion/cl_convert -F -v 4.5.0

Для запуска утилиты преобразования требуются:

  • привилегии пользователя root;
  • версия HACMP, с которой выполняется преобразование.

Утилита cl_convert записывает информацию о выполнении преобразования в файл /tmp/clconvert.log, что дает возможность оценить успешность выполнения преобразования. Этот файл журнала генерируется (перезаписывается) при каждом выполнении cl_convert или clconvert_snapshot.

Утилита clconvert_snapshot не запускается автоматически во время установки, ее следует запускать из командной строки. Выполните clconvert_snapshot для обновления снимков кластера при миграции с HACMP (HAS) на HACMP, как описано в этом разделе.

Обновление диспетчера одновременного доступа к ресурсам

Для установки средства одновременного доступа на узлах кластера необходимо установить диспетчер одновременного доступа к ресурсам (Concurrent Resource Manager, CRM), следуя процедуре, описанной в разделе "Установка программного обеспечения HACMP".

AIX 5L V5.1 поддерживает расширенный режим одновременного доступа (enhanced concurrent mode, ECM). Если вы выполняете установку HACMP вместе с диспетчером одновременного доступа к ресурсам (Concurrent Resource Manager), см. "Составляющие высокой доступности" , "Initial Cluster Planning", руководства HACMP for AIX 5L V5.1 Planning and Installation Guide, SC23-4861-02.

Сведения о расширенном режиме одновременного доступа и о поддерживаемых дисковых устройствах общего доступа производства IBM см. в гл. 5, "Planning Shared LVM Components", руководства HACMP for AIX 5L V5.1 Planning and Installation Guide, SC23-4861-02. Кроме того, если вы хотите использовать диски других производителей, см. прил. D, "OEM Disk Accommodation", руководства HACMP for AIX 5L V5.1 Planning and Installation Guide, SC23-4861-02.

Проблемы при установке

Если при установке возникают проблемы, программа установки автоматически выполняет процесс очистки. Если по какой-либо причине после неудачной установки не была выполнена очистка, нужно выполнить следующие действия:

  1. Введите smitty install.
  2. Выберите Software Maintenance and Utilities.
  3. Выберите Clean Up After a Interrupted Installation.
  4. Просмотрите выходные данные SMIT (или файл /smit.log) на наличие указания причины прерывания установки.
  5. Исправьте выявленные проблемы с использованием методов определения проблем AIX и повторите процесс установки.
Лекция 1: 123456 || Лекция 2 >
Анатолий Гречман
Анатолий Гречман
Казахстан, Экибастуз, Экибастузский Инженерно-технический Институт, 2014
Berkut Molodoy
Berkut Molodoy
Россия