Компания IBM
Опубликован: 01.02.2008 | Доступ: свободный | Студентов: 540 / 20 | Оценка: 4.60 / 4.40 | Длительность: 43:55:00
Специальности: Разработчик аппаратуры
Лекция 3:

Планирование

Настраиваемый план тестирования

Как и в прежних версиях HACMP, вам следует разработать локальный набор тестов для проверки целостности кластера. Это обычно включает отключение сетевых кабелей, отключение интерфейсов и завершение работы узлов кластера в целях проверки возможностей восстановления кластера. Это упражнение все еще остается полезным, так как вы имеете возможность имитировать отказы и наблюдать за поведением кластера. Если что-то идет неправильно или не так, как ожидалось, следует остановить тестирование и изучить проблему. После успешного завершения всех тестов кластер можно переносить в рабочую среду.

В табл. 3.15 представлен пример плана тестирования, который можно использовать для тестирования кластера.

Подробная схема кластера

увеличить изображение
Подробная схема кластера
Таблица 3.15. Пример плана тестирования
План тестирования кластера
Тест № Описание теста Комментарии Результаты
1 Запуск HACMP на node01 node01 запускается и перехватывает группу ресурсов C10RG1
2 Запуск HACMP на node02 node02 запускается и перехватывает группу ресурсов C10RG2
3 Постепенная остановка без перехвата (graceful stop without takeover) на node01 Группа ресурсов C10RG1 отключается
4 Запуск HACMP на node01 node01 запускается и перехватывает группу ресурсов C10RG1
5 Постепенная остановка с перехватом (graceful stop with takeover) на node01 Группа ресурсов C10RG1 перемещается на node02
6 Запуск HACMP на node01 node01 запускается и требует группу ресурсов C10RG1
7 Отказ (отключение) сервисного интерфейса на node01 Перемещение сервисного IP-адреса на второй базовый адаптер
8 Переподключение сервисного интерфейса на node01 Сервисный IP-адрес остается на втором базовом адаптере
9 Отказ (отключение) сервисного интерфейса на node01 (теперь на втором адаптере) Сервисный (и постоянный) IP-адрес перемещается на первый базовый адаптер
10 Выполнение на node01 команды halt -q для принудительного отключения операционной системы node01 останавливается – группа ресурсов C10RG1 перемещается на node02
11 Перезагрузка node01 и перезапуск HACMP node01 перезагружается. После запуска HACMP, node01 требует C10RG1
12 Постепенная остановка без перехвата (graceful stop without takeover) на node02 Группа ресурсов C10RG1 отключается
13 Запуск HACMP на node02 node02 запускается и перехватывает группу ресурсов C10RG2
14 Постепенная остановка с перехватом (graceful stop with takeover) на node01 Группа ресурсов C10RG2 перемещается на node01
15 Запуск HACMP на node02 node02 запускается и требует группу ресурсов C10RG2
16 Отказ (отключение) сервисного интерфейса на node02 Перемещение сервисного IP-адреса на второй базовый адаптер
17 Переподключение сервисного интерфейса на node02 Сервисный IP-адрес остается на втором базовом адаптере
18 Отказ (отключение) сервисного интерфейса на node02 (теперь на втором адаптере) Сервисный (и постоянный) IP-адрес перемещается на первый базовый адаптер
19 Выполнение на node02 команды halt -q для принудительного отключения операционной системы node02 останавливается – группа ресурсов C10RG2 перемещается на node01
20 Перезагрузка node02 и перезапуск HACMP node02 перезагружается. После запуска HACMP, node02 требует C10RG2

Инструмент Cluster Test Tool

Чтобы упростить тестирование кластера, HACMP 5.2 и 5.3 включают инструмент Cluster Test Tool, позволяющий протестировать функции кластера, прежде чем он станет частью рабочей среды.

Инструмент Cluster Test Tool работает только в кластере с HACMP 5.2 или более поздней версии с верифицированной и синхронизированной конфигурацией. Инструмент может работать в двух режимах:

  • Автоматическое тестирование. Процедура автоматического тестирования (предопределенный набор тестов), поставляемая вместе с инструментом, используется для выполнения базового тестирования кластера. Выполнение установки не требуется. Нужно просто запустить тест из SMIT и просмотреть результаты тестирования в файле журнала Cluster Test Tool.
  • Настраиваемое тестирование. Если вы являетесь опытным администратором HACMP и хотите выполнить точную настройку тестирования кластера для своей среды, можно создать настраиваемые тесты, которые можно запускать из SMIT. После установки настраиваемой среды тестирования выполняется запуск процедуры тестирования из SMIT, после чего результаты тестирования просматриваются в файле журнала Cluster Test Tool.

Cluster Test Tool использует демон коммуникаций кластера HACMP для организации связи между узлами кластера с целью обеспечения безопасности кластера HACMP.

Автоматическое тестирование

Инструмент тестирования содержит автоматический метод, предназначенный для быстрого тестирования функционирования кластера. Его выполнение обычно занимает от 30 до 60 мин., в зависимости от сложности кластера; при этом выполняются тесты, перечисленные ниже. Для выполнения этих тестов вы должны иметь доступ под записью root.

Тесты общей топологии кластера

Cluster Test Tool выполняет тесты общей топологии кластера в следующем порядке:

  • запуск служб кластера на всех доступных узлах;
  • постепенная (graceful) остановка служб кластера на узле;
  • перезапуск служб кластера на узле, который был остановлен;
  • остановка служб кластера с перехватом на другом узле;
  • перезапуск служб кластера на узле, который был остановлен;
  • принудительная остановка служб кластера на другом узле;
  • перезапуск служб кластера на узле, который был остановлен.

Тесты групп ресурсов с неодновременным доступом

Если кластер включает одну или несколько групп ресурсов с неодновременным доступом, инструмент тестирования выполняет каждый из нижеперечисленных тестов в заданном порядке для каждой группы ресурсов:

  • отключение локальной сети на узле, чтобы инициировать перемещение группы ресурсов;
  • восстановление ранее отключенной сети;
  • отключение сервера приложений и восстановление после отказа приложения.

Тест групп ресурсов с одновременным доступом

Если кластер содержит одну или несколько групп ресурсов с политикой управления запуском, настроенной на подключение на всех доступных узлах (online on all available nodes, OAAN), инструмент тестирования выполняет один тест, состоящий в отключении сервера приложений и восстановлении после отказа приложения.

Тест на фатальный отказ

Инструмент выполняет один тест на фатальный отказ, который останавливает диспетчер кластера на произвольно выбранном узле, на котором в данный момент находится как минимум одна активная группа ресурсов.

Примечание. Если инструмент останавливает диспетчер кластера на контрольном узле, вам может потребоваться перезагрузить этот узел.

Выполнение автоматических тестов

Общие рекомендации советуют периодически подтверждать конфигурацию кластера. Существует два инструмента автоматизации выполнения этой задачи:

  • Инструмент автоматического тестирования кластера. Используется непосредственно для тестирования кластера.
  • Автоматическая верификация конфигурации кластера. Этот инструмент периодически проверяет и информирует о любых изменениях конфигурации, чтобы администратор кластера мог предпринять корректирующие действия (выполнить синхронизацию и повторное тестирование кластера).

Эти инструменты можно использовать для реализации стандартной процедуры проверки. После выполнения первоначального теста тестирование вручную выполнять необязательно. Однако так как автоматический инструмент тестирования кластера предпринимает действия, которые могут вызвать перерыв в обслуживании, необходимо назначить использование этого инструмента на время, соответствующее окну обслуживания.

Инструмент Cluster Test Tool выполняет заданный набор тестов, произвольным образом выбирая узлы, сети, группы ресурсов и т. д. для тестирования. В процессе тестирования инструмент тестирует различные компоненты кластера.

Важно! Прежде чем начать выполнение автоматического тестирования, убедитесь, что кластер не работает в режиме обслуживания в рабочей среде.

Для запуска автоматической процедуры тестирования:

  • Введите smit hacmp.
  • В SMIT выберите Initialization and Standard Configuration > HACMP Cluster Test Tool и нажмите Enter.
  • Появится сообщение "Are you sure". Если вы еще раз нажмете Enter, запустится автоматическое тестирование.

Появится сообщение "Are you sure". Если вы еще раз нажмете Enter, запустится автоматическое тестирование.

После планирования конфигурации и составления схемы кластера, нужно выполнить подготовку к установке.

При внедрении HACMP на существующих серверах следует выделить достаточное окно обслуживания для установки, конфигурирования и тестирования кластера. Если выполняется новая инсталляция, нужно выделить время на конфигурирование и тестирование базового кластера. После конфигурирования и тестирования кластера можно выполнять интеграцию необходимых приложений во время запланированного окна обслуживания.

Возвратившись к рис. 3.1, можно увидеть, что установке HACMP предшествует этап подготовки. Этот этап необходим для того, чтобы обеспечить готовность инфраструктуры к установке HACMP. Обычно это предполагает использование таблиц планирования и схемы кластера для подготовки узлов для установки HACMP 5.3.

  • Убедитесь в том, что установлены необходимые пакеты программного обеспечения узлов и операционной системы.
  • Убедитесь в правильности конфигурирования сети.
  • Убедитесь в правильности конфигурирования общих дисков.
  • Убедитесь в том, что требуемые приложения способны выполняться на всех узлах.

Этап подготовки может занять некоторое время, в зависимости от сложности среды и количества используемых групп ресурсов и узлов. Нужно выделить достаточно времени на подготовку среды, так как нет смысла пытаться устанавливать HACMP в неподготовленной среде. Это обернется напрасной тратой времени на устранение неполадок в плохой инсталляции. Помните о том, что построение хорошо сконфигурированного кластера происходит на основе надежной инфраструктуры.

После завершения планирования кластера и подготовки среды узлы готовы к установке HACMP.

Установка кода достаточно проста. При установке с компакт-диска следует просто использовать SMIT для установки требуемых наборов файлов. При установке из хранилища программного обеспечения можно выполнить NFS-подключение каталога, после чего использовать SMIT для установки из этого каталога. Убедитесь в том, что у вас есть лицензии на все устанавливаемые функции, такие, как Smart Assist и HACMP/XD.

После того как были установлены необходимые наборы файлов на всех узлах кластера, используйте таблицы планирования для конфигурирования кластера. У вас есть несколько инструментов, которые можно использовать для конфигурирования кластера:

  • Можно настроить WebSmit и использовать его для конфигурирования кластера.
  • В кластере из двух узлов можно использовать Two-Node Configuration Assistant, реализованный на основе Java.
  • Можно использовать ASCII-экран и SMIT для выполнения конфигурирования.
  • Существует множество способов облегчить конфигурирование кластера. В следующей лекции каждый из них будет рассмотрен подробно, но, если вкратце, вы можете:
    • Использовать Two-Node Configuration Assistant для конфигурирования кластера. Этот инструмент позволяет сконфигурировать базовый двухузловой кластер с одной группой ресурсов.
    • Использовать панели SMIT "HACMP Standard Configuration" для конфигурирования кластера в стандартном формате.
    • Использовать панели SMIT "HACMP Extended Configuration" для конфигурирования кластера вручную.
    • Применить к кластеру файл *.haw, сгенерированный системой автоматизированного планирования (Online Planning Worksheets).

Применить снимок кластера для конфигурирования кластера.

Примечание. При конфигурировании кластера мы рекомендуем начать с конфигурирования (сетевой) топологии кластера. После конфигурирования топологии кластера следует выполнить конфигурирование, верификацию и синхронизацию кластера, прежде чем переходить к ресурсам (общим группам томов, сервисным IP-адресам и приложениям). После успешной верификации и синхронизации топологии следует запустить службы кластера и проверить, все ли работает в соответствии с ожиданиями. Это позволяет выявить любые проблемы в сети до конфигурирования ресурсов кластера.

После конфигурирования, верификации и синхронизации кластера следует запустить инструмент автоматического тестирования кластера, чтобы проверить функционирование кластера. Просмотрите результаты работы инструмента тестирования; если они являются успешными, выполните необходимые собственные тесты для дальнейшей верификации кластера.

Проверьте все включенные вами уведомления об ошибках.

После успешного выполнения тестирования создайте резервные копии системы (mksysb) для каждого узла, а также снимок кластера с одного из узлов кластера. На этом этапе кластер должен быть готов к переносу в рабочую среду.

Теперь к управлению доступностью приложения применимы стандартные процессы управления изменениями и проблемами.

Резервное копирование конфигурации кластера

Основным средством резервного копирования кластера HACMP является снимок кластера. Хотя файл описания кластера системы автоматизированного планирования (Online Planning Worksheets) тоже описывает конфигурацию кластера, он менее полный, так как он не включает записи ODM.

Основной информацией, сохраненной в снимке кластера, являются данные, находящиеся в классах базы данных конфигурации HACMP (таких, как HACMPcluster, HACMPnode, HACMPnetwork, HACMPdaemons). Эта информация используется для воссоздания конфигурации кластера при применении снимка кластера.

Снимок кластера не сохраняет какие-либо пользовательские скрипты, приложения и прочие параметры конфигурации, не связанные с HACMP. Например, имена серверов приложений и расположение их скриптов запуска и остановки сохраняются в объектном классе HACMPserver базы данных конфигурации. Однако сами скрипты, как и вызываемые ими приложения, не сохраняются.

Утилита создания снимков кластера сохраняет данные в двух разных файлах:

  • Файле данных ODM (.odm). Этот файл содержит все данные, сохраненные в объектных классах базы данных конфигурации HACMP для кластера. Этому файлу назначается определяемое пользователем имя с расширением .odm. Так как информация в базе данных конфигурации практически одинакова на всех узлах кластера, снимок кластера сохраняет значения только с одного узла.
  • Файле информации о состоянии кластера (.info). Этот файл содержит стандартные выходные данные AIX 5L и HACMP. Этому файлу назначается то же определяемое пользователем имя с расширением .info. По умолчанию этот файл больше не содержит информацию журнала кластера. Обратите внимание на то, что через SMIT можно задать сбор журналов кластера в этом файле при создании снимка кластера.

Для полного резервного копирования следует создать резервную копию (mksysb) каждого узла кластера с использованием стандартных методов. Выберите один узел для создания снимка кластера и сохраните снимок в безопасном месте в целях аварийного восстановления.

При возможности создайте снимок до создания резервной копии (mksysb) узла, чтобы он был включен в резервную копию системы.

Важно! Можно создать снимок с любого узла в кластере, даже при отключенном HACMP. Однако применить снимок к кластеру можно только в том случае, если все узлы доступны и выполняют одну версию HACMP (HACMP может осуществлять связь между узлами с использованием clcomdES).

Документирование кластера

Для эффективного управления кластером важно выполнять документирование конфигурации кластера. Хорошее документирование кластера позволяет обеспечить более эффективный контроль изменений и быстрое разрешение проблем на всех этапах, от управления изменениями в кластере до устранения неполадок. Мы рекомендуем вам вести точную схему кластера, которую можно использовать для управления изменениями и проблемами.

Кроме того, HACMP обеспечивает инструменты для упрощения сбора данных конфигурации кластера посредством использования системы автоматизированного планирования (OLPW).

В этом разделе описывается создание файла определения кластера через SMIT с последующим его использованием для создания отчета о конфигурации кластера через OLPW. Итоговый отчет имеет формат HTML и может быть просмотрен через веб-браузер.

Основные этапы создания отчета кластера следующие:

  • Экспорт файла определения кластера с одного из узлов кластера с использованием SMIT:
    • файл обычно сохраняется в формате *.haw;
    • при использовании OLPW на рабочей станции следует передать файл определения через ftp на рабочую станцию.
  • Использование OLPW для открытия существующего файла определения.
  • Использование OLPW для создания отчета о конфигурации. При этом создается файл *.html.
  • Использование веб-браузера для просмотра файла. Рекомендуем сохранить файл на другом сервере или рабочей станции в целях аварийного восстановления.

Экспорт файла определения кластера с применением SMIT

Можно создать файл определения кластера из активного кластера HACMP, после чего открыть этот файл с использованием приложения Online Planning Worksheets.

Для создания файла определения кластера из SMIT проделайте следующее:

  • Введите smit hacmp.
  • Выберите Extended Configuration (Расширенное конфигурирование). Выберите Export Definition File for Online Planning Worksheets (Экспорт файла определения для OLPW) и нажмите Enter ( пример 3.2).
    Extended Configuration
    Move cursor to desired item and press Enter.
    Discover HACMP-related Information from Configured Nodes
    Extended Topology Configuration
    Extended Resource Configuration
    Extended Cluster Service Settings
    Extended Event Configuration
    Extended Performance Tuning Parameters Configuration
    Security and Users Configuration
    Snapshot Configuration
    Export Definition File for Online Planning Worksheets
    
    Extended Verification and Synchronization
    HACMP Cluster Test Tool
    Пример 3.2. Экспорт файла определения из SMIT
  • Введите значения следующих полей и нажмите Enter:
    • File Name (Имя файла). Полный путь к файлу определения кластера. По умолчанию используется путь /var/hacmp/log/cluster.haw.
    • Cluster Notes (Примечания кластера). Любые дополнительные комментарии, относящиеся к вашему кластеру. Введенная здесь информация будет выводиться в панели Cluster Notes (Примечания кластера) в Online Planning Worksheets.
  • Откройте файл определения кластера в Online Planning Worksheets.

Создание файла определения кластера из снимка с использованием SMIT

Кроме того, файл определения кластера также можно создать из снимка кластера HACMP, после чего его можно открыть с использованием приложения Online Planning Worksheets.

Для создания файла определения кластера из снимка с применением SMIT проделайте следующее:

  • введите smit hacmp ;
  • выберите Extended Configuration (Расширенное конфигурирование):
    • Snapshot Configuration (Конфигурация снимка) >;
    • Convert Existing Snapshot For Online Planning Worksheets (Преобразовать существующий снимок для OLPW);
    • выберите предварительно созданный снимок;
  • после создания файла определения кластера откройте его в Online Planning Worksheets.

Создание отчета о конфигурации

Отчет о конфигурации позволяет записать информацию о состоянии конфигурации кластера в формате HTML.

Отчет содержит обзорную информацию, включающую следующее:

  • имя каталога, содержащего изображения, используемые в отчете;
  • версия приложения Online Planning Worksheets;
  • автор и компания, указываемые на панели Cluster Configuration (Конфигурация кластера);
  • примечания кластера, добавленные с панели Cluster Notes (Примечания кластера);
  • последние дата и время, в которые система Online Planning Worksheets сохранила файл определения кластера.

Отчет также содержит разделы по следующим вопросам:

  • узлы и пути для связи;
  • приложения;
  • сети;
  • экспорт NFS;
  • IP-метки;
  • серверы приложений;
  • глобальная сеть;
  • мониторы приложений;
  • сайты;
  • пейджеры и мобильные телефоны;
  • диски;
  • удаленные уведомления;
  • группы ресурсов;
  • ресурсы накопителей на магнитной ленте;
  • группы томов;
  • политики времени выполнения для групп ресурсов;
  • логические тома;
  • обзор узлов;
  • наборы файлов;
  • верификация кластера;
  • межсайтовое зеркальное отображение LVM.

Для создания отчета о конфигурации:

  • выберите File (Файл) > Create Report (Создать отчет);
  • в диалоговом окне Save (Сохранение) введите имя и расположение файла отчета.
    Образец отчета о конфигурации

    увеличить изображение
    Рис. 3.22. Образец отчета о конфигурации

При создании отчета в каталоге, содержащем отчет, создается каталог olpwimages. Например, при сохранении файла отчета в каталоге /home/pat/reports в качестве каталога изображений используется /home/pat/reports/olpwimages. Каталог olpwimages содержит графические файлы, связанные с отчетом. При каждом создании отчета происходит замена файлов отчета и файлов в каталоге изображений.

На рис. 3.22 показан скриншот созданного отчета. Можно выполнять прокрутку страницы для просмотра информации.

Управление изменениями и проблемами

После запуска кластера начинается работа по управлению изменениями и проблемами.

Эффективные процессы управления изменениями и проблемами необходимы для обеспечения доступности кластера. В целях эффективности текущая конфигурация кластера всегда должна быть "под рукой". Можно использовать OLPW для создания html-версии конфигурации, а также (рекомендуется) схемы текущего кластера.

Любые изменения в кластере должны быть всесторонне исследованы с точки зрения их воздействия на функционирование кластера. Даже те изменения, которые непосредственно не влияют на HACMP (например, добавление дополнительной нагрузки, не связанной с HACMP), могут отразиться на работе кластера. Необходимо выполнять планирование, назначение и документирование изменений, а после их внесения – тестирование кластера.

Чтобы упростить внедрение изменений в кластере, HACMP обеспечивает набор SMIT-меню C-SPOC (Cluster Single Point of Control). Всегда, когда это возможно, следует использовать меню C-SPOC для внесения изменений. Используя C-SPOC, можно вносить изменения на одном узле, после чего они распространяются на другие узлы кластера.

Все возникающие проблемы в кластере следует немедленно изучать и исправлять. Так как основная задача HACMP состоит в том, чтобы скрывать любые возникающие ошибки от приложений, даже при наличии инструментов мониторинга вы можете не узнать о перемещении при сбое. Убедитесь в том, что включены уведомления об ошибках, сообщающие об отказах соответствующему персоналу.

Инструменты планирования

В этом разделе подробно рассматриваются три основных инструмента планирования. Также включен образец схемы кластера и таблицы планирования.

Динар Валеев
Динар Валеев
Россия
Lichodedov Andrej
Lichodedov Andrej
Литва