Компания IBM
Опубликован: 01.02.2008 | Доступ: свободный | Студентов: 612 / 22 | Оценка: 4.60 / 4.40 | Длительность: 43:55:00
Специальности: Разработчик аппаратуры

Лекция 15: Концепции и планирование HACMP Extended Distance

< Лекция 14 || Лекция 15: 12 || Лекция 16 >
Аннотация: В этой лекции рассматриваются функции и возможности HACMP Extended Distance (HACMP/XD) и описаны установка и конфигурирование некоторых функций аварийного восстановления в HACMP/XD. Мы рассмотрим следующие вопросы: компоненты HACMP/XD; аспекты аварийного восстановления; дополнительные сведения.

Компоненты HACMP/XD

Базовый программный продукт High Availability Cluster Multi-Processing for AIX (HACMP) лишь частично разрешает задачу обеспечения непрерывной работы. Он выполняет восстановление после отказа узла, адаптера или локальной сети в пределах вычислительного комплекса на одном сайте.

HACMP/XD расширяет базовые возможности HACMP, обеспечивая поддержку автоматического перемещения при сбое и возврата после восстановления для приложений в географически распределенных системах. Системы, работающие в различных местах, определяются как узлы HACMP, приписанные к сайтам, и HACMP осуществляет для них управление как для обычных узлов.

Основной функцией HACMP/XD является репликация данных между сайтами. Для выполнения этой функции HACMP/XD может использовать несколько компонентов:

  • HAGEO
  • PPRC
  • GLVM.

HACMP/XD HAGEO

Программное обеспечение HAGEO/GeoRM является оригинальным решением для репликации данных по сетям TCP/IP. Первоначально оно создавалось как отдельный продукт, который можно было использовать либо как автономную версию (GeoRM) только для репликации данных, либо как интегрированную версию, при использовании совместно с HACMP, для обеспечения функций автоматического перемещения при сбое и возврата после восстановления на сайте для приложений, использующих реплицируемые данные. Начиная с HACMP 5.1 HAGEO входит в программное обеспечение HACMP/XD.

Стандартная схема кластера HACMP/XD High Availability Geographic Cluster (HAGEO) представлена на рис. 15.1.

Функции HAGEO:

  • Конфигурирование кластера с географически распределенными сайтами. HAGEO расширяет HACMP таким образом, чтобы охватить два географически распределенных информационных центра или сайта. В результате такого расширения отдельный сайт перестает быть единой точкой отказа в кластере. Процесс географического зеркального отображения (geo-mirroring) создает на каждом сайте обновленную копию важных данных. Любой из сайтов может выполнять основные приложения, обеспечивая постоянную доступность критически важных вычислительных ресурсов на географически распределенных сайтах в случае, если отказ или авария выведет из строя один из сайтов.
  • Автоматические обнаружение и оповещение об отказах. HAGEO работает с HACMP, обеспечивая автоматическое обнаружение отказа сайта или географической сети. Он инициирует процесс восстановления и оповещает системного администратора обо всех обнаруживаемых отказах и предпринимаемых ответных действиях.
  • Автоматическое перемещение при сбое. HAGEO включает скрипты обработки событий, предназначенные для выполнения восстановления после отказа сайта или географической сети. Эти скрипты интегрированы в стандартные скрипты обработки событий HACMP. Можно настроить работу своей конфигурации путем добавления скриптов предили постобработки событий так же, как и в HACMP.
    Пример конфигурации HACMP/XD HAGEO

    увеличить изображение
    Рис. 15.1. Пример конфигурации HACMP/XD HAGEO
  • Быстрое восстановление после аварии данных и приложений на рабочем сайте. Процесс географического зеркального отображения обеспечивает доступность данных на втором сайте при возникновении аварии. Восстановление обычно занимает несколько минут, не включая времени восстановления приложения.
  • Автоматическая ресинхронизация данных при восстановлении сайта. HAGEO осуществляет ресинхронизацию зеркальных отображений на каждом сайте в ходе процесса восстановления сайта. Узлы на реинтегрируемом сайте автоматически обновляются с использованием данных, полученных, когда сайт находился в состоянии отказа.
  • Надежное обеспечение целостности и согласованности данных. Компоненты географического зеркального отображения и географического обмена сообщениями в HAGEO в случае отказа сайта обеспечивают согласованность данных между оставшимся сайтом и отказавшим сайтом. При реинтеграции отказавшего сайта в кластер HAGEO обновляет этот сайт актуальными данными с работающего сайта, что опять же обеспечивает согласованность данных.
  • Поддержка широкого диапазона конфигураций, что позволяет настроить решение аварийного восстановления специально под ваши потребности. Кластер HAGEO может иметь до восьми узлов с различным количеством узлов на каждом сайте.

HAGEO не зависит от файловой системы и базы данных, так как устройство географического зеркального отображения работает так же, как и поддерживаемые им дисковые устройства. Так как зеркальное отображение является прозрачным, приложения, настроенные на использование географического зеркального отображения, не требуют каких-либо изменений.

Компоненты HAGEO

Программное обеспечение содержит три важных компонента:

  • GeoMirror. Состоит из логического устройства и драйвера псевдоустройства, осуществляющего зеркальное отображение второго сайта; данные вводятся на одном сайте. Для транспортировки данных зеркального отображения используется TCP/ IP. GeoMirror можно применять в синхронном и асинхронном режимах, в зависимости от пропускной способности связи между сайтами и объема транзакций приложений (определяющего количество измененных данных).
  • GeoMessage. Обеспечивает надежную доставку данных и сообщений между устройствами GeoMirror на двух сайтах. GeoMessage представляет систему обмена сообщениями между процессами ядра, которую драйвер устройств GeoMirror использует для отправки и получения сообщений через IP-сети. GeoMessage может применять UDP или TCP в качестве транспортного протокола в IP-сети.
  • Географическая топология. Обеспечивает логику для интеграции функций географического отображения с функциями HACMP для обеспечения автоматического обнаружения отказов и восстановления после событий, оказывающих влияние на целые сайты. Этот компонент включает:
    • скрипты и программы, встраивающие обработку GeoMirror и GeoMessage в события кластера, такие, как подключения и отказы узлов и сетей;
    • скрипты, встраивающие запуск и остановку функций GeoMirror и GeoMessage в скрипты запуска и остановки HACMP;
    • сообщения журнала ошибок, обеспечивающие регистрацию операций GeoMirror и GeoMessage.

Базовые конфигурации HACMP/XD HAGEO

Можно настроить любую конфигурацию кластера HAGEO, поддерживаемую базовым программным обеспечением HACMP. Это включает дежурные конфигурации, конфигурации с перехватом и конфигурации с одновременным доступом.

  • Дежурные конфигурации. Дежурная конфигурация представляет традиционную конфигурацию с дублированием оборудования, где один или несколько узлов в кластере бездействуют до тех пор, пока не произойдет отказ серверного узла. В HAGEO это означает наличие бездействующего сайта. Сайт не является совсем бездействующим, так как он тоже может быть вовлечен в процесс географического зеркального отображения. Однако узлы на этом сайте не выполняют приложений.
  • Конфигурации с перехватом:
    • конфигурации с перехватом внутри сайта (локальный);
    • конфигурации с удаленным односторонним перехватом;
    • конфигурации с удаленным взаимным перехватом. В конфигурации с перехватом все узлы осуществляют обработку; бездействующих узлов не существует.
  • Конфигурации с одновременным доступом. В конфигурации с одновременным доступом все узлы на одном сайте имеют одновременный доступ к группе томов с одновременным доступом и владеют одинаковыми дисковыми ресурсами. Другой сайт настроен таким же образом. Выход узла из сайта не влияет на доступность ресурсов, так как на других узлах активизирована группа томов с одновременным доступом. При отказе сайта другой сайт обеспечивает одновременный доступ на узлах сайта. К приложению с одновременным доступом могут получить доступ все узлы в кластере. Диспетчер блокировки кластера (Cluster Lock Manager) должен быть запущен на всех узлах в кластере. Не все базы данных можно использовать для одновременного доступа к географически распределенным узлам.

Функция интеграции HACMP/XD PPRC

Эта функция впервые появилась одновременно в HACMP V4.5 PTF5 и в HACMP V5.1 и обеспечивает автоматическое перемещение при отказе сайта и активизацию удаленных копий данных приложения в среде, в которой на обоих сайтах используется IBM Enterprise Storage Server (ESS) и в которой зеркальное отображение дисковых томов обеспечивается функцией Peer to Peer Remote Copy (PPRC).

Стандартная конфигурация HACMP/XD PPRC представлена на рис. 15.2.

В случае отказа основного сайта данные должны быть доступны для использования на дополнительном сайте (реплицируются с использованием PPRC). Для использования копии данных на дополнительном сайте она должна быть активизирована. Функция интеграции HACMP/XD PPRC обеспечивает автоматическое разделение копий в случае отказа основного сайта и автоматическую реинтеграцию при восстановлении основного сайта.

Дополнительные сведения см. в руководстве HACMP/XD for ESS PPRC Version 5.3: Planning and Administration Guide, SC23-4863.

Пример конфигурации HACMP/XD PPRC

Рис. 15.2. Пример конфигурации HACMP/XD PPRC
< Лекция 14 || Лекция 15: 12 || Лекция 16 >