Компания IBM
Опубликован: 01.02.2008 | Доступ: свободный | Студентов: 612 / 22 | Оценка: 4.60 / 4.40 | Длительность: 43:55:00
Специальности: Разработчик аппаратуры

Лекция 13: Аспекты подсистемы хранения

< Лекция 12 || Лекция 13: 1234 || Лекция 14 >

Включение быстрого перехвата дисков

В конфигурации кластера HACMP нет специальной опции или флага, устанавливающих быстрый перехват дисков. Быстрый перехват дисков устанавливается в результате определенного сочетания параметров кластера.

Общие группы томов должны представлять собой группы томов с расширенным одновременным доступом. Эти группы томов затем добавляются как ресурсы в группу ресурсов в режиме неодновременного доступа. Сочетание этих двух параметров и определяют использование метода быстрого перехвата дисков для получения группы томов в HACMP.

При подключении группы ресурсов с неодновременным доступом HACMP проверяет один из дисков группы томов, является ли он группой томов с расширенным одновременным доступом. HACMP определяет это с помощью команды lqueryvg -p devicename -X. Если команда возвращает 0, значит, группа томов является обычной группой томов без одновременного доступа. Если возвращается значение 32, тогда группа томов является группой томов с расширенным одновременным доступом. На рис. 13.3 диск hdisk0 входит в группу томов rootvg без одновременного доступа. Vpath0 представляет собой диск группы томов с расширенным одновременным доступом.

В AIX 5.1 было три возможных возвращаемых значения. Значение 16 возвращалось при использовании групп томов SSA с одновременным доступом. В AIX 5.2 и выше этот тип группы томов считается устаревшим.

Пример определения типа группы томов в HACMP

Рис. 13.3. Пример определения типа группы томов в HACMP

Преимущества

Существует по меньшей мере два преимущества использования быстрого перехвата дисков:

  • уменьшение продолжительности получения дисков;
  • синхронизация ODM LVM.

Мы уже описывали первое преимущество в разделе "Принцип работы быстрого перехвата дисков". Второе преимущество, синхронизация ODM LVM, напрямую связано с использованием групп томов с расширенным одновременным доступом и с выполнением демона gsclvmd со службами кластера.

Когда все узлы группы томов с расширенным одновременным доступом подключены в активном кластере, изменения в LVM, вносимые на домашнем узле (через командную строку или через SMIT), автоматически синхронизируются по всем остальным узлам. Это значительно уменьшает вероятность несогласованности информации группы томов на разных узлах.

Однако само по себе это преимущество не является рекомендованным методом работы в среде HACMP. Рекомендуется использовать C-SPOC для синхронизации информации ODM LVM между узлами кластера. Синхронизация в C-SPOC имеет следующие преимущества в сравнении с автономной синхронизацией ODM LVM:

  1. Независима от состояния узлов кластера (активный/неактивный).
  2. Может использоваться для изменений в JFS.
  3. Обновляет файлы отметок времени VGDA на узлах кластера.

Известные проблемы

Один из недостатков использования быстрого перехвата дисков состоит в невозможности остановить службы кластера с использованием опции forced. При остановке кластера через smit clstop HACMP проверяет, содержит ли локальный узел какуюлибо группу ресурсов с быстрым перехватом дисков. Если да, то опция forced не будет выводиться в меню.

Причина в том, что при этом группы томов оставляются подключенными и зависят от gsclvmd. Gsclvmd зависит от служб групп. При остановке служб кластера происходит остановка служб, необходимых для обеспечения согласованности группы томов. Это означает потенциальную уязвимость групп томов.

В последних версиях HACMP опция принудительного отключения используется не настолько часто. Однако в некоторые периоды обслуживания может быть желательно ее применять, чтобы сократить общее время простоя служб приложений. Это ограничение является хорошо известным, и разработчики ищут способы его устранения в будущем. Однако нет никакой гарантии, что оно когда-либо будет устранено.

Мониторинг пульса через диски

Этот раздел описывает следующие аспекты мониторинга пульса через диски:

  1. Обзор.
  2. Требования.
  3. Аспекты производительности.
  4. Конфигурирование (на примере кластера из двух узлов).
  5. Тестирование.
  6. Мониторинг.

Обзор

Мониторинг пульса через диски представляет еще один вариант мониторинга пульса, отличный от IP, который использует существующие общие диски любого типа. Эта функция впервые была реализована в HACMP V5.1 и быстро стала предпочтительным методом мониторинга пульса, отличного от IP, так как он не требует использования последовательных кабелей и/или 8-портовых асинхронных адаптеров. При использовании среды SAN этот метод позволяет легко справиться с большими расстояниями между узлами.

Для обеспечения требуемого доступа к диску с каждого узла данная функция требует применения групп томов с расширенным одновременным доступом. Она использует специальную зарезервированную область на дисках для чтения и записи данных пульса. Так как эта функция применяет зарезервированную область, возможно использование существующих групп томов данных без потери дискового пространства. Однако следует помнить об аспектах производительности, описываемых в соответствующем разделе этой работы.

Возможно использование выделенного диска/LUN для мониторинга пульса через диски. Однако так как мониторинг пульса через диски применяет зарезервированное пространство, остальная область хранения данных не используется. Чем больше объем диска/LUN, выделенного для этой цели, тем больше пространства расходуется впустую. Однако при необходимости его можно использовать позже в качестве дополнительного дискового пространства.

Как и другие сети, отличные от IP, сеть пульса через диски имеет тип "точка-точка". Если кластер содержит больше двух узлов, потребуется как минимум N сетей пульса, отличных от IP, где N представляет количество узлов в кластере. Например, кластер из трех узлов требует по меньшей мере использования трех сетей пульса, отличных от IP.

Требования

Ниже перечислены требования к программному и аппаратному обеспечению.

  • HACMP V5.1 или выше.
  • Cluster.es.clvm.rte (компонент HACMP CRM).
  • AIX 5.2 или выше (рекомендуется ML2).
  • RSCT 2.3.1.1 или выше (рекомендуется 2.3.3.1).
  • Bos.clvm.enh (необходимо для поддержки групп томов с расширенным одновременным доступом).
  • Общие диски (конфигурируются как группы томов с расширенным одновременным доступом).

Аспекты производительности

Большинство современных дисков, не входящих в RAID-массивы, могут выполнять около 100 операций поиска в секунду. Секторы, используемые для мониторинга пульса через диски, являются частью VGDA. Область VGDA расположена на внешнем крае диска и может находиться далеко от данных приложений. Это означает, что при каждом импульсе мониторинга пульса выполняется операция поиска. Мониторинг пульса через диски обычно (при заданных по умолчанию параметрах) требует четыре (4) операции поиска в секунду. Другими словами, каждый из двух узлов будет выполнять запись на диск и чтение с диска один раз в секунду, что в сумме составляет 4 IOPS. При выборе диска, применяемого для мониторинга пульса, рекомендуется использовать диск с менее чем 60 операциями поиска в секунду. Для мониторинга активности операций поиска на диске можно применять инструмент filemon.

Если вы решите использовать диск, нагрузка ввода-вывода в котором превышает приведенное выше рекомендуемое значение, тогда рекомендуется изменить скорость обнаружения отказов (failure detection rate) в сети мониторинга пульса через диски на slow.

Указанные рекомендации относятся к хранению без использования RAID (т. е. JBOD). Технология дисковой подсистемы влияет на общие рекомендации. Например:

  • Если диск является частью подсистемы хранения промышленного класса с большим объемом кеша записи (например, ESS), то количество операций поиска может быть значительно выше.
  • Если диск, используемый для мониторинга пульса, входит в массив или подмассив RAID с небольшим кешем или без кеша, диск будет поддерживать меньшее количество операций поиска, в связи с дополнительной активностью, вызываемой операциями RAID. Свяжитесь с производителем, чтобы выяснить, сколько операций поиска то или иное устройство способно поддерживать.
< Лекция 12 || Лекция 13: 1234 || Лекция 14 >