Компания IBM
Опубликован: 01.02.2008 | Доступ: свободный | Студентов: 612 / 22 | Оценка: 4.60 / 4.40 | Длительность: 43:55:00
Специальности: Разработчик аппаратуры
Лекция 8:

Управление кластером

Утилиты проверки состояния кластера и служб

lssrc

Состояние подсистемы HACMP или RSCT можно проверить с помощью команды lssrc с опцией -s или -g. Она выводит имя, группу, PID и состояние (активное или нерабочее) подсистемы.

lssrc -ssubsystem_name //выводит информацию об определенной подсистеме.

lssrc -g subsystem_group_name //выводит информацию обо всех подсистемах в определенной группе.

Внимание! Начиная с HACMP 5.3 демон диспетчера кластера clstrmgrES инициируется из процесса init, так что он автоматически запускается при загрузке. Диспетчер кластера (Cluster Manager) должен быть запущен, прежде чем можно будет запустить какие-либо службы кластера на узле. Так как демон clstrmgr является постоянно выполняющимся процессом, нельзя использовать команду lssrc -s clstrmgrES для определения состояния кластера. Вместо этого следует использовать команду /usr/ es/sbin/cluster/clstat или любую другую утилиту, описанную в этом разделе.

На рис. 8.27 показаны имена подсистем и имена групп для всех подсистем, используемых в HACMP.

Имена подсистем и имена групп, используемых в HACMP

Рис. 8.27. Имена подсистем и имена групп, используемых в HACMP

clshowsrv

Существует еще один способ вывода информации о состоянии подсистем HACMP с использованием команды clshowsrv (/usr/es/sbin/cluster/utilities/cldump). Она выводит состояние всех подсистем, используемых в HACMP, или состояние выбранной подсистемы. Формат выходных данных команды соответствует формату команды lssrc -s.

На ниже представлен синтаксис команды clshowsrv.

clshowsrv [-a|-v] [clstrmgrES|clinfoES|clcomdES]

clshowsrv -a //выводит состояние подсистемы HACMP: clstrmgrES, clinfoES и clcomdES.

clshowsrv -v // выводит состояние подсистем HACMP и RSCT. Пример 8.15 показывает выходные данные команды clshowres из нашего тестового кластера при запущенных службах кластера.

Status of the RSCT subsystems used by HACMP:
Subsystem Group PID Status
topsvcs topsvcs 22756 active
grpsvcs grpsvcs 21858 active
grpglsm grpsvcs inoperative
emsvcs emsvcs 24932 active
emaixos emsvcs 28982 active
ctrmc rsct 13430 active
Status of the HACMP subsystems:
Subsystem Group PID Status
clcomdES clcomdES 15738 active
clstrmgrES cluster 26498 active
Status of the optional HACMP subsystems:
Subsystem Group PID Status
clinfoES cluster 26260 active
Пример 8.15. Выходные данные команды clshowres -v

Также можно выполнить команду clshowsrv -v, используя меню SMIT: smit hacmp > System Management (C-SPOC) > Manage HACMP Services (Управление службами HACMP) > Show Cluster Services (Вывод служб кластера).

Команды информации о топологии

cltopinfo

Команда cltopinfo (/usr/es/sbin/cluster/utilities/cltopinfo) выводит информацию о топологии кластера в более простом формате.

Ниже представлен синтаксис команды cltopinfo.

cltopinfo [-c] [-n] [-w] [-i]

Также можно использовать меню SMIT для вывода информации о топологии в различных форматах; для этого следует запустить smit hacmp > Extended Configuration (Расширенное конфигурирование) > Extended Topology Configuration (Расширенное конфигурирование топологии) > Show HACMP Topology (Отображение топологии HACMP) и выбрать требуемый формат. На рис. 8.28 показаны меню SMIT для вывода информации о топологии с различными опциями формата.

Меню топологии кластера

Рис. 8.28. Меню топологии кластера

Служба topsvcs

Можно выполнить команду lssrc -ls topsvcs для мониторинга активности пульса на основе службы топологии. Выходные данные деятельности демона topsvcs содержат всю информацию по мониторингу пульсации для всех активных сетевых путей. Информация об определенных параметрах активности пульса содержится в полях Missed HBs (Пропущенные импульсы), Packets sent (Отправленные пакеты), Packets received (Полученные пакеты) и Errors (Ошибки) в выходных данных того или иного сетевого пути. В примере 8.16 представлен фрагмент выходных данных команды lssrc -ls topsvcs в нашем тестовом кластере. Выделенные слова указывают интересующую информацию в выходных данных.

Subsystem Group PID Status
topsvcs topsvcs 811144 active
Network Name Indx Defd Mbrs St Adapter ID Group ID
migr1_eth_01_0 [ 0] 3 3 S 11.11.1.11 11.11.1.13
migr1_eth_01_0 [ 0] en2 0x42cc1f00 0x42cc1f1b
HB Interval = 1.000 secs. Sensitivity = 10 missed beats
Missed HBs: Total: 64 Current group: 64
Packets sent : 8893 ICMP 17 Errors: 0 No mbuf: 0
Packets received: 10616 ICMP 31 Dropped: 0
NIM's PID: 774256
rs232_1 [ 3] 2 2 S 255.255.0.2 255.255.0.2
rs232_1 [ 3] tty1 0x82cc1f02 0x82cc1f05
HB Interval = 2.000 secs. Sensitivity = 5 missed beats
Missed HBs: Total: 0 Current group: 0
Packets sent : 5841 ICMP 0 Errors: 0 No mbuf: 0
Packets received: 6250 ICMP 0 Dropped: 0
NIM's PID: 893118
Пример 8.16. Выходные данные команды lssrc -ls topsvcs

Команды информации о группах ресурсов

clrginfo

Используя команду clRGinfo (/usr/es/sbin/cluster/utilities/clRGinfo), можно вывести атрибуты группы ресурсов в кластере. Выходные данные команды представляют отчет о расположении и состоянии одной или нескольких заданных групп ресурсов. Выходные данные команды представляют как глобальное состояние, так и конкретное состояние группы ресурсов на локальном узле.

Ниже представлен синтаксис команды clRGinfo.

clRGinfo [-h][-v][-a][-s|-c][-p][-t][-d][groupname1] [groupname2] ...

clRGinfo -v // выводит расположение, отменяющее приоритет (priority override location), и активные таймеры группы ресурсов.

clRGinfo -p // выводит параметры запуска, перемещения при сбое и возврата после восстановления для группы ресурсов.

clRGinfo -t // запрашивает диспетчер кластера (Cluster Manager) только на локальном узле.

clRGinfo -c // команда выводит выходные данные в формате с разделяющими двоеточиями.

clRGinfo -a // команда выводит информацию о том, какие операции с группами ресурсов выполняются во время текущего события кластера (если она выполняется во время обработки события кластера).

Существуют следующие состояния групп ресурсов:

  • Online. Группа ресурсов в настоящий момент работает должным образом.
  • Offline. Группа ресурсов в настоящий момент не работает в кластере и не находится в состоянии ошибки.
  • Acquiring. Группа ресурсов в настоящий момент подключается на одном из узлов кластера. При нормальных условиях состояние должно измениться на Online.
  • Releasing. Группа ресурсов находится в процессе освобождения от владения одним из узлов. При нормальных условиях состояние должно измениться на Offline.
  • Error. Группа ресурсов находится в состоянии ошибки. Требуется вмешательство пользователя.
  • Unknown. Текущее состояние группы ресурсов нельзя определить в связи с потерей связи из-за отказа какого-либо ресурса в группе ресурсов или в связи с несоответствием зависимости группы ресурсов.

Если на локальном узле не запущены службы кластера, команда определяет узел, на котором службы кластера активны, и получает информацию группы ресурсов от активного диспетчера кластера.

Вместо команды clrginfo можно использовать команду clfindres, представляющую собой ссылку на clRGinfo (/usr/es/sbin/cluster/utilities/clfindres).

В примере 8.17 представлены выходные данные команды clRGinfo в нашем тестовом кластере.

---------------------------------------------------------------------------Group Name Group State Node
---------------------------------------------------------------------------rg1 	ONLINE 		p650n01
	OFFLINE 	p650n02
rg2 	ONLINE 		p650n02
	OFFLINE 	p650n01
Листинг 8.17.