Новосибирский Государственный Университет
Опубликован: 06.11.2008 | Доступ: свободный | Студентов: 3338 / 1210 | Оценка: 4.24 / 3.67 | Длительность: 14:37:00
Специальности: Математик
Лекция 9:

Метод вычисления оптимальных стратегий

< Лекция 8 || Лекция 9: 12 || Лекция 10 >

Вычисление оптимальных стратегий в биматричных играх

Описание биматричной игры. Все игры которые были рассмотрены, относились к классу игр с нулевой суммой. Однако ряд конфликтных ситуаций, складывающихся в ходе действий, характерны тем, что выигрыш одной стороны не равен в точности проигрышу другой. Теоретико-игровыми моделями подобных ситуаций являются некооперативные игры с ненулевой суммой. Такие игры называются биматричными, потому что задание каждой такой игры сводится к заданию двух матриц A и B одинаковой формы: A=||a_{ij}||; B=||b_{ij}||  при i=1,...m; j=1,...,n.

Процесс биматричной игры состоит в независимом выборе игроком I числа i а игроком II — числа j, после чего игрок I получает выигрыш a_{ij}, а игрок II — выигрыш b_{ij}.

Номера строк матриц A и B назовем чистыми стратегиями игрока I, а номера столбцов этих матриц – чистыми стратегиями игрока II. Тогда пары вида (i,j) будут являться ситуациями в чистых стратегиях биматричной игры, а числа a_{ij} и b_{ij} — выигрышами I и II игроков в ситуации (i,j). Соответственно, распределение вероятностей применения чистых стратегий игрока I — x=(x_1,...,x_m) и игрока II — y=(y_1,...,y_n) будем называть смешанными стратегиями. Тогда пары вида (x,y) представляют ситуации биматричной игры в смешанных стратегиях, а числа \sum\limits_{i=1}^{m}\sum\limits_{j=1}^{n}a_{ij}x_iy_j и \sum\limits_{i=1}^{m}\sum\limits_{j=1}^{n}b_{ij}x_iy_j являются математическими ожиданиями выигрыша I и II игроков.

Ситуацией равновесия биматричной игры в смешанных стратегиях будем называть такую пару (x^*,y^*), при которой:

\nu_I=\sum\limits_{i=1}^{m}\sum\limits_{j=1}^{n}a_{ij}x^*_iy^*_j \ge \sum\limits_{i=1}^{m}\sum\limits_{j=1}^{n}a_{ij}x_iy^*_j;\\ \nu_{II}=\sum\limits_{i=1}^{m}\sum\limits_{j=1}^{n}b_{ij}x^*_iy^*_j \ge \sum\limits_{i=1}^{m}\sum\limits_{j=1}^{n}b_{ij}x_iy^*_j ( 8.2)
,

где \nu_I — математическое ожидание выигрыша игрока I;

\nu_{II} — математическое ожидание выигрыша игрока II;

x^* — оптимальная смешанная стратегия игрока I;

y^* — оптимальная смешанная стратегия игрока II.

Задача

Построение и решение биматричной игры. Предположим, что противолодочная подводная лодка страны L осуществляет поиск ракетной подводной лодки государства R, которая маневрирует в строго определенной части района боевого патрулирования. В остальной части этого района действует противолодочная подводная лодка R, которая осуществляет поиск противолодочной подводной лодки L. Пусть каждая противолодочная лодка для обнаружения противника может использовать свою гидроакустическую станцию или в активном режиме, включая ее периодически, или только в пассивном режиме, выполняя непрерывный поиск.

Как противолодочная подводная лодка L, так и ракетная подводная лодка R с обнаружением сигналов гидролокатора может уклониться от противника. Однако периодичность включения гидролокатора делает обнаружение возможным, но недостоверным.

В подобной конфликтной ситуации одним из игроков является противолодочная подводная лодка L, а другим — противолодочная подводная лодка R.Очевидно, ракетная подводная лодка не может быть игроком, так как она имеет только один способ действий, заключающийся в скрытом маневрировании и выполнении уклонения с обнаружением сигналов гидролокаторов.

Характерным здесь является то, что каждый из игроков преследует разные, но не противоположные цели. Действительно, целью противолодочной подводной лодки L является обнаружение ракетной подводной лодки, а целью противолодочной подводной лодки R — обнаружение противолодочной подводной лодки L. Поэтому для оценки достижения цели каждым из игроков в зависимости от выбранных способов действий (стратегий) необходимо иметь два критерия эффективности и соответственно две функции выигрыша. Тогда моделью подобной конфликтной ситуации будет конечная игра с ненулевой суммой, описываемая двумя матрицами одинаковой формы A=||a_{ij}|| и B=||b_{ij}||, называемая биматричной.

Примем за критерий эффективности противолодочной подводной лодки L (игрок I ) вероятность обнаружения ракетной подводной лодки (a_{ij}), а за критерий эффективности противолодочной подводной лодки R (игрок II ) – вероятность обнаружения противолодочной подводной лодки L(b_{ij}). Тогда биматричная игра будет задана матрицей A (рисунок 9.a) и матрицей B (рисунок 9.b).

Матрица A

Рис. 9.a. Матрица A
Матрица B

Рис. 9.b. Матрица B

Где i=j=1 — использование активного режима;

i=j=2 — использование пассивного режима.

Для решения полученной биматричной игры (2 \times 2) достаточно задать значения вероятностей a_{ij} и b_{ij}.

Пусть для конкретных значений вероятностей a_{ij} и b_{ij} биматричная игра задана матрицами A (рис. 8.c) и B (рис. 8.d).

Матрица A

Рис. 9.c. Матрица A
Матрица B

Рис. 9.d. Матрица B

Из анализа матриц A и B устанавливаем, что i_0=1 и j_0=1, то есть игроки осуществляют ситуацию равновесия в чистых стратегиях, так как максимальные элементы матриц A и B принадлежат паре (1,1).

Таким образом, моделью конфликтной ситуации, в которой противники преследуют разные, но не прямо противоположные цели, является биматричная игра. Ее особенность по сравнению с матричной игрой заключается в наличии двух матриц, элементы каждой из которых равны значениям критерия эффективности соответствующего игрока. Принцип оптимальности, лежащий в основе вычислительной процедуры смешанных стратегий, исходит из обеспечения игрокам выигрыша, которой остается неизменным и равным значению игры независимо от действий противника.

< Лекция 8 || Лекция 9: 12 || Лекция 10 >
Данил Комардин
Данил Комардин

мне задали дистанционное задание на сертификат,но я не могу его найти