Новосибирский Государственный Университет
Опубликован: 06.11.2008 | Доступ: свободный | Студентов: 3338 / 1210 | Оценка: 4.24 / 3.67 | Длительность: 14:37:00
Специальности: Математик
Лекция 10:

Вычисление оптимальных стратегий в бесконечных играх

< Лекция 9 || Лекция 10: 1234 || Лекция 11 >

Свойства оптимальных стратегий

Математическое ожидание выигрыша игрока I, применяющего чистую стратегию против оптимальной смешанной стратегии игрока II, не может быть больше значения игры.

Математическое ожидание выигрыша игрока I, применяющего оптимальную смешанную стратегию против чистой стратегии игрока II, не может быть меньше значения игры.

У каждого игрока имеется по меньшей мере одна чистая стратегия, применение которой против оптимальной стратегии другого игрока дает математическое ожидание выигрыша, равное значению игры.

Вычисление оптимальных смешанных стратегий в играх на единичном квадрате

Одним из классов игр на единичном квадрате, для которых можно найти решение, являются игры с выпуклыми или вогнутыми функциями выигрыша.

Функция K(u) называется выпуклой по u на интервале [0,1], если

K[\lambda u_1 + (1-\lambda)u_2]\le \lambda K(u_1) +(1-\lambda)K(u_2);\\ (u_1,u_2\in u;0 \le \lambda\le 1) ( 10.5)
.

График такой функции всегда проходит не выше отрезка прямой, проведенной между двумя его точками.


Рис. 10.2.

Если в выражении 9.5. имеет место строгое неравенство при u_1\ne u_2 и 0 < \lambda < 1 , то функция K(u) называется строго выпуклой. График строго выпуклой функции всегда проходит ниже отрезка прямой, проведенной между любыми его точками. (См. рисунок (10.2).)


Рис. 10.3.

В некотором смысле обратным понятию выпуклости является понятие вогнутости.

Функция K(u) называется вогнутой по u на интервале [0,1], если

K[\lambda u_1 + (1-\lambda)u_2]\ge \lambda K(u_1) +(1-\lambda)K(u_2);\\ (u_1,u_2\in u;0 \le \lambda\le 1) ( 10.6)
.

Если в выражении 9.6. имеет место строгое неравенство при u_1\ne u_2 и 0 < \lambda < 1, то функция K(u) называется строго вогнутой. График такой функции всегда проходит выше отрезка прямой, проведенной между любыми его точками (рис. 10.3).


Рис. 10.4.

Свойство выпуклости или строгой выпуклости функции выигрыша K(x,y) по y для любого x устанавливается путем вычисления ее вторых производных по y (если они существуют):

при \frac{\partial^2 k}{\partial y^2}\ge 0 функция K(x,y) является выпуклой по y ;

при \frac{\partial^2 k}{\partial y^2} > 0 функция K(x,y) является строго выпуклой по y.

Допустим, что функция выигрыша K(x,y) при любом является строго выпуклой по y и что игра имеет решение (F^*,G^*).

Предположим, что игрок I выбирает число x из интервала [0,1] согласно функции распределения F^*(x). Тогда для любой чистой стратегии y игрока II

математическое ожидание выигрыша M(F^*,y) будет равно

\int\limits_{0}^{1} K(x,y)dF^*.

Функция M(F^*,y) является строго выпуклой , так как

\frac{\partial^2 M(F^*,y)}{\partial y^2} = \int\limits_{0}^{1} \frac{\partial^2 K(x,y)}{\partial y^2} dF^*(x) > 0

Поэтому M(F^*,y) принимает минимальное значение в одной точке. Следовательно, оптимальной стратегией игрока II является чистая стратегия y^*, при которой достигается минимум функции M(F^*,y). Такую стратегию можно задать одноступенчатой функцией распределения

I_{y_1}(y)=\left
\begin{array}{aaa}
1\text{ при }y > y_1;\\
0\text{ при }y < y_1.
\end{array}
\right

Значение игры в этом случае равно

\mathop{min}\limits_y \mathop{max}\limits_x K(x,y) = \mathop{max}\limits_x K(x,y^*),

а константа y_1

есть решение уравнения

\nu=\mathop{max}\limits_x K(x,y^*).

Аналогично для функции выигрыша K(x,y), строго вогнутой по x для любого y, игрок I имеет единственную оптимальную стратегию, являющуюся одноступенчатой функцией I_{x_1}(x). Значение игры \nu в этом случае равно

\mathop{max}\limits_x \mathop{min}\limits_y K(x,y) = \mathop{min}\limits_y K(x^*,y),

а константа x_1 есть решение уравнения

\nu=\mathop{min}\limits_y K(x_1,y).

Заметим, что свойство вогнутости или строгой вогнутости функции выигрыша K(x,y) по x для любого y устанавливается путем вычисления ее вторых производных по x, если они существуют:

при \frac{\partial^2 k}{\partial x^2}\le 0 функция K(x,y) является вогнутой по x ;

при \frac{\partial^2 k}{\partial x^2} < 0 функция K(x,y) является строго вогнутой по x.

Оптимальные смешанные стратегии игрока I, если функция выигрыша K(x,y) строго выпукла по y, и игрока II, если функция выигрыша K(x,y) строго вогнута по x, определяются на основании следующих теорем ( доказательство которых дается в Мак-Кенси Д. Введение в теорию игр. М. , Изд-во физико-математической литературы, 1960.).

Т е о р е м а 1. Пусть K(x,y)функция выигрыша бесконечной игры на единичном квадрате, непрерывная по двум по двум переменным и строго выпуклая по y для любого x. Пусть I_{y_1}(y) — единственная оптимальная стратегия игрока II, и \nuзначение игры. Если y_1=0 или y_1=1, то у игрока I имеется оптимальная стратегия I_{b}, где константой b может быть любое число, удовлетворяющее условиям:

0\le b\le 1;\\
K(b,y_1)=\nu

\frac{\partial k(b,y_1)}{\partial y} 
\left< \begin{array}{ccc}
\ge 0 \text{ для }y_1=0;\\
\le 0 \text{ для }y_1=1.
\end{array}\right

Если 0 < y_1 < 1, то у игрока I имеется оптимальная стратегия следующего вида:

F^*(x)=\alpha I_{x_1}(x)+(1-\alpha)I_{x_2}(x) ( 10.6)
,

где \alpha, x_1 и x_2 — любые числа, удовлетворяющие условиям:

0\le x_1 \le 1; \le x_2 \le 1; \le \alpha \le 1;\\
K(x_1,y_1)=\nu; K(x_2,y_1)=\nu;\\
\frac{\partial k(x_1,y_1)}{\partial y} \ge 0 \ge \frac{\partial k(x_2,y_1)}{\partial y};\\
\alpha \frac{\partial k(x_1,y_1)}{\partial y} +(1-\alpha) \frac{\partial k(x_2,y_1)}{\partial y} =0 ( 10.7)
.

Т е о р е м а 2. Пусть K(x,y)функция выигрыша бесконечной игры на единичном квадрате, непрерывная по двум по двум переменным и строго вогнутая по x для любого y. Пусть I_{x_1}(x) — единственная оптимальная стратегия игрока I, и \nuзначение игры. Если x_1=0 или x_1=1, то у игрока II имеется оптимальная стратегия I_b, где константой b может быть любое число, удовлетворяющее условиям:

0\le b\le 1;\\
K(x_1,b)=\nu

\frac{\partial k(x_1,b)}{\partial y} 
\left< \begin{array}{ccc}
\le 0 \text{ для }x_1=0;\\
\ge 0 \text{ для }x_1=1.
\end{array}\right

Если 0 < x_1 < 1, то у игрока II имеется оптимальная стратегия следующего вида:

G^*(x)=\alpha I_{y_1}(x)+(1-\alpha)I_{y_2}(y) ( 10.8)
,

где \alpha, y_1 и y_2 — любые числа, удовлетворяющие условиям:

0\le y_1 \le 1; \le y_2 \le 1; \le \alpha \le 1;\\
K(x_1,y_1)=\nu; K(x_1,y_2)=\nu;\\
\frac{\partial k(x_1,y_1)}{\partial x} \ge 0 \ge \frac{\partial k(x_1,y_2)}{\partial x};\\
\alpha \frac{\partial k(x_1,y_1)}{\partial x} +(1-\alpha) \frac{\partial k(x_1,y_2)}{\partial x} =0 ( 10.9)
.

Из теорем 1 и 2 вытекает, что оптимальная стратегия игрока I для функции выигрыша, строго выпуклой по y, есть чистая стратегия, представляющая одну из точек интервала [0,1], если y^*=0 или 1. Если 0 < y^* < 1, то оптимальная стратегия игрока I состоит в случайном выборе одного из двух значений x_1,x_2 по закону двухступенчатой функции распределения вида 9.6. Для функции выигрыша, строго вогнутой по x, оптимальная стратегия игрока II есть чистая стратегия, представляющая одну из точек интервала [0,1], если x^*=0 или x^*=1. Если 0 < x^* < 1, то оптимальная стратегия игрока II

Состоит в случайном выборе одного из двух значений y_1,y_2 по закону двухступенчатой функции вида (10.8.)

Реализация смешанной стратегии вида (10.6) или (10.8.) заключается в том, что с помощью случайного механизма выбирается число \alpha^* из интервала [0,1] и x(y) принимает значение x_1(y_1), если \alpha^* < \alpha и x_2(y_2), если \alpha^* \ge \alpha.


Рис. 10.5.

Решение игры на единичном квадрате с выпуклой (вогнутой) функцией выигрыша можно найти аналогично решению игры, функция выигрыша которой является строго выпуклой (вогнутой). Однако в этом случае оптимальная стратегия игрока I, указанная в теореме 9.2. (или игрока I в теореме 9.1.), вообще уже не является единственной.

< Лекция 9 || Лекция 10: 1234 || Лекция 11 >
Данил Комардин
Данил Комардин

мне задали дистанционное задание на сертификат,но я не могу его найти