Нижегородский государственный университет им. Н.И.Лобачевского
Опубликован: 26.04.2007 | Доступ: свободный | Студентов: 1395 / 113 | Оценка: 3.69 / 3.54 | Длительность: 14:45:00
ISBN: 978-5-9556-0072-7
Специальности: Математик
Лекция 11:

Смешанные стратегии и проблема устойчивости решений

< Лекция 10 || Лекция 11: 123 || Лекция 12 >

Существование устойчивых решений в смешанных расширениях 2 x 2 игр

Обобщим результаты рассмотрения конкретного примера на случай смешанного расширения произвольной 2\times 2 биматричной игры. Обозначим элементы матриц первой и второй сторон соответственно через aij} и bij (1\le i,\, j \le 2). Примем, что сторона P1 использует смешанную стратегию (x,1-x), 0\le x \le 1, а сторона P2 - смешанную стратегию (y,1-y), 0 \le y \le 1. Смешанные стратегии (x,1-x), (y,1-y), выбранные сторонами P1, P2, однозначно описываются парой вещественных чисел (x,y), принадлежащей единичному квадрату

D = \{(x,y)\colon 0 \le x, y \le 1\}. ( 10.4)

Математическое ожидание M1(x,y) выигрыша стороны P1, соответствующее паре (x,y) (с учетом независимости выборов, порождаемых рулетками сторон), определяется выражением

\begin{gathered}
M_1 (x,y) = [a_{11} x + a_{21}(1 - x)]y + [a_{12}x + a_{22}(1 - x)](1-
y)=\\ = xy (a_{11} - a_{12} - a_{21} + a_{22}) - x(a_{22} - a_{12}) -
y(a_{22} - a_{21}) + a_{22},
\end{gathered}
или
M_1(x,y) = Axy - ax + f(y), ( 10.5)
где
\begin{gathered}
A = a_{11} - a_{12} - a_{21} + a_{22},\quad a = a_{22} - a_{12},\\
f(y) = a_{22} - y(a_{22} - a_{21}).
\end{gathered} ( 10.6)

Аналогичные вычисления дают выражение для математического ожидания M2(x,y) выигрыша стороны P2:

M_2(x,y) = Bxy - by + g(x), ( 10.7)
B = b_{11} - b_{12} - b_{21} + b_{22},\quad b = b_{22} - b_{21}, ( 10.8)
g(x) = b_{22} - x(b_{22} - b_{12}).

Таблица 2.6.
Матрица игрока P1 Смешанная cтратегия P2 Матрица игрока P2 Смешанная cтратегия P2
y 1-y y 1-y
Смешанная стратегия P1 x a11 a12 Смешанная стратегия P1 x b11 b12
1-x a21 a22 1-x b21 b22

Теперь вопрос о существовании пары (x*,y*), определяющей устойчивое (по Нэшу) решение (x*,1-x*), (y*,1-y* ) в смешанном расширении

M_i(x,y),\quad i = 1,2,\quad 0 \le x,\ y \le 1, ( 10.9)
исходной 2\times 2 биматричной игры, сводится к вопросу о существовании решения (x^\ast, y^\ast) \in D системы неравенств:
(\forall x \in [0,1])\, M_1 (x^\ast, y^\ast) \ge M_1(x, y^\ast), ( 10.10)
(\forall y \in [0,1])\, M_2 (x^\ast, y^\ast) \ge M_2(x^\ast, y). ( 10.11)
Условия (10.10), (10.11) могут быть существенно упрощены.

Лемма 2.1. Для выполнения соответствующего паре (x*,y*) континуума неравенств (10.10) необходима и достаточна справедливость двух неравенств:

M_1 (x^\ast, y^\ast) \ge M_1(0, y^\ast),\quad
M_1 (x^\ast, y^\ast) \ge M_1(1, y^\ast). ( 10.12)
Аналогично, для выполнения условий (10.11) необходима и достаточна справедливость неравенств:
M_2 (x^\ast, y^\ast) \ge M_2(x^\ast, 0),\quad
M_2 (x^\ast, y^\ast) \ge M_2(x^\ast, 1). ( 10.13)

Доказательство Покажем эквивалентность условий (10.10) и (10.12). Эквивалентность условий (10.11) и (10.13) доказывается аналогично. Подстановка значений x=0 и x=1 в условия (10.10) дает неравенства (10.12). Т.е. необходимость отношений (10.12) действительно имеет место.

Пусть выполняются условия (10.12). Из линейности по x выражения (10.5) для величины M1(x,y) следует, что при любом значении x \in [0, 1]

M_1(x, y^\ast) = M_1[1 \cdot x + 0 \cdot (1 - x), y^\ast] =
x M_1 (1, y^\ast) + (1 - x)M_1(0, y^\ast).
Отсюда, учитывая сделанное предположение о справедливости неравенств (10.12), выводим истинность отношения
M_1(x, y^\ast) \le M_1 (x^\ast, y^\ast),
что и доказывает выполнение условий (10.10). Таким образом, достаточность также установлена.

Теорема 2.2 (о существовании устойчивых решений в смешанном расширении 2\times 2 биматричной игры. Каждая 2\times 2 биматричная игра имеет устойчивое (по Нэшу) решение в смешанных стратегиях.

Доказательство 1. Определим множество всех пар (x, y) \in D, удовлетворяющих неравенствам (10.12), которые, согласно доказанной лемме, эквивалентны условиям (10.10).

При x=0 из выражения (10.5) и из первого неравенства в (10.12) следует справедливость отношения

x^\ast (Ay^\ast - a) \ge 0. ( 10.14)

Аналогично, из второго неравенства в (10.12) (для случая x=1 ) вытекает оценка

(1 - x^\ast)(Ay^\ast - a) \le 0. ( 10.15)

Найдем множество всех решений системы (10.14), (10.15), лежащих в единичном квадрате D из (10.4).

При x*=0 условие (10.14) необходимо выполняется и, следовательно, все пары вида

(0, y^\ast),\quad Ay^\ast \le a ,\quad 0 \le y^\ast\le 1, ( 10.16)
являются решениями системы (10.14), (10.15).

Аналогично, при x*=1 необходимо выполняется условие (10.15) и все пары вида

(1, y^\ast),\quad Ay^\ast \ge a,\quad 0 \le y^\ast \le 1, ( 10.17)
являются решениями рассматриваемой системы (10.14), (10.15).

Наконец, при 0<x*<1 множество решений системы (10.14), (10.15) состоит из пар вида

(x^\ast, y^\ast),\quad Ay^\ast = a,\quad 0 < x^\ast < 1,\quad 0 \le y^\ast \le 1. ( 10.18)

Теперь рассмотрим выполнимость полученных условий (10.16)-(10.18) в зависимости от значений величин a и A из (10.06). При a=A=0 любая пара (x^\ast, y^\ast) \in D удовлетворяет условиям (10.16)-(10.18) и, следовательно, является решением (10.10).

При A=0 и a\ne 0 возможны два случая, которым соответствуют два верхних фрагмента на рис. 2.8. При a>0 все точки, лежащие на левой стороне (выделена жирной линией на левом верхнем фрагменте) квадрата D, являются решениями системы (10.10). При a<0 этим свойством обладают все точки, лежащие на правой стороне квадрата D (см. правый верхний фрагмент на рис. 2.8).

Пусть A \ne 0. Тогда, согласно (10.16), все решения вида (0, y^\ast) \in D возможны лишь при условии, что y^\ast \le \alpha (если A>0 ) или y^\ast \ge \alpha (если A<0 ), где

\alpha = a/A. ( 10.19)

Аналогично, из (10.17) выводим, что все решения вида (1, y^\ast) \in D возможны лишь при выполнении условия y^\ast \ge \alpha (если A>0 ) или при выполнении условия y^\ast \le \alpha (если A<0 ). Наконец, согласно (10.18), решения вида (x^\ast, \alpha) \in D, 0<x*<1, возможны лишь в случаях, когда 0 \le \alpha \le 1. Случаю A>0 соответствует левый фрагмент второго (сверху) ряда на рис. 2.8. При этом все точки из D, удовлетворяющие условиям (10.10), лежат на жирной ломаной линии, составленной из трех отрезков. Два вертикальных отрезка представляют точки вида (0,y*) и (1,y*). Горизонтальный отрезок является образом точек вида (x^\ast, \alpha), 0<x*<1. Правый фрагмент из этого же ряда соответствует случаю A<0, 0 < \alpha < 1.

< Лекция 10 || Лекция 11: 123 || Лекция 12 >
Михаил Агапитов
Михаил Агапитов

Не могу найти  требования по оформлению выпускной контрольной работы по курсу профессиональной переподготовки "Менеджмент предприятия"

Подобед Александр
Подобед Александр

Я нажал кнопку "начать курс" и почти его уже закончил, но для получения диплома на бумаге, нужно его же оплатить? Как оплатить?