НОУ ИНТУИТ | Теория экономических механизмов. Лекция 1: Теория игр

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Регистрация Вход

Твой путь к знаниям!

Опубликован: 05.08.2011 | Доступ: свободный | Студентов: 1543 / 82 | Оценка: 4.50 / 3.50 | Длительность: 18:52:00

ISBN: 978-5-9963-0014-3

Темы: Математика, Экономика

Специальности: Математик, Экономист

|

Вам нравится? Нравится 44 студентам

| Поделиться |

Поддержать курс

| Скачать электронную книгу

Совместные смешанные стратегии

Мы уже говорили о том, что в игре может быть несколько равновесий Нэша. Давайте приведем конкретный пример; пример не только проиллюстрирует этот факт, но и вдобавок поднимет важную проблему, которую мы попытаемся решить в этом параграфе.

Пример 1.9. Этот классический пример называется "Семейный спор" (по-английски звучит более внушительно: "Battle of the sexes"). Рассмотрим семью (пока что из двух человек), которая пытается решить, куда пойти вечером. Муж, разумеется, хочет идти на футбол, в то время как жена пытается вытащить мужа в театр. Но, несмотря на этот конфликт интересов, за семью можно быть спокойным: и муж, и жена хотят провести вечер вместе, и ни футбол, ни театр будут не в радость, если пойти туда одному. Осталось только сделать предположение (пожалуй, самое противоестественное), что муж и жена не обсуждают друг с другом свои решения, а просто сами по себе идут или на футбол, или в театр. У игры получается следующая матрица (строки выбирает муж, столбцы — жена; в векторе результатов первый компонент принадлежит мужу, второй — жене).

$\begin{array}{r|rr} & \sdt{Футбол} & \sdt{Театр} \\ \hline \text{Футбол} & (5, 2) & (0, 0) \\ \text{Театр} & (0, 0) & (2, 5) \\ \end{array}$

Как нетрудно заметить, у этой игры два равновесия Нэша:

$(\text{Футбол}, \text{Футбол})\text{ и } (\text{Театр}, \text{Театр}).$

Ни мужу, ни жене невыгодно отклоняться от одного из этих равновесий. Но вот первая беда: любое из них нечестное — если постоянно выбирать одну и ту же стратегию (а стимулов отклоняться-то нет), один супруг будет получать значительно большую выгоду, чем другой.

Можно попробовать решить эту игру в смешанных стратегиях. Сыграем за мужа: найдем для данной вероятности того, что жена пойдет на футбол, оптимальную вероятность пойти на футбол самому:

$\text{E [выгода мужа]} = 5pq + 2(1-p)(1-q) = p(7q-2) + 2-2q.$

Поскольку для жены ситуация абсолютно симметрична, понятно, что в точке $p=\frac57$ , $q=\frac27$ (каждый выбирает свой любимый способ провести вечер с вероятностью $\frac57$ ) достигается равновесие в смешанных стратегиях, ведь ожидаемая выгода каждого участника не зависит от его стратегии. В итоге ожидаемая выгода и мужа, и жены оказывается равной $p(7q-2)+2-2q = 2-\frac47 = \frac{10}7$ . Вот и вторая беда: использовать смешанные стратегии хуже, чем просто согласиться на "неподходящий" вариант: там выгода будет равна , а тут всего $\frac{10}7$ .

Конец примера 1.9.

На первый взгляд кажется, что делать нечего: придется кому-то поступиться своим интересом. Решение приходит в виде нового понятия равновесия, которое позволяет участникам использовать внешнюю информацию.

Определение 1.7. Совместная смешанная стратегия игроков — это распределение вероятностей на всем множестве возможных чистых стратегий всех игроков $\mathbf S$ .

То есть, грубо говоря, муж и жена заранее договариваются: кто-то (возможно, кто-то третий — важно, что ни один участник не контролирует этот результат, но оба имеют к нему доступ) вечером подбросит монетку, и если выпадет орел, то они вместе пойдут в театр, а если решка — на футбол. В такой ситуации исход получается оптимальным: и точку (0,0) выбирать никогда не придется, и равновесие честное, ведь у каждого участника ожидаемая выгода равна $\frac72$ .

Определение 1.8. Равновесие в совместных смешанных стратегиях — это такое распределение вероятностей на множестве чистых стратегий $\mathbf S$ , что для всех $i\in\mathcal I$ и любой пары векторов $s_i, s^\prime_i\in \mathbf S$

$\sum\limits_{\mathbf s_{-i}}p(s_i,\mathbf s_{-i})u_i(s_i,\mathbf s_{-i}) \ge \sum\limits_{\mathbf s_{-i}}p(s_i,\mathbf s_{-i})u_i(s^\prime_i,\mathbf s_{-i}),$

или, что то же самое,

$\sum\limits_{\mathbf s_{-i}}p(s_i,\mathbf s_{-i})\left(\vphantom{1^2}u_i(s_i, \mathbf s_{-i}) - u_i(s^\prime_i, \mathbf s_{-i})\right)\ge 0.$

То есть некое внешнее устройство выбирает стратегию $\mathbf s\in\mathbf S$ случайным образом по распределению , и оказывается так, что для каждого из игроков в получившемся векторе невыгодно отклоняться от своей стратегии. В примере с семейным спором все выходит именно так: монетка определяет стратегию и мужа, и жены, но при этом выбор делается между двумя равновесиями Нэша, то есть любой случайно выбранный вектор получится равновесным. Совместные смешанные стратегии — это способ перейти от одного равновесия Нэша к линейной комбинации нескольких равновесий, если эта комбинация оказывается более выгодна агентам.

Равновесия по Байесу-Нэшу

До сих пор мы рассматривали исключительно игры, в которых все агенты знали все на свете. Каждый агент знал функции выплаты u_i других агентов, знал множества стратегий других игроков S_i . Более того, каждый агент знал, что каждый другой агент это знает, и что каждый другой агент знает, что он знает, что... в общем, понятно.

Однако на самом деле это условие довольно часто не выполняется. А если агент не знает, к примеру, какие выплаты у других агентов, то говорить о равновесии Нэша становится бессмысленным. Что же делать?

Пример 1.10. В качестве примера рассмотрим вариант все того же "семейного спора", который на этот раз для мужа гораздо печальнее. Предположим, что муж не уверен, хочет ли жена провести с ним вечер или, наоборот, в этот раз от него отдохнуть. Если жена ищет встречи, то матрица игры будет как в примере 1.9:

$\begin{array}{r|rr} & \sdt{Футбол} & \sdt{Театр} \\ \hline \text{Футбол} & (5, 2) & (0, 0) \\ \text{Театр} & (0, 0) & (2, 5) \\ \end{array}$

А если встречаться не хочет, то матрица становится другой:

$\begin{array}{r|rr} & \sdt{Футбол} & \sdt{Театр} \\ \hline \text{Футбол} & (5, 0) & (0, 5) \\ \text{Театр} & (0, 2) & (2, 0) \\ \end{array}$

Пусть муж ничего не знает о желаниях жены, и для него вероятности этих исходов равны 50%. Таким образом, с точки зрения мужа, у жены есть два возможных типа; или, что то же самое, есть два возможных равновероятных состояния мира, и только жена знает истинное состояние (этакая, простите за выражение, "жена Шредингера").

Если в такой ситуации муж решит пойти на футбол, то (в предположении о 50%) ему невыгодно будет менять свое предпочтение, ведь в случае футбола выгода получается $\frac12\cdot 0 + \frac12\cdot 5 = \frac52$ , а в случае театра лишь $\frac12\cdot 2 + \frac12\cdot 0 = \frac12$ . А для жены, очевидно, в такой ситуации выгодным будет идти на футбол, если она хочет встретить мужа, и идти в театр, если не хочет. Таким образом, профиль стратегий $(\text{Футбол}, [\text{Футбол}, \text{Театр}])$ будет находиться в равновесии Нэша.

Конец примера 1.10.

Более общая формулировка будет изрядно напоминать равновесие в совместных смешанных стратегиях. Но теперь придется немного дополнить модель самой игры. Определение 1.9 отличается от определения 1.1 только множествами типов $\Theta_i$ .

Определение 1.9. Стратегическая игра с неполной информацией — это четверка

$\langle \mathcal I, \{S_i\}_{i\in\mathcal I}, \{\Theta_i\}_{i\in\mathcal I}, \{u_i\}_{i\in\mathcal I}\rangle,$

где обозначения расшифровываются следующим образом:

$\mathcal I=\{1,...,N\}$ — конечное множество игроков.
$\{S_i\}_{i\in\mathcal I}$ — множество доступных игрокам действий.
$\{\Theta_i\}_{i\in\mathcal I}$ — множество типов игроков; для типов мы будем применять ту же нотацию, например

$\theta_{-i} = (\theta_1,...,\theta_{i-1},\theta_{i+1},...,\theta_N).$
Через $\mathbf\Theta$ будем обозначать множество векторов типов: $\mathbf\Theta=\Theta_1\times\ldots\times\Theta_N$ . Каждому игроку известен его собственный тип $\theta_i$ и общее распределение $p(\mathbf\Theta)$ , из которого берутся типы всех остальных; в частности, игрок знает

$p(\mathbf\Theta_{-i}\mid \theta_i) = \frac{p(\theta_i,\mathbf\Theta_{-i})}{p(\theta_i)}$ .
$\{u_i\}_{i\in\mathcal I}$ — множество функций выплат $u_i:\mathbf S\times\mathbf\Theta \to\mathbb R$ . Функции выплат теперь зависят не только от стратегий, но и от типов.

В играх с неполной информацией игроки не знают типов других игроков, но знают распределение. Таким образом, легко определить новое понятие равновесия, которое теперь будет действовать только в ожидании.

Определение 1.10. Равновесие по Байесу-Нэшу для стратегической игры с неполной информацией $\langle \mathcal I, \{S_i\}_{i\in\mathcal I}, \{\Theta_i\}_{i\in\mathcal I}, \{u_i\}_{i\in\mathcal I}\rangle$ — это такой профиль стратегий $s^*\in S$ , что для всякого агента $i\in\mathcal I$ и всякого его типа $\theta_i\in\Theta_i$ выполняется следующее условие:

$s_i^*\in \arg\max\limits_{s^\prime_i\in S_i} \sum\limits_{\mathbf\Theta_{-i}}p(\mathbf\Theta_{-i}\mid\theta_i)u_i(s^\prime_i, \mathbf s_{-i}(\mathbf\Theta_{-i}), \theta_i, \mathbf\Theta_{-i}).$

Очевидно (проверьте!), что любое равновесие в доминантных стратегиях является равновесием по Байесу-Нэшу.

Кроме уже описанных, нам в теории экономических механизмов потребуется и еще одно понятие равновесия, промежуточное между равновесием по Байесу-Нэшу и равновесием в доминантных стратегиях.

Определение 1.11. Равновесие ex post для стратегической игры с неполной информацией $\langle \mathcal I, \{S_i\}_{i\in\mathcal I}, \{\Theta_i\}_{i\in\mathcal I}, \{u_i\}_{i\in\mathcal I}\rangle$ — это равновесие по Байесу-Нэшу $\mathbf s^*\in S$ , в котором дополнительно выполняется следующее условие: для всех $i\in\mathcal I$ , всех $\theta\in\Theta$ и всех $s^\prime_i\in S_i$

$u_i(\mathbf s^*(\theta), \theta) \ge u_i(\mathbf s^\prime_i, s_{-i}(\theta_{-i}), \theta).$

Проще говоря, даже если агенту рассказать о том, какие типы были у всех остальных игроков, ему все равно не будет резона менять свое решение. Поэтому агенту гарантированно "не о чем жалеть" в результате игры: даже если он узнает то, чего не знал раньше, все равно для него s^*_i останется оптимальной стратегией. Мы еще не раз встретимся с понятием ex post и другими моментами времени в течение игры в контексте аукционов; подробно эти понятия мы объясним в "Введение в дизайн механизмов" .

Дальше >>

Авторизоваться

Теория экономических механизмов

Теория игр

Совместные смешанные стратегии

Равновесия по Байесу-Нэшу

Вопросы и ответы