Опубликован: 05.08.2011 | Доступ: свободный | Студентов: 1407 / 57 | Оценка: 4.50 / 3.50 | Длительность: 18:52:00
ISBN: 978-5-9963-0014-3
Специальности: Математик, Экономист
Лекция 3:

Принцип выявления предпочтений

< Лекция 2 || Лекция 3: 1234 || Лекция 4 >

Свойства механизмов в контексте аукционов

Прежде всего напомним общее определение механизма.

Определение 3.2. Механизм

\mathcal{M}=(\Sigma_1,\ldots,\Sigma_N,g)

состоит из набора стратегий \Sigma_i для каждого агента и функции исходов

g:\Sigma_1\times\ldots\times\Sigma_N\to\mathcal{O},

которая определяет исход, предусмотренный механизмом для полученного на вход профиля стратегий \mathbf s=(s_1,...,s_N).

Теперь немного конкретизируем это определение, применив его к конкретной ситуации аукционов.

Во-первых, у агентов вместо множеств стратегий \Sigma_i будут множества возможных ставок \mathcal{B}_i. Каждый агент должен сделать ставку b_i\in\mathcal{B}_i. Итого получится вектор ставок

\mathbf b=(b_1,\ldots,b_N)\in\mathcal{B}=\mathcal{B}_1\times\ldots\times\mathcal{B}_N.

Во-вторых, в контексте аукционов можно конкретизировать и понятие функции исходов. Она разделится на две функции: правило размещения ( \pi ) и правило платежей ( \mu ).

Правило размещения (allocation rule) \pi:\mathcal{B}\to\Delta будет определять, кому достанется предмет; здесь \Delta — множество распределений вероятностей над множеством агентов, потому что правило размещения, вообще говоря, не обязано ограничиваться строго детерминированным размещением.

А правило платежей (payment rule) \mu:\mathcal{B}\to\mathbb R^N определяет, сколько каждый агент должен будет заплатить. \mu_i(\b) — цена, которую должен заплатить i -й агент по итогам аукциона. Как и размещение \pi_i(\b), цена зависит исключительно от вектора ставок, поданного на вход механизма. Здесь важно отметить, что платить может оказаться нужно далеко не только победителю. Бывают аукционы, в которых все участники платят ту или иную сумму (либо за вход, либо сумму, связанную с их ставкой). Бывают аукционы, в которых некоторые участники платят, а другие перераспределяют между собой то, что первые заплатили (и для них \mu_i будет принимать отрицательные значения); таковы, например, аукционы с условием баланса бюджета, которые мы рассмотрим в лекции "Эффективные и оптимальные механизмы" .

Пример 3.3. Функции размещения и платежей в аукционе первой цены будут выглядеть так:

\pi_i(\mathbf b) = \begin{cases} 1, & \text{если }b_i>\max_{j\neq i}b_j, \\ 0, & \text{в противном случае}.\end{cases}\\
\mu_i(\mathbf b) = \begin{cases} b_i, & \text{если }b_i>\max_{j\neq i}b_j, \\ 0, & \text{в противном случае}.\end{cases}

То есть мы отдаем предмет агенту, который предложил больше всех, и ни с кого не берем денег, кроме этого агента; зато уж с победителя мы берем его ставку полностью. Каемся: в этих формулах мы допустили небольшую неточность. Может оказаться, что ни для какого i не верно, что b_i>\max_{j\neq i}b_j. Это значит, что в аукционе равенство ставок между несколькими участниками; раньше мы упоминали, что будем в такой ситуации равновероятно отдавать вещь любому из победителей (и с него и брать деньги). Поэтому формулы для \pi_i и \mu_i не вполне точны. Но при равномерных функциях распределений внутренних ценностей и ставок вероятность совпадения равна нулю, поэтому мы ею будем в дальнейшем пренебрегать.

В аукционе второй цены функция размещения точно такая же, как и в аукционе первой цены. Зато функция выплат отличается:

\mu_i(\mathbf b) = \begin{cases} \max_{j\neq i}b_j, & \text{если }b_i>\max_{j\neq i}b_j, \\ 0, & \text{в противном случае}.\end{cases}

Конец примера 3.3.

Стратегии в контексте аукционов тоже немного конкретизируются; теперь стратегии — это функции

\beta_i:[0,\omega_i]\to\mathcal{B}_i,

где \omega_i — максимальная возможная для i -го агента стоимость (возможно, \omega_i=\infty ).

Равновесие вектора стратегий \mathbf\beta=(\beta_1,\ldots,\beta_N) достигается, если для каждого i и каждого x_i отклонение от стратегии \beta_i уменьшает ожидаемый выигрыш i -го агента:

\mathbf E_{X_j,j\neq i}[m(\beta^\prime_i(x_i))]\le\mathbf E_{X_j,j\neq i}[m(\beta_i(x_i))],

где вероятность берется по распределениям X_j других агентов, придерживающихся стратегии \beta_j.

Теперь снова обратимся к общему определению механизма и рассмотрим один из типов механизмов — прямые механизмы (direct mechanisms, direct revelation mechanisms). В этом случае у каждого агента просто спрашивают его тип, то есть \Sigma_i=\theta_i. В случае аукционов, соответственно, у агента спрашивают его истинную внутреннюю стоимость x_i. Но, как мы уже выясняли, агенты могут нам лгать, и поэтому мы хотим придумать такие механизмы, чтобы лгать было невыгодно.

Вспомним определение того, что механизм реализует социальную функцию.

Определение 3.3. Механизм \mathcal{M}=(\Sigma_1,\ldots,\Sigma_N,g) реализует функцию социального выбора f:\Theta_1\times\ldots\times\Theta_N\to\mathcal O, если для всех \mathbf\theta=(\theta_1,\ldots,\theta_N)\in\Theta_1\times\ldots\times\Theta_N

g(s_1^*(\theta_1),\ldots,s_N^*(\theta_N))=f(\mathbf\theta),

где профиль стратегий (s^*_1,...,s^*_N) находится в равновесии по отношению к игре, индуцированной \mathcal{M}.

А теперь добавим в это определение правдивость механизма.

Определение 3.4. Прямой механизм \mathcal{M}=(\Theta_1,\ldots,\Theta_N,g) реализует функцию социального выбора f:\Theta_1\times\ldots\times\Theta_N\to\mathcal O, если для всех \mathbf\theta=(\theta_1,\ldots,\theta_N)\in\Theta_1\times\ldots\times\Theta_N

g(\theta_1,\ldots,\theta_N)=f(\mathbf\theta),

где профиль стратегий (\theta_1,...,\theta_N) находится в равновесии по отношению к игре, индуцированной \mathcal M.

Учитывая, что в этом определении получилось, что g=f, можно определить правдиво реализуюмую функцию социального выбора.

Определение 3.5. Функция социального выбора f:\Theta_1\times\ldots\times\Theta_N\to\mathcal O правдиво реализуема (truthfully implementable, incentive compatible), если профиль стратегий (s^*_1,\ldots,s^*_N), где s^*_i(\theta_i)=\theta_i, находится в равновесии в игре, индуцированной прямым механизмом \mathcal M=(\theta_1,\ldots,\theta_N,f) .

Итак мы получили определение правдивых механизмов. Их главный плюс заключается в том, что участникам выгоднее говорить правду. Если это так, то им нет нужды рассчитывать сложные равновесные стратегии, в которых можно допустить ошибку. Более того, если равновесие у правдивого механизма — в доминантных стратегиях (см. также ниже), то агенты могут вообще не задумываться: вне зависимости от наличия или отсутствия информации от других агентов нужно просто говорить правду. Так у нас уже было с аукционом Викри, а теперь мы рассмотрели то же самое и в общем виде.

Теперь, введя определение, можно задаться вопросом — когда можно получить правдивый механизм для заданной функции социального выбора? Ответ на этот вопрос уже есть: Роджер Майерсон доказал принцип выявления доходности, который гарантирует, что если какую-то социальную функцию можно реализовать, ее можно и реализовать правдиво. Перед доказательством ослабленного варианта этого факта нам нужно будет вспомнить несколько определений.

Определение 3.6. Стратегия s_i называется доминантной, если она (слабо) максимизирует ожидаемую прибыль агента для всех возможных стратегий других агентов:

\forall s^\prime_i\neq s_i, \mathbf s_{-i}\in \mathbf \Sigma_{-i}\quad u_i(s_i,\mathbf s_{-i},\theta_i)\ge u_i(s^\prime_i,\mathbf s_{-i}, \theta_i).

Мы уже говорили, что если стратегии у агентов доминантные, то можно быть абсолютно уверенным, что агент изберет доминантную стратегию, ведь она не зависит от его прогнозов на действия других агентов. По этой же причине можно отказаться от предположений на распределение типов у агентов F(\mathbf\theta) ; да и вообще F(\mathbf\theta) не рассматривать.

Определение 3.7. Механизм \mathcal M=(\Sigma_1,\ldots,\Sigma_N,g) реализует функцию социального выбора f:\Theta_1\times\ldots\times\Theta_N\to\mathcal O в доминантных стратегиях, если для всех векторов типов агентов \mathbf\theta=(\theta_1,\ldots,\theta_N)\in\Theta_1\times\ldots\times\Theta_N выполнено равенство

g(s_1^*(\theta_1),\ldots,s_N^*(\theta_N))=f(\mathbf\theta),

и каждая из стратегий s^*_i является доминантной для агента i.

< Лекция 2 || Лекция 3: 1234 || Лекция 4 >
Berkut Molodoy
Berkut Molodoy
Россия
Μаксим Εфремов
Μаксим Εфремов
Россия