Нижегородский государственный университет им. Н.И.Лобачевского
Опубликован: 26.04.2007 | Доступ: свободный | Студентов: 1385 / 107 | Оценка: 3.69 / 3.54 | Длительность: 14:45:00
ISBN: 978-5-9556-0072-7
Специальности: Математик

Лекция 18: Выбор решений при неизвестных состояниях природы (игры с природой)

< Лекция 17 || Лекция 18: 123 || Лекция 19 >

Статистические игры

В рассмотренных операциях с испытаниями правило выбора решения a \in A (в зависимости от исхода испытания z \in Z ) можно описать как некоторую функцию

a = d(z),\quad a \in A,\quad z \in Z. ( 17.12)
Эту функцию называют стратегией статистика или решающей функцией. Класс всех решающих функций будем обозначать символом D.

Функция (17.12) сопоставляет каждому решению a\in A некоторое подмножество Q_a \subset Z исходов испытаний, порождающих это решение, т.е.

Q_a = \{z \in Z\colon d(z) = a\},\quad a \in A. ( 17.13)

Множества Qa из (17.13), соответствующие разным решениям a, не пересекаются друг с другом. При этом их объединение совпадает с множеством всех исходов из (17.7). Т.е. любая решающая функция d\in D порождает разбиение множества исходов Z на подмножества Qa из (17.13) и, следовательно, может быть конструктивно задана таким разбиением.

Пусть задано априорное распределение вероятностей \xi для состояний природы из (17.6) и семейство функций p_\omega из (17.8), характеризующих используемую статистическую схему проведения испытаний с фиксированным объемом выборки. Тогда математическое ожидание потерь статистика, реализующего стратегию d\in D, определяется выражением

\rho(\xi,d) = \sum_{\omega \in \Omega} \sum_{z \in Z} L(\omega, d(z))
p_\omega(z) \xi(\omega), ( 17.14)
которое, согласно (17.9)-(17.11), может быть представлено также в виде
\rho(\xi,d) = \sum_{z\in Z} p(z) \rho(\xi_z, d), ( 17.15)
\rho(\xi_z, d) = \sum_{\omega\in \Omega} L(\omega,
d(z))\xi(\omega/z). ( 17.16)
При этом математическое ожидание (17.14), соответствующее априорному распределению \xi, называется функцией априорного риска (или априорным риском ), а математическое ожидание (17,16), соответствующее апостериорному распределению \xi_z, - функцией апостериорного риска (или апостериорным риском ). Заметим, что введенная оценка эффективности стратегий с помощью математического ожидания потерь возвращает нас к уже использованному ранее приему усреднения полезностей (см. обсуждение в "Анализ антагонистической игры на основе принципа максимума гарантированного результата" .

Построенная модель

\rho(\xi,d),\quad \xi \in \Xi,\ d \in D, ( 17.17)
в которой возможные стратегии статистика, описываемые решающими функциями d\in D из (17.12), характеризуются априорным риском \rho(\xi,d) из (17.14), зависящим от распределения \xi \in \Xi из (17.16) для состояний природы \omega \in \Omega из (17.5), называется статистической игрой. При этом априорное распределение \xi иногда интерпретируется как смешанная стратегия природы.

Принцип Байеса

При заданном априорном распределении \xi любая стратегия d\in D статистика характеризуется ожидаемыми потерями \rho(\xi,d) из (17.14). Это позволяет рассмотреть задачу выбора стратегии d_\xi, минимизирующей риск при заданном распределении \xi, т.е.

\rho(\xi, d_\xi) = \min\{\rho(\xi,d)\colon d \in D\}. ( 17.18)
Стратегия d_\xi из (17.18) называется байесовской решающей функцией (относительно заданного априорного распределения \xi ), а соответствующий ей риск
\rho(\xi) = \rho(\xi, d_\xi) ( 17.19)
- байесовским риском .6Байес Томас (1702-1761) - английский исследователь в области теории вероятностей, член Королевского общества (1742). Принцип выбора, называемый его именем, не упоминается в опубликованных работах Т.Байеса - см., например, работы Майстрова Л.Е.: (1) Теория вероятностей. Исторический очерк. М.: Наука, 1967; (2) Развитие понятия вероятности. М.: Наука, 1980. Из (17.15), (17.18) выводим, что
\begin{gathered}
\rho(\xi, d_\xi) = \min_{d \in D} \sum_{z \in Z} p(z)
\rho(\xi_z, d) = \\ =\sum_{z \in Z} p(z) \min_{d \in D}
\sum_{\omega\in \Omega}
L(\omega, d(z)) \xi(\omega/z) = \\ =\sum_{z \in Z} p(z)\min_{a \in A}
\sum_{\omega\in \Omega} L(\omega, a)\xi
(\omega/z).
\end{gathered}
Следовательно, байесовское решение az, соответствующее конкретному исходу испытания z, может быть получено из условия:
a_z = d_\xi(z) = {\rm arg} \min\{\rho(\xi_z, a)\colon a \in A\}, ( 17.20)
где \rho(\xi_z, a) есть апостериорный риск, соответствующий решению a при исходе испытания z.

Поскольку множества \Omega и A являются конечными, то условие (17.20) может быть представлено системой неравенств

\sum_{\omega \in \Om} L(\omega, a_z) \xi(\omega/z) \le
\sum_{\omega\in \Omega} L(\omega, a)\xi(\omega/z),\quad a \in A,
которую, учитывая (17.10), можно привести к виду:
\sum_{\omega\in \Omega} L(\omega, a_z) p_\omega(z) \xi(\omega) \le
\sum_{\omega \in \Omega} L(\omega, a) p_\omega(z) \xi(\omega),\quad a \in A, ( 17.21)
удобному для определения решения az при заданных априорном распределении \xi и исходе испытания z. Заметим, что приведение условий (17.20) к виду (17.21) с использованием соотношения (17.10) предполагает положительность значения p(z) из (17.11). В случае исходов z, вероятность реализации которых является нулевой, в качестве байесовского значения az может быть использовано любое решение a\in A. Потери от такого решения не дают вклада в функцию риска - см. (17.11) и (17.14).

Выбор простой гипотезы из конечного множества гипотез}

Пусть функция потерь, соответствующая множествам \Omega и A из (17.5) при m=n, имеет вид:

L(\omega, a) = w,\ \omega\ne a,\quad L(\omega, a) = 0,\ \omega = a,\quad
\omega \in \Omega,\ a \in A, ( 17.22)
где величина w является положительной.

Замечание 4.2 о простых гипотезах ). Согласно (17.22), решение статистика влечет потери лишь в случае, если его номер во множестве A отличается от номера текущего состояния природы \omega. В связи с этим рассматриваемая операция может интерпретироваться как задача определения текущего состояния природы.

Напомним, что статистик принимает решение после наблюдения исхода z некоторого испытания, модель которого задается набором распределений (17.8). Поэтому выбор конкретного значения a\in A может также интерпретироваться и как заключение о том, что полученный исход z порожден распределением pa(z). Таким образом, при функции потерь вида (17.22) выбор решения, фактически, состоит в принятии гипотезы о том, какое именно распределение вероятностей из набора (17.8) определило реализацию исхода z. Далее, поскольку любое предположение относительно распределения вероятностей наблюдаемой случайной величины называется статистической гипотезой, то можно также говорить о том, что рассматриваемая операция представляет собой задачу принятия статистической гипотезы (относительно распределения вероятностей из (17,8) для наблюдаемой случайной величины z ). Отметим также, что в рассматриваемом случае любое решение a\in A полностью определяет соответствующее распределение вероятностей pa(z) из (17.8). Статистические гипотезы, обладающие таким свойством, называются простыми. Следовательно, функция потерь вида (17.22) определяет задачу выбора простой статистической гипотезы из множества простых гипотез.

Согласно (17.21) и (17.22), байесовское решение \tau  = a_z для рассматриваемой задачи может быть описано неравенствами:

p_\tau (z) \xi(\tau) \ge p_a(z) \xi(a),\quad a \in A. ( 17.23)

Отсюда вытекает, что минимальный риск соответствует гипотезе с номером \tau  = a_z, имеющей максимальную вероятность

P(\tau,z) = p_\tau(z) \xi(\tau) = \max \{p_a(z) \xi(a)\colon a \in A\}
реализации совместно с исходом z.

< Лекция 17 || Лекция 18: 123 || Лекция 19 >
Михаил Агапитов
Михаил Агапитов

Не могу найти  требования по оформлению выпускной контрольной работы по курсу профессиональной переподготовки "Менеджмент предприятия"

Подобед Александр
Подобед Александр

Я нажал кнопку "начать курс" и почти его уже закончил, но для получения диплома на бумаге, нужно его же оплатить? Как оплатить?