НОУ ИНТУИТ | Основы математического моделирования. Лекция 11: Основные понятия теории статистических решений

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Регистрация Вход

Твой путь к знаниям!

Новосибирский Государственный Университет

Опубликован: 06.11.2008 | Доступ: свободный | Студентов: 3338 / 1210 | Оценка: 4.24 / 3.67 | Длительность: 14:37:00

Темы: Математика, Образование

Специальности: Математик

|

Вам нравится? Нравится 41 студенту

| Поделиться |

Поддержать курс

| Скачать электронную книгу

Обоснование статистических решений при фиксированных экспериментах

Часто встречаются ситуации, когда на выбор решения существенное влияние оказывают факторы, информация о которых отсутствует или является недостаточно полной. Обоснование решений в этих условиях оказывается весьма эффективным с помощью статистических решений.

Сущность задач статистических решений состоит в том, что нужно сделать выбор из множества действий (a_1,a_2,...,a_n) , эффективность каждого из которых зависит от того, какое из состояний "природы" $(\theta_1,\theta_2,...,\theta_m)$ имеет место. Поэтому каждая пара $(\theta_i,a_j)$ , состоящая из действия и состояния "природы", имея тот или иной исход, характеризуется значением критерия эффективности $u_{ij}$ . Последнее приводит к $(m\times n)$ матрице (таблица 11.1), на основании которой нужно выбрать действие, являющееся оптимальным согласно некоторому критерию. Подобная матрица представляет стохастическую модель конфликтной ситуации, в которой одним из противников является "природа" (обстановка боевых действий, — Абчук В.А., Емельянов Л.А., Матвейчук Ф.А., Суздаль В.Г. Введение в теорию выработки решений. М., Военное издательство, 1972.). Обычно в теории статистических решений оперируют с критерием эффективности, характеризующим те или иные потери. Поэтому получаемую матрицу называют матрицей потерь.

Таблица 11.1. Матрица потерь
Состояние "природы"	Действие
Состояние "природы"			...		...
$\theta_1$ $\theta_2$ . . . $\theta_i$ . . . $\theta_m$	$u_{11}$ $u_{21}$ . . . $u_{i1}$ . . . $u_{m1}$	$u_{12}$ $u_{22}$ . . . $u_{i2}$ . . . $u_{m2}$	... ... ... ...	$u_{1j}$ $u_{2j}$ . . . $u_{ij}$ . . . $u_{mj}$	... ... ... ...	$u_{1n}$ $u_{2n}$ . . . $u_{in}$ . . . $u_{mn}$

Поясним сказанное на следующем примере.

Предположим, что ракетная подводная лодка для нанесения удара по береговой цели должна занять огневую позицию в одном из трех районов. Каждый район огневых позиций a_j(j=1,2,3) в зависимости от состояния моря $\theta_i(i=1,2)$ характеризуется математическим ожиданием числа непопадающих ракет $e(\theta,a)$ , величины которых определяются таблицей 11.2.

Таблица 11.2. Матрица потерь для выбора района огневых позиций
Состояние "природы"	Действие
Состояние "природы"	Район №1	Район №2	Район №3
Море 2 балла Море 5	0 5	1 3	3 2

Очевидно, если вероятности состояний "природы" $\theta_1,\theta_2,...,\theta_m$ известны и равны соответственно P_1,P_2,...,P_m , где $\sum\limits_{i=1}^{m}P_i=1$ , то за критерий можно принять среднюю (ожидаемую) эффективность действия a_j . Тогда выбирается действие, которое минимизирует данный критерий, и принимается , что это действие является оптимальным при данном априорном распределении вероятностей.

Так, если в рассматриваемом примере все состояния равновероятны, то следует выбрать действие a_2 (район №2), поскольку в этом случае средняя эффективность будет равна $1\times \frac{1}{2}+3\times \frac{1}{2}=2,0$ , тогда как при выборе a_1 (района №1) или a_3 (района №3) она составит $0\times \frac{1}{2}+5\times \frac{1}{2}=2,5 или 3\times \frac{1}{2}+2\times \frac{1}{2}=2,5$ соответственно.

Таким образом, допущение априорного распределения вероятностей дает довольно простой метод выбора оптимального решения. Однако на практике истинное распределение вероятностей состояний "природы", как правило, неизвестно. В связи с этим целесообразно поставить эксперимент для оценки состояния "природы".

Предположим, что в рассматриваемом примере таким экспериментом является измерение атмосферного давления.

Пусть $Z_1,Z_2,...,Z_{\gamma}$ — множество возможных исходов, и известна вероятность $P(Z/\theta)$ каждого исхода для каждого истинного состояния природы. Допустим r=3 и примем значения вероятности $P(Z/\theta)$ , равным приведенным в таблице 11.3.

Таблица 11.3. Вероятности показаний барометра в зависимости от истинного состояния природы
Состояние "природы"	Наблюдение
Состояние "природы"
$\theta_1$ $\theta_2$	0,60 0,20	0,25 0,30	0,15 0,50

Теперь в зависимости от результатов эксперимента можно перечислить все возможные стратегии выбора района огневых позиций. Так, например, одной из стратегий может быть следующий план: выбрать район №1 (действие a_1 ), если результат эксперимента Z_1 ; район №2 (действие a_2 ), если результат эксперимента Z_2 ; район №3, если результат эксперимента Z_3 .

Каждая такая стратегия представляет систему:

$S_e=||a_{j1},a_{j2},...,a_{jr}||$

( 11.1)

,

где $a_{ji}$ — действие, предпринимаемое при наблюдении $Z_{ji}$

— номер действия (j=1,...,n) ;

— номер стратегии (e=1,...,n^r) ;

— номер эксперимента (i=1,...,r) .

Иными словами, стратегия – это функция, определенная на пространстве выбора эксперимента , значения которой суть действия a_j . Поскольку каждому исходу эксперимента соответствует возможных действий, при возможных исходных имеется n^r возможных стратегий. Для рассматриваемого примера n^r=3^3=27 (таблица 11.4).

Таблица 11.4. Стратегии выбора района огневых позиций в зависимости от результатов экспериментов
Стратегия
									$S_{10}$	$S_{11}$	$S_{12}$	$S_{13}$	$S_{14}$

$S_{15}$	$S_{16}$	$S_{17}$	$S_{18}$	$S_{19}$	$S_{20}$	$S_{21}$	$S_{22}$	$S_{23}$	$S_{24}$	$S_{25}$	$S_{26}$	$S_{27}$

Из анализа таблицы видно, что некоторые из стратегий совершенно не учитывают исход эксперимента, например, $S_1,S_{14},S_{27}$ ; другие — учитывают в определенной степени и так далее. Однако каждая стратегия в зависимости от истинного состояния "природы" приводит к тем или иным результатам. Для вычисления этого результата с учетом эксперимента определим его вероятность P_i(a_j/S_e) как вероятность того, что, когда истинное состояние "природы" есть $\theta_i$ , эксперимент приводит к исходу, с которым стратегия S_e связывает действие a_j . Очевидно, что $\sum\limits_{j=1}^n P_i(a_j/S_e)=1$ . Так, например, из описания стратегии S_5 (таблица 11.4) видно, что если результатом эксперимента будет Z_1 , то выбирается действи a_1 , если Z_2 или Z_3 , — действие a_2 . Для состояния природы $\theta_1$ исход эксперимента Z_1 возможен с вероятностью 0.60 (таблица 11.3), а Z_2 или Z_3 — с вероятностью 0,40. Следовательно,

P_1(a_1/S_5)=0,60; P_1(a_2/S_5)=0,40; P_1(a_3/S_5)=0 .

Аналогично для состояния "природы" $\theta_2$ получим:

P_2(a_1/S_5)=0,20; P_2(a_2/S_5)=0,80; P_2(a_3/S_5)=0 .

Теперь можно определить средние потери для каждой стратегии S_e , когда истинное состояние "природы" есть $\theta_i$ .

Так как следствием пары $(S_e,\theta_i)$ являются результаты $u_{i1},u_{i2},...,u_{in}$ , а вероятность пар "действие – состояние" $(a_1,\theta_i),(a_2,\theta_i),…,(a_n,\theta_i)$ равны P_i(a_1/S_e),P_i(a_2/S_e),...,P_i(a_n/S_e) , то средние потери для стратегии S_e будут:

$L(\theta_i,S_e)=\sum\limits_{j=1}{n}u_{ij}P_i(a_j/S_e)$

( 11.2)

,

где $u_{ij}$ — потери при выборе действия a_j и истинном состоянии "природы" $\theta_i$ .

На основании (11.2.) можно вычислить матрицу средних потерь.

Таблица 11.5. Матрица средних потерь
Состояние "природы"	Стратегия
Состояние "природы"			...		...	$S_{n^r}$
$\theta_1$ $\theta_2$ . . . $\theta_i$ . . . $\theta_m$	$L(\theta_1,S_1)$ $L(\theta_2,S_1)$ . . . $L(\theta_i,S_1)$ . . . $L(\theta_m,S_1)$	L(\theta_1,S_2) $L(\theta_2,S_2)$ . . . $L(\theta_i,S_2)$ . . . $L(\theta_m,S_2)$	... ... ... ...	$L(\theta_1,S_e)$ $L(\theta_2,S_e)$ . . . $L(\theta_i,S_e)$ . . . $L(\theta_m,S_e)$	... ... ... ...	$L(\theta_1,S_{n^r})$ $L(\theta_2,S_{n^r})$ . . . $L(\theta_i,S_{n^r})$ . . . $L(\theta_m,S_{n^r})$

Для условий рассматриваемого примера вычисление средних потерь по формуле (11.2.) приводит к таблице 11.6.

Таблица 11.6. Матрица средних потерь для выбора района огневых позиций
Состояние "природы"	Стратегия
Состояние "природы"
$\theta_1$ $\theta_2$	0,00 5,00	0,15 4,00	0,45 3,50	0,25 4,40	0,40 3,40	0,70 2,90	0,75 4,10	0,90 3,10	1,20 2,60
	$S_{10}$	$S_{11}$	$S_{12}$	$S_{13}$	$S_{14}$	$S_{15}$	$S_{16}$	$S_{17}$	$S_{18}$
$\theta_1$ $\theta_2$	0,60 4,60	0,75 3,60	1,05 3,10	0,85 4,00	1,00 3,00	1,30 2,50	1,35 3,70	1,50 2,70	1,80 2,20
	$S_{19}$	$S_{20}$	$S_{21}$	$S_{22}$	$S_{23}$	$S_{24}$	$S_{25}$	$S_{26}$	$S_{27}$
$\theta_1$ $\theta_2$	1,80 4,40	1,95 3,40	2,25 2,90	2,05 3,80	2,20 2,80	2,50 2,30	2,55 3,50	2,70 2,50	3,00 2,00

Матрица средних потерь (табл. 11.5) представляет собой модель конфликтной ситуации при фиксированных экспериментах. В связи с этим первоначальная задача статического решения модифицируется, сводясь к выбору одной из стратегий $S_1,S_2,...,S_{n^r}$ для состояний "природы" $\theta_1,\theta_2,...,\theta_m$ .

Предположим теперь, что даны априорные вероятности состояний "природы" $P(\theta_1),P(\theta_2),...,P(\theta_m)$ . После постановки эксперимента, исход которого зависит от истинного состояния "природы", значения вероятностей состояний изменяются и по формуле Байеса будут равны

$P(\theta_i/Z)=\frac{P(\theta_i)P(Z/theta_i)}{\sum\limits_{i=1}^m P(Z/\theta_i)P(\theta_i)}$

( 11.3)

,

где $P(\theta_i/Z)$ — апостериорная вероятность состояния $\theta_i$ ;

$P(Z/\theta_i)$ — вероятность исхода для истинного состояния $\theta_i$ .

Если теперь принять, что $P(\theta_1)=0,6$ и $P(\theta_2)=0,4$ , то апостериорные вероятности состояний примут значения, приведенные в таблице 11.7.

Таблица 11.7. Апостериорные вероятности состояний "природы"
Состояние "природы"	Наблюдение
Состояние "природы"
$\theta_1$ $\theta_2$	$\frac{36}{44}$ $\frac{8}{44}$	$\frac{15}{27}$ $\frac{12}{27}$	$\frac{9}{29}$ $\frac{20}{29}$

В результате приходим к первоначальной задаче оптимального выбора действия, когда вероятности состояний "природы" известны и равны $P(\theta_1/Z),P(\theta_2/Z),...,P(\theta_m/Z)$ .

На основании этого можно определить средние потери для действия a_j с учетом эксперимента по формуле

$L(a_j)=\sum\limits_{i=1}^m P(\theta_i/Z) u_{ij}$

( 11.4)

,

где $u_{ij}$ — потери пары "действие – состояние" $(a_j,\theta_i)$ .

Оптимальным в этом случае будет действие, дающее наименьшие потери. Для нашего примера расчеты, выполненные по формуле 11.4., сведены в таблицу 11.8.

Таблица 11.8. Средние потери с учетом эксперимента
Эксперимент	Действие
Эксперимент
	$\frac{40}{44}$ $\frac{60}{27}$ $\frac{100}{29}$	$\frac{60}{44}$ $\frac{51}{27}$ $\frac{69}{29}$	$\frac{124}{44}$ $\frac{69}{27}$ $\frac{67}{29}$

Из таблицы 11.8 видно, что в случае исхода Z_1 оптимальным является действие a_1, исхода Z_2 — действие a_2 и исхода Z_3 — действие a_3 .

Таким образом, получено правило, в соответствии с которым каждому исходу эксперимента соответствует действие , дающее минимальные потери. Это правило называется правилом Байеса относительно априорного распределения вероятностей состояний природы, а действие — байесовым. Так, для рассматриваемого примера, если исход эксперимента Z_1 , байесовым действием является действие a_1 , если исход Z_2 — действие a_2 и если исход Z_3 — действие a_3 .

Байесовое действие входит в байесовую стратегию, которая минимизирует среднее взвешенное

$Z(S_e)=\sum\limits_{i=1}^{m} P(\theta_i/Z)L(\theta_i,S_e)$

( 11.5)

и соответствует вероятности $P(\theta_i/Z)$ .

В этом можно убедиться, если по формуле (11.4.) произвести вычисление, используя данные таблицы 11.5 – 11.7, и выбрать стратегию, для которой Z(S_e)

будет минимальным. Такой байесовой стратегией окажется S_6=||a_1a_2a_3|| . Из описания стратегии S_6 видно, что если исход эксперимента Z_1 , то выбирается действие a_1 , если Z_2 , то действие a_2 , и если Z_3 , то действие a_3 , то есть байесовые действия.

Таким образом, задаваясь априорным распределением вероятностей состояния природы, возможно их уточнить путем постановки эксперимента и определения апостериорных вероятностей.

Теорема Байеса. Пусть A_1,A_2,...,A_n — взаимоисключающие события. Объединение всех A_i образует достоверное событие, полную группу событий. Тогда теорема Байеса гласит: вероятность того, что событие A_i наступит при условии, что событие E уже наступило, определяется выражением

$P(A_i\left|E)=\frac{P(A_i)\cdot P(E|A_i)}{P(A_1)\cdot P(E|A_1)+...+P(A_n)\cdot P(E|A_n)}\right;\\ P(A_i\left|E)=\frac{P(A_i)\cdot P(E|A_i)}{\sum\limits_{i=1}^nP(A_i)\cdot P(E|A_i)}\right$

( 11.15)

.

Дальше >>

Авторизоваться

Основы математического моделирования

Основные понятия теории статистических решений

Обоснование статистических решений при фиксированных экспериментах

Вопросы и ответы