Новосибирский Государственный Университет
Опубликован: 06.11.2008 | Доступ: свободный | Студентов: 3338 / 1210 | Оценка: 4.24 / 3.67 | Длительность: 14:37:00
Специальности: Математик
Лекция 11:

Основные понятия теории статистических решений

< Лекция 10 || Лекция 11: 123 || Лекция 12 >

Обоснование статистических решений при фиксированных экспериментах

Часто встречаются ситуации, когда на выбор решения существенное влияние оказывают факторы, информация о которых отсутствует или является недостаточно полной. Обоснование решений в этих условиях оказывается весьма эффективным с помощью статистических решений.

Сущность задач статистических решений состоит в том, что нужно сделать выбор из множества действий (a_1,a_2,...,a_n), эффективность каждого из которых зависит от того, какое из состояний "природы" (\theta_1,\theta_2,...,\theta_m) имеет место. Поэтому каждая пара (\theta_i,a_j), состоящая из действия и состояния "природы", имея тот или иной исход, характеризуется значением критерия эффективности u_{ij}. Последнее приводит к (m\times n) матрице (таблица 11.1), на основании которой нужно выбрать действие, являющееся оптимальным согласно некоторому критерию. Подобная матрица представляет стохастическую модель конфликтной ситуации, в которой одним из противников является "природа" (обстановка боевых действий, — Абчук В.А., Емельянов Л.А., Матвейчук Ф.А., Суздаль В.Г. Введение в теорию выработки решений. М., Военное издательство, 1972.). Обычно в теории статистических решений оперируют с критерием эффективности, характеризующим те или иные потери. Поэтому получаемую матрицу называют матрицей потерь.

Таблица 11.1. Матрица потерь
Состояние "природы" Действие
a_1 a_2 ... a_j ... a_n
\theta_1

\theta_2

.

.

.

\theta_i

.

.

.

\theta_m

u_{11}

u_{21}

.

.

.

u_{i1}

.

.

.

u_{m1}

u_{12}

u_{22}

.

.

.

u_{i2}

.

.

.

u_{m2}

...

...

...

...

u_{1j}

u_{2j}

.

.

.

u_{ij}

.

.

.

u_{mj}

...

...

...

...

u_{1n}

u_{2n}

.

.

.

u_{in}

.

.

.

u_{mn}

Поясним сказанное на следующем примере.

Предположим, что ракетная подводная лодка для нанесения удара по береговой цели должна занять огневую позицию в одном из трех районов. Каждый район огневых позиций a_j(j=1,2,3) в зависимости от состояния моря \theta_i(i=1,2) характеризуется математическим ожиданием числа непопадающих ракет e(\theta,a), величины которых определяются таблицей 11.2.

Таблица 11.2. Матрица потерь для выбора района огневых позиций
Состояние "природы" Действие
Район №1 Район №2 Район №3
Море 2 балла

Море 5

0

5

1

3

3

2

Очевидно, если вероятности состояний "природы" \theta_1,\theta_2,...,\theta_m известны и равны соответственно P_1,P_2,...,P_m, где \sum\limits_{i=1}^{m}P_i=1, то за критерий можно принять среднюю (ожидаемую) эффективность действия a_j. Тогда выбирается действие, которое минимизирует данный критерий, и принимается , что это действие является оптимальным при данном априорном распределении вероятностей.

Так, если в рассматриваемом примере все состояния равновероятны, то следует выбрать действие a_2 (район №2), поскольку в этом случае средняя эффективность будет равна 1\times \frac{1}{2}+3\times \frac{1}{2}=2,0, тогда как при выборе a_1 (района №1) или a_3 (района №3) она составит 0\times \frac{1}{2}+5\times \frac{1}{2}=2,5 или 3\times \frac{1}{2}+2\times \frac{1}{2}=2,5 соответственно.

Таким образом, допущение априорного распределения вероятностей дает довольно простой метод выбора оптимального решения. Однако на практике истинное распределение вероятностей состояний "природы", как правило, неизвестно. В связи с этим целесообразно поставить эксперимент для оценки состояния "природы".

Предположим, что в рассматриваемом примере таким экспериментом является измерение атмосферного давления.

Пусть Z_1,Z_2,...,Z_{\gamma} — множество возможных исходов, и известна вероятность P(Z/\theta) каждого исхода для каждого истинного состояния природы. Допустим r=3 и примем значения вероятности P(Z/\theta), равным приведенным в таблице 11.3.

Таблица 11.3. Вероятности показаний барометра в зависимости от истинного состояния природы
Состояние "природы" Наблюдение
Z_1 Z_2 Z_3
\theta_1

\theta_2

0,60

0,20

0,25

0,30

0,15

0,50

Теперь в зависимости от результатов эксперимента можно перечислить все возможные стратегии выбора района огневых позиций. Так, например, одной из стратегий может быть следующий план: выбрать район №1 (действие a_1 ), если результат эксперимента Z_1 ; район №2 (действие a_2 ), если результат эксперимента Z_2 ; район №3, если результат эксперимента Z_3.

Каждая такая стратегия представляет систему:

S_e=||a_{j1},a_{j2},...,a_{jr}|| ( 11.1)
,

где a_{ji} — действие, предпринимаемое при наблюдении Z_{ji}

j — номер действия (j=1,...,n) ;

e — номер стратегии (e=1,...,n^r) ;

i — номер эксперимента (i=1,...,r).

Иными словами, стратегия – это функция, определенная на пространстве выбора эксперимента Z, значения которой суть действия a_j. Поскольку каждому исходу эксперимента соответствует n возможных действий, при r возможных исходных имеется n^r возможных стратегий. Для рассматриваемого примера n^r=3^3=27 (таблица 11.4).

Таблица 11.4. Стратегии выбора района огневых позиций в зависимости от результатов экспериментов
Наблюдение Стратегия

Z_1

Z_2

Z_3

S_1 S_2 S_3 S_4 S_5 S_6 S_7 S_8 S_9 S_{10} S_{11} S_{12} S_{13} S_{14}
a_1

a_1

a_1

a_1

a_1

a_2

a_1

a_1

a_3

a_1

a_2

a_1

a_1

a_2

a_2

a_1

a_2

a_3

a_1

a_3

a_1

a_1

a_3

a_2

a_1

a_3

a_3

a_2

a_1

a_1

a_2

a_1

a_2

a_2

a_1

a_3

a_2

a_2

a_1

a_2

a_2

a_2

Z_1

Z_2

Z_3

S_{15} S_{16} S_{17} S_{18} S_{19} S_{20} S_{21} S_{22} S_{23} S_{24} S_{25} S_{26} S_{27}
a_2

a_2

a_3

a_2

a_3

a_1

a_2

a_3

a_2

a_2

a_3

a_3

a_3

a_1

a_1

a_3

a_1

a_2

a_3

a_1

a_3

a_3

a_2

a_1

a_3

a_2

a_2

a_3

a_2

a_3

a_3

a_3

a_1

a_3

a_3

a_2

a_3

a_3

a_3

Из анализа таблицы видно, что некоторые из стратегий совершенно не учитывают исход эксперимента, например, S_1,S_{14},S_{27} ; другие — учитывают в определенной степени и так далее. Однако каждая стратегия в зависимости от истинного состояния "природы" приводит к тем или иным результатам. Для вычисления этого результата с учетом эксперимента определим его вероятность P_i(a_j/S_e) как вероятность того, что, когда истинное состояние "природы" есть \theta_i, эксперимент Z приводит к исходу, с которым стратегия S_e связывает действие a_j. Очевидно, что \sum\limits_{j=1}^n P_i(a_j/S_e)=1. Так, например, из описания стратегии S_5 (таблица 11.4) видно, что если результатом эксперимента будет Z_1, то выбирается действи a_1, если Z_2 или Z_3, — действие a_2. Для состояния природы \theta_1 исход эксперимента Z_1 возможен с вероятностью 0.60 (таблица 11.3), а Z_2 или Z_3 — с вероятностью 0,40. Следовательно,

P_1(a_1/S_5)=0,60; P_1(a_2/S_5)=0,40; P_1(a_3/S_5)=0.

Аналогично для состояния "природы" \theta_2 получим:

P_2(a_1/S_5)=0,20; P_2(a_2/S_5)=0,80; P_2(a_3/S_5)=0.

Теперь можно определить средние потери для каждой стратегии S_e, когда истинное состояние "природы" есть \theta_i.

Так как следствием пары (S_e,\theta_i) являются результаты u_{i1},u_{i2},...,u_{in}, а вероятность пар "действие – состояние" (a_1,\theta_i),(a_2,\theta_i),…,(a_n,\theta_i) равны P_i(a_1/S_e),P_i(a_2/S_e),...,P_i(a_n/S_e), то средние потери для стратегии S_e будут:

L(\theta_i,S_e)=\sum\limits_{j=1}{n}u_{ij}P_i(a_j/S_e) ( 11.2)
,

где u_{ij} — потери при выборе действия a_j и истинном состоянии "природы" \theta_i.

На основании (11.2.) можно вычислить матрицу средних потерь.

Таблица 11.5. Матрица средних потерь
Состояние "природы" Стратегия
S_1 S_2 ... S_e ... S_{n^r}
\theta_1

\theta_2

.

.

.

\theta_i

.

.

.

\theta_m

L(\theta_1,S_1)

L(\theta_2,S_1)

.

.

.

L(\theta_i,S_1)

.

.

.

L(\theta_m,S_1)

L(\theta_1,S_2)

L(\theta_2,S_2)

.

.

.

L(\theta_i,S_2)

.

.

.

L(\theta_m,S_2)

...

...

...

...

L(\theta_1,S_e)

L(\theta_2,S_e)

.

.

.

L(\theta_i,S_e)

.

.

.

L(\theta_m,S_e)

...

...

...

...

L(\theta_1,S_{n^r})

L(\theta_2,S_{n^r})

.

.

.

L(\theta_i,S_{n^r})

.

.

.

L(\theta_m,S_{n^r})

Для условий рассматриваемого примера вычисление средних потерь по формуле (11.2.) приводит к таблице 11.6.

Таблица 11.6. Матрица средних потерь для выбора района огневых позиций
Состояние "природы" Стратегия
S_1 S_2 S_3 S_4 S_5 S_6 S_7 S_8 S_9
\theta_1

\theta_2

0,00

5,00

0,15

4,00

0,45

3,50

0,25

4,40

0,40

3,40

0,70

2,90

0,75

4,10

0,90

3,10

1,20

2,60

S_{10} S_{11} S_{12} S_{13} S_{14} S_{15} S_{16} S_{17} S_{18}
\theta_1

\theta_2

0,60

4,60

0,75

3,60

1,05

3,10

0,85

4,00

1,00

3,00

1,30

2,50

1,35

3,70

1,50

2,70

1,80

2,20

S_{19} S_{20} S_{21} S_{22} S_{23} S_{24} S_{25} S_{26} S_{27}
\theta_1

\theta_2

1,80

4,40

1,95

3,40

2,25

2,90

2,05

3,80

2,20

2,80

2,50

2,30

2,55

3,50

2,70

2,50

3,00

2,00

Матрица средних потерь (табл. 11.5) представляет собой модель конфликтной ситуации при фиксированных экспериментах. В связи с этим первоначальная задача статического решения модифицируется, сводясь к выбору одной из стратегий S_1,S_2,...,S_{n^r} для состояний "природы" \theta_1,\theta_2,...,\theta_m.

Предположим теперь, что даны априорные вероятности состояний "природы" P(\theta_1),P(\theta_2),...,P(\theta_m). После постановки эксперимента, исход которого зависит от истинного состояния "природы", значения вероятностей состояний изменяются и по формуле Байеса будут равны

P(\theta_i/Z)=\frac{P(\theta_i)P(Z/theta_i)}{\sum\limits_{i=1}^m P(Z/\theta_i)P(\theta_i)} ( 11.3)
,

где P(\theta_i/Z) — апостериорная вероятность состояния \theta_i ;

P(Z/\theta_i)вероятность исхода Z для истинного состояния \theta_i.

Если теперь принять, что P(\theta_1)=0,6 и P(\theta_2)=0,4, то апостериорные вероятности состояний примут значения, приведенные в таблице 11.7.

Таблица 11.7. Апостериорные вероятности состояний "природы"
Состояние "природы" Наблюдение
Z_1 Z_2 Z_3
\theta_1

\theta_2

\frac{36}{44}

\frac{8}{44}

\frac{15}{27}

\frac{12}{27}

\frac{9}{29}

\frac{20}{29}

В результате приходим к первоначальной задаче оптимального выбора действия, когда вероятности состояний "природы" известны и равны P(\theta_1/Z),P(\theta_2/Z),...,P(\theta_m/Z).

На основании этого можно определить средние потери для действия a_j с учетом эксперимента Z по формуле

L(a_j)=\sum\limits_{i=1}^m P(\theta_i/Z) u_{ij} ( 11.4)
,

где u_{ij} — потери пары "действие – состояние" (a_j,\theta_i).

Оптимальным в этом случае будет действие, дающее наименьшие потери. Для нашего примера расчеты, выполненные по формуле 11.4., сведены в таблицу 11.8.

Таблица 11.8. Средние потери с учетом эксперимента
Эксперимент Действие
a_1 a_2 a_3
Z_1

Z_2

Z_3

\frac{40}{44}

\frac{60}{27}

\frac{100}{29}

\frac{60}{44}

\frac{51}{27}

\frac{69}{29}

\frac{124}{44}

\frac{69}{27}

\frac{67}{29}

Из таблицы 11.8 видно, что в случае исхода Z_1 оптимальным является действие a_1, исхода Z_2 — действие a_2 и исхода Z_3 — действие a_3.

Таким образом, получено правило, в соответствии с которым каждому исходу эксперимента Z соответствует действие a, дающее минимальные потери. Это правило называется правилом Байеса относительно априорного распределения вероятностей состояний природы, а действие — байесовым. Так, для рассматриваемого примера, если исход эксперимента Z_1, байесовым действием является действие a_1, если исход Z_2 — действие a_2 и если исход Z_3 — действие a_3.

Байесовое действие входит в байесовую стратегию, которая минимизирует среднее взвешенное

Z(S_e)=\sum\limits_{i=1}^{m} P(\theta_i/Z)L(\theta_i,S_e) ( 11.5)

и соответствует вероятности P(\theta_i/Z).

В этом можно убедиться, если по формуле (11.4.) произвести вычисление, используя данные таблицы 11.511.7, и выбрать стратегию, для которой Z(S_e)

будет минимальным. Такой байесовой стратегией окажется S_6=||a_1a_2a_3||. Из описания стратегии S_6 видно, что если исход эксперимента Z_1, то выбирается действие a_1, если Z_2, то действие a_2, и если Z_3, то действие a_3, то есть байесовые действия.

Таким образом, задаваясь априорным распределением вероятностей состояния природы, возможно их уточнить путем постановки эксперимента и определения апостериорных вероятностей.

Теорема Байеса. Пусть A_1,A_2,...,A_n — взаимоисключающие события. Объединение всех A_i образует достоверное событие, полную группу событий. Тогда теорема Байеса гласит: вероятность того, что событие A_i наступит при условии, что событие E уже наступило, определяется выражением

P(A_i\left|E)=\frac{P(A_i)\cdot P(E|A_i)}{P(A_1)\cdot P(E|A_1)+...+P(A_n)\cdot P(E|A_n)}\right;\\ P(A_i\left|E)=\frac{P(A_i)\cdot P(E|A_i)}{\sum\limits_{i=1}^nP(A_i)\cdot P(E|A_i)}\right ( 11.15)
.

< Лекция 10 || Лекция 11: 123 || Лекция 12 >
Данил Комардин
Данил Комардин

мне задали дистанционное задание на сертификат,но я не могу его найти