мне задали дистанционное задание на сертификат,но я не могу его найти |
Основные понятия теории статистических решений
Обоснование статистических решений при фиксированных экспериментах
Часто встречаются ситуации, когда на выбор решения существенное влияние оказывают факторы, информация о которых отсутствует или является недостаточно полной. Обоснование решений в этих условиях оказывается весьма эффективным с помощью статистических решений.
Сущность задач статистических решений состоит в том, что нужно сделать выбор из множества действий , эффективность каждого из которых зависит от того, какое из состояний "природы" имеет место. Поэтому каждая пара , состоящая из действия и состояния "природы", имея тот или иной исход, характеризуется значением критерия эффективности . Последнее приводит к матрице (таблица 11.1), на основании которой нужно выбрать действие, являющееся оптимальным согласно некоторому критерию. Подобная матрица представляет стохастическую модель конфликтной ситуации, в которой одним из противников является "природа" (обстановка боевых действий, — Абчук В.А., Емельянов Л.А., Матвейчук Ф.А., Суздаль В.Г. Введение в теорию выработки решений. М., Военное издательство, 1972.). Обычно в теории статистических решений оперируют с критерием эффективности, характеризующим те или иные потери. Поэтому получаемую матрицу называют матрицей потерь.
Состояние "природы" | Действие | |||||
---|---|---|---|---|---|---|
... | ... | |||||
. . . . . . |
. . . . . . |
. . . . . . |
... ... ... ... |
. . . . . . |
... ... ... ... |
. . . . . . |
Поясним сказанное на следующем примере.
Предположим, что ракетная подводная лодка для нанесения удара по береговой цели должна занять огневую позицию в одном из трех районов. Каждый район огневых позиций в зависимости от состояния моря характеризуется математическим ожиданием числа непопадающих ракет , величины которых определяются таблицей 11.2.
Состояние "природы" | Действие | ||
---|---|---|---|
Район №1 | Район №2 | Район №3 | |
Море 2 балла Море 5 |
0 5 |
1 3 |
3 2 |
Очевидно, если вероятности состояний "природы" известны и равны соответственно , где , то за критерий можно принять среднюю (ожидаемую) эффективность действия . Тогда выбирается действие, которое минимизирует данный критерий, и принимается , что это действие является оптимальным при данном априорном распределении вероятностей.
Так, если в рассматриваемом примере все состояния равновероятны, то следует выбрать действие (район №2), поскольку в этом случае средняя эффективность будет равна , тогда как при выборе (района №1) или (района №3) она составит соответственно.
Таким образом, допущение априорного распределения вероятностей дает довольно простой метод выбора оптимального решения. Однако на практике истинное распределение вероятностей состояний "природы", как правило, неизвестно. В связи с этим целесообразно поставить эксперимент для оценки состояния "природы".
Предположим, что в рассматриваемом примере таким экспериментом является измерение атмосферного давления.
Пусть — множество возможных исходов, и известна вероятность каждого исхода для каждого истинного состояния природы. Допустим и примем значения вероятности , равным приведенным в таблице 11.3.
Состояние "природы" | Наблюдение | ||
---|---|---|---|
0,60 0,20 |
0,25 0,30 |
0,15 0,50 |
Теперь в зависимости от результатов эксперимента можно перечислить все возможные стратегии выбора района огневых позиций. Так, например, одной из стратегий может быть следующий план: выбрать район №1 (действие ), если результат эксперимента ; район №2 (действие ), если результат эксперимента ; район №3, если результат эксперимента .
Каждая такая стратегия представляет систему:
( 11.1) |
где — действие, предпринимаемое при наблюдении
— номер действия ;
— номер стратегии ;
— номер эксперимента .
Иными словами, стратегия – это функция, определенная на пространстве выбора эксперимента , значения которой суть действия . Поскольку каждому исходу эксперимента соответствует возможных действий, при возможных исходных имеется возможных стратегий. Для рассматриваемого примера (таблица 11.4).
Наблюдение | Стратегия | |||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Из анализа таблицы видно, что некоторые из стратегий совершенно не учитывают исход эксперимента, например, ; другие — учитывают в определенной степени и так далее. Однако каждая стратегия в зависимости от истинного состояния "природы" приводит к тем или иным результатам. Для вычисления этого результата с учетом эксперимента определим его вероятность как вероятность того, что, когда истинное состояние "природы" есть , эксперимент приводит к исходу, с которым стратегия связывает действие . Очевидно, что . Так, например, из описания стратегии (таблица 11.4) видно, что если результатом эксперимента будет , то выбирается действи , если или , — действие . Для состояния природы исход эксперимента возможен с вероятностью 0.60 (таблица 11.3), а или — с вероятностью 0,40. Следовательно,
.
Аналогично для состояния "природы" получим:
.
Теперь можно определить средние потери для каждой стратегии , когда истинное состояние "природы" есть .
Так как следствием пары являются результаты , а вероятность пар "действие – состояние" равны , то средние потери для стратегии будут:
( 11.2) |
где — потери при выборе действия и истинном состоянии "природы" .
На основании (11.2.) можно вычислить матрицу средних потерь.
Состояние "природы" | Стратегия | |||||
---|---|---|---|---|---|---|
... | ... | |||||
. . . . . . |
. . . . . . |
L(\theta_1,S_2)
. . . . . . |
... ... ... ... |
. . . . . . |
... ... ... ... |
. . . . . . |
Для условий рассматриваемого примера вычисление средних потерь по формуле (11.2.) приводит к таблице 11.6.
Состояние "природы" | Стратегия | ||||||||
---|---|---|---|---|---|---|---|---|---|
0,00 5,00 |
0,15 4,00 |
0,45 3,50 |
0,25 4,40 |
0,40 3,40 |
0,70 2,90 |
0,75 4,10 |
0,90 3,10 |
1,20 2,60 |
|
0,60 4,60 |
0,75 3,60 |
1,05 3,10 |
0,85 4,00 |
1,00 3,00 |
1,30 2,50 |
1,35 3,70 |
1,50 2,70 |
1,80 2,20 |
|
1,80 4,40 |
1,95 3,40 |
2,25 2,90 |
2,05 3,80 |
2,20 2,80 |
2,50 2,30 |
2,55 3,50 |
2,70 2,50 |
3,00 2,00 |
Матрица средних потерь (табл. 11.5) представляет собой модель конфликтной ситуации при фиксированных экспериментах. В связи с этим первоначальная задача статического решения модифицируется, сводясь к выбору одной из стратегий для состояний "природы" .
Предположим теперь, что даны априорные вероятности состояний "природы" . После постановки эксперимента, исход которого зависит от истинного состояния "природы", значения вероятностей состояний изменяются и по формуле Байеса будут равны
( 11.3) |
где — апостериорная вероятность состояния ;
— вероятность исхода для истинного состояния .
Если теперь принять, что и , то апостериорные вероятности состояний примут значения, приведенные в таблице 11.7.
В результате приходим к первоначальной задаче оптимального выбора действия, когда вероятности состояний "природы" известны и равны .
На основании этого можно определить средние потери для действия с учетом эксперимента по формуле
( 11.4) |
где — потери пары "действие – состояние" .
Оптимальным в этом случае будет действие, дающее наименьшие потери. Для нашего примера расчеты, выполненные по формуле 11.4., сведены в таблицу 11.8.
Из таблицы 11.8 видно, что в случае исхода оптимальным является действие a_1, исхода — действие и исхода — действие .
Таким образом, получено правило, в соответствии с которым каждому исходу эксперимента соответствует действие , дающее минимальные потери. Это правило называется правилом Байеса относительно априорного распределения вероятностей состояний природы, а действие — байесовым. Так, для рассматриваемого примера, если исход эксперимента , байесовым действием является действие , если исход — действие и если исход — действие .
Байесовое действие входит в байесовую стратегию, которая минимизирует среднее взвешенное
( 11.5) |
и соответствует вероятности .
В этом можно убедиться, если по формуле (11.4.) произвести вычисление, используя данные таблицы 11.5 – 11.7, и выбрать стратегию, для которой
будет минимальным. Такой байесовой стратегией окажется . Из описания стратегии видно, что если исход эксперимента , то выбирается действие , если , то действие , и если , то действие , то есть байесовые действия.
Таким образом, задаваясь априорным распределением вероятностей состояния природы, возможно их уточнить путем постановки эксперимента и определения апостериорных вероятностей.
Теорема Байеса. Пусть — взаимоисключающие события. Объединение всех образует достоверное событие, полную группу событий. Тогда теорема Байеса гласит: вероятность того, что событие наступит при условии, что событие E уже наступило, определяется выражением
( 11.15) |