Новосибирский Государственный Университет
Опубликован: 06.11.2008 | Доступ: свободный | Студентов: 3338 / 1210 | Оценка: 4.24 / 3.67 | Длительность: 14:37:00
Специальности: Математик
Лекция 11:

Основные понятия теории статистических решений

< Лекция 10 || Лекция 11: 123 || Лекция 12 >

Примеры

  1. Две машины на некоторой фирме производят соответственно 10 и 90% общей продукции определенного вида. Предположим, что вероятность брака на первой машине равна 0,01, а на второй – 0,05. Чему равна вероятность того, что наугад взятое из дневной продукции изделие изготовлено первой машиной, если оно оказалось бракованным?

    Применим теорему Байеса. E — событие, заключающееся в том, что изделие бракованное; A_1 — изделие изготовлено первой машиной; A_2 — изделие изготовлено второй машиной. \text{P(изготовлено 1 машиной| брак)= }P(A_1|E).

    P(A_1\left|E)=\frac{P(A_1)\cdot P(E|A_1)}{P(A_1)\cdot P(E|A_1)+P(A_2)\cdot P(E|A_2)}\right .\\ P(A_1\left|E)=\frac{0,10\cdot 0,01}{0,10\cdot 0,01+0,90\cdot 0,05}=\frac{1}{46}\approx 0,022\right.

  2. Предположим, что надежность определения туберкулеза при рентгеновском просвечивании грудной клетки составляет 90%, то есть 10% тбц-носителей остаются неопознанными; вероятность неправильного определения тбц у здоровых людей составляет 1%.

    Просвечиванию была подвергнута большая группа людей со средним процентом больных 0,1%. Какова вероятность того, что люди, которые признаны больными, действительно являются тбц-носителями?

    E — просвечивание определило наличие тбц, A_1 — человек болен, A_2 — человек здоров.

    \text{P (тбц-носитель|  положительный результат просвечивания)}=\\ \frac{0,001\cdot 0,9}{0,001\cdot 0,9+0,999\cdot 0,01}=0,0826,

    то есть мы нашли, что из общего числа людей, признанных больными, только 8% являются действительно тбц-носителями.

    В среднем рентгеновские исследования дают 30% неправильных отрицательных и 2% неправильных положительных диагнозов!

  3. В бюро работают 4 секретарши, которые отправляют соответственно 40, 10, 30 и 20% исходящих бумаг. Вероятности ошибки при этом соответственно равны 0,01; 0,04; 0,06 и 0,01. Чему равна вероятность того, что некоторый документ неверно адресован третьей секретаршей?

    \text{P (секретарша N3|  документ неверно адресован)}=\\ \frac{0,30\cdot 0,06}{0,40\cdot 0,01+0,10\cdot 0,04+0,30\cdot 0,06+0,20\cdot 0,10}=\frac{0,018}{0,046}=0,391\approx 39%

    Ничего себе, 39% всех ошибок!

Обоснование статистических решений при нефиксированных экспериментах

В ряде случаев для обоснования решений представляется возможным провести несколько экспериментов. Очевидно, что с ростом экспериментов растет и надежность статистического решения, то есть уменьшается риск, связанный с принятием ошибочного решения. Однако постановка каждого эксперимента связана с определенным расходом средств. Более того, в ряде случаев просто нецелесообразно или невозможно провести все необходимые эксперименты для обоснования оптимального решения. Такие условия, например, складываются, когда необходимо принять партию взрывателей. Очевидно, для выбора решения, принять или не принять данную партию, можно проверить только часть взрывателей, так как проверка всей партии связана с их уничтожением.

На основании изложенного можно сформулировать следующие условия для обоснования оптимального решения при нефиксированных экспериментах.

Имеются некоторые действия a_1,a_2,...,a_n и состояния "природы" \theta_1,\theta_2,...,\theta_m. Требуется выбрать действие, которое соответствует истинному состоянию природы на основе оценки результатов эксперимента Z^{(1)} из одного наблюдения, Z^{(2)} из двух наблюдений, в котором Z^{(1)} повторяется дважды,…, Z^{(k)} из k наблюдений, в котором Z^{(1)} повторяется k раз.

Затем определяется множество стратегий (правил решения) S. Любая стратегия из этого множества должна однозначно указывать до начала эксперимента, что нужно сделать на каждом этапе экспериментирования в зависимости от имеющейся информации. Каждому возможному исходу, обусловленному стратегией, присваивается показатель эффективности. Такой показатель должен учитывать стоимость данного исхода и потери, вызванные неправильными решениями. Вычисляется также и вероятность каждого исхода для истинного состояния "природы" \theta_i и стратегии S_e. Кроме того, для каждого состояния и каждой стратегии вычисляются потери или выигрыши, связанные с парами ("исход – состояние"), которые взвешены согласно вероятностям, вычисленным в предположении наличия данного состояния "природы". В результате каждая стратегия оценивается величинами средних потерь.

Обоснование статистических решений без постановки экспериментов

В жизни нередко складываются ситуации, когда необходимо принимать решение при отсутствии как полного и точного знания обстановки, так и возможности получения какой-либо дополнительной информации. С подобной неопределенностью мы уже сталкивались, рассматривая обоснование решений методами теории игр. Однако тогда неопределенность создавалась за счет скрытности выбора, осуществляемого противником. В результате этого (по крайней мере в антагонистических играх двух лиц) всегда можно предсказать поведение второго игрока, который стремится сделать все зависящее от него для противодействия первому игроку. Особенность же рассматриваемой неопределенности состоит в том, что второй игрок не является, строго говоря, противником. Часто таким вторым игроком оказывается "природа", и поэтому соответствующие задачи выбора оптимального способа действий с помощью теории статистических решений иногда называют играми против природы. С этой точки зрения эта часть теории статистических решений имеет дело с так называемым случаем полного незнания, то есть такого случая, когда игрок, принимающий то или иное решение, не располагает никакими сведениями о конкретном состоянии природы. Если же игрок располагает даже небольшой информацией, скажем, полученной при том или ином эксперименте, то условия полного незнания оказываются нарушенными, и следует обратиться к вышеизложенным положениям теории статистических решений. Однако было бы ошибочно полагать, что случай полного незнания исключает наличие всякой информации. Здесь так же, как и в теории игр, необходим такой объем информации об обстановке, который позволяет построить матрицу игр, то есть считается, что игрок знает все стратегии, которые он может использовать сам, и стратегии (состояния) "природы". Кроме того, предполагается, что игрок знает все элементы матрицы эффективности.

Таким образом, единственное, но весьма существенное различие между проблемами теории игр и теории статических решений состоит в том, что "природа" в отличие от разумного игрока характеризуется стихийностью, а не сознательностью выбора. Иными словами, "природа" выбирает то или иное состояние без какого-либо намерения помешать игроку достичь своей цели наилучшим образом. Это различие нельзя переоценить, так как оно ( в отличие от теории игр) приводит к нескольким конкурирующим критериям оптимальности, используемым в теории статистических решений.

< Лекция 10 || Лекция 11: 123 || Лекция 12 >
Данил Комардин
Данил Комардин

мне задали дистанционное задание на сертификат,но я не могу его найти