Опубликован: 16.12.2009 | Уровень: для всех | Доступ: платный
Лекция 8:

Статистика нечисловых данных

Законы больших чисел и состоятельность статистических оценок в пространствах произвольной природы

Законы больших чисел состоят в том, что эмпирические средние сходятся к теоретическим. В классическом варианте: выборочное среднее арифметическое при определенных условиях сходится по вероятности при росте числа слагаемых к математическому ожиданию. На основе законов больших чисел обычно доказывают состоятельность различных статистических оценок. В целом эта тематика занимает заметное место в теории вероятностей и математической статистике.

Однако математический аппарат при этом основан на свойствах сумм случайных величин (векторов, элементов линейных пространств). Следовательно, он не пригоден для изучения вероятностных и статистических проблем, связанных со случайными объектами нечисловой природы. Это такие объекты, как бинарные отношения, нечеткие множества, вообще элементы пространств без векторной структуры. Объекты нечисловой природы все чаще встречаются в прикладных исследованиях. Много конкретных примеров приведено выше в настоящей лекции. Поэтому представляется полезным получение законов больших чисел в пространствах нечисловой природы. Необходимо решить следующие задачи.

  • Определить понятие эмпирического среднего.
  • Определить понятие теоретического среднего.
  • Ввести понятие сходимости эмпирических средних к теоретическому.
  • Доказать при тех или иных комплексах условий сходимость эмпирических средних к теоретическому.
  • Обобщив это доказательство, получить метод обоснования состоятельности различных статистических оценок.
  • Дать применения полученных результатов при решении конкретных задач.

Ввиду принципиальной важности рассматриваемых результатов приводим доказательство закона больших чисел, а также результаты компьютерного анализа множества эмпирических средних.

Определения средних величин. Пусть X - пространство произвольной природы, x_1, x_2, x_3, \dots, x_n - его элементы. Чтобы ввести эмпирическое среднее для x_1, x_2, x_3, \dots, x_n будем использовать действительнозначную (т.е. с числовыми значениями) функцию f(x,y) двух переменных со значениями в X . В стандартных математических обозначениях, f:X^2 \to R^1 Величина f(x,y) интерпретируется как показатель различия между x и y : чем f(x,y) больше, тем x и y сильнее различаются. В качестве f можно использовать расстояние в Х , квадрат расстояния и т.п.

Определение 1. Средней величиной для совокупности x_1, x_2, x_3, \dots, x_n (относительно меры различия f ), обозначаемой любым из трех способов:

х_{ср}  = E_n(f) = E_n(x_1, x_2, x_3, \dots, x_n ; f),

называем решение оптимизационной задачи

\sum_{i=1}^nf(x,y) \to \min, y \in X

Это определение согласуется с классическим: если Х = R^1, f(x,y) = (x - y)^2 , то х_{ср} - выборочное среднее арифметическое. Если же Х = R^1, f(x,y) = |x - y| , то при n = 2k+1 имеем х_{ср} = x(k+1) , при n= 2k эмпирическое среднее является отрезком [x(k), x(k+1)] . Здесь через x(i) обозначен i -ый член вариационного ряда, построенного по x_1, x_2, x_3,\dots, x_n , т.е. i -я порядковая статистика. Таким образом, при Х = R^1, f(x,y) = |x - y| решение задачи (1) дает естественное определение выборочной медианы, правда, несколько отличающееся от предлагаемого в курсах "Общей теории статистики", в котором при n= 2k медианой называют полусумму двух центральных членов вариационного ряда (x(k) + x(k+1))/2 . Иногда x(k) называют левой медианой , а х(k+1) - правой медианой [3].

Решением задачи (1) является множество E_n(f) , которое может быть пустым, состоять из одного или многих элементов. Выше приведен пример, когда решением является отрезок. Если Х = R^1 \{х_0\} , f(x,y) = (x - y)^2 , а среднее арифметическое выборки равно х_0 , то E_n(f) пусто.

При моделировании реальных ситуаций часто можно принять, что Х состоит из конечного числа элементов, а тогда E_n(f) непусто - минимум на конечном множестве всегда достигается.

Понятия случайного элемента x=x(\omega) со значениями в Х , его распределения, независимости случайных элементов используем согласно пункту 2 настоящей лекции, т.е. справочнику Ю.В. Прохорова и Ю.А. Розанова [25]. Будем считать, что функция f измерима относительно \sigma -алгебры, участвующей в определении случайного элемента x=x(\omega). Тогда f(x(\omega),y) при фиксированном y является действительнозначной случайной величиной. Предположим, что она имеет математическое ожидание.

Определение 2. Теоретическим средним (математическим ожиданием) для случайного элемента x=x(\omega) относительно меры различия f, обозначаемом E(x,f) , называется решение оптимизационной задачи

Ef(x(\omega),y) \to \min, y \in X

Это определение также согласуется с классическим. Если Х = R^1, f(x,y) = (x - y)^2, то E(x,f) = E(x) - обычное математическое ожидание, при этом Ef(x(\omega),y) - дисперсия случайной величины x=x(\omega). Если же Х = R^1 , f(x,y) = |x - y|, то E(x,f) = [a,b] , где a = \sup\{t: F(t) \le 0,5\}, b =\ inf\{t: F(t)\ge 0,5\}, причем F(t) - функция распределения случайной величины x=x(\omega). Если график F(t) имеет плоский участок на уровне F(t) = 0,5, то медиана - теоретическое среднее в смысле определения 2 - является отрезком. В классическом случае обычно говорят, что каждый элемент отрезка [a; b] является одним из возможных значений медианы. Поскольку наличие указанного плоского участка - исключительный случай, то обычно решением задачи (2) является множество из одного элемента a = b - классическая медиана распределения случайной величины x=x(\omega).

Теоретическое среднее E(x,f) можно определить лишь тогда, когда Ef(x(\omega),y) существует при всех y \in Y. Оно может быть пустым множеством, например, если Х = R^1 \\ {х_0\} , f(x,y) = (x - y)^2 , x_0= E(x) . И то, и другое исключается, если Х конечно. Однако и для конечных Х теоретическое среднее может состоять не из одного, а из многих элементов. Отметим, однако, что в множестве всех распределений вероятностей на Х подмножество тех распределений, для которых E(x,f) состоит более чем из одного элемента, имеет коразмерность 1, поэтому основной является ситуация, когда множество E(x,f) содержит единственный элемент [3].

Существование средних величин. Под существованием средних величин будем понимать непустоту множеств решений соответствующих оптимизационных задач.

Если Х состоит из конечного числа элементов, то минимум в задачах (1) и (2) берется по конечному множеству, а потому, как уже отмечалось, эмпирические и теоретические средние существуют.

Ввиду важности обсуждаемой темы приведем доказательства. Для строгого математического изложения нам понадобятся термины из раздела математики под названием "общая топология". Топологические термины и результаты будем использовать в соответствии с классической монографией [29]. Так, топологическое пространство называется бикомпактным в том и только в том случае, когда из каждого его открытого покрытия можно выбрать конечное подпокрытие [29, с.183].

Теорема 1. Пусть Х - бикомпактное пространство, функция f непрерывна на Х^2 (в топологии произведения). Тогда эмпирическое и теоретическое средние существуют.

Доказательство. Функция f(x_i,y) от y непрерывна, сумма непрерывных функций непрерывна, непрерывная функция на бикомпакте достигает своего минимума, откуда и следует заключение теоремы относительно эмпирического среднего.

Перейдем к теоретическому среднему. По теореме Тихонова [29, с.194] из бикомпактности Х вытекает бикомпактность Х^2. Для каждой точки (x, y) из Х^2 рассмотрим \epsilon/2 - окрестность в Х^2 в смысле показателя различия f, т.е. множество

U(x,y)=\{(x', y'):|f(x,y)-f(x',y')| < \epsilon /2\}

Поскольку f непрерывна, то множества U(x,y) открыты в рассматриваемой топологии в Х^2. По теореме Уоллеса [29, с.193] существуют открытые (в Х ) множества V(x) и W(y) , содержащие x и y соответственно и такие, что их декартово произведение V(x) x W(y) целиком содержится внутри U(x, y) .

Рассмотрим покрытие Х^2 открытыми множествами V(x) x W(y) . Из бикомпактности Х^2 вытекает существование конечного подпокрытия \{V(x_i) x W(y_i), i = 1,2, \dots, m\}. Для каждого х из Х рассмотрим все декартовы произведения V(x_i) x W(y_i) , куда входит точка (x, y) при каком-либо y. Таких декартовых произведений и их первых множителей V(x_i) конечное число. Возьмем пересечение таких первых множителей V(x_i) и обозначим его Z(x) . Это пересечение открыто, как пересечение конечного числа открытых множеств, и содержит точку х. Из покрытия бикомпактного пространства X открытыми множествами Z(x) выберем открытое подпокрытие Z_1, Z_2,\dots, Z_k.

Покажем, что если x'_1 и x'_2 принадлежат одному и тому же Zj при некотором j, то

\sup\{|f(x'_1, y)-f(x'_2,y)|, y \in X\} \lt; \epsilon ( 3)

Пусть Z_j = Z(x_0) при некотором x_0. Пусть V(x_i) x W(y_i) , y \in I, - совокупность всех тех исходных декартовых произведений из системы \{V(x_i) x W(y_i), i = 1,2, \dots, m\}, куда входят точки (x_0, y) при различных y. Покажем, что их объединение содержит также точки (x'_2,y) и (x'_1,y) при всех y. Действительно, если (х_0, y) входит в V(x_i) x W(y_i) , то y входит в W(y_i), а x'_1 и x'_2 вместе с x_0 входят в V(x_i) , поскольку x'_1, x'_2 и x_0 входят в Z(x_0) . Таким образом, (x'_1, y) и (x'_2,y) принадлежат V(x_i) x W(y_i) , а потому согласно определению V(x_i) x W(y_i)

|f(x'_1,y)-f(x_i,y_i)| < \epsilon /2,\\
|f(x'_2,y)-f(x_i,y_i)| < \epsilon /2

откуда и следует неравенство (3).

Поскольку Х^2 - бикомпактное пространство, то функция f ограничена на Х^2, а потому существует математическое ожидание E f(x(\omega),y) для любого случайного элемента x(\omega), удовлетворяющего приведенным в предыдущем разделе условиям согласования топологии, связанной с f, и измеримости, связанной с x(\omega). Если х_1 и х_2 принадлежат одному открытому множеству Z_j, то |Ef(x_1,y)-|Ef(x_2,y)|  < \epsilon а потому функция

g(y)=Ef(x(\omega),y) ( 4)

непрерывна на Х. Поскольку непрерывная функция на бикомпактном множестве достигает своего минимума, т.е. существуют такие точки z, на которых g(z) = \inf\{g(y), y\inX\}, то теорема 1 доказана.

В ряде интересных для приложений ситуаций Х не является бикомпактным пространством. Например, если Х = R^1. В этих случаях приходится наложить на показатель различия f некоторые ограничения, например, так, как это сделано в теореме 2.

Михаил Агапитов
Михаил Агапитов

Не могу найти  требования по оформлению выпускной контрольной работы по курсу профессиональной переподготовки "Менеджмент предприятия"

Подобед Александр
Подобед Александр

Я нажал кнопку "начать курс" и почти его уже закончил, но для получения диплома на бумаге, нужно его же оплатить? Как оплатить? 

Вячеслав Гримальский
Вячеслав Гримальский
Россия
Михаил Байков
Михаил Байков
Россия, Москва, Московский Авиационный Институт, 2009