Опубликован: 28.04.2012 | Доступ: свободный | Студентов: 3087 / 876 | Оценка: 3.86 / 2.57 | Длительность: 07:45:00
Специальности: Математик, Преподаватель
Лекция 4:

Случайная величина и ее основные характеристики.

Гистограмма. Полигон частот. Непрерывное распределение

Для экспериментальной информации характерно большое количество разнообразных наблюдаемых значений, которые отличаются друг от друга на небольшую величину. В таком случае рекомендуется от дискретного распределения перейти к непрерывному ряду. Данный переход может выполняться двумя способами.

Первый способ рекомендуется для длинных рядов ( $N>200$ ). Этот переход основан на использовании коэффициента Стэрджеса

\[h=\frac { x_{max} -x_{min} } {1+3,322 \cdot lnN } \] ( 12)
определяющий шаг дискретизации интервала $\left [ x_{max};x_{min} \right]$ экспериментальных данных. В формуле (12) обозначено $x_{max}$ - наибольшее и $x_{min}$ - наименьшее значения вариант исследуемого вариационного ряда; N ? длина вариационного ряда (общее количество измерений); 3,222 -константа, определяемая из предположения, что данное распределение нормально . Весь интервал $\left [ x_{max};x_{min} \right]$ разбивают следующим образом
\[a_{0}= x_{min} -\frac  h 2; \]
\[a_{1}= a_{0}+ h; \]
\[\vdots\]
\[a_{k}= a_{k-1}+h; \]
\[\vdots\]
и завершают разбиение тогда, когда выполняется неравенство
\[a_{k}>x_{max}\]
И на каждом полученном полуинтервале $\left [a_{i};a_{i+1} \right )$ под-считываются значения $x_{i}$, отвечающие условию $x_{i} \in \left [a_{i};a_{i+1} \right )$

Рассмотрим пример. Пусть получены следующие значения плотности образцов горных пород:

2.58 2.65 2.52 2.68 2.70 2.73 2.71 2.58 2.49
2.50 2.73 2.68 2.64 2.68 2.72 2.73 2.78 2.78
2.77 2.59 2.53 2.59 2.62 2.51 2.52 2.64 2.65

Всего N=27. Ранжируем ряд

Варианты 2.49 2.50 2.51 2.52 2.53 2.58 2.59 2.62
Частоты 1 1 1 2 1 2 2 1
Вероятность 1/27 1/27 1/27 2/27 1/27 2/27 2/27 1/27
Варианты 2.64 2.65 2.68 2.7 2.71 2.72 2.73 2.78
Частоты 2 2 3 1 1 1 3 2
Вероятность 2/27 2/27 3/27 1/27 1/27 1/27 3/27 2/27

Выделено 16 вариант при длине ряда 27. Поэтому перейдем к непрерывному распределению, воспользовавшись коэффициентом Стэрджеса (12):

\[h=\frac { 2,78-2,49 } {1+3,322 \cdot 3,3 } \approx 0,025 \approx  0,03\] ( 12)
Таким образом, ряд разбивается на интервалы с $a_{0}=2,49-0,03/2=2,48$:

Числовые характеристики случайных величин
N п/п $\left [a_{i}$ Значения $x_{i}$, входящие в интервал $a_{i+1} \right )$ $x_{i}$ $p_{i}$
0 2,47 2,50 2,49 1 1/27
1 2,50 2,53 2,50;2.51;2.52 4 4/27
2 2,53 2,56 2,53 1 1/27
3 2,56 2,59 2,58 2 2/27
4 2,59 2,62 2,59 2 2/27
5 2,62 2,65 2,62;2.64 3 3/27
6 2,65 2,68 2,65 2 2/27
7 2,68 2,71 2,68;2.70 4 4/27
8 2,71 2,74 2,71;2.72;2.73 5 5/27
9 2,74 2,77 - 0 0
10 2,77 2,80 2,78 2 2/27

В результате оказалось, что ряд разбит только на 10 интервалов; вместо 16, что в конечном итоге ведет к уменьшению вычислений.

Второй способ рекомендуется для коротких рядов ( $N<200$ ). В этом случае задается не шаг, а количество интервалов разбиения. Как правило, выбирают 10 интервалов. Тогда шаг разбиения вычисляется по приближенной формуле

h=\frac { x_{max} -x_{min} } {10 }. ( 13)
А дальнейшие действия - совершенно аналогичны первому способу.

Если вернуться к нашему примеру, то

\[h=\frac { 2,78 -2,49 } {10 }=\frac {0,29} {10} = 0,029 \approx 0,03, \]
т.е получим тот же результат, что и в первом случае. Именно поэтому для коротких рядов используют более простой (с вычислительной точки зрения) способ, так как результаты практически одинаковые, то применение сложной вычислительной схемы не оправдано.

Дискретное распределение (полигон частот)

Рис. 7.1. Дискретное распределение (полигон частот)

Если теперь по оси ОХ отложить варианты, а по оси OY - частоты, то, используя уже рассмотренный пример, получим следующие графики для дискретного (рис.1) и непрерыв-ного (рис.2) распределений.

Непрерывное распределение (гистограмма)

Рис. 7.2. Непрерывное распределение (гистограмма)

Полигон частот и гистограмма описывают распределение частот $m_{x}$, определяемых для каждого значения случайной величины. При построении этих графиков не существует строгих методов выбора конечного числа интервалов или значений, однако рекомендуют, если $h \approx \sqrt n$ переходить от дискретного к непрерывному распределению.

В заключении отметим, что довольно часто по оси OY откладывают значения $p_{i}$ вместо $m_{x}$