Случайная величина и ее основные характеристики.
Гистограмма. Полигон частот. Непрерывное распределение
Для экспериментальной информации характерно большое количество разнообразных наблюдаемых значений, которые отличаются друг от друга на небольшую величину. В таком случае рекомендуется от дискретного распределения перейти к непрерывному ряду. Данный переход может выполняться двумя способами.
Первый способ рекомендуется для длинных рядов ( ). Этот переход основан на использовании коэффициента Стэрджеса
( 12) |
Рассмотрим пример. Пусть получены следующие значения плотности образцов горных пород:
2.58 | 2.65 | 2.52 | 2.68 | 2.70 | 2.73 | 2.71 | 2.58 | 2.49 |
2.50 | 2.73 | 2.68 | 2.64 | 2.68 | 2.72 | 2.73 | 2.78 | 2.78 |
2.77 | 2.59 | 2.53 | 2.59 | 2.62 | 2.51 | 2.52 | 2.64 | 2.65 |
Всего N=27. Ранжируем ряд
Варианты | 2.49 | 2.50 | 2.51 | 2.52 | 2.53 | 2.58 | 2.59 | 2.62 |
Частоты | 1 | 1 | 1 | 2 | 1 | 2 | 2 | 1 |
Вероятность | 1/27 | 1/27 | 1/27 | 2/27 | 1/27 | 2/27 | 2/27 | 1/27 |
Варианты | 2.64 | 2.65 | 2.68 | 2.7 | 2.71 | 2.72 | 2.73 | 2.78 |
Частоты | 2 | 2 | 3 | 1 | 1 | 1 | 3 | 2 |
Вероятность | 2/27 | 2/27 | 3/27 | 1/27 | 1/27 | 1/27 | 3/27 | 2/27 |
Выделено 16 вариант при длине ряда 27. Поэтому перейдем к непрерывному распределению, воспользовавшись коэффициентом Стэрджеса (12):
( 12) |
N п/п | Значения , входящие в интервал | ||||
---|---|---|---|---|---|
0 | 2,47 | 2,50 | 2,49 | 1 | 1/27 |
1 | 2,50 | 2,53 | 2,50;2.51;2.52 | 4 | 4/27 |
2 | 2,53 | 2,56 | 2,53 | 1 | 1/27 |
3 | 2,56 | 2,59 | 2,58 | 2 | 2/27 |
4 | 2,59 | 2,62 | 2,59 | 2 | 2/27 |
5 | 2,62 | 2,65 | 2,62;2.64 | 3 | 3/27 |
6 | 2,65 | 2,68 | 2,65 | 2 | 2/27 |
7 | 2,68 | 2,71 | 2,68;2.70 | 4 | 4/27 |
8 | 2,71 | 2,74 | 2,71;2.72;2.73 | 5 | 5/27 |
9 | 2,74 | 2,77 | - | 0 | 0 |
10 | 2,77 | 2,80 | 2,78 | 2 | 2/27 |
В результате оказалось, что ряд разбит только на 10 интервалов; вместо 16, что в конечном итоге ведет к уменьшению вычислений.
Второй способ рекомендуется для коротких рядов ( ). В этом случае задается не шаг, а количество интервалов разбиения. Как правило, выбирают 10 интервалов. Тогда шаг разбиения вычисляется по приближенной формуле
( 13) |
Если вернуться к нашему примеру, то
т.е получим тот же результат, что и в первом случае. Именно поэтому для коротких рядов используют более простой (с вычислительной точки зрения) способ, так как результаты практически одинаковые, то применение сложной вычислительной схемы не оправдано.Если теперь по оси ОХ отложить варианты, а по оси OY - частоты, то, используя уже рассмотренный пример, получим следующие графики для дискретного (рис.1) и непрерыв-ного (рис.2) распределений.
Полигон частот и гистограмма описывают распределение частот , определяемых для каждого значения случайной величины. При построении этих графиков не существует строгих методов выбора конечного числа интервалов или значений, однако рекомендуют, если переходить от дискретного к непрерывному распределению.
В заключении отметим, что довольно часто по оси OY откладывают значения вместо