Опубликован: 20.04.2011 | Уровень: для всех | Доступ: платный
Лекция 7:

Пуассоновский процесс

< Лекция 6 || Лекция 7: 12 || Лекция 8 >
Аннотация: Пуассоновский процесс - самый важный точечный процесс. Позже мы поймем, что его роль среди точечных процессов столь же фундаментальна, как роль нормального распределения среди статистических распределений. Результатом сложения случайных переменных с помощью Центральной предельной теоремы является нормальное распределение. Подобным способом мы получаем экспоненциальное распределение при совмещении стохастических точечных процессов. Большинство других прикладных точечных процессов являются обобщением или модификацией Пуассоновского процесса. Этот процесс дает удивительно хорошее описание многих реальных процессов жизни. Чем сложнее процесс, тем лучше Пуассоновский процесс будет служить для него общей моделью. Пуассоновский процесс имеет широкое практическое применение, поэтому мы изучим его подробно в этой лекции. Сначала (секция 6.2) поговорим о физической модели. При этом главное внимание будет уделено распределениям, связанным с процессом, а затем мы рассмотрим некоторые важные свойства Пуассоновского процесса (секция 6.3). Наконец, в секции 6.4 рассмотрим прерванный Пуассоновский процесс, как пример обобщения.

Характеристики Пуассоновского процесса

Фундаментальные свойства Пуассоновского процесса определены в секции 5.2:

а. стационарность;

б. независимость (отсутствие последействия) во все моменты времени (периоды), и

в. простота (ординарность).

(б) и (в) - фундаментальные свойства, тогда как (а) не является необходимым. Таким образом, можно допустить, что Пуассоновский процесс может иметь интенсивность, зависящую от времени поступления. Из этих свойств можно получить другие свойства, которые являются достаточными, чтобы определить Пуассоновский процесс. Два самых важных:

  • числовое представление: число событий в пределах временного интервала фиксированной длины имеет Пуассоновское распределение. Поэтому процесс называют Пуассоновским процессом ;
  • представление с помощью интервала: интервал времени Х_i(5.2) между последовательными событиями является экспоненциально распределенным.

В этом случае, используя (4.8) и (4.10) равенство Феллера- Дженсена (5.4), можно показать фундаментальное отношение между кумулятивным (накопленным) Пуассоновским распределением и распределением Эрланга:

\sum_{j=0}^{n-1} \frac{(\lambda t)^j}{j!}*e^{-\lambda t}=\int_{x=1}^{\infty}\frac{(\lambda x)^{n-1}}{(n-1)!} \lambda * e^{-\lambda x}dx=1-F(t). ( 6.1)

Эта формула может также быть получена повторным интегрированием по частям.

Распределения Пуассоновского процесса

В этой секции мы поговорим о динамическом и физическом представлении Пуассоновского процесса (1928 [30] и Дженсен, 1954 [11] ). Дифференцирования основаны на простой физической модели и концентрируются на распределениях вероятности, связанных с Пуассоновским процессом.

Физическая модель получается следующим способом. События (поступление) помещены наугад на реальной оси времени независимо от всех других событий, т.е. мы помещаем события однородно и независимо на реальных осях времени.

Средняя плотность выбрана как \lambda события (поступление) в единицу времени. Если рассматривать ось как ось времени, то в среднем мы будем иметь \lambda поступлений в единицу времени.

Вероятность, что данное поступление заявки возникает в пределах временного интервала, не зависит от местоположения интервала на оси времени.


Рис. 6.1.

В Пуассоновском процессе мы рассматриваем поступление заявки в пределах двух не перекрывающихся временных интервалов продолжительностью t_1 и t_2 соответственно.

Пусть р(v, t) обозначают вероятность, что v событий возникают в пределах временного интервала продолжительностью t.

Математическая формулировка вышеупомянутой модели следующая.

  1. Независимость (отсутствие последействия). Если t_1t_2 - два не перекрывающихся временных интервала (рис.6.1), мы предполагаем, что они независимы:

    p(0, t_1) *p(0, t_2)=p(0, t_1+t_2) ( 6.2)
    .
  2. Средняя величина временного интервала между двумя последовательными поступлениями заявок - \frac{1}{\lambda} (3.4):

    \int_0^{\infty}p(0,t)dt=\frac{1}{\lambda}, 0 < \frac{1}{\lambda} < \infty. ( 6.3)

    Здесь р(0, t) - вероятность, что в пределах временного интервала (0, t) нет поступления заявок. Идентичная вероятность: время, пока произойдет первое событие первое событие, не больше, чем t (дополнительное распределение). Средняя величина (6.3) получена непосредственно из (3.4). Формула (6.3) может также интерпретироваться как область под кривой р(0, t) Это никогда не увеличивающаяся функция, уменьшающаяся от 1 до 0.

  3. Отметим, что (6.2) подразумевает, что событие нет поступления заявок в пределах интервала длиной 0 существует и равно:

    p(0,0)=1 ( 6.4)
  4. Отметим, что (6.3) подразумевает, что вероятность события нет никаких поступлений заявок в пределах интервала времени длиной \infty является нулевым и никогда не имеет место

    p(0, \infty)=0 ( 6.5)

Экспоненциальное распределение

Следующий существенный шаг в развитии Пуассоновского распределения - получение вероятности р (0, t) , которая является вероятностью непоступления заявки в пределах временного интервала длины t, то есть вероятности, что первое поступление заявки произойдет позже, чем t. Мы покажем, что \{1 - р(0, t)\} - экспоненциальное распределение (сравните с результатом секции 4.1).

Из (6.2) мы имеем:

ln \quad p(0,t_1)+ln \quad p(0,t_2)=ln \quad p(0, t_1+t_2). ( 6.6)

Обозначая ln \quad p(0, t) =f(t) , (6.6) может быть записано как:

f(t_1)+f(t_2)=f(t_1+t_2). ( 6.7)

Дифференцируя, например, по t_2 , мы имеем

f'(t_2)=f_{t_2}'(t_1+t_2).

Заметим, что f_0 (t) должна быть константой, и поэтому

f(t)=a+bt. ( 6.8)

Подставляя (6.8) в (6.7), мы получаем а = 0 . Тогда р(0, t) имеет форму

p(0,t)=e^{bt}.

Из (6.3) мы получаем b :

\frac{1}{\lambda}=\int_0^{\infty}p(0,t) dt=\int_0^{\infty}e^{bt}dt=-\frac 1b,

или

b=-\lambda

Таким образом, на основе пункта (1) и (2) выше мы показали, что:

p(0,t)=e^{-\lambda t}. ( 6.9)

Если мы рассматриваем р(0, t) как вероятность того, что следующее событие наступает позже, чем за время t , тогда время до следующего прибытия является экспоненциально распределенным (секция. 4.1):

1-p(0,t)=F(t)=1-e^{-\lambda t}, \lambda > 0, t \ge 0, ( 6.10)
F'(t)=f(t)=\lambda *e^{-\lambda t}, \lambda >0, t \ge 0. ( 6.11)

Мы имеем следующую среднюю величину и дисперсию (4.4):

m_1=\frac{1}{\lambda},\\
\sigma^2=\frac{1}{\lambda^2}. ( 6.12)

Вероятность, что следующее появление заявки в пределах интервала (t, t + dt) может быть записана, как:

f(t)dt=\lambda e^{-\lambda t}dt\\

\quad=p(0,t) \lambda dt, ( 6.13)

то есть вероятность, что заявка поступит в пределах интервала (t, t+df) , равна \lambda dt , независимо om t пропорционально dt (3.17).

Поскольку \lambda независима от величины ( возраста ) t , экспоненциальное распределение не имеет памяти (сравните секции 4.1 и 3.1.2). Процесс не имеет возраста.

Параметр \lambda называется интенсивностью или скоростью экспоненциального распределения и соответствующего Пуассоновского процесса, и это соответствует интенсивности в (5.6). Экспоненциальное распределение - вообще очень хорошая модель для интервалов поступления вызовов, когда нагрузка генерируется автоматически, а не вручную (рис.6.2).

 Распределение времени временного интервала вызовов на транзитной станции.

Рис. 6.2. Распределение времени временного интервала вызовов на транзитной станции.

Теоретические значения получены при условии экспоненциально распределенных времен интервалов. Согласно принципу измерения (метод сканирования) непрерывное экспоненциальное распределение преобразовано в дискретное распределение Вестберга (Westerberg) (15.14) (критерий - \chi^2 = 18,86 с 19 степенями свободы, квантиль = 53)

Распределение Эрланга k-ого порядка

Из приведенного выше можно заметить, что время поступления точно k событий определяется суммой k IID (independently and identically distributed - независимо и тождественно распределенных) экспоненциально распределенных случайных переменных.

Распределение этой суммы - распределение Эрланга k - ого порядка (секция 4.2), и плотность равна:

g_k(t)dt=\lambda \frac{(\lambda t)^{k-1}}{(k-1)!}e^{-\lambda t}dt, \lambda > 0, k=1,2,\dots, ( 6.14)

Для k=1 мы получаем экспоненциальное распределение. Распределение g_{k+1}(t), k > 0 , получено свертыванием g_{k(t)}(t) и g_1(t) . Если мы принимаем, что выражение (6.14) правильно для g_k(t) , тогда получаем свертыванием:

g_{k+1}(t)=\int_0^t g_k(t-x)g_1(x)dx\\

\qquad=\int_0^t \lambda \frac{\{\lambda(t-x)\}^{k-1}}{(k-1)!}e^{-\lambda(t-x)}\lambda e^{-\lambda x}dt\\
=\frac{\lambda^{k+1}}{(k-1)!}e^{-\lambda t} \int_0^t(t-x)^{k-1}dx\\

\qquad =\lambda *\frac{(\lambda t)^k}{k!}*e^{-\lambda t}.

Так как выражение справедливо при k=1 , согласно приведенной выше индукции мы имеем, что это справедливо для любого k .

Распределение Эрланга k -ого порядка со статистической точки зрения - это специальное гамма-распределение.

Средняя величина и дисперсия получаются из (6.12):

m_1=\frac{k}{\lambda},\\
\sigma^2=\frac{k}{\lambda^2},\\
\varepsilon=1+\frac{1}{k}. ( 6.15)
Пример 6.2.1: статистика вызова в системе с программным управлением (сравните с Примером 5.1.2)

Пусть вызовы поступают в систему с программным управлением, например, на программно управляемую телефонную станцию ( SPC - System Program Control ), согласно Пуассоновскому процессу. Станция автоматически собирает полную информацию о каждом 1000-ном вызове. Интервалы поступления между двумя регистрацией тогда будут иметь k=1000 распределение Эрланга и иметь коэффициент формы \varepsilon = 1,001 , то есть регистрация будет очень регулярной.

Пуассоновское распределение

Покажем теперь, что число поступления заявок в интервал фиксированной длины t имеет Пуассоновское распределение со средней величиной \lambda t . Когда мы знаем вышеупомянутое экспоненциальное распределение и распределение Эрланга, дифференцирование Пуассоновского распределения - только вопрос применения простой комбинаторики. Доказательство может быть осуществлено по индукции.

Мы хотим получить p(i, t) = вероятность i -ого поступления заявки в пределах временного интервала t. Предположим, что:

p(i-1,t)=\frac{(\lambda t)^{i-1}}{(i-1)!}*e^{-\lambda t}, \lambda > 0, i=1,2, \dots.

Это справедливо, для i=0 (6.9) . Интервал (0, t) разделен на три не перекрывающихся интервала: (0, t_1), (t_1, t_1+dt_1) и (t_1+dt_1, t) . Из предположения о независимости мы знаем, что события в пределах интервала не зависят от событий в других интервалах, потому что интервалы - не перекрывающиеся. Выбирая t_1 так, чтобы последнее поступление заявки в пределах (0, t) появлялось в интервале (t_1, t_1+dt_1) , получим вероятность р (i, t) объединением по всем возможным значениям t как произведение следующих трех вероятностей.

  • Вероятность, что (i - 1) поступление произойдет в пределах временного интервала (0, t_1) :

    p(i-1, t_1)=\frac{(\lambda t_1)^{i-1}}{(i-1)!}*e^{-\lambda t_1}, 0 \le t_1 \le t_1.
  • Вероятность, что только одно поступление произойдет в пределах временного интервала от t_1 до t_1 + dt_1

    \lambda dt_1 .
  • Вероятность, что не произойдет поступление в пределах временного интервала от t_1 + dt_1 до t

    e^{-\lambda(t-t_1)}.

Произведение первых двух вероятностей дает вероятность того, что i -тая заявка поступит в момент t_1 + dt_1 , т.е. будет иметь место Эрланговское распределение из предыдущей секции.

Интегрируя, мы получаем

p(i,t)=\int_0^t \frac{(\lambda t_1)^{i-1}}{(i-1)!}e^{-\lambda t_1}\lambda dt_1e^{-\lambda(t-t_1)}\\
=\frac{\lambda^i}{(i-1)!}e^{\lambda t} \int_0^tt_1^{i-1}dt_1,\\
p(i,t)=\frac{(\lambda t)^i}{i!}*e^{-\lambda t}. ( 6.16)

Это - Пуасоновское распределение, которое мы, таким образом, получили из (6.9) индукцией. Средняя величина и дисперсия:

m_1=\lambda * t, ( 6.17)
\sigma^2=\lambda *t. ( 6.18)

Пуассоновское распределение - очень хорошая модель для числа вызовов в телекоммуникационной системе (рис.6.3) или вакантных мест в компьютерной системе.

< Лекция 6 || Лекция 7: 12 || Лекция 8 >
Нияз Сабиров
Нияз Сабиров

Здравствуйте. А уточните, пожалуйста, по какой причине стоимость изменилась? Была стоимость в 1 рубль, стала в 9900 рублей.

Елена Сапегова
Елена Сапегова

для получения диплома нужно ли кроме теоретической части еще и практическую делать? написание самого диплома требуется?

алексей оглы
алексей оглы
Россия
рафич Салахиев
рафич Салахиев
Россия