Опубликован: 10.09.2016 | Уровень: для всех | Доступ: платный
Лекция 10:

Стационарные временные ряды, модели авторегрессии - скользящего среднего

10.8. Алгоритм выбора модели оптимальной сложности для временного ряда в АРСС(p, q)-моделях

Все множество наблюдений y_{t}, t = 1, 2, 3, \dots , T разбивают на две выборки:

  1. обучающую с объемом наблюдений T_{1} (y_{1}, y_{2}, \dots , y_{T1});
  2. экзаменационную (y_{T1}_{+1}, \dots , y_{T1} +_{t}_{2}) с объемом наблюдений Т_{2}.

На обучающей выборке определяют числовые характеристики временного ряда, а именно: среднее, дисперсию, автоковариации и автокорреляционные функции (АКФ):




Организуются циклы по переменным p - числу параметров авторегрессии и q - числу параметров скользящего среднего:

p = 1, 2, \dots , p_{max}; q = 1, 2, \dots , q_{max}.

Для каждой пары (p, q) вычисляются оценки параметров авторегрессии Ф = (Ф_{1}, Ф_{2}, \dots , Ф_{p}) путем решения системы р линейных уравнений

АФ = x,
где А - матрица с элементами А_{ij} = \gamma_{|q+i-j|}, а вектор х = (х_{1}, х_{2}, \dots , х_{p}) с координатами х_{i} = \gamma_{q+i}; i, j = 1, 2, \dots , p.

По известным автоковариациям \gamma_{k} вычисляется модифицированная последовательность ковариаций \gamma_{j} ^{1}:


Вычисляются начальные значения \tau _{0}^{0} = \sqrt{\gamma_{0}^{1}}; \tau _{1}^{0} = \tau _{2}^{0 }= \dots = \tau _{q}^{0 }= 0, т.е. формируется начальный вектор \tau ^{0 }= (\tau _{0}^{0}, \tau _{1}^{0}, \tau _{2}^{0}, \dots , \tau _{q}^{0}).

Далее используется алгоритм Ньютона - Рафсона вида

\tau ^{i+1 }= \tau ^{i } - h, \tau ^{i }= (\tau _{0}^{i}, \tau _{1}^{i}, \tau _{2}^{i}, \dots , \tau _{q}^{i}) .
где h - решение системы T^{i} h = f^{i}.

При этом

f ^{i }= (f_{0}^{i}, f_{1}^{i}, f_{2}^{i}, \dots , f_{q}^{i}),

и начальный вектор определен выше.

Если |f_{ji}| < \varepsilon , j = 0,1, \dots, q, для некоторого выбираемого заранее малого \varepsilon, то итерационный процесс завершается.

Оценки \beta _{i} параметров скользящего среднего находятся по формулам

\beta _{j} = -\tau _{j }/ \tau _{0}, j = 0, 1, \dots , q,

где получен в результате применения алгоритма Ньютона - Рафсона (см. выше).

Вычисляем свободный член модели


Определяем оценку дисперсии белого шума:


Вычисляем остаточные ошибки модели на обучающей выборке. Пусть s = max{p, q}, тогда остаточные ошибки на обучающей выборке (y_{1}, y_{2}, \dots , yT_{1}) имеют вид

\alpha _{1}^{об} = \alpha _{2}^{об} = \alpha _{3}^{об} = \dots = \alpha _{s}^{об};

Найдем остаточные ошибки модели на проверочной последовательности. Полагаем:

\alpha _{0}^{пр} = \alpha _{1}^{об}; = \alpha _{-1}^{пр} = \dots = \alpha T1-1^{об}; \dots , \alpha _{-s}^{пр} = \alpha T1-s^{об}

и далее


Вычисляем на экзаменационной (проверочной) последовательности среднюю сумму квадратов ошибок:


Оформляем конец циклов на p и q.

Выбираем пару p^{опт} и q^{опт}, для которой \sigma ^{2}_{pq} принимает минимальное значение:

(p^{опт}, q^{опт}) = arg min \sigma ^{2}_{pq}.

Далее производится оценка коэффициентов авторегрессии и скользящего среднего для модели выбранной оптимальной сложности с p = p^{опт}, q = q^{опт}, повторяя описанный выше алгоритм для всей выборки Т и получая окончательные значения коэффициентов а_{0}, Ф_{1}, \dots , Ф_{p}, \beta _{0}, \dots , \beta _{q}.

Экономичность модели. Помимо "внешнего" критерия при построении модели можно использовать принцип экономичности. Включение дополнительных переменных в модель увеличивает адекватность модели (на обучающей выборке), так как средняя ошибка модели убывает. Часто можно заменить одну модель другой - более экономичной. Например, СС(\infty )-модель

y_{t} = \varepsilon _{t} + 0,5\varepsilon _{t} - 1 + 0,25\varepsilon _{t} - 2 + 0,125\varepsilon _{t} - 3 + 0,0625\varepsilon _{t} - 4 +\dots

эквивалентна модели y_{t} = 0,5y_{t} - 1 + \varepsilon _{t}, что легко проверить.

Для того чтобы сделать модель более экономичной, считают, что коэффициенты авторегрессии и скользящего среднего должны иметь t-статистики больше или равны 2 (чтобы каждый коэффициент значимо отличался от нуля при 5%-ном уровне значимости). Кроме того, необходимо следить за тем, чтобы коэффициенты не были сильно коррелированны друг с другом. Сильная корреляция коэффициентов делает модель неустойчивой. В этом случае следует исключать те коэффициенты, которые в наименьшей степени ухудшают результаты прогноза.

Кроме того, важно, чтобы остатки оцениваемой модели были сериально некоррелированные. Наличие сериальной корреляции остатков сигнализирует о систематических изменениях в последовательности \{y_{t}\}, которые не могут быть учтены АРСС-моделью.

Чтобы проверить корреляцию остатков, строят АКФ и ЧАКФ для остатков оцениваемой модели. Затем можно использовать Q-статистики Бокса - Пирса и Льюиса - Бокса (см. (10.49)-(10.50)). Они позволяют определить, будут ли автокорреляции остатков или частные автокорреляции статистически значимы. Обычно можно предполагать наличие сериальной корреляции остатков при превышении критического уровня Q-статистикой при 10%-ном уровне значимости. В этом случае велика вероятность построения другой модели, лучше отражающей специфику процесса.

Стационарность и обратимость модели. Из теории вероятностей известно, что выборочные АКФ и ЧАКФ аппроксимируют АКФ и ЧАКФ реального временного ряда в том случае, если предполагать стационарность ряда y_{t}. Далее, t- и Q-статистики также предполагают стационарность ряда y_{t}.

Если искомый ряд y_{t} не стационарный, то первым шагом в подходе Бокса - Дженкинса является взятие первой, второй и следующих разностей временного ряда

\Delta ^{2}y_{t} = y_{t} - y_{t} - 1, \Delta ^{2}y_{t} = \Delta (\Delta y_{t})

и так далее до тех пор, пока в результате не получится стационарный временной ряд. Этот подход обладает серьезным недостатком, так как не позволяет включать в модель долговременные составляющие. Современные подходы к построению модели временных рядов в условиях нестационарности рассмотрены в последующих главах книги.

Подход Бокса - Дженкинса требует также обратимости модели. Она означает возможность представления модели в виде конечного или бесконечного, но сходящегося авторегрессионного процесса. Это необходимо для АКФ и ЧАКФ. Рассмотрим, к примеру, СС(1)-модель

y_{t} = \varepsilon _{t} - \beta _{1}\varepsilon _{t} - 1.

Если |\beta _{1}| < 1, то

\varepsilon _{t} = y_{t}/(1 - \beta _{1}L).

Разлагая в ряд правую часть равенства, получаем:

y_{t} + \beta _{1}y_{t-1} + \beta _{1}^{2}y_{t} + \beta _{1}^{3}y_{t} + \dots = \varepsilon _{t}.

Полученная модель представляет собой сходящуюся авторегрессионную модель бесконечного порядка, для которой могут быть посчитаны АКФ и ЧАКФ. Однако если |\beta_{1}| >= 1, то последовательность \{y_{t}\} не может быть представлена сходящейся авторегрессией. В общем случае для АРСС(p, q)-модели корни многочлена 1 + \beta _{1}L + \beta _{2}L^{2} +\dots + + \beta qL^{q } должны лежать вне единичного круга. Тогда модель обратима.

Заметим, что могут существовать и необратимые модели с "долгосрочной памятью", которые нельзя построить по методу Бокса - Дженкинса. Например, модель стационарного процесса

y_{t} = \varepsilon _{t} - \varepsilon _{t} - 1

с постоянным средним Myt = Myt - s = 0, дисперсией и автоковариациями \gamma1 = - \beta 1\sigma 2 = -\sigma 2 и \gamma\sigma = 0. Записывая модель в эквивалентном виде

y_{t} = -y_{t} - 1 + y_{t} - 2 - y_{t} - 3 + y_{t} - 4 +\dots

убеждаемся, что ЧАКФ не затухают с увеличением лага s \to \infty.

Инесса Воробьева
Инесса Воробьева

В дисциплине "Основы эконометрики" тест 6 дается по теме 7.

Вера Борисова
Вера Борисова
Россия
Студентик Студент
Студентик Студент
Россия