Опубликован: 10.09.2016 | Уровень: для всех | Доступ: платный
Лекция 10:

Стационарные временные ряды, модели авторегрессии - скользящего среднего

10.6. Построение АРСС-моделей

Первым шагом в подборе АРСС-модели наблюдаемого временного ряда является оценка среднего - \mu, дисперсии - (\sigma _{y})^{2} и автокорреляций \rho _{k}. В предположении стационарности и эргодичности (возможности получения оценок по одной реализации процесса) применимы следующие оценки:


(10.44)

(10.45)

и


(10.46)

Выборочные АКФ из (10.46) и ЧАКФ, полученные по формулам (10.39)-(10.43), сравнивают с различными теоретическими функциями, чтобы идентифицировать процесс, породивший данную выборочную реализацию.

Дж. Бокс и Г. Дженкинс (1976) получили формулу для расчета дисперсии выборочной АКФ r_{s} в предположении, что y_{t} - стационарны с нормально распределенными ошибками. Тогда

D(r_{s}) = T-1 для s = 1, (10.47)
для s > 1 (10.48)

при настоящем значении r_{s} = 0. Более того, в большой выборке (Т - велико) r_{s} нормально распределено с нулевым средним. Для коэффициентов ЧАКФ АР(р)-модели доказано, что D(Ф_{p+ i, p+i}) \approx Т^{-1}.

На практике полученные выборочные значения АКФ и ЧАКФ тестируются на значимость с использованием (10.47) и (10.48). Например, для 95%-ого доверительного интервала (двух стандартных отклонений), если r_{1} превышает 2Т^{-1/2}, то следует отвергнуть нулевую гипотезу о том, что АКФ первого порядка статистически незначимо отличается от нуля. Это означает, что q > 0, где q - показатель числа запаздываний в модели SS(q). Затем, пусть s = 2, D(r_{2}) = (1 + 2r_{1}^{2}) / T.

Если, например, r_{1} = 0,5 и Т = 100, то D(r_{2}) = 0,015 и \sigma (r_{2}) \approx 0,123. Тогда если вычисленное по выборке значение r_{2} превышает 2 \times (0,123) (два стандартных отклонения), то при принятых ограничениях с 95%-ной вероятностью можно утверждать, что гипотезу r_{2} = 0 надо отвергнуть. Следовательно, q > 1. Повторяя процесс проверки гипотез для различных s можно пытаться идентифицировать порядок процесса.

Однако если просматривать большое число АКФ, то можно обнаружить, что некоторые АКФ превышают 2\sigma (r_{s}), хотя настоящие \rho _{s} = 0. Это вызвано как 5%-ными ошибками первого рода, так и несоответствием реальных распределений теоретическим предпосылкам нормальности ошибок.

Следующая Q-статистика может быть использована для тестирования, когда группа АКФ значимо отличается от нуля. Q-статистика Бокса - Пирса имеет вид


(10.49)

Если данные порождены стационарным АРСС-процессом, то Q асимптотически x^{2}-распределенная с s степенями свободы. Интуитивно понятно, что большие значения АКФ ведут к большим значениям Q. Если выборочное Q превышает соответствующее табличное значение Q, то отвергается гипотеза о незначимости группы АКФ. Отметим, что альтернативная гипотеза означает, что хотя бы одна АКФ не равна нулю.

Однако оказалось, что даже в средней величины выборках Q-статистика работает плохо. Для малых выборок используют модифицированную Q-статистику Льюиса - Бокса, вычисленную по формуле


(10.50)

Если выборочное значение Q-статистики превышает критическое значение x^{2}-распределения с s степенями свободы, то по крайней мере одно значение r_{k} статистически отлично от нуля при данном уровне значимости. Особо полезны эти статистики для проверки гипотезы об образовании остатками вычисленной АРСС(p, q)-модели белого шума. Поэтому если рассчитывать s АКФ для остатков оцененной АРСС(p, q)-модели, то число степеней свободы уменьшается на число коэффициентов модели. Следовательно, используя остатки для АРСС(p, q)-модели, необходимо проверять Q с помощью x^{2}-распределения с s - p - q степенями свободы. Если включена свободная постоянная, то используем таблицы x^{2}-распределения с s - p - q - 1 степенями свободы.

10.7. Селекция моделей АРСС

Наиболее простой и популярный в настоящее время метод селекции моделей предполагает построение множества моделей с различными p и q, а затем выбор модели, минимизирующей выбранный критерий селекции, который характеризует качество модели.

Существующие "внутренние" критерии селекции выражают компромисс между сложностью модели и величиной суммы квадратов остатков. Так, наиболее популярными являются информационный критерий Акайке (AIC) и бестестовый критерий Шварца (SBC), вычисляемые по формулам

AIC = T ln(R^{2}) + 2n,\\
		SBC = T ln(R^{2}) + n ln(T),

где

Т - число используемых наблюдений;
R^{2} - сумма квадратов остатков (ошибок) модели;
n - число оцениваемых параметров модели.

Так как ln(T) > 2, то оптимальная модель SBC будет менее сложной, чем оптимальная модель AIC. Стоимость "добавки" лишнего слагаемого больше для SBC-критерия, чем для AIC-критерия. Доказано, что с увеличением выборки SBC-модели асимптотически состоятельны, в то время как AIC-модели становятся слишком сложными.

Рассмотренные выше критерии отбора являются "внутренними", т.е. используют данные, уже ранее использованные для построения моделей. Если позволяет величина выборки, то гораздо надежнее использовать "внешние" критерии селекции, т.е. независимые наблюдения, не вошедшие в первоначальную выборку. Алгоритм построения АРСС(p, q)-модели по внешнему критерию минимизации ошибок на "экзаменующей" выборке рассмотрен ниже.

Инесса Воробьева
Инесса Воробьева

В дисциплине "Основы эконометрики" тест 6 дается по теме 7.

Вера Борисова
Вера Борисова
Россия
Студентик Студент
Студентик Студент
Россия