Опубликован: 10.09.2016 | Уровень: для всех | Доступ: платный
Лекция 5:

Методологические вопросы прогнозирования временных рядов

5.4. Выделение тренда в случае нестационарного временного ряда

Процесс выделения тренда (выравнивание ряда) включает в себя три этапа:

  1. выбор типа кривой, соответствующей характеру изменения ряда;
  2. определение числовых значений параметров кривой;
  3. оценка качества подобранной модели тренда.

На практике используется несколько приемов, позволяющих подобрать соответствующую (адекватную) действительности форму кривой.

Первый прием - визуальный - является наиболее простым. Форма кривой выбирается на основе графического изображения временного ряда, формы его корреляционного поля. Корреляционным полем временного ряда X(t) называется множество точек (t, X(t)) на плоскости (t, OX). Однако при этом есть риск субъективного и произвольного выбора. Результат выбора зависит от масштаба графического изображения. Но при относительно простых конфигурациях корреляционного поля и незначительных отклонениях (помехах) от тенденции развития визуальный подход дает вполне приемлемые результаты. Для уменьшения субъективизма следует привлекать по возможности всю информацию об исследуемом процессе, в том числе о внутренней структуре и движущих силах процесса.

Второй прием заключается в вычислении последовательных разностей


(5.13)

Порядок разностей, при котором они становятся примерно одинаковыми, берется в качестве степени аппроксимирующего (выравнивающего) многочлена. Так, если малыми оказываются первые разности \{\Delta _{i}^{(1)}\}, i = 2, 3, \dots , n, то для выравнивания берется многочлен первой степени X(t) = a + bt, если малы разности второго порядка \{\Delta _{i}^{(2)}\}, то X(t) = a + bt + ct^{2} и т.д.

Ясно, что такой прием не универсален и может использоваться при подборе кривых, описываемых многочленами. Если уравнение кривой путем некоторого преобразования (обычно путем логарифмирования) можно свести к многочлену, то его можно применить и в этом случае. Однако при этом необходимо следить уже не за постоянством величины конечных разностей (5.13), а за их преобразованными значениями.

Например, уравнение гиперболы X(t) = a + b/t можно считать многочленом первой степени от функции 1/t. Кроме того, путем логарифмирования к линейному виду можно преобразовать такие функции, как

X(t) = ae^{bt} \to ln X(t) = lna + bt,\\
			X(t) = ae^{b/t} \to ln X(t) = lna + b/t,\\
		X(t) = ae^{bt + c2} \to ln X(t) = lna + bt + ct2.

В таблице 5.1 приведены уравнения кривых, их графики, критерии, по которым эти кривые выбираются, а также системы нормальных уравнений метода наименьших квадратов (МНК) для нахождения коэффициентов этих кривых.

Данный подход менее субъективен, так как после визуального выбора кривой с использованием графиков следует проверка ее соответствия временному ряду по критерию выбора кривой (см. табл. 5.1).

Таблица 5.1.
Уравнение кривых График кривых Критерий выбора кривой Система нормальных уравнений МНК




Часто используются другие критерии отбора. Обычно в качестве критерия принимают сумму квадратов отклонений фактических значений от расчетных, полученных выравниванием. Выбирается кривая, которой соответствует минимальное значение критерия. Однако минимум суммы квадратов еще не означает, что тенденция развития временного ряда описана наилучшим образом. Это объясняется тем, что через любой набор из N точек на плоскости всегда можно провести многочлен степени N - 1. Поэтому, выбрав достаточно сложную кривую, можно сделать нулевой сумму квадратов отклонений расчетных значений от заданных. Однако в этом случае вряд ли будет отражена тенденция дальнейшего развития процесса.

Следовательно, отбор кривых следует проводить в два этапа. На первом этапе по большей части данных строят различного вида зависимости X(t). Затем по оставшимся данным (проверочной последовательности) с помощью критерия минимума квадратов отклонений выбирают кривую с минимальным значением критерия на проверочной последовательности. Этот прием более трудоемкий, чем описанный в табл. 5.1, но, как правило, дает лучшие результаты при прогнозировании тенденции развития временного ряда.

5.5. Автокорреляция остатков

Вычитая из данных X(t_{i})выровненные значения получаем остатки, случайную составляющую тренда

\varepsilon (t) = X(t) - X(t_{i}). (5.14)

Обычно считается, что выравнивание удовлетворительное, если остатки \varepsilon (t) образуют стационарный процесс с нулевым математическим ожиданием m\varepsilon (t) = M[\varepsilon (t)] = 0.

Кроме того, для корректного применения МНК необходимо более жесткое предположение, что \varepsilon (t) - случайные независимые (хотя бы некоррелированные) величины с m_{\varepsilon } (t) = 0.

Если \varepsilon (t_{i}) коррелируют между собой, то в модели присутствует автокорреляция остатков. Метод наименьших квадратов и в этом случае дает несмещенные и состоятельные оценки коэффициентов уравнений кривых. Однако получаемые при этом стандартные ошибки и доверительные интервалы для коэффициентов оказываются заниженными. Это может привести к ошибочным выводам при оценке качества отобранной модели поведения временного ряда. Значительная корреляция остатков сигнализирует о том, что либо кривая подобрана неудачно, либо необходимо строить еще одну модель для описания поведения самих остатков \varepsilon (t_{i}).

Итак, при анализе модели тренда необходимо определить, присутствует ли автокорреляция в \varepsilon (t_{i}). Предварительную оценку случайности поведения остатков проводят на основе критерия поворотных точек. В соответствии с ним каждое значение \varepsilon (t_{i}) ряда остатков сравнивают с двумя рядом стоящими значениями \varepsilon (t_{i} - 1) и \varepsilon (t_{i} + 1).

Если \varepsilon (t_{i}) > \varepsilon (t_{i} - 1)и \varepsilon (t_{i}) > \varepsilon (t_{i} + 1) или \varepsilon (t_{i}) < \varepsilon (t_{i} - 1), \varepsilon (t_{i}) < \varepsilon (t_{i} + 1), то точка \varepsilon (t_{i}) считается поворотной (в ней достигается локальный максимум или минимум соответственно). Далее подсчитывают общее количество поворотных точек P. В случайном ряду остатков должно выполняться строгое неравенство

P > [2(n - 2)/3-2 \sqrt{(16n - 29)}/90)]. (5.15)

Квадратные скобки здесь означают, что берется целая часть числа (не путать с процедурой округления). Отметим, что критерий поворотных точек сигнализирует только о наличии положительной корреляции в ряде остатков. Если число поворотных точек P велико, приближается к n - 2, то можно говорить о наличии отрицательной корреляции между соседними членами временного ряда остатков. Критерий поворотных точек является предварительным, его следует дополнить другими более точными критериями.

Простейшим из известных критериев является критерий Неймана. Расчетное значение критерия

Q = F/S^{2}, (5.16)
где

(5.17)

Для доказательства положительной корреляции вычисленное значение Q должно быть меньше Q_{кр1}, а для доказательства отрицательной корреляции Q должно быть больше Q_{кр2} (табл. 5.2).

Таблица 5.2.
Число наблюдений, n Положительная автокорреляция при Q < Q_{кр 1 } Отрицательная автокорреляция при Q > Q_{кр 2 }
\alpha = 0,05 \alpha = 0,01 \alpha = 0,05 \alpha = 0,01
10 1,18 0,84 3,61 3,26
15 1,29 0,99 3,30 2,99
20 1,37 1,10 3,12 2,84
25 1,42 1,17 2,99 2,74
30 1,47 1,24 2,90 2,67

Помимо критерия Неймана для временных рядов используется хорошо изученный тест Дарбина - Ватсона. Он основан практически на той же статистике и отличается множителем n/(n - 1)


Этот тест подробно исследован и реализован во всех статистических пакетах (STATGRAPHICS, STATISTICA и др.).

Пусть


Можно показать, что DW \approx 2(1 - r). Отсюда вывод: чем ближе DW к двум, тем меньше автокорреляция остатков временного ряда. Более того, ученые показали, что существуют две границы d_{u}и dl (u - upper) верхняя, (l - low) нижняя, которые зависят от n, числа параметров кривой и уровня значимости a. Результаты теста Дарбина - Ватсона можно представить в следующем виде (табл. 5.3).

Наличие зоны неопределенности, конечно, несколько затрудняет использование теста Дарбина - Ватсона. Ширина зоны неопределенности может быть значительной. Например, при n = 19, k = 3 она образует интервал (0,218; 0,463). Поэтому многие дальнейшие исследования были направлены на построение тестов, которые сужают зону неопределенности.

Таблица 5.3.
Значение статистики DW Вывод
4 - dl < DW < 4 Гипотеза о независимости остатков отвергается, есть отрицательная корреляция
4 - d_{u} < DW < 4 - dl Неопределенность
2 < DW < 4 - d_{u} Принимается гипотеза о независимости остатков
d_{u} < DW < 2 Принимается гипотеза о независимости остатков
dl < DW < d_{u} Неопределенность
0 < DW < dl Гипотеза о независимости остатков отвергается, есть положительная корреляция
Инесса Воробьева
Инесса Воробьева

В дисциплине "Основы эконометрики" тест 6 дается по теме 7.

Вера Борисова
Вера Борисова
Россия
Студентик Студент
Студентик Студент
Россия