2.1. Определим, является ли исходный временной ряд стационарным. Для этого, в первую очередь, обратимся к графику ряда:
На первый взгляд ряд кажется стационарным. Чтобы убедиться в этом, проведем тест Дики-Фуллера и посмотрим на его результаты:
Расширенный тест Дики-Фуллера для B
включая один лаг для (1-L)B (максимальное значение равно 12)
объем выборки 98
нулевая гипотеза единичного корня: a = 1
тест с константой
модель: (1-L)y = b0 + (a-1)*y(-1) +... + e
коэф. автокорреляции 1-го порядка для e: -0,039
оценка для (a - 1): -1,62959
тестовая статистика: tau_c(1) = -10,1364
асимпт. р-значение 1,21e-019
с константой и трендом
модель: (1-L)y = b0 + b1*t + (a-1)*y(-1) +... + e
коэф. автокорреляции 1-го порядка для e: -0,040
оценка для (a - 1): -1,63415
тестовая статистика: tau_ct(1) = -10,113
асимпт. р-значение 2,975e-020
P-value значительно меньше любого разумного уровня значимости, а значит, нулевая гипотеза Но теста Дики-Фулера о нестационарности ряда отклоняется. Ряд В является стационарным.
2.2. Обратим внимание на коррелограмму ряда В:
Обратим внимание на то, что между поведением графика ACF и PACF нет существенного различия. Это увеличивает вероятность того, что процесс будет описан одновременно MA-компонентой и AR-компонентой.
2.3. Непосредственное построение предположительной модели. Опираясь на предположение, что модель, скорее всего, должна содержать MA-компоненту и AR-компоненту, сгенерируем в первую очередь модель ARIMA (1,0,1) = ARMA (1,1):
Модель 4: ARMA, использованы наблюдения 1980:1-2004:4 (T = 100)
Зависимая переменная: B
Стандартные ошибки рассчитаны на основе Гессиана
Коэффициент | Ст. ошибка | z | P-значение | ||
const | 99,9953 | 0,049329 | 2027,1110 | <0,00001 | *** |
phi_1 | 0,218113 | 0,195312 | 1,1167 | 0,26410 | |
theta_1 | -0,646726 | 0,153671 | -4,2085 | 0,00003 | *** |
Среднее зав. перемен | 99,99557 | Ст. откл. зав. перемен | 1,181085 | |
Среднее инноваций | -0,003485 | Ст. откл. инноваций | 1,074320 | |
Лог. правдоподобие | -149,2059 | Крит. Акаике | 306,4117 | |
Крит. Шварца | 316,8324 | Крит. Хеннана-Куинна | 310,6291 |
Действительная часть | Мнимая часть | Модуль | Частота | ||
AR | Корень 1 | 4,5848 | 0,0000 | 4,5848 | 0,0000 |
MA | Корень 1 | 1,5462 | 0,0000 | 1,5462 | 0,0000 |
Обратим внимание на то, что лаг, связанный с AR-компонентой модели, оказался незначимым. Наше предположение оказалось неверным, и, возможно, имеет смысл отказаться от AR-компоненты в пользу большего числа лагов MA-компоненты модели. Сгенерируем новую модель ряда В, например, модель ARIMA (0,0,2) = MA (2):
Модель 5: ARMA, использованы наблюдения 1980:1-2004:4 (T = 100)
Зависимая переменная: B
Стандартные ошибки рассчитаны на основе Гессиана
Коэффициент | Ст. ошибка | z | P-значение | ||
const | 99,995 | 0,0498668 | 2005,2438 | <0,00001 | *** |
theta_1 | -0,416798 | 0,0994291 | -4,1919 | 0,00003 | *** |
theta_2 | -0,125268 | 0,0990634 | -1,2645 | 0,20604 |
Среднее зав. перемен | 99,99557 | Ст. откл. зав. перемен | 1,181085 | |
Среднее инноваций | -0,003100 | Ст. откл. инноваций | 1,072888 | |
Лог. правдоподобие | -149,0738 | Крит. Акаике | 306,1477 | |
Крит. Шварца | 316,5683 | Крит. Хеннана-Куинна | 310,3651 |
Действительная часть | Мнимая часть | Модуль | Частота | ||
MA | Корень 1 | 1,6152 | 0,0000 | 1,6152 | 0,0000 |
Корень 2 | -4,9424 | 0,0000 | 4,9424 | 0,5000 |
Можем заметить, что последующие лаги компоненты MA также не улучшают качества модели. Уберем незначимые лаги вовсе и получим следующую модель:
Модель 6: ARMA, использованы наблюдения 1980:1-2004:4 (T = 100)
Зависимая переменная: B
Стандартные ошибки рассчитаны на основе Гессиана
Коэффициент | Ст. ошибка | z | P-значение | ||
const | 99,9949 | 0,0564112 | 1772,6057 | <0,00001 | *** |
theta_1 | -0,483229 | 0,0975609 | -4,9531 | <0,00001 | *** |
Среднее зав. перемен | 99,99557 | Ст. откл. зав. перемен | 1,181085 | |
Среднее инноваций | -0,001273 | Ст. откл. инноваций | 1,081344 | |
Лог. правдоподобие | -149,8473 | Крит. Акаике | 305,6946 | |
Крит. Шварца | 313,5101 | Крит. Хеннана-Куинна | 308,8577 |
Действительная часть | Мнимая часть | Модуль | Частота | ||
MA | Корень 1 | 2,0694 | 0,0000 | 2,0694 | 0,0000 |
В результате перехода к модели (6) удалось улучшить критерии Шварца и Акаике, а также избавиться от незначимых лагов. Обратим внимание также на коррелограмму остатков модели (6):
Все представленные остатки статистически незначимо отличаются от нуля, а значит, остатки данной модели описываются процессом белого шума, как и должно быть.
*Обратим внимание также на то, что попытка убрать константу из модели на стадии перебора моделей сразу привела к увеличению критериев Акаике и Шварца более чем в 3 раза, поэтому такая модель не была представлена.
Будем считать, что модель (6) ARIMA (0,0,1) = MA (1) наиболее удачно описывает динамику ряда В. Ряд В в результате будет описываться регрессией следующего вида:
3 - подборка модели вида ARIMA (p,k,q) для ряда С
(более сокращенное описание действий)
д