В ходе обработки динамического ряда важнейшей задачей является выявление основной тенденции развития явления (тренда) и сглаживание случайных колебаний. Для решения этой задачи в статистике существуют особые способы, которые называют методами выравнивания.
Выделяют три основных способа обработки динамического ряда:
а) укрупнение интервалов динамического ряда и расчет средних для каждого укрупненного интервала;
б) метод скользящей средней;
в) аналитическое выравнивание (выравнивание по аналитическим формулам).
Укрупнение интервалов - наиболее простой способ. Он заключается в преобразовании первоначальных рядов динамики в более крупные по продолжительности временных периодов, что позволяет более чётко выявить действие основной тенденции (основных факторов) изменения уровней.
По интервальным рядам итоги исчисляются путём простого суммирования уровней первоначальных рядов. Для других случаев рассчитывают средние величины укрупнённых рядов (переменная средняя). Переменная средняя рассчитывается по формулам простой средней арифметической.
Скользящая средняя - это такая динамическая средняя, которая последовательно рассчитывается при передвижении на один интервал при заданной продолжительности периода. Если, предположим, продолжительность периода равна 3, то скользящие средние рассчитываются следующим образом:
; ; и т.д. (3.45)
При чётных периодах скользящей средней можно центрировать данные, т.е. определять среднюю из найденных средних. К примеру, если скользящая исчисляется с продолжительностью периода, равной 2, то центрированные средние можно определить так:
; ; и т.д. (3.46)
Первую рассчитанную центрированную относят ко второму периоду, вторую - к третьему, третью - к четвертому и т.д. По сравнению с фактическим, сглаженный ряд становится короче на (m - 1)/2, где m - число уровней интервала.
Суть аналитического выравнивания динамического ряда заключается в том, что фактические уровни ряда заменяются плавными уровнями, вычисленными на основе определённой линии (прямой или кривой), выбранной в предположении, что она точнее всего отображает общую тенденцию явления.
В основе метода лежит установление функциональной зависимости уровней ряда от времени с использованием корреляционно-регрессионного анализа. При этом на практике чаще всего применяются математические функции такого вида:
а) линейная , (3.47)
б) параболическая , (3.48)
в) гиперболическая , (3.49)
г) степенная , (3.50)
где - параметры, которые находятся методом наименьших
квадратов;
t - порядковый номер периода.
На основе теоретического анализа выявляется характер развития явления во времени, и на этой основе выбирается тот или другой вид аналитической функции. Практикой статистических исследований установлено, что принятие соответствующей аналитической функции осуществляется при таких условиях:
1) выравнивать динамические ряды по уравнению прямой линии целесообразно тогда, когда более или менее постоянны цепные абсолютные приросты, то есть тогда, когда уровни ряда изменяются приблизительно в арифметической прогрессии;
2) выравнивание динамических рядов по уравнению квадратичной параболы необходимо выполнять в тех случаях, когда изменение уровней ряда происходит с приблизительно равномерным ускорением или замедлением цепных абсолютных приростов;
3) выравнивание по степенной функции целесообразно использовать тогда, когда уровни ряда динамики выявляют тенденцию постоянства цепных темпов роста, то есть в случае изменения уровней ряда динамики в геометрической прогрессии.
Расчёт параметров математических функций осуществляется методом наименьших квадратов. Он даёт возможность получить такую зависимость, которая наиболее близко проходит к точкам фактических данных на графике в осях координат «t - у», то есть даёт наименьшую сумму квадратов отклонений фактических значений результативного признака у от уровней (теоретических) значений У:
, (3.51)
На основании этого условия получают систему нормальных уравнений для расчёта параметров и , где в качестве фактора х выступает время t.
Выравнивание рядов динамики по методу наименьших квадратов, как и выравнивание, посредством других приёмов, должно осуществляться в пределах качественно однородных периодов. Если в динамическом ряду есть качественно неоднородные периоды, то выявлять тенденцию целесообразно в пределах каждого из них.
Расчёт параметров и можно значительно упростить, если отсчёт времени t = 0 осуществлять с середины динамического ряда. Тогда значения t, размещённые выше середины, будут отрицательными, а ниже - положительными. В обоих случаях ∑t = 0. Для этого уровень, который будет пребывать в середине ряда динамики, берут за условное начало отсчёта или нулевое значение.
Для того чтобы сумма показателей времени равнялась нулю, условные обозначения нужно давать таким образом:
при нечётном числе уровней ряда динамики, чтобы выполнить условие ∑t = 0, уровень, который будет прибывать в середине ряда, приравнивают к нулю, а уровни, расположенные выше его, помечают числами со знаком «минус» (-1; -2; -3 и т. п.), а ниже - числами со знаком «плюс» (+1; +2; +3 и т. д.);
при парном числе уровней ряда динамики уровни, которые лежат выше среднего значения (оно находится в середине между двумя средними датами), помечают натуральными числами со знаком «минус» (-1; -3; -5 и т. п.), а уровни, которые лежат ниже среднего значения, — натуральными числами со знаком «плюс» (+1;+2;+3 и т. д.).
При условии, что ∑t = 0, система нормальных уравнений упрощается, приобретая в случае линейной зависимости такой вид:
, (3.52)
Откуда
, (3.53)
, (3.54)
Парабола второго порядка () используется для описания рядов динамики, в которых меняется направление развития: со снижения показателей на их рост и наоборот.
Параметр называется коэффициентом регрессии и характеризует изменение интенсивности развития в единицу времени.
При > 0 наблюдается ускоренное развитие, при < 0 – замедленное.
, (3.55)
Отсюда
(3.56)
, (3.57)
, (3.58)
Задачей аналитического выравнивания является определение не только общей тенденции развития явления, но и некоторых недостающих значений как внутри периода, так и за его пределами. Способ определения неизвестных значений внутри динамического ряда называют интерполяцией. Эти неизвестные значения можно определить:
1) используя полусумму уровней, расположенных рядом с интерполируемыми;
2) по среднему абсолютному приросту;
3) по темпу роста.
Способ определения количественных значений за пределами ряда называют экстраполяцией. Экстраполирование используется для прогнозирования тех факторов, которые не только в прошлом и настоящем обусловливают развитие явления, но и могут оказать влияние на его развитие в будущем.
Экстраполировать можно по средней арифметической, по среднему абсолютному приросту, по среднему темпу роста.
На практике результат экстраполяции прогнозируемых уровней социально-экономических явлений обычно выполняют интервальными оценками. Для определения границ интервалов используется интервальное неравенство:
, (3.59)
где - коэффициент доверия g. распределения Стьюдента;
- остаточное среднее квадратическое отклонение ;
п - количество уровней рассматриваемого (базисного) ряда динамики;
m - количество параметров геометрической зависимости тренда;
(n-m) – число степеней свободы;
- дискретное (точечное) значение прогнозного уровня.
Коэффициент доверия выбирается из статистических таблиц распределения Стьюдента в зависимости от числа степеней свободы (n-m) и уровня значимости (0,01 или 0,05).
Тогда окончательно с вероятностью p=1-a прогнозный уровень тренда в будущем будет находиться в пределах: верхний предел составит , нижний предел - .
При аналитическом выравнивании может иметь место автокорреляция, под которой понимается зависимость между соседними членами динамического ряда. Автокорреляцию можно установить с помощью перемещения уровня на одну дату.
Коэффициент автокорреляции вычисляется по формуле:
, (3.60)