Парная регрессия на основе метода наименьших квадратов

Парная регрессия характеризует связь между двумя признаками: результативным и факторным. Аналитическая связь между ними описывается уравнениями:

прямой y_x = a₀ + a₁*x;

параболы y_x = a₀ + a₁*x + a₂*x²;

гиперболы _ 1

y_x = a₀ + a₁* -- и т.д.

Определить тип уравнения можно, исследуя зависимость графически, однако существуют более общие указания, позволяющие выявить уравнение связи, не прибегая к графическому изображению. Если результативный и факторный признаки возрастают одинаково, то это свидетельствует о том, что связь между ними линейная, а при обратной связи - гиперболическая. Если результативный признак увеличивается в арифметической прогрессии, а факторный значительно быстрее, то используется параболлическая или степенная регрессия.

Оценка параметров уравнений регрессии a₀ и a₁(и a₂ в уравнении параболы второго порядка) осуществляется методом наименьших квадратов, в основе которого лежит прежположение о независимости наблюдений исследуемой совокупности и нахождении параметров модели a₀ и a₁, при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:

å (y_i- y_t) ²® min.

Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:

ì a₀*n + a₁*å t = å y

î a₀*å t + a₁*å t² = å y*t,

где n - объем исследуемой совокупности (число единиц наблюдения).

В уравнениях регрессии параметр a₀ показывает усредненное влияние на результативный признак неучтенных в уравнении факторных признаков, коэффициент регрессии a₁ показывает, на сколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.

Множественная регрессия

Изучение связи между тремя и более связанными между собой признаками носит название множественной (многофакторной) регрессии:

y_1,2,…k= f (x₁, x₂, …, x_k). (11.3.1)

Построение моделей множественной регрессии включает несколько этапов:

v выбор формы связи (уравнение регрессии);

v отбор факторных признаков;

v обеспечение достаточного объема совокупности.

Выбор типа уравнения затрудняется тем, что для любой формы зависимости можно выбрать целый ряд уравнений, которые в определенной степени будут описывать эти связи. Основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации.

Линейное уравнение множественной регрессии имеет вид:

y_1,2,…k= a₀ + a₁*x₁ + a₂*x₂+ … + a_k*x_k, (11.3.2)

где y_1,2,…_k - теоретические значения результативного признака, полученные в результате подстановки соответствующих значений факторных признаков в уравнение регрессии;

x₁x₂… x_k - факторные признаки;

a₀ a₁ a₂ …a_k - параметры модели (коэффициенты регрессии).

Параметры уравнения могут быть определены графическим методом, методом наименьших квадратов и т.д.

Важным этапом построения уже выбранного уравнения множественной регрессии является отбор и последующее включение факторных признаков. С одной стороны, чем больше факторных признаков включено в уравнение, тем оно лучше описывает явление. С другой стороны, сокращение размерности модели за счет исключения второстепенных факторов способствует простоте и качеству ее реализации.

При построении модели регрессии возможна проблема мультиколлинеарности, под которой понимается тесная зависимость между факторными признаками, включенными в модель (r_xy > 0,8).

Наличие мультиколлинеарности между признаками приводит к искажению величины параметров модели, которые имеют тенденцию к завышению, чем осложняется процесс определения наиболее существенных факторных признаков.

В качестве причин возникновения мультиколлинеарности между признаками можно выделить следующие:

Ø изучаемые факторные признаки являются характеристикой одной и той же стороны явления или процесса. Например, показатели объема производимой продукции и среднегодовой стоимости основных фондов одновременно включать в модель не рекомендуется, так как они оба характеризуют размер предприятия;

Ø факторные признаки являются составляющими элементами друг друга;

Ø факторные признаки по экономическому смыслу дублируют друг друга.