Множественная линейная регрессия в скалярной и векторной формах

Обобщением модели парной регрессии является модель множественной регрессии. Множественная регрессия – уравнение связи с несколькими независимыми переменными:

где – зависимая переменная (результативный признак);

– независимые переменные (факторы).

Основная цель множественной регрессии - построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель.

Чаще всего используются линейные уравнения множественной регрессии:

. (2.1)

Построение модели связано с выбором вида уравнения и отбором факторов модели. Факторы, включаемые в модель, должны удовлетворять требованиям:

1. должны быть количественно измеримы;

2. не должны быть интеркоррелированы;

3. между факторами не должно быть высокой корреляционной связи, т.к. будет сложно определить влияние каждого фактора в отдельности на прибыль.

Для выявления мультиколлинеарных факторов можно использовать корреляционную матрицу :

где – оценки коэффициентов парной корреляции. При этом, если факторы некоррелированы, то , если между факторами линейная связь, то и чем ближе к нулю, тем сильнее мультиколлинеарность. Один из путей устранения мультиколлинеарности – исключение из модели одного или нескольких коллинеарных факторов.

Для оценки параметров уравнения множественной регрессии используют МНК, для чего необходимо решить систему линейных уравнений

Другой вид уравнения множественной регрессии – уравнение регрессии в стандартизованном масштабе:

где – стандартизованные переменные;

– стандартизированные коэффициенты регрессии.

Связь коэффициентов множественной регрессии со стандартизованными коэффициентами описывается соотношениями:

Средние коэффициенты эластичности для линейной регрессии рассчитываются по формуле

Для расчета частных коэффициентов эластичности применяется формула

На основе уравнения (2.1) могут быть найдены частные уравнения регрессии:

Тесноту совместного влияния факторов на результат оценивает индекс множественной корреляции:

Значение индекса множественной корреляции лежит в пределах от 0 до 1 и должно быть больше или равно максимальному парному индексу корреляции:

Индекс множественной корреляции для уравнения в стандартизованном масштабе можно записать в виде:

Частные коэффициенты (или индексы) корреляции, измеряющие влияние на фактора при неизменном уровне других факторов, можно определить по формуле

Частные коэффициенты корреляции изменяются в пределах от –1 до 1.

Качество построенной модели в целом оценивает коэффициент (индекс) детерминации. Коэффициент множественной детерминации рассчитывается как квадрат индекса множественной корреляции: .

Скорректированный индекс множественной детерминации содержит поправку на число степеней свободы и рассчитывается по формуле

где – число наблюдений, – число факторов.

Значимость уравнения множественной регрессии в целом оценивается с помощью F-критерия Фишера:

Частный -критерий оценивает статистическую значимость присутствия каждого из факторов в уравнении. В общем виде для фактора частный -критерий определится как

Оценка значимости коэффициентов уравнения регрессии с помощью t-критерия Стьюдента сводится к вычислению значения

где – средняя квадратическая ошибка коэффициента регрессии и определяется по формуле

Возможны случаи, когда в модель регрессии необходимо включить факторы, имеющие качественные признаки, например, образование, тип изделия, профессия и т.д.

Чтобы использовать эти переменные им придают численные значения. Такие искусственно сконструированные переменные в эконометрике называются фиктивными или структурными переменными.

Фиктивные переменные могут вводиться как в линейные, так и в нелинейные модели.