Лекция №2. Парная регрессия и корреляция
1. Корреляционный анализ. 1
1.1.Задачи корреляционно анализа. 2
1.2.Ковариация. 2
1.3.Дисперсия. 3
1.4.Коэффициент парной корреляции. 3
1.5.Качественная оценка коэффициента корреляции. 3
1.6.Оценка значимости коэффициента парной корреляции. 4
1.7.Парный коэффициент детерминации. 4
Пример. 4
2.Регрессионный анализ. 6
2.1.Задачи регрессионного анализа. 6
2.2.Линейная парная регрессия. 6
2.3.Коэффициент эластичности. 7
2.4.Формула определения бета - коэффициента. 7
Пример. 7
3.Проверка модели на адекватность. 9
3.1. Проверка значимости коэффициентов регрессии по t-критерию Стьюдента. 9
3.2.Определение доверительных интервалов. 9
3.3.Проверка значимости уравнения регрессии по F-критерию Фишера. 9
3.4.Проверка модели на наличия или отсутствия систематической ошибки. 9
3.4.1.Проверка на случайность ряда остатков. 9
3.4.2.Проверка на равенство нулю математического ожидания ряда остатков. 10
3.4.3.Проверка на постоянство дисперсии ряда остатков. 10
3.4.4.Проверка на независимость ряда остатков. 10
3.4.5.Проверка на распределение ряда остатков по нормальному закону. 10
3.5.Определение меры точности модели. 11
3.6.Точечный и интервальный прогноз. 11
Пример. 12
Корреляционный анализ
При изучении конкретных зависимостей социально экономических явлений одни признаки выступают в качестве факторов, обусловливающих изменение других признаков.
|
Рассматривая зависимости между признаками, выделяют две категории зависимости: функциональные и корреляционные.
Функциональные связи характеризуются полным соответствием между изменением факторного признака и изменением результативной величины, и каждому значению фактора соответствуют вполне определенные значения результата. Функциональная зависимость может связывать результативный признак с одним или несколькими факторными признаками.
В корреляционных связях между изменением факторного и результативного признака нет полного соответствия, воздействие отдельных факторов проявляется лишь в среднем при массовом наблюдении фактических данных [аналогом среднему служит математическое ожидание].
Например, в семьях, где родители ниже ростом, дети в среднем выше, чем родители. Однако такого рода зависимости проявляются лишь при большом числе наблюдений.
Одновременное воздействие на изучаемый признак большого количества самых разнообразных факторов приводит к тому, что одному и тому же значению признака-фактора соответствует целое распределение значений результативного признака, поскольку в каждом конкретном случае прочие факторные признаки могут изменять силу и направленность своего воздействия.
При наличии функциональной зависимости между признаками можно, зная величину факторного признака, точно определить величину результативного признака.
При наличии же корреляционной зависимости устанавливается лишь тенденция изменения результативного признака при изменении величины факторного признака.
Корреляционный анализ - метод, применяемый тогда, когда данные наблюдений или эксперимента можно считать случайными и выбранными из совокупности, распределенной по многомерному нормальному закону.
Задачи корреляционно анализа
1. Установление численного значения корреляционной связи между изучаемыми признаками путем вычисления (парных, множественных и/или частных) коэффициентов корреляции
2. Измерение тесноты связи между признаками
3. Определение достоверности суждения о наличии связи (с помощью t-критерия Стьюдента)
4. Отбор факторов, оказывающих наибольшее влияние на результативный признак
5. Выявление ранее неизвестных причинных связей
Ковариация
Мерой взаимосвязи между двумя переменнымиявляется ковариация. Она построена на сумме отклонений индивидуальных значений признаков xi и yi от их средних значений.
Опр. При наличии n наблюдений двух переменных (x и y) ковариация между x и у задается формулой:
[1].
При наличии прямой связи ковариация будет положительной.
При наличии обратной связи ковариация будет отрицательной величиной.
При отсутствии связи ковариация будет близка к нулю.
Размер ковариации зависит от масштаба признаков x и y.