ЗАДАЧА корреляционного анализа сводится к:
1. Установлению направления и формы связи между признаками;
2. Измерению ее тесноты.
Функциональной называется однозначная зависимость между переменными величинами, когда определенному значению одной (независимой) переменной х, называемой аргументом, соответствует определенное значение другой (зависимой) переменной у, называемой функцией. (Пример: зависимость скорости химической реакции от температуры; зависимость силы притяжения от масс притягивающихся тел и расстояния между ними).
Корреляционной называется зависимость между переменными, имеющими статистистический характер, когда определенному значению одного признака (рассматриваемого в качестве независимой переменной) соответствует целый ряд числовых значений другого признака. (Пример: связь между урожаем и количеством осадков; между ростом и весом и т.д.).
Поле корреляции представляет собой множество точек, координаты которых равны полученным на опыте парам значений переменных х и у.
По виду корреляционного поля можно судить о наличии или отсутствии связи и ее типе.
Связь между величинами х и у линейная, положительная (прямая). | Связь между величинами х и у линейная, отрицательная (обратная). |
Связь между величинами квадратичная. | Связи между величинами нет. |
Связь называется положительной, если при увеличении одной переменной увеличивается другая переменная.
Связь называется отрицательной, если при увеличении одной переменной уменьшается другая переменная.
Связь называется линейной, если ее можно в аналитическом виде представить как .
Показателем тесноты линейной связи является коэффициент линейной корреляции. Эмпирический коэффициент линейной корреляции определяется выражением:
Коэффициент линейной корреляции лежит в пределах от -1 до 1 и характеризует степень близости между величинами x и y. Если:
1. - положительная корреляция;
2. - отрицательная корреляция;
3. - связь функциональная;
4. - связь высокая (или сильная);
5. - связь средняя;
6. - связь слабая;
7. - линейной связи нет.
Корреляционную зависимость между признаками можно описывать разными способами. В частности, любая форма связи может быть выражена уравнением общего вида . Уравнение вида и называются регрессией. Уравнение прямой регрессии у на х в общем случае можно записать в виде
Уравнение прямой регрессии х на у в общем случае выглядит как
Наиболее вероятные значения коэффициентов а и в, с и d могут быть вычислены, например, при использовании метода наименьших квадратов.