Корреляционный анализ - это статистический метод, изучающий связь между явлениями, если одно из них входит в число причин, определяющих другое, или, если имеются общие причины, воздействующие на эти явления.
Основная задача - выявление связи между случайными переменными.
Регрессионный анализ - это статистический метод, изучающий зависимость между результативным признаком Y и входной переменной X.
Основная задача - установление формы связи между переменными и изучение зависимости между ними.
Функциональная и корреляционная зависимости
Функциональная зависимость - это зависимость вида у =f(x), когда каждому возможному значению случайной величины X соответствует одно возможное значение случайной величины Y. Например, площадь круга S однозначно связана с радиусом окружности R: S = πR2.
Корреляционная зависимость - это статистическая зависимость, проявляющаяся в том, что при изменении одной из величин изменяется среднее значение другой:
.
Например, рост и масса. При одном и том же росте масса различных индивидуумов может быть различна, но между средними значениями этих показателей имеется определенная зависимость.
Установление взаимосвязи между различными признаками и показателями функционирования организма позволяют по изменениям одних судить о состоянии других.
Для изучения корреляционной связи данные о статистической зависимости удобно задавать в виде корреляционной таблицы или в виде двумерной выборки.
Xi | x1 | x2 | ... | хп |
Yi | y1 | y2 | ... | yn |
Схема эксперимента следующая: пусть имеется выборка объема п из генеральной совокупности N. На каждом объекте выборки определяют числовые значения признаков, между которыми требуется установить наличие или отсутствие связи. Таким образом, получают 2 ряда числовых значений.
Для наглядности полученного материала каждую пару можно представить в виде точки на координатной плоскости. По оси абсцисс откладывают значения одного вариационного ряда - xi, а по оси ординат - другого - yi.
Такое изображение статистической зависимости называется полем корреляции, или корреляционным полем точек. Оно создает общую картину корреляции.
А б
Рис. 14.1. Поле корреляции
Если точки группируются вдоль некоторого направления (рис. 14.1а), то это говорит о наличии линейной корреляционной связи между признаками.
Если точки распределены равномерно (рис. 14.1б), то линейная корреляционная связь отсутствует.
На рисунке 13.2 приведены примеры зависимостей Y от X и отдельно даны значения коэффициента корреляции r. Найти соответствие между значениями коэффициента корреляции и графиками зависимостей.
Значения r:
1) 1; 2) 0,8; 3) 0; 4) -1.
Эталон ответа: 1...; 2...; 3...; 4....
Примеры зависимостей:
Рис. 14.2. Корреляционные поля точек
Ответ: 14.2а; 14.2в; 14.2г; 14.4б.