Для определения тесноты линейной связи между двумя параметрами х и у используется коэффициент корреляции r, вычисляемый по формулам
или
Если коэффициент корреляции rху = 1, то между параметрами х, у существует функциональная зависимость, и поэтому использовать корреляционный анализ в этом случае нельзя. Если rху = 0, то линейная зависимость между х и у отсутствует, но возможна нелинейная зависимость. Чем ближе коэффициент корреляции к 1, тем теснее линейная зависимость. Величина r 2 является коэффициентом детерминации, который показывает, какая часть изменения у описывается изменением х.
Существенность тесноты линейной зависимости можно определить, используя таблицы значений коэффициентов корреляции для различных уровней существенности (см. материалы лекций). По этим таблицам видно, что существенность коэффициента корреляции связанно с количеством наблюдений в выборке. Для приведенных в
табл. 1 приложения данных количество наблюдений n = 61, и существенным будет признаваться коэффициент корреляции свыше 0,25.
Если коэффициент корреляции признается существенным, то сама линейная зависимость может быть использована в качестве производственных нормативов.
Параметры линейной формы зависимости у = а + bх, где y – теоретическое значение изучаемого показателя, находятся методом наименьших квадратов:
Рассмотрим коэффициенты корреляции для всех 8 факторов (табл. 1 приложения) х 1, х 2, …, х 8 между собой, сведенные в таблицу – матрицу парных коэффициентов корреляции (табл. 7). Эта матрица имеет треугольную форму, поскольку rxi , xj = rxj, xi.
Таблица 7.1
x1 | x2 | x 3 | x4 | x5 | x6 | x7 | x8 | |
x1 | ||||||||
x2 | –0,50707 | |||||||
x3 | –0411010 | 0,957696 | ||||||
x4 | –0,00520 | –0,25657 | –0,36028 | |||||
x5 | –0,09519 | 0,046817 | 0,014952 | 0,263691 | ||||
x6 | –0,18771 | 0,407014 | 0,512369 | –0,26082 | –0,06788 | |||
x7 | –0,40114 | 0,782969 | 0,667539 | –,08576 | 0,068765 | –0,228719 | ||
x8 | 0,03045 | –0,20181 | –0,28062 | 0,28054 | 0,116644 | –0,621718 | 0,127935 |
Нумерация первой графы означает следующее: 1 – количество перерабатываемой руды; 2 – содержание металла в руде; 3 – выход концентрата; 4 – содержание металла в концентрате; 5 – содержание серы в концентрате; 6 – извлечение; 7 – содержание металла в хвосте; 8 – содержание металла в сульфате.
При сравнении табличного коэффициента значимости, равного 0,349 4 (при N = 30, α = 0,05), с вычисленными значениями r, существенными линейные связи могут быть признаны только для 5 зависимостей из 28 возможных (табл. 1 приложения):
а) между выходом концентрата и содержанием металла в руде (2–3):
Линейная зависимость у = –0,15 + 1,38 х
б) между содержанием металла в руде и извлечением(2–6):
Линейная зависимость у = 66,08 + 12,88 х
в) между содержанием металла в руде и хвосте (2–7):
Линейная зависимость у = 0,04 + 0,18 х
г) между содержанием выходом концентрата и извлечением (3–6):
Линейная зависимость у = 66,27 + 11,27 х
д) между выходом концентрата и содержание металла в хвосте (3–7):
Линейная зависимость у = 0,07 + 0,11 х
Анализируя графики можно сделать вывод, что линейная связь во всех 5 случаях существенна. Рассчитаем для них остаточную, факторную и общую дисперсии:
зависимости дисперсии | (2–3) | (2–6) | (2–7) | (3–6) | (3–7) |
остаточная | 0,001 7 | 8,090 1 | 0,000 2 | 7,150 9 | 0,000 3 |
факторная | 0,02 | 9,70 | 0,000 5 | 9,70 | 0,000 5 |
общая | 0,02 | 17,79 | 0000 7 | 16,85 | 0,000 8 |