Как всегда в статистике, формула (2) дает точечное значение коэффициента корреляции. Для ответа на вопрос: значимо ли он отличается от нуля (т.е. есть ли связь?) необходимо построить доверительный интервал и посмотреть: попадает ли в этот интервал нулевое значение. Если попадает, то мы не имеем право говорить, что связь существует, если нет, то с той вероятностью, с которой строился доверительный интервал, мы может считать, что связь действительно существует. Вычисление точных значений доверительного интервала достаточно сложно. Однако существует более простой способ. Для определения достоверности отличия от нуля коэффициента корреляции Пирсона, можно использовать Таблицу приложения 10. Для этого необходимо:
- Рассчитать точечное значение коэффициента корреляции по формуле (2)
- Задаться уровнем достоверности (0,95; 0,99 или 0,999) и войти в таблицу приложения 10, учитывая число проведенных пар измерений n.
- Сравнить полученную точечную оценку коэффициента корреляции с табличным значением. Если оценка больше или равна табличному значению, коэффициент корреляции достоверно отличается от нуля на данном уровне значимости и, следовательно, можно сделать заключение, что связь между изучаемыми случайными величинами действительно существует.
Например, проведя 20 пар измерений двух случайных величин и проведя расчеты по формуле (2), мы получили значение . Достоверно ли это значение отличается от нуля? Для ответа на этот вопрос входим в таблицу приложения 5 по двадцатой строке. Для уровня значимости 0,05, чтобы сделать заключение о наличии связи необходимо, чтобы значение выборочной оценки коэффициента корреляции было больше 0,444. Для уровня значимости 0,01 это значение должно быть больше чем 0,561, а для уровня значимости 0,001 – больше чем 0,679. Поскольку в нашем случае выборочная оценка равна 0,754, мы можем заключить, что с вероятностью 0,999 связь между изучаемыми случайными величинами действительно существует.
Определение по знаку коэффициента корреляции и по его значению характера связи и ее силы
Этот вопрос достаточно прост: поскольку значение коэффициента корреляции положительное, следовательно связь прямая.
Коэффициент детерминации.
Чаще всего в исследовании, мы не в состоянии контролировать все факторы, могущие влиять на изучаемые случайные величины. Поэтому представляется важным знать какая часть изменчивости одной случайной величины определяется изменчивостью другой, а какая происходит от неконтролируемых факторов.
Ответ на эти вопросы дает коэффициент детерминации. Коэффициент детерминации определяется по формуле (в процентах):
(3)
В этой формуле d –коэффициент детерминации, r – коэффициент корреляции.
Допустим, мы изучали изменение верхнего артериального давления в зависимости от секреции надпочечников и получили коэффициент корреляции равный 0,567. Тогда коэффициент детерминации будет равен:
Таким образом, мы приходим к заключению, что изменчивость верхнего артериального давления в данном случае только на 32% объясняется изменчивостью секреции коры надпочечников, а на 68% другими факторами.