Критерий выборочного коэффициента корреляции определяется по формуле:
(11.9)
где:
– критерий достоверности коэффициента корреляции;
r – выборочный коэффициент корреляции;
n – число коррелированных пар данных;
tst – стандартное значение критерия Стьюдента, определяемое по таблице для установленного числа степеней свободы и порога вероятности безошибочных прогнозов.
При t ≥ tst коэффициент корреляции достоверен. В этом случае с определенной вероятностью можно считать, что между коррелируемыми признаками имеется связь и в генеральной совокупности такая же по знаку, какая получилась в выборке (прямая или обратная).
При t < tst выборочный коэффициент корреляции недостоверен, что не дает возможности сделать какое-либо заключение о связи признаков в генеральной совокупности. Для выяснения этого вопроса требуется провести повторные исследования на более многочисленном материале.
Пример
При проверке гипотезы о связи крупноплодности с жирномолочностью был рассчитан коэффициент корреляции между процентом жира в молоке у 50 коров и весом при рождении телят от этих же коров. Получено:
коэффициент корреляции: r = +0,21;
его ошибка: ;
критерий достоверности: ; n = 48;
tst = {2,0 – 2,7 –3,5}.
Выборочный коэффициент оказался явно недостоверным. На основе проведенного исследования нельзя ожидать связи между крупноплодностью и жирномолочностью у всех коров вообще.
Определение достоверности коэффициента корреляции можно значительно упростить, используя свойства особой функции предложенной Фишером:
(11.10)
При помощи этой функции можно заранее определить, при каком объеме выборки коэффициент корреляции определенной величины будет достоверен по требуемому порогу вероятности безошибочных прогнозов, по следующей формуле:
, (11.11)
где:
– количество пар значений, достаточное для достоверности выборочного коэффициента корреляции,
t – критерий Стьюдента для каждого из трех порогов вероятности безошибочных прогнозов (b1 = 0,95, b2 = 0,99, b3 = 0,999), для больших групп: t1 = 1,96, t2 =2,58, t3 = 3,30.
z – функция Фишера
По этой формуле рассчитано значение z и количество пар значений, достаточное для достоверности выборочного коэффициента корреляции для каждого из трех порогов вероятности безошибочных прогнозов.
В примере в выборке объемом n = 50 получен коэффициент корреляции r = +0,21.
При r = 0,21, рассчитаны три числа: 87 – 149 – 242. Это значит, что выборочный коэффициент корреляции, равный r = 0,21, может стать достоверным в том случае, если объем выборки (число коррелируемых пар данных) будет: для первого порога вероятности 87, для второго – 149, для третьего – 242. Так как фактический объем выборки n = 50 далеко не достигает первого, максимальною порога, то полученный коэффициент корреляции оказался недостоверным, что было найдено и обычным способом.
Объем выборки для первого порога вероятности безошибочных прогнозов b1 = 0,95 можно оценить, воспользовавшись простым соотношением: