Рассмотрим выборку объемом – пусть среднее вариант этой выборки равно М1, среднеквадратичное отклонение . И выборку объемом со средним М2, среднеквадратичным отклонением . При этом М1≠М1, а выборки подчиняются нормальному закону распределения. Обозначим разницу средних значений выборок .
Нулевая гипотеза в данном случае гласит: «Наблюдаемая разница между выборочными средними была получена случайным образом. не выходит за пределы своих собственных случайных колебаний». Как говорилось выше, нулевая гипотеза не может быть отвергнута, если ее вероятность превысит некоторый порог , называемый уровнем значимости.
Альтернативная гипотеза утверждает противоположное: «Наблюдаемая разница между выборочными средними не могла быть получена случайным образом. Наблюдаемая разница средних выходит за пределы возможных случайных колебаний». Альтернативная гипотеза может быть принята, если ее вероятность сравняется с некоторым порогом или превысит его.
Проверка гипотез производится при помощи критерия Стьюдента, обозначаемого символом :
где - стандартная ошибка или мера отклонения наблюдаемой разницы выборочных средних от теоретически возможной, «генеральной». Формально величина t показывает, во сколько раз разница выборочных средних превышает свою собственную случайную вариацию.
В случае независимых выборок критерий t рассчитывается следующим образом:
При этом, как для первой, так и для второй выборки стандартная ошибка m рассчитывается по формуле:
Полученное значение критерия t сравнивают со стандартным табличным значением t-критерия Стьюдента для выбранного уровня значимости и числа степеней свободы .
Если , нулевая гипотеза не может быть отвергнута, и различие выборочных средних считается «статистически незначимым» (при этом обязательно указывается при каком уровне значимости это имеет место).
Если , то это означает что величина d оказалась за пределами своих собственных случайных колебаний. Такое различие называют «статистически значимым», т.е. нулевая гипотеза может быть отвергнута. Достоверность в статистическом смысле обозначает, что полученное различие предсказуемо: при повторении эксперимента или наблюдения в тех же условиях оно будет воспроизводиться с вероятностью β или более.
Например, при сравнении двух групп критерий tкр равен 2, и, если полученное значение t больше 2, то различие статистически значимо и это можно утверждать с вероятностью безошибочного прогноза, равной 95% (при tкр = 3 и более – с вероятностью безошибочного прогноза –99%). Величина критерия менее 2 свидетельствует об отсутствии статистической значимости различий сравниваемых показателей.
Пример.
Имеется две группы пациентов численностью 247 и 116 человек. Средний возраст пациентов первой группе наблюдения составил (32,06±9,62) лет (М±σ), средний возраст пациентов второй группы – (39,22±6,39) лет. Сравним 2 группы пациентов по возрасту при условии, что возраста в обеих группах были распределены нормально.
Вначале рассчитаем стандартные ошибки для возрастов в каждой группе.
Поскольку полученная величина t больше tкр =3, то нулевая гипотеза отвергается, и различия между группами по возрасту можно считать статистически значимыми (р<0,01).