Задача проверки статистических гипотез решается с помощью специальных критериев, среди которых наибольшее значение приобрел t-критерий Стьюдента.
T-критерий Стьюдента
t-критерий Стьюдента направлен на оценку различий величин и двух выборок Х1 и Х2, которые распределены по нормальному закону. Одним из главных достоинств критерия является широта его применения. Он может быть использован для сопоставления средних у зависимых и независимых выборок, причем выборки могут быть не равны по величине.
В общем случае формула для расчета по t-критерию Стьюдента такова:
В числителе находится разница по абсолютной величине между средними двух групп. В знаменателе – сумма квадратов средних ошибок этой разницы.
Если вычисленный критерий t более или равен 2 (t ≥ 2), что соответствует вероятности безошибочного прогноза Р, равной или более 95,5% (Р ≥ 95,5%), то разность следует считать достоверной (существенной), т.е. обусловленной влиянием какого-то фактора, что будет иметь место и в генеральной совокупности.
ЗАДАЧА на оценку достоверности разности средних величин
Условие задачи: при изучении комбинированного воздействия шума и низкочастотной вибрации на организм человека было установлено, что средняя частота пульса у водителей сельскохозяйственных машин через 1 ч после начала работы составила 80 ударов в минуту; S1 = ± 1 удар в минуту. Средняя частота пульса у этой же группы водителей до начала работы равнялась 75 ударам в минуту; S2 = ± 1 удар в минуту.
Задание: оценить достоверность различий средних значений пульса у водителей сельскохозяйственных машин до и после 1 ч работы. Число наблюдений (n), т.е. совокупность водителей, составило 36 человек.
РЕШЕНИЕ.
Вывод: значение критерия t=3,5 соответствует вероятности безошибочного прогноза Р>99,7%, следовательно, можно утверждать, что различие в средних значениях пульса у водителей сельскохозяйственных машин до и после 1 ч работы не случайно, а достоверно, существенно, т.е. обусловлено влиянием воздействия шума и низкочастотной вибрации.
2.1 1) Оценка значимости различия средних значений показателя в независимых выборках (непарный t- критерий).
Независимыми называются выборки, в каждой из которых наблюдаются различные объекты, например первая контрольная группа (здоровые) и вторая опытная группа (больные, получающие определенную схему лечения).
а) Рассмотрим сначала равночисленные выборки. В этом случае n1=n2=n, тогда формула расчета t-критерия имеет вид: , числа степеней свободы df= n-1.
б) В случае неравночисленных выборок n1≠n2,
; числа степеней свободы df= n1+n2-2.
1 пример.
Определить различие белка в составе плазмы крови здоровых и больных гепатитом. α=0,05.
X1 (норма) | 6,87 | 6,51 | 6,9 | 7,05 | ||
X2 (гепатит) | 7,2 | 6,92 | 7,52 | 7,18 | 7,25 | 7,1 |
Н0 – различие белка в составе плазмы крови здоровых и больных гепатитом отсутствует (нет статистического различия между средними двух выборок).
Н1 – есть различие белка в составе плазмы крови здоровых и больных гепатитом (есть статистическое различия между средними двух выборок).
Вычислим средние по двум выборкам:
Найдем t-критерий:
α=0,05 и для степени свободы (n1-1)+(n2-1)=9 определим критическое значение tкрит=2,26.
tнабл > tкрит (2,67>2,26), то есть нулевая гипотеза отвергается.
Заключение: при нормальном распределении и α=0,05 существует статистическое различие белка в составе плазмы крови здоровых и больных гепатитом.