Лекция 9
Критерии различия
Параметрический t-критерий Стьюдента
На прошлой лекции было введено понятие статистического критерия, говорилось о параметрических и непараметрических критериях, служащих для проверки статистических гипотез, при решении различных задач. В сравнительных и лонгитюдных исследованиях наиболее популярна задача о различии двух выборочных средних, а также ряд сходных задач.
Для ее решения чаще всего применяется t-критерий Стьюдента (псевдоним В.Госсета). Критерий Стьюдента - это параметрический критерий различия, служащий для проверки гипотезы о достоверности или недостоверности различия между двумя средними значениями. Обычно он изучается в двух наиболее популярных вариантах - когда сравниваемые выборки независимы (не связаны) и когда они зависимы (связаны), т.е. состоят из попарно связанных вариант.
Поскольку критерий Стьюдента – параметрический критерий, он применяется для количественых данных, к тому же требуется распределение переменной, близкое к нормальному закону распределения. Напомним, что в изучаемых критериях используются данные с одной переменной (признаком), и в случае многомерных данных приходится применять критерий многократно.
В.Госсет нашел закон распределения величины , в которой генеральное стандартное отклонение s заменено на его выборочную оценку s. Оказалось, что распределение этого выражения весьма близко к нормальному уже при объеме выборки n = 30.
Идея измерения значимости различий в критерии естественна, он представляет собой меру различия, пропорциональную разности двух средних и обратно-пропорциональную ошибке репрезентативности разности средних.
t = ;
Рассмотрим рабочие формулы критерия для наиболее часто встречающихся случаев:
1. Вариант применения критерия Стьюдента для независимых (несвязанных) выборок, встречающийся в сравнительном исследовании.
В этом случае применяется формула:
t = = = ,
число степеней свободы определяется по формуле: df = nx + ny - 2
В случае, когда сравниваемые выборки равны по численности, то-есть при nx= ny = n формула преобразуется:
t =
Поясним, что обозначения x и y в формуле не означают двух различных переменных, это обозначения одной переменной, измеренной в двух различных выборках.
2. Вариант применения критерия Стьюдента для зависимых (связанных) выборок, встречающийся, к примеру, в лонгитюдном исследовании, когда сравниваются данные, полученные в одной группе.
tф= ,
где – среднее различие значений в связанных парах данных,т.е. , где di = xi - yi
df = n - 1; где n - число пар данных или, что то же, количество испытуемых в группе.
Пример:
Рассмотрим варианты применения критерия Стьюдента, в двух его вариантах. Измерялась импрессивная способность, то-есть способность распознавания эмоционального состояния по фотоизображению лиц с эмоциональной экспрессией. Эти данные измерены в группе испытуемых.
№ | x i | y i |
1. | ||
2. | ||
3. | ||
4. | ||
5. | ||
6. | ||
7. | ||
8. | ||
9. | ||
10. |
А) Первоначально рассмотрим пример исходя предположения, что обследовались 2 различные группы, то-есть случай несвязанных выборок. Необходимо определить, достоверны ли различия выборочных средних в двух группах, принять или опровергнуть Ho. Таким образом, согласно условию, nx = 10 и ny = 10, df = nx + ny - 2 = 18
Расчеты показывают, что =40.1; = 38.6; Dx = 10,1; Dy=11,6:
t = =
и фактическое значение критерия равное 1.02 при граничных значениях, равных, соответственно t гр. (5%)=2.10 и t гр. (1%)=2.88 (см. рис.).
Cтатистический вывод: поскольку фактическое значение критерия,
равное 1.02, меньше граничного значения критерия на 5% уровне значимости, равного 2.10, то принимается нулевая гипотеза H0, согласно которой нет статистически достоверных различий между двумя средними выборочными значениями = 40.1 и =38.6.
Психологический вывод: поскольку принимается нулевая гипотеза, не существует достоверных значений средних значений импрессивной способности в обеих группах.
Б) Теперь рассмотрим эти же данные, предположив, что они представляют два среза, полученных в одной группе.
№ | x i | y i | d i | ||
11. | -8 | -9,5 | 90,25 | ||
12. | 2,5 | 6,25 | |||
13. | 2,5 | 6,25 | |||
14. | 2,5 | 6,25 | |||
15. | 1,5 | 2,25 | |||
16. | 0,5 | 0,25 | |||
17. | 0,5 | 0,25 | |||
18. | 3,5 | 12,25 | |||
19. | -1 | -2,5 | 6,25 | ||
20. | 0,5 | 0,25 | |||
å | 130,5 | ||||
среднее | 40,1 | 38,6 | =1,5 |
tф= = = 1,25; df = n – 1 = 9,
t гр. (5%)=2.26 и t гр. (1%)=3.25 (см. рис.).
Cтатистический вывод: поскольку фактическое значение t -критерия, равное 1.25, меньше граничного значения критерия на 5% уровне значимости, равного 2.26, то принимается нулевая гипотеза H0, согласно которой нет статистически достоверных различий между двумя выборочными средними значениями.
Психологический вывод: поскольку принимается нулевая гипотеза, не обнаружено достоверных значений двух средних значений импрессивной способности, измеренных в одной группе.
3 Оценка достоверности различий выборочной средней и генеральной средней.
В некоторых случаях значение генеральной средней m известно, например, оно может быть получено в процессе стандартизации психодиагностического теста с помощью весьма большой по объему, в несколько тысяч испытуемых, выборки стандартизации. В ходе проведения выборочного исследования с помощью этого теста может возникнуть проблема сравнения генерального параметра m и выборочной оценки х.
Для этой цели используется формула:
,
где в знаменателе ошибка репрезентативности для
генерального среднего, а df =n-1, где n – объем выборки.
К примеру, в тесте, измеряющем уровень умственного развития Векслера, значение генерального среднего m=100. Допустим, на выборке в 25 человек получено выборочное среднее =115 и стандартное отклонение s=15. Достоверно ли отличие генерального среднего и выборочного? С помощью критерия Стьюдента можно ответить на этот вопрос.
В нашем случае:
= = = 5,00, df =n-1=24
Статистический вывод:
Поскольку фактическое значение критерия равно 5.0 и больше граничных значений и на 5%, и на 1% уровнях значимости, принимается альтернативная гипотеза H1, согласно которой существует статистически достоверное различие между генеральной средней m=100 и нашей выборочной средней, равной 115.
Психологический вывод:
поскольку принимается Н0, можно говорить о статистически достоверном различии между выборочным значением уровня интеллекта и генеральным средним для этой переменной.
Вопросы и упражнения:
1. Какую роль оказывает дисперсии переменных в обеих группах на значение t -критерия Стьюдента.
2. Почему t -критерий Стьюдента является параметрическим критерием?
3. Какое количество различных переменных входят в формулу критерия Стьюдента.
4. Рассчитать значение t-критерия Стьюдента для данных, приведенных в таблице, полученных при измерении личностной тревожности с помощью теста Тейлор.
Провести расчеты в двух вариантах исходя из следуюющих предположений:
А) данные получены для двух независимых выборок по 13 человек в каждой.
Б) данные получены для двух зависимых выборок, относятся к двум срезам
№ | X | У |
Рассчитать значения t-критерия Стьюдента, принять одну из двух статистических гипотез, сделать статистический и психологический выводы.
Ответы:
А) Для независимых выборок:
= 19.38; =22.62; s.=9.50; s=7.94; Dx = 90.25; Dy=63.04.
Значение t-критерия Стьюдента t=0.94, принимается Н0.
Б) для зависимых выборок:
Значение t-критерия Стьюдента t=3.71, принимается Н1.