Испытуемые Фон После воз- d d1 действия |
Д 1 19 21 +2 4 2 10 8-24 3 12 13 +1 1 4 13 11 -2 4 5 17 20 +3 9 6 14 12 -2 4 7 17 15 -2 4 Ю 1 15 17 +2 4 2 14 15 +1 1 3 15 15 -4 17 18 +1 1 5 15 16 +1 1 6 18 15 -3 9 7 19 19 -8 22 25 +3 9 |
+3 +3 +3
= 0,39.
V
/(15 х 55)-32 /825-9 /58,28
15- 1 14
' Все эти расчеты необходимо сделать в чисто учебных целях. Сегодня существуют более быстрые методы, при которых основная работа сводится к вводу данных в программируемый микрокалькулятор или в компьютер, который автоматически выдает результат. Приведенная здесь таблица помогает понять все расчеты, которые осуществляются такими машинами.
Статистика и обработка данных 301
Величина t = 0,39 ниже той, которая необходима для уровня значимости 0,05 при 14 степенях свободы. Иными словами, порог вероятности для такого / выше 0,05. Таким образом, нулевая гипотеза не может быть отвергнута, и разница между выборками недостоверна. В сокращенном виде это записывается следующим образом:
t = 0,39; г| = 14; Р > 0,05; недостоверно.
Теперь попробуйте самостоятельно применить метод Стьюдента для зависимых выборок к обоим распределениям опытной группы с учетом того, что вычисление частных разностей для пар дало следующие результаты:
•Ld= -59 и ~Ld2 =349;
Значение t...... чем то, которое соответствует уровню значимости 0,05
для..... степеней свободы. Значит, нулевая гипотеза...... а различие
между выборками.....
Запишите это в сокращенном виде.
Дисперсионный анализ (тест F Снедекора)
Метод Снедекора - это параметрический тест, используемый в тех случаях, когда имеются три или большее число выборок. Сущность этого метода заключается в том, чтобы определить, является ли разброс средних для различных выборок относительно общей средней для всей совокупности данных достоверно отличным от разброса данных относительно средней в пределах каждой выборки. Если все выборки принадлежат одной и той же популяции, то разброс между ними должен быть не больше, чем разброс данных внутри их самих.
В методе Снедекора в качестве показателя разброса используют вариансу (дисперсию). Поэтому анализ сводится к тому, чтобы сравнить вариансу распределений между выборками с вариансами в пределах каждой выборки, или:
(<, =, >?) 0,05; различие
где с^рж.ву- варианса средних каждой выборки относительно общей средней;
внутри- варианса данных внутри каждой выборки. Если различие между выборками недостоверно, то результат должен быть близок к 1. Чем больше будет F по сравнению с 1, тем более досговерно различие.
302 Приложение Б
Таким образом, дисперсионный анализ показывает, принадлежат ли выборки к одной популяции, но с его помощью нельзя выделить те выборки, которые отличаются от других. Для того чтобы определить те пары выборок, разница между которыми достоверна, следует после дисперсионного анализа применить метод Шеффе. Поскольку, однако. этот весьма ценный метод требует достаточно больших вычислений. а к нашему гипотетическому эксперименту он неприменим, мы рекомендуем читателю для ознакомления с ним обратиться к какому-либо специальному пособию по статистике.
Непараметрические методы Метод /2 («хи-квадрат»)
Для использования непараметрического метода у2 не требуется вычислять среднюю или стандартное отклонение. Его преимущество состоит в том, что для применения его необходимо знать лишь зависимость распределения частот результатов от двух переменных; это позволяет выяснить, связаны они друг с другом или, наоборот, независимы. Таким образом, этот статистический метод используется для обработки качественных данных (см. дополнение Б.1). Кроме того, с его помощью можно проверить, существует ли достоверное различие между числом людей, справляющихся или нет с заданиями какого-то интеллектуального теста, и числом этих же людей, получающих при обучении высокие или низкие оценки; между числом больных, получивших новое лекарство, и числом тех, кому это лекарство помогло; и, наконец, существует ли достоверная связь между возрастом людей и их успехом или неудачей в выполнении тестов на память и т.п. Во всех подобных случаях этот тест позволяет определить число испытуемых, удовлетворяющих одному и тому же критерию для каждой из переменных.
При обработке данных нашего гипотетического эксперимента с помощью метода Стьюдента мы убедились в том, что употребление марихуаны испытуемыми из опытной группы снизило у них эффективность выполнения задания по сравнению с контрольной группой. Однако к такому же выводу можно было бы прийти с помощью другого метода-/2. Для этого метода нет ограничений, свойственных методу Стьюдента: он может применяться и в тех случаях, когда распределение не является нормальным, а выборки невелики.
При использовании метода у2 достаточно сравнить число испытуемых в той и другой группе, у которых снизилась результативность, и подсчитать, сколько среди них было получивших и не получивших наркотик; после этого проверяют, есть ли связь между этими двумя переменными.
Из результатов нашего опыта, приведенных в таблице в дополнении Б.2, видно, что из 30 испытуемых, составляющих опытную и контрольную группы, у 18 результативность снизилась, а 13 из них получили марихуану. Теперь надо внести значение этих так называемых эмпирических частот (Э) в специальную таблицу:
Статистика и обработка данных 303
Результаты
Ухудшение Без изменений Итого или улучшение
После употреб- 13 2 15 д ления наркотика |
5 Без наркотика 5 10 15 ^ |
Итого 18 12 30 |
Эмпирические частоты (Э)
Далее надо сравнить эти данные с теоретическими частотами (Т), которые были бы получены, если бы все различия были чисто случайными. Если учитывать только итоговые данные, согласно которым, с одной стороны, у 18 испытуемых результативность снизилась, а у 12-повысилась, а с другой -15 из всех испытуемых курили марихуану, а 15 -нет, то теоретические частоты будут следующими:
Результаты
Ухудшение Без изменений Итого или улучшение
После употреб- 18 • 15 12-15
———=9 ———=6 15
ления накортика 30 30
Без наркотика
18-15
=9
12-15
Quot; — 0
30 30
Итого 18 12 30
Теоретические частоты (Т)
Метод /2 состоит в том, что оценивают, насколько сходны между собой распределения эмпирических и теоретических частот. Если разница между ними невелика, то можно полагать, что отклонения эмпирических частот от теоретических обусловлены случайностью. Если же, напротив, эти распределения будут достаточно разными, можно будет считать, что различия между ними значимы и существует связь между действием независимой переменной и распределением эмпирических частот.
Для вычисления у2 определяют разницу между каждой эмпирической
Приложение Б
и соответствующей теоретической частотой по формуле (Э - Т)2 Т'
а затем результаты, полученные по всех таких сравнениях, складываю-;
, ^(Э-Т)2
х ^-т—
В нашем случае все это можно представить следующим образом:
Э т э-т О - Т)2 (э - т)2
Наркотик, 13 9 +4 16 1,77 ухудшение |
Наркотик, 2 6 -4 16 2,66 улучшение |
,77
Без наркотика, 5 б —4 ухудшение
2,66
Без наркотика,
улучшение 10 б +4
^(Э-Т)2 X = Е——-—— = 8,66
Для расчета числа степеней свободы число строк в табл. 2 (в конце приложения Б) за вычетом единицы умножают на число столбцов за вычетом единицы. Таким образом, в нашем случае число степеней свободы равно (2— 1)-(2— 1)=1.
Табличное значение /2 (см. табл. 2 в дополнении Б. 5) для уровня значимости 0,05 и 1 степени свободы составляет 3,84. Поскольку вычисленное нами значение /2 намного больше, нулевую гипотезу можно считать опровергнутой. Значит, между употреблением наркотика и гла-зодвигательной координацией действительно существует связь1.
Критерий знаков (биномиальный критерий)
Критерий знаков-это еще один непараметрический метод, позволяющий легко проверить, повлияла ли независимая переменная на выпол-
' Следует, однако, отметить, что если число степеней свободы больше 1, то критерий /2 нельзя применять, когда в 20 или более процентах случаев теоретические частоты меньше 5 или когда хотя бы в одном случае теоретическая частота равна 0 (Siegel, 1956).
Статистика и обработка данных 305
нение задания испытуемыми. При этом методе сначала подсчитывают число испытуемых, у которых результаты снизились, а затем сравнивают его с тем числом, которого можно было ожидать на основе чистой случайности (в нашем случае вероятность случайного события 1:2). Далее определяют разницу между этими двумя числами, чтобы выяснить, насколько она достоверна.
При подсчетах результаты, свидетельствующие о повышении эффективности, берут со знаком плюс, а о снижении - со знаком минус; случаи отсутствия разницы не учитывают.
Расчет ведется по следующей формуле:
(X + 0,5)
Z=
где Х- сумма «плюсов» или сумма «минусов»;
и/2 - число сдвигов в ту или в другую сторону при чистой случайности (один шанс из двух 1);
0,5-поправочный коэффициент, который добавляют к X, если Х < п/2, или вычитают, если Х > и/2.
Если мы сравним в нашем опыте результативность испытуемых до воздействия (фон) и после воздействия, то получим
Опытная группа
Фон: 12 21 10 15 15 19 17 14 13 11 20 15 15 14 17 После воздействия: 8 20 6 8 17 10 10 9 7 8 14 13 16 11 12 Знак: ____-(-- ----_--)---
Итак, в 13 случаях результаты ухудшились, а в 2-улучшились. Теперь нам остается вычислить Z для одного из этих двух значений X:
(13-0,5)
либо Z =
15 \ 2
(2 + 0,5) -
12,5 - 7,5 ^ZT^-1'83'
либо Z =
/L5 2
' Такая вероятность характерна, например, для п бросаний монеты. В случае же если п разбросают игральную кость, то вероятность выпадения той или иной грани уже равна одному шансу из 6 (nid).
406 При гожение Б
Из таблицы значений Z можно узнать, что Z для уровня значимости 0,05 составляет 1,64. Поскольку полученная нами величина Z оказалась выше табличной, нулевую гипотезу следует отвергнуть; значит, под действием независимой переменной глазодвигательная координация действительно ухудшилась.
Критерий знаков особенно часто используют при анализе данных, получаемых в исследованиях по парапсихологии. С помощью этого критерия легко можно сравнить, например, число так называемых телепатических или психокинетических реакций (X) (см. досье 5.1) с числом сходных реакций, которое могло быть обусловлено чистой случайностью (и/2).