Использование индивидуальных протоколов для математической обработки результатов не очень удобно. Для того, чтобы представить материал в более компактном виде, данные сводятся в итоговую таблицу следующего вида:
№№ п/п. | Фамилия, имя, отчество | Другие данные (если необходимо) | Исследуемый показатель | |
1 |
| |||
2 |
| |||
3 |
| |||
… | ||||
n |
В ряде случаев перед составлением сводной таблицы проводится ранжирование данных. Оно, в частности, необходимо при определении квантилей (см. подраздел 3.3). Для этого данные выстраиваются в общий ряд по исследуемому признаку в порядке его возрастания (или убывания) следующим образом: х 1≤ х 2≤ х 3≤ ... ≤ х n (или наоборот), где n – общее число значений признака (объем выборки). Знак «меньше или равно» предполагает, что у разных испытуемых могут встречаться одинаковые значения переменной.
Иногда даже итоговые таблицы могут оказаться довольно громоздкими и не вполне удобными для дальнейшей обработки. В этом случае материал можно сделать еще более компактным, составляя частотные таблицы (таблицы распределения частот исследуемого признака):
№№ пп. | 1 | 2 | 3 | 4 | ... | n – 1 | n |
x i | |||||||
f i |
В первой строке дается номер значения переменной в ранжированном ряду, во второй – конкретное значение (величина признака) и в третьей – частота встречаемости признака (число одинаковых значений признака в выборке).
Для того чтобы полученные данные представить в еще более компактном виде, используются таблицы распределения сгруппированных частот. Для составления такой таблицы необходимо:
1) общий диапазон изменения признака разделить на ряд поддиапазонов (классов) при условии, что ширина всех классов должна быть одинакова;
2) определить границы классов и их число в общем диапазоне;
3) подсчитать частоты встречаемости признака в каждом классе.
Обычно для построения распределения сгруппированных частот используется 7 – 15 классов. Для наиболее точного разбиения диапазона на классы (если в дальнейшем предполагаются математические операции с этими классами) можно использовать формулу Стэрджесса: N = 1 + 3,322 lg n, где n – объем выборки (количество значений признака), а N – количество классов. Так, например, если n = 100, то N = 1 + 3,322 × 2» 8.
Пример
На выборке испытуемых численностью 100 человек определялся коэффициент интеллекта (IQ). Минимальное значениеIQоказалось равным 72, а максимальное – 134. Для составления таблицы сгруппированных частот используем 8 классов (в соответствии с формулой Стэрджесса). Определяем общий диапазон изменения признака – он будет соответствовать разнице между минимальным и максимальным значениями: 134 – 72 = 62. Следовательно, в каждый класс должно попадать по 8 значений признака (при разбиении на классы можно слегка расширить диапазон с тем расчетом, чтобы в каждом классе оказалось одинаковое число значений и чтобы крайние значения не оказались за пределами диапазона). В соответствии с этим определяем границы классов и составляем таблицу сгруппированных частот:
Номер класса (N) | 1 | 2 | 3 | ... | 8 |
Границы класса (x min ¸ x max) | 72 79 | 80 87 | 8895 | ... | 128 135 |
Среднее значение (х¯) | 75,5 | 83,5 | 91,5 | ... | 131,5 |
Частоты (f i ) | 1 | 7 | 32 | ... | 2 |
Накопленные частоты (F i) | 1 | 8 | 40 | … | 100 |
Накопленные частоты, приведенные в 5-й строке, могут быть использованы в некоторых статистических расчетах (например, для вычисления критерия l по Колмогорову). Накопленные частоты вычисляются путем простого суммирования частот от 1-го до N -го класса: F 1 = f 1; F 2 = f 1 + f 2; F 3 = f 1 + f 2 + f 3 и т. д.
Определение квантилей
Квантиль – точка на числовой оси (значение признака), делящая совокупность наблюдений в определенной пропорции. Определение квантилей достаточно часто используется в психодиагностических процедурах (при определении тестовых норм и т. д.). Для определения квантилей необходимо иметь ряд значений исследуемого признака, ранжированных в порядке возрастания величины.
Различают несколько разновидностей квантилей:
а) квартили (Q) делят совокупность наблюдений (ранжированный ряд) на 4 равные части: 1-й квартиль (Q 1) делит ряд в соотношении 25:75%, 2-й (Q 2) – в соотношении 50:50% и 3-й (Q 3 ) – в соотношении 75:25%.
б) квинтили (K) делят выборку на 5 равных частей: K 1 – в соотношении 20:80%, K 2 – 40: 60%, K 3 – 60:40%, K 4 – 80:20%.
в) децили (D) делят ранжированный ряд на 10 равных частей: D 1 = 10%, D 2 = 20%,... D 9 = 90%.
г) наконец, процентили (Р) делят совокупность наблюдений на 100 частей (в процентном отношении).
Соотношения квантилей можно представить в виде следующей схемы:
Пример
На 20 испытуемых определялся уровень личностной тревожности (УЛТ) по тесту Спилбергера. При ранжировании значений признака получен следующий вариационный ряд (см. таблицу). Задача состоит в том, чтобы определить значения 1-го, 2-го и 3-го квартилей.
№№ | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
УЛТ | 31 | 32 | 32 | 34 | 36 | 36 | 36 | 37 | 39 | 41 | 42 | 42 | 43 | 44 | 45 | 45 | 45 | 46 | 47 | 48 |
|
|
|
|
Q 1 = 36 Q 2 = 41,5 Q 3 = 45
Для определения значений квартилей разбиваем ранжированный ряд на 4 равные части (по 5 значений признака). 1-й квартиль располагается между 5-м и 6-м значениями ряда, оба из которых соответствуют 36. Следовательно, Q 1 = 36. 2-й квартиль расположен между 10-м значением, равным 41, и 11-м, равным 42. Представляется разумным определить значение 2-го квартиля как среднее между двумя смежными значениями (Q 2 = 41,5). Значение 3-го квартиля лежит между 15-м и 16-м значениями ряда (Q 3 = 45).
Точно так же мы можем определить значения квинтилей (разбиение ранжированного ряда на 5 частей по 4 значения признака) или децилей (разбиение ряда на 10 равных частей по 2 значения переменной в каждой).