Шкалограммный анализ Гуттмана

7.5.2. Шкалограмма Гуттмана

Известный американский психолог Л.Гуттман предложил свой способ адаптации тестовой традиции к потребностям социологии [Guttman, 1950]. В принципе идея была той же — опереться на проверку того, что наблюдаемые признаки представляют собой плотную "связку" в смысле корреляции друг с другом, и предложить такой способ измерения латентной переменной, чтобы при фиксации ее значения эти корреляции исчезали. Описание метода можно найти в [Грин, 1966; Гуттман, 1966; Осипов, Андреев, 1977; Рабочая книга..., 1983; Ядов, 1995].

Наблюдаемые признаки — дихотомические. Предполагается, что выполнение условий, требующихся для реализации тестовой традиции, будет обеспечено, если удастся доказать возможность определенным образом их упорядочить. А именно: будем говорить, что признаки упорядочены, если, скажем, относительно человека, положительно реагирующего на третий признак, можно быть почти уверенным, что он положительно реагировал и на четвертый, пятый и т.д. признаки.

Подобные шкалы называются кумулятивными. Они использовались и до Гуттмана. Так, кумулятивна известная шкала социальной дистанции Богардуса, содержащая семь признаков, отражающих различные степени социальной дистанции. Эти признаки могут быть следующим образом упорядочены (речь идет об отношении респондента к человеку или социальной группе, дистанция до которой вычисляется): допущение человека в качестве родственника посредством брака, как личного друга, в качестве соседа, допущение равной работы, гражданства, допущение в страну только в качестве туриста. Кумулятивность шкалы представляется очевидной: относительно респондента, согласного принять кого-то в качестве соседа, можно почти наверняка сказать, что он согласится с тем, чтобы тот же человек имел одинаковые с ним работу, гражданство, или мог приехать в страну как турист.

Значение латентной переменной рассчитывается как сумма положительных ответов, данных респондентом на рассматриваемые вопросы. Нетрудно показать, что если рассматриваемые дихотомические признаки удалось упорядочить, то соответствующая матрица данных приведется к так называемому диагональному виду (табл. 7.2).

Плюсами помечены положительные ответы респондентов на соответствующие вопросы анкеты (их согласие с соответствующими суждениями), минусами — отрицательные.

Нетрудно проверить, что согласие респондента, скажем, с 4-м суждением означает его согласие с 5-м, 6-м и т.д. А это и означает, что наши признаки упорядочены.

Но поскольку количество респондентов, как правило, будет больше числа суждений, то многие респонденты будут давать одинаковые наборы ответов, и матрица приобретет ступенчато-диагональный вид (табл. 7.3).

Нетрудно показать, что для таких переменных будут выполнены все требующиеся посылки: они будут связаны друг с другом и фиксация значения латентной переменной приведет к распаду этих связей.

Действительно, пусть р. и р. — вероятности положительных ответов на /-й и у'-й вопросы соответственно, р.. — вероятность положительного ответа на /-й и у'-й вопросы одновременно (напомним, что в выборочном исследовании вероятность какого-либо события отождествляется с относительной частотой его встречаемости).

Таблица 7.3. Результат шкалограммного анализа Гуттмана: приведение матрицы данных к ступенчато-диагональному

виду

Респонденты	Суждения	Значение латентной переменной

	+	+	+	+	+	+	+	+	+
	+	+	+	+	+	+	+	+	+
	+	+	+	+	+	+	+	+	+
	-	+	+	+	+	+	+	+	+
	-	-	+	+	+	+	+	+	+
	-	-	+	+	+	+	+	+	+
	-	-	-	+	+	+	+	+	+
	-	-	-	+.	+	+	+	+	+
	-	-	-	+	+	+	+	+	+
	-	-	-	-	+	+	+	+	+
	-	-	-	-	+	+	+	+	+
						+	+	+	+
							+	+	+
								+	+
								+	+
								+	+
									+

Вспомним одно из основных положений теории вероятностей. Независимость двух событий означает, что вероятность наступления обоих событий вместе равна произведению вероятностей наступления каждого из них в отдельности. Учитывая это, нетрудно видеть, что в нашем случае независимость двух признаков с номерами i и j означает, что

P_t⁼P,Pj- (^?-²>

Однако в действительности, если предположить, что признаки упорядочены в нашем смысле (и / < j), то окажется, что р. = = p_i (для нашего примера со шкалой Богардуса — вероятность того, что респондент согласен допустить рассматриваемого человека одновременно и в качестве соседа, и в качестве согражданина, равна вероятности того, что он допустит этого человека в качестве соседа, поскольку второе требование само собой будет выполнено). Поскольку соотношение (7.2) не выполняется, то признаки зависимы.

Если же взять только тех людей, которые имеют одно и то же значение латентной переменной, то, как нетрудно проверить, для них однозначно восстанавливается картина их ответов на рассматриваемые вопросы: скажем, балл 5 респондент может иметь только в том случае, если он дал положительные ответы на последние 5 вопросов. Другими словами, респонденты с одним и тем же значением латентной переменной имеют одни и те же значения рассматриваемых признаков. Ни о какой связи тут говорить не приходится.

Гуттман предложил простой алгоритм, позволяющий либо привести матрицу к диагональному виду, либо показать, что это сделать в принципе невозможно. Прежде чем описать этот алгоритм, заметим, что мы должны учитывать еще одно обстоятельство.

Выше в действительности был описан некий идеальный случай. Мы уже говорили, что в социологии практически никакая теоретическая схема никогда не проходит в совершенно "чистом" виде, никакая гипотеза не может стопроцентно выполняться, никакие данные не бывают без ошибок. И всегда встает вопрос, в каких пределах эти ошибки допустимы.

В нашем случае это означает, что даже при самом тщательном подборе суждений всегда найдутся респонденты, для которых они не будут упорядочены предполагаемым нами образом (в подтвер-" ждение того, что ошибки всегда будут, напомним, как уже мы говорили, что человек, ответивший положительно на третий вопрос, почти наверняка, но не наверняка (!) даст положительный ответ на четвертый и пятый). То есть наша матрица хотя бы в малой мере, но практически всегда не будет точно диагональной. Необходимо, как всегда в подобных случаях, установить предел допустимых ошибок (напомним, что мы так же поступили, например, когда говорили о возможных нарушениях транзитивности в матрицах парных сравнений). В ситуации, когда этот предел не будет превышен, считать, что матрица диагональна, и, следовательно, наши условия, обеспечивающие возможность использования тестовой традиции, выполняются. Если ошибки превы-

сят допустимый предел, то будем полагать, что матрицу нельзя привести к диагональному виду и, стало быть, нельзя описанным образом измерять латентную переменную.

Ошибки будут проявляться в том, что даже в самом хорошем варианте у нас в области плюсов будут одиночные минусы, и наоборот. Оценим количество таких смешений. Их ниже мы и называем ошибками. Введем критерий:

R = 1 — (количество ошибок)/(количество клеток в таблице).

Будем полагать, что мы привели матрицу к диагональному виду, если R < 0,9. Теперь на примере покажем, в чем состоит алгоритм Гуттмана и как можно оценить качество его работы.

Итак, пусть исходная матрица данных имеет вид (табл. 7.4).

Таблица 7.4. Фрагмент гипотетической матрицы данных, полученных с помощью шкалы Гуттмана

Респонденты	Суждения	Значение латентной переменной
		со
	+	-	-	-	+	+
см	+	+	+	-	-	-	со
со	-	-	-	-	-	-
	+	+	+	+	+	-
СП	-	-	-	-	-	+
	+	+	-	-	+	+
	-	-	-	+	+	+
	+	+	+	-	+	-

В соответствии с упомянутым алгоритмом сначала надо таким образом переставить строки, чтобы соответствующие им значения измеряемой переменной расположились по убыванию (табл. 7.5).

Не зря мы ввели в таблицу еще одну строку. Теперь надо переставить столбцы таблицы таким образом, чтобы возрастали ранги, стоящие в ее нижней, как бы маргинальной, строке (табл. 7.6).

Строго диагонального (ступенчато-диагонального) вида у нас не получилось. Теперь требуется оценить, можно ли все же считать, что полученная матрица достаточно близка к диагональному виду.

R = I - (6 + 3)/ 48 = 0,81

(6 — количество плюсов, "заблудившихся" в минусовой области; 3 — количество минусов, находящихся в плюсовой области). Если такое значение критерия представляется неприемлемым (19% "неправильных" клеток в таблице), то приходим к выводу, что наша гипотеза о наличии латентной переменной, проявляющейся в рассматриваемых наблюдаемых признаках, не верна.

Итак, наша работа начинается с того (имеется в виду этап работы после предварительного формирования анкеты), что мы проводим пробное исследование, собираем данные и переставляем столбцы и строки полученной матрицы до тех пор, пока она либо приобретет диагональный вид, либо мы убедимся в том, что это сделать невозможно. В первом случае мы полагаем, что одномерная латентная переменная существует, признаки и способ выражения через них латентной переменной выбраны удачно, и переходим к основному исследованию. Во втором — вообще говоря, отказываемся от построения одномерной шкалы. Однако в отдельных случаях исправить положение можно с помощью некоторой корректировки данных. Скажем, может оказаться, что привести матрицу к диагональному виду нам мешает какой-то ее столбец. Тогда выбросим из рассмотрения соответствующее суждение: оно не укладывается в наше упорядочение (может быть, не так понимается респондентами, как мы рассчитывали, и т.д.). Затем перейдем к основному исследованию. В приведенном выше примере таким суждением можно считать шестое (правда, убрав его, мы уменьшим долю "неправильных" клеток не до 10%, а только до 12% (стало быть, R будет равно 0,88).

В основе шкалирования по Гуттману лежит схема ответов, допускающая следующие операции:
1. Балл установки респондента равен сумме положительных реакций (числу знаков «+») на высказывания.
2. Балл установки позволяет воспроизвести реакции на отдельные суждения.
Годными для шкалирования признаются лишь те суждения, которые дают монотонную последовательность ответов.
Методика Гуттмана состоит из восьми этапов.
^ Первый этап. Подбор суждений. Исследователь априори выбирает суждения, относящиеся к установке людей на изучаемый объект или явление. В состоянии ли эти суждения образовать шкалу решается экспертной проверкой. Требования к суждениям следующие:
наличие двух альтернативных ответов — только «да» или «нет»;
нацеленность на изучение какой-то одной специфической области;
расположение по кумулятивной (накопительной) шкале, т.е. если респондент дал положительный ответ на первое суждение, то существует большая вероятность того, что и на последующие он даст положительные ответы. Гуттман считает, что реакции на суждения образуют одномерный континуум.
Можно привести следующий пример анкеты, построенной согласно процедуре Гуттмана:
Новая общественная система, сложившаяся в России после 1991 года, несомненно, способствует повышению производительности труда.
Согласен Не согласен
Если брать в целом, эта система лучше той, что была раньше.
Согласен Не согласен
Некоторые стороны новой общественной системы плохо продуманы.
Согласен Не согласен
Как и любая другая система организации общественной жизни, новая система имеет немало минусов.
Согласен Не согласен
Новая система удачно сочетает материальное и моральное стимулирование работников
Согласен Не согласен
Аргументы в пользу новой системы очень убедительны
Согласен Не согласен
В прежней системе было немало хорошего, что утрачено в новой системе
Согласен Не согласен
Преимущества новой системы организации жизни общества совершенно не ясны.
Согласен Не согласен
Согласие с суждениями 1, 2, 5, 6 и несогласие с суждениями 3, 4, 7, 8 означает благоприятное отношение к новой общественной системе. Идеальная шкалограмма предполагает, что ответ на один из вопросов должен повлечь за собой определенный ответ на следующий за ним по нисходящей ветви. Главная задача исследователя состоит в том, чтобы выяснить, действительно ли ответы на эти вопросы образуют одномерный континуум.
^ Второй этап. Подбор экспертов.
Третий этап. Экспертная оценка предложенных суждений.
Четвертый этап. Процедура обработки данных. Данные опроса экспертов заносятся в таблицу так, чтобы упорядочить опрошенных по схеме: от суждений, выражающих благожелательное отношение к объекту оценивания, до суждений, выражающих неблагоприятное отношение. Составляется первичная таблица плюсов и минусов. Каждый столбец представляет суждение, каждая строка — ответы экспертов. Из этой таблицы необходимо построить шкалограмму. Шкалограмма — это такая картина, когда люди и их ответы ранжированы. То есть расположены так, что первый человек отвечает положительно на все вопросы (первая строка состоит из одних плюсов), второй человек отвечает положительно на все вопросы, кроме последнего, третий — на все, кроме последних двух и т.д.
В шкалограмме нужно провести наклонную прямую, отсекающую плюсы от минусов. Но практически так никогда не получается. Представляя строки и столбцы, можно составить только приблизительную шкалограмму, где наклонная прямая не рассекает таблицу на часть с плюсами и часть с минусами, а представляет лестницу.
Например, мы опросили 12 экспертов и получили следующую шкалограмм
Шкалограмма

№ эксперта Балл эксперта Суждения

7 5 1 8 2 4 6 3

5 8 + + + + + + + +

7 7 + + + + + + + –

8 6 + + + + + + – –

10 6 + + + + + + – –

2 5 + + + + + – – –

1 4 + + + + – – – –

6 4 + + + – – + – –

11 4 + + + + – – – –

4 3 + + + – – – – –

12 3 + + + – – – – –

3 2 + – – – – – + –

9 1 + – – – – – – –

Балл эксперта высчитывается по схеме: при ответе «согласен» на 1, 2, 5, 6 суждения нашего примера эксперту присваивается 1 балл, при ответе «не согласен» на 3, 4, 7, 8 суждения также 1 балл. На противоположные ответы на эти суждения присваивается 0 баллов. Таким образом, максимально эксперт может набрать 8 баллов.
^ Пятый этап. Проверка шкалы на воспроизводимость. По коэффициенту воспроизводимости определяют возможность воспроизведения ответов экспертов на выборке респондентов. Коэффициент воспроизводимости определяет возможное число отклонений от идеальной шкалы:

где ^ V — коэффициент воспроизводимости;
n — число ошибочных ответов;
K — число пунктов шкалы, по которым следует дать ответ (в нашем примере 8);
N — число экспертов.
Для нашего примера:

0,85. Он характеризует степень приближенности к идеальной шкалограмме, в которой коэффициент воспроизводимости равен 1,00.³Суждения считаются пригодными для шкалирования, если коэффициент воспроизводимости
^ Шестой этап. Отбор надежных суждений. Если коэффициент воспроизводимости меньше 0,85, тогда отбрасываются суждения, дающие много ошибочных ответов. Строится новая шкалограмма и высчитывается новый коэффициент воспроизводимости. Эта процедура повторяется до тех пор, пока не будут отобраны надежные и значимые суждения. Шкала с коэффициентом воспроизводимости не менее 0,85 готова.
^ Седьмой этап. Проведение опроса респондентов. При массовом опросе все суждения тасуются в беспорядке.
Восьмой этап. Математическая обработка полученных данных. Ранг каждого респондента определяется по сумме набранных им баллов. Затем высчитывается среднеарифметический ранг данной категории обследованных. Сравнивается с рангами других категорий. Можно сравнить, например, ранги представителей различных профессий, демографических, этнических и прочих групп, провести корреляционный, факторный анализы и прочее. Среднестатистический ранг категории показывает общую установку этой группы людей на изучаемый объект или явление.