ОБЩИЕ ПРИНЦИПЫ ИЗМЕРЕНИЯ
В СОЦИОЛОГИИ
Глава 1. ПРОБЛЕМЫ ИЗМЕРЕНИЯ, ВОЗНИКАЮЩИЕ В ЭМПИРИЧЕСКИХ ИССЛЕДОВАНИЯХ
Успешность решения проблемы измерения является одной из главных компонент, составляющих понятие качества социологического исследования. Однако далеко не каждый социолог об этом задумывается. Более того, как показывает опыт, само выражение "проблемы измерения" часто вызывает недоумение: а существуют ли такие проблемы? В чем, собственно, они состоят?
Поэтому начнем с простого: покажем, к каким недоразумениям может привести отсутствие внимания к проблемам социологического измерения. Но сделаем это в п. 1.2, а пока дадим некоторые предварительные определения, и прежде всего шкал и их типов, обозначив элементы тех представлений, которые станут главными в следующих разделах.
К определениям, связанным со шкалами, мы вернемся в разделе 4 и уточним их посредством введения формализма, принятого в репрезентационной теории измерений. Мы не даем сразу соответствующих дефиниций, хотим, чтобы читатель вначале усвоил материал первых трех разделов. Тогда он поймет, что эти дефиниции естественны, что они органично "впитывают" в себя многое из того, что заложено в известных методах социологического шкалирования (о других причинах см. п. 13.3.3). Формулировки, приводимые в п. 1.1, тоже несут в себе оттенок формализма.
1.1. Предварительные определения
Мы предполагаем, что читатель имеет хотя бы самое поверхностное представление об эмпирическом социологическом исследовании; знает, что такое анкета, из чего она обычно состоит; слышал об использовании в социологии шкал разных типов.
Все это раскрывается в курсе по методам социологического исследования (см., например, [Ядов, 1995]).
Назовем эмпирической системой (ЭС) интересующую исследователя совокупность реальных (эмпирических) объектов с выделенными соотношениями между ними. Последние часто можно выразить в виде некоторых отношений между объектами (любое отношение есть соотношение, но не наоборот), и тогда говорят об эмпирической системе с отношениями (ЭСО).
Пример ЭСО — совокупность сотрудников какого-то завода, рассматриваемых как "носителей" удовлетворенности своим трудом с заданным бинарным (т.е. определенным на парах объектов) отношением: "респондент А больше удовлетворен работой, чем респондент Б". Для одних пар это отношение может выполняться, для других нет. Но мы полагаем, что, каких бы респондентов мы ни взяли, разговор о выполнении этого отношения будет осмысленным (ниже мы будем подробнее обсуждать вопрос о подобной осмысленности). Подчеркнем, что ЭС отражает представление исследователя об изучаемой реальности, процесс ее формирования по существу является моделированием (подробнее об этом пойдет речь ниже; см. также [Бородкин, Миркин, 1972; Клигер и др., 1978]). С учетом этого ЭС можно считать фрагментом реальности.
Назовем математической системой (МС) совокупность математических объектов (чаще всего в качестве таковых выступают числа и тогда МС называется числовой) с выделенными соотношениями между ними. Когда последние задаются в виде некоторых отношений между объектами, говорят о математической системе с отношениями или о числовой системе с отношениями (МСО и ЧСО). Примеры ЧСО приведены ниже.
Теперь о нашем ключевом понятии. Будем понимать под измерением (до введения строгих определений в главе 14) отображение некоторой ЭС в МС.
Подчеркнем, что измерение — это всегда моделирование и осуществляется оно как бы в два этапа: сначала мы строим ЭС, затем математическую модель этой системы. Цель такого моделирования — обеспечение возможности использования математики для решения социологических задач.
Шкалой мы будем называть правило, определяющее, каким образом в процессе измерения каждому изучаемому объекту ставится в соответствие некоторое число или другой математический конструкт. Каждый такой конструкт будем называть результатом измерения объекта, или его шкальным значением. Иног-
да, в соответствии с традицией, шкалой будем называть совокупность шкальных значений объектов изучаемой ЭС. Процесс получения шкальных значений назовем шкалированием. Нередко понятие шкалы связывают только с использованием числовых МС.
Подчеркнем, что в соответствии с нашим пониманием измерения совокупность шкальных значений — это определенная модель реальности.
Общим местом стало рассмотрение в качестве основной специфической черты социологического измерения активное использование номинальных, порядковых, интервальных шкал. Напомним их определения.
Предположим, что мы приписываем респонденту число как обозначение, код его профессии. Ясно, что, анализируя полученные числа, мы можем судить лишь об их равенстве или неравенстве: из того, что два респондента закодированы одним числом, следует, что они имеют одинаковую профессию; разным числам отвечают разные профессии. Выражения типа 3 < 5 в таком случае становятся бессмысленными: они не отражают ничего реального. Это — номинальная шкала.
Ясно, что она отвечает отображению ЭСО с заданным отношением равенства в соответствующую ЧСО. Если же, например, каждому респонденту приписано число от 1 до 5 в соответствии с тем, как он ответил на вопрос типа: "Удовлетворены ли Вы своей работой?" (с вариантами ответов от "совершенно не удовлетворен" до "полностью удовлетворен", закодированными цифрами от 1 до 5 соответственно), то мы, кроме равенства и неравенства, можем судить также и о некотором порядке между полученными числами: если одному респонденту приписано число 3, а другому — 5, то считаем, что первый меньше удовлетворен работой, чем второй. Но соотношения типа 5 — 4 = 2—1 остаются бессмысленными с содержательной точки зрения. Это — порядковая шкала. ЭСО в данном случае содержит два отношения — равенства и порядка.
Совокупность эмпирических отношений, отражаемых с помощью интервальной шкалы, богаче, она дает возможность отразить еще и порядок расстояний между шкалируемыми объектами.
Предположим, например, что мы измерили отношение студентов к учебе и в результате получили, что четырем респондентам А, Б, В и Г оказались приписанными соответственно числа 1, 2, 3 и 8. Если мы знаем, что была использована порядковая шкала, то, интерпретируя результаты измерения, можно быть
уверенными только в том, что респондент А хуже всех относится к учебе, респондент Б — получше и т.д. При использовании же интервальной шкалы мы можем получить дополнительную информацию: различие по отношению к учебе между респондентами А и Б меньше, чем различие между респондентами В и Г. А такого рода сведения весьма полезны.
Итак, если мы получаем числа, для которых "физически" осмыслены равенства типа 5 — 4 = 2— 1 или 8 — 3 > 3 — 2, то считаем, что они отвечают интервальной шкале. Эта шкала обычно считается "хорошей" в том смысле, что соответствующие шкальные значения в достаточной мере похожи на обычные числа (вопрос о смысле "похожести" часто даже не ставится; одна из наших задач — уточнить его). По интервальным шкалам обычно считают полученными значения таких признаков, как возраст или зарплата. ЭСО в данном случае содержит отношения равенства и порядка как для объектов, так и для расстояний между объектами. Интервальные шкалы часто называют шкалами высокого типа, количественными, числовыми. Номинальные же и порядковые шкалы — шкалами низкого типа, качественными, нечисловыми (мы негативно относимся к такому использованию терминов "качественный" и "количественный", что ниже попытаемся обосновать). Смысл таких определений очевиден: числа, полученные с помощью шкал высокого типа, больше похожи на те числа, которые знакомы каждому из нас со школьной скамьи. Будем считать интуитивно ясным понятие признака (синонимы: переменная, характеристика, параметр, величина; примеры: пол, возраст, удовлетворенность респондента работой) и его значения (синонимы: градация, категория, альтернатива; примеры: мужчина, 25 лет, совершенно не удовлетворен работой). Переменную, значения которой нельзя получить сразу, задав, скажем, определенный вопрос в анкете и получив соответствующий ответ респондента, будем называть латентной (скрытой). В противоположном случае будем говорить о наблюдаемой переменной. Процесс получения значений наблюдаемой переменной называется прямым измерением (в работе [Клигер и др., 1978] оно называется измерением при сборе данных).
Латентные переменные измеряются косвенным путем, с помощью определенных преобразований некоторых наблюдаемых, поддающихся адекватной интерпретации данных. (Представления о том, какой вид эти данные имеют и как они должны преобразовываться, должны опираться на определенные теоре-
тические исследовательские концепции, априорные модельные представления социолога. Обсуждение этих представлений станет ключевым моментом в дальнейшем изложении.)
Отметим, что только что введенное определение латентной переменной несколько расходится с тем, что под таковой часто понимают социологи. Мы имеем в виду ситуацию, когда латентной называют переменную, относительно которой заранее неизвестно не только то, как ее измерить, но и то, что она из себя представляет: исследователь догадывается, что наблюдаемое поведение респондента (чаще всего — ответы на вопросы предложенной ему анкеты) объясняется действием одной или нескольких скрытых переменных, но не может априори дать им название (подобная ситуация имеет место, например, при использовании факторного анализа; подробнее мы ее рассмотрим в главе 7). Приведенное же выше определение предполагает, что исследователь вполне может заранее знать, какая латентная переменная его интересует. Латентность же ее заключается в том, что ее измерение осуществляется не в процессе сбора данных, а в процессе анализа некой первичной информации. Другими словами, мы называем латентной переменную, значения которой получаются врезультате так называемого производного измерения (в работе [Клигер и др., 1978] оно называется измерением при анализе данных). Коротко поясним, почему мы прибегли к такому определению.
С нашей точки зрения, в социологии между указанными двумя ситуациями нет непреодолимой пропасти. Для социолога любая переменная, находящаяся в результате производного измерения, всегда в той или иной мере является латентной: исследователь практически никогда не может быть уверен, что предположение о самом существовании этой переменной адекватно моделирует ситуацию, что наблюдаемое поведение отражает именно то, что интересует исследователя, и т.д. И продвинутые способы измерения всегда дают возможность пересмотра социологом наименования переменной или вообще отказа от убежденности в ее существовании.
Говоря о комплексе вопросов, связанных с измерением латентной переменной, будем использовать также терминологию, касающуюся операционализации понятий. Представляется очевидным родство соответствующих проблем: латентная переменная часто отвечает трудно измеримому или смутно очерчиваемому заранее понятию, наблюдаемые признаки — результату его операционализации.
Основой модельных представлений, заложенных в известных методах шкалирования, является сопоставление с каждой измеряемой переменной (в том числе латентной) некоторой протяженности, психологического континуума — прямой линии (числовой прямой, числовой оси), на которой мы размещаем те объекты, которым в результате измерения должны приписать числа (термин "континуум" означает непрерывность). Это предположение является естественным, в его целесообразности не сомневается ни один социолог, но в нем имеются свои "подводные камни". Так, на практике исследователь иногда забывает о том, что, приписывая числа объектам, т.е. размещая их на указанной прямой, он, как правило, не определяет место размещения объекта однозначно, не "прибивает гвоздями" объект к оси. "Числа", используемые социологом, заданы не однозначно, а как бы "плавают" на оси. Например, как нетрудно проверить, для определенных выше типов шкал эквивалентными являются совокупности шкальных значений, представленные в табл. 1.1.
Таблица 1.1. Свойства шкал рассматриваемых типов
Тип шкалы | Отношения, сохраняющиеся при отображении ЭСО в ЧСО | Пример эквивалентных совокупностей шкальных значений |
Номинальная | а= b | 1 2 3 4 5 10 31 2 5 118 |
Порядковая | а = b, а> b | 1 2 3 4 5 10 31 44 100 118 |
Интервальная | а= b, a> b a-b= с -d а -b> с -d | 1 2 3 4 5 10 31 52 73 94 |
Действительно, если нас интересуют только эмпирические отношения равенства — неравенства, скажем, если мы измеряем профессию, безразлично, какими цифрами зашифровать наши объекты: с точки зрения смысла решаемой задачи совершенно безразлично, припишем ли мы токарю — 1, пекарю — 2, лекарю — 3,
либо же токарю — 10, пекарю — 31, а лекарю — 2. Требуется лишь, чтобы всем токарям было приписано одно и то же число, чтобы это число не совпадало с числом, приписанным пекарям, и т.д. А вот если мы ставим своей целью сохранить в числах некое эмпирическое отношение порядка, то тут уже набор чисел во второй строке не будет эквивалентен набору 1, 2, 3, 4, 5, поскольку эти наборы отражают разный порядок. Если же мы учитываем порядок расположения по величине неких эмпирических интервалов между рассматриваемыми объектами, то набору 1, 2, 3, 4, 5 может быть эквивалентен только такой набор, в котором интервалы между последовательными числами равны. В подобных соображениях выражается нечисловая сущность наших шкальных значений. И это положение принципиально. Оно вытекает из сути той роли, которую играет число в социологии. На это обстоятельство мы будем обращать особое внимание. (Как мы увидим в разделе 14, подобные соображения лежат в основе репрезентационной теории измерений.)
Каждый социолог в наше время знает, что используемые им "числа", отвечающие, скажем, номинальной и порядковой шкале, на самом деле не являются обычными числами (хотя бы потому, что с ними нельзя обращаться как с таковыми), но нечисловой характер данных обычно не ассоциируется с неоднозначностью используемых шкальных значений, в то время как такая ассоциация представляется естественной.
Отметим, что хотя шкальные значения, полученные по интервальной шкале, в значительной мере можно считать похожими на обычные действительные числа с точки зрения возможностей дальнейшей работы с ними (к ним применимо значительное количество традиционных числовых математических методов), все же и они не являются числами в привычном школьном смысле этого слова, поскольку они тоже определены не однозначно, а лишь с точностью до преобразований, сохраняющих структуру интервалов между исходными числами.
Перейдем к описанию тех неприятностей, к которым может привести некорректное использование некоторых традиционных способов шкалирования. По существу речь пойдет о примерах латентных переменных: мы покажем, что латентными в действительности являются многие признаки, фактически считающиеся социологами наблюдаемыми.
Установочные и оценочные шкалы
Установочными называют шкалы, с помощью которых числа приписываются самим респондентам (а не оцениваемым ими объектам). При использовании такой шкалы речь чаще всего идет об измерении установки последних. Правда, под установкой здесь может пониматься не совсем то, для обозначения чего используется этот термин в социальной психологии (здесь мы отвлекаемся от разных нюансов его понимания, отождествляя, например, установку с аттитюдом и т.д.; об упомянутых нюансах см. [Андреева, 1994, с. 254; Дилигенский, 1996, с. 154]). Скажем, мы будем полагать, что по установочной шкале измеряется возраст респондента.
В социологии часто используются некорректные установочные шкалы. Так, не всегда позволяют достичь порядкового уровня измерения традиционные шкалы-пятичленки типа описанной выше шкалы для измерения удовлетворенности работой: нетрудно понять, что соотношение вида 3 < 5 иногда не может (Интерпретироваться как соответствующее различие эмоционального отношения к работе "стоящих" за числами респондентов. Причины подобных явлений могут быть разными — например, обусловленная национально-культурными особенностями респондентов разница их восприятия анкетных вопросов [Ермолаева, 1990].
Оценочными называют такие шкалы, итогом "действия" которых является приписывание чисел не респондентам, а некоторым объектам (суждениям, ценностям, проблемам и т.д.); при этом предполагается, что полученные числа отражают усредненное мнение интересующей исследователя совокупности респондентов об этих объектах.
Многие традиционные способы получения оценочных шкал тоже не являются корректными. Так, при разных способах опроса объекты, указываемые респондентами как самые значимые, могут быть различными. Приведем пример. Авторы статьи [Согомонов, Толстых, 1989], пытаясь выявить, какие социально-экономические проблемы более всего волнуют респондентов, обратились к ним в анкете несколько раз, по-разному сформулировав соответствующий вопрос (просили отметить одну, самую острую проблему, несколько наиболее актуальных проблем и т.д.) и... получили противоречащие друг другу результаты.
Рассмотрим более подробно еще один очень популярный способ построения оценочной шкалы. Предположим, что мы хотим получить рейтинги 4-х лиц, претендующих на то, чтобы быть
избранными на какой-либо руководящий пост. Условно обозначим претендентов буквами Е, Ж, 3, Я. Анализируемый способ опирается на результаты ранжировки респондентами рассматриваемых лиц. На примере покажем, каким образом в соответствии с традицией каждому претенденту приписывается число, отражающее его рейтинг.
Пусть результаты ранжировки имеют вид, отраженный в табл. 1.2.
Таблица 1.2. Результаты ранжировки гипотетических претендентов на должность несколькими респондентами
№ респондента | Ранжируемые претенденты |
Е Ж 3 Я | |
1 2 3 | 4 3 1 2 3 2 4 1 1 2 3 4 |
4 2 2 1 |
Мы видим, что претенденту Е наши респонденты приписывали ранги 4, 3, 1,..., 4. Искомая рейтинговая оценка VE этого претендента равна среднему арифметическому значению таких рангов:
VE=(4 + 3 + 1+...+ 4)/100. Аналогично,
V ж= (3+2+2+...+2)/100
и т.д.
Мы утверждаем, что такой подход некорректен. Он может увести нас весьма далеко от реальности. Приведем пример.
Предположим, что респонденты какой-либо одной совокупности думают совершенно одинаково и твердо уверены в одном: претендент Е не должен занять вакантную должность. Претенденты же Ж, 3, Я, с точки зрения этих респондентов, примерно одинаково пригодны на должность, и наши респонденты с большим трудом их ранжируют, скорее отдавая дань вежливости исследователю, чем в действительности отражая свои пристрастия.
Тогда на упомянутом выше гипотетическом психологическом континууме точки, отвечающие оцениваемым претендентам, займут примерно следующее положение (рис. 1.1).
Рис. 1.1. Расположение претендентов на числовом континууме респондентами первой совокупности
Предположим также, что респонденты какой-то другой совокупности, рассуждая одинаковым образом, уверены в том, что вакантный пост должен занять 3 и что остальные претенденты одинаково непригодны для занятия этой должности. Но и эти респонденты, хотя и с трудом, все же ранжируют всех претендентов (рис. 1.2).
Рис. 1.2. Расположение претендентов на числовом континууме респондентами второй совокупности
Нетрудно проверить, что для респондентов первой совокупности средние ранги претендентов Я и Ж будут равны соответственно 2 и 3, а для респондентов второй совокупности — 3 и 2.
Предположим теперь, что мы должны дать ответ претенденту Ж на вопрос о том, среди какой из двух рассматриваемых совокупностей респондентов он пользуется большей популярностью. Наш ответ однозначен — среди второй (соответствующий рейтинг не только относительно выше, но и в абсолютном плане приличен: представители второй совокупности ставят этого претендента на второе место, представители первой — на третье). Ж организует встречу с респондентами рекомендованной совокупности и вместо "любви" наталкивается на "гнилые помидоры".
В чем же наша ошибка? Нетрудно понять, что неоправданным было наше приписывание претендентам чисел. Мы как бы подменяли истинное мнение респондента тем, о чем он не говорил, "додумывали" за него: респондент просто отмечал, что ставит 3 на первое место, Ж— на второе, Я — на третье, а мы полагали, что он приписывает 3 число \,Ж— число 2, а Я — число 3. Сделав это
предположение, естественно, мы полагали, что с точки зрения этого респондента различие между Ж и 3 равно различию между Я и Ж (ведь 2 — 1 = 3 — 2). А это могло быть совсем не так.