«Обратный перевод» с языка анкеты на язык исследователя
В первой половине репрезентативного статистического исследования основная задача заключается в разложении некоторой целостности на составляющие ее элементы, во второй половине исследования необходимо вновь объединить элементы в единое целое. Попытаемся разъяснить это в ходе дальнейшего изложения.
Сначала задача исследования (вопрос программы) должна быть выражена с помощью анкеты, а это всегда означает формулирование задачи (за исключением простейших, которые встречаются довольно редко) в виде нескольких вопросов анкеты. Понятно, что качество исследования в значительной степени зависит от точности и полноты выражения задачи исследования в вопросах анкеты, от качества формулирования вопросов.
При этом элемент абстракции не может быть устранен полностью: ведь конкретный вопрос нужно сформулировать так, чтобы он был приемлем для всех респондентов. Конкретность отдельного вопроса — всегда ограниченная определенной в анкете последовательностью вопросов и классификацией ответов респондентов по установленным категориям — становится явной для интервьюера только во время опроса.
При анализе происходит «обратный перевод» вопросов анкеты в вопросы (задачи) исследования и таким образом одновременно осуществляется воссоединение ранее разделенного. На этом этапе усилия направлены на достижение абстракции, вид и степень которой были заданы при определении целей исследования. Для выполнения первого шага — составление схемы анализа анкеты для обсчета собранного материала — нужноиметьпредставление о том, для решения каких проблем организовано исследование. Такого рода работа не может быть передана техническому персоналу. Неправильное кодирование в настоящее время приводит к большему числу ошибок, чем неправильная выборка, считает директор одного из исследовательских институтов рынка и потребления в Англии, и с ним нельзя не согласиться[133].
Система кодирования
Возьмем пример из одной анкеты: «Давайте подумаем о том, что нас ждет в ближайшем будущем — я имею в виду наступающий год. Исполнения какого желания Вы больше всего хотели бы в этом году?» (При уточняющем вопросе независимо от его направленности — личные заботы или общественные — это будет звучать так: «О чем Вы думаете в первую очередь?») Непосредственно вовремяинтервьюбылизаписаныследующиеответы:
«Навестить детей...»—«Всеобщее спокойствие и мир в стране»— «Получить в скором времени квартиру побольше»— «Если бы можно было — выиграть в лотерею столько, чтобы иметь возможность работать только у себя дома; но из-за этого я не стану ленивым»—«Хорошая погода для доброго урожая»—«Путешествие в Вену»— «Здоровье»—«Отпуск вместе с мужем»—«Побольше зарабатывать»— «Чтобы не было войны»—«Чтобы сын больше заботился обо мне»—«Чтобы поправилось мое здоровье»— «Дожить до серебряной свадьбы»—«Погасить долги за новый дом»—«Получить назначение на работу за границу».
«Хотела бы выйти замуж»—«У меня нет никаких желаний»— «Чтобы жена и я были здоровы и чтобы мой жилец не доставлял мне хлопот»—«Чтобы^моя футбольная команда перешла в высшую лигу»—«Здорового наследника»— «Чтобы мне дали должность чиновника».
Эти ответы невозможно подсчитать в том виде, как они записаны интервьюерами. Поэтому сначала их надо упорядочить, закодировать, то есть объединить (за этим последуют другие аналогичные процедуры). Для упорядочения ответов разрабатывается достаточное число групп или категорий, чтобы охватить ими все полученные ответы респондентов. Определение групп и сортировка ответов по группам — в этом и заключается процедура кодирования. Процесс упорядочения кажется простым, в действительности это трудная задача. Совокупность групп или категорий можно сравнить с сетью рыбака, в которой величина и тип ячеек определяет улов. Так, например, для вопроса «Исполнения какого желания Вам больше всего хотелось бы в наступающем году?» можно сплести грубую сеть, рассортировав ответы на две категории — «высказано желание» и «нет желания». Сквозь ячейки такой сети проскальзывает тип и содержание желания, и для дальнейшей работы интересная информация потеряна.
Система кодирования определяется техникой обработки
Система кодирования зависит от техники, которая будет применена для обработки данных. Если запланировано — что теперь случается редко — обрабатывать результаты без машин, без технических средств, вручную, то в этом случае имеется наибольшая свобода. Тогда для классификации ответов на каждый вопрос можно формировать любое количество групп, эти группы можно обозначить любым девизом или буквами, цифрами или отметить любым цветным карандашом. При ручной обработке рекомендуется (особенно если анкеты велики по объему) подготовить для каждой анкеты бланк кодирования и на него переносить обозначения зашифрованных ответов. Тогда можно легко сортировать материал для подсчета результатов по отдельным группам и не перебирать каждый раз все анкеты.
Самый употребительный способ — это обработка данных на перфокартах с помощью электромагнитных или электронных счетно-перфорационных машин и табуляторов. Системы различныхфирм (ИБМ,БУЛЛ, Пауэрс й т. д.) не имеют принципиальных различий, они отлй-чаются технически, что, однако, необходимо учитывать при выборе системы кодирования. Как правило, перфокарты машинной сортировки имеют 80 колонок. Каждая колонка имеет в свою очередь строки, пронумерованные от 0 до 9, и два дополнительных поля наверху, так что в каждой колонке возможны 12 перфораций, а на всей перфокарте умещается 960 групповых признаков. Это число можно значительно увеличить, установив для групповых признаков различные комбинации. Например, применяют двойную комбинацию — перфорируют 1 и 2 в одной колонке, 1 и 3, 1 и 4, 2 и 3, 2 и 4 и т. д. Тогда на одной колонке умещается 66 признаков. Если не ограничиваться двойной комбинацией, а использовать все возможные комбинации из 12 перфорируемых мест, то на одной колонке можно уместить 4096 групповых признаков. Можно также применить комбинацию из перфорации на двух колонках и, ограничившись двойной комбинацией, уместить на двух колонках 276 признаков.
В зависимости от объема анкеты, логической схемы обработки и мощности используемой техники — имеется в виду не скорость подсчета, а многообразие производимых операций (расчет многочисленных признаков за одну операцию) — при разработке системы кодирования следует решить, будут ли данные одного интервью размещены на одной перфокарте или на нескольких, делать ли в одной колонке одну перфорацию или несколько. Иллюстрацией могут служить примеры из анкеты, приводимые на с. 211 и далее. Справа на полях, около кодов для ответов, Вы^видите (с некоторыми перерывами) технические пометки, указывающие данные для перфорирования в 27—45-й колонках. Здесь же показано, что в 30-й колонке размещаются результаты двух сообщений.
Система кодирования выглядит иначе, если опрос обрабатывается при помощи счетных лент, имеющих цветные отметки по краям. При этом наглядно проявляются (что особенно важно, если о них не предполагают) взаимосвязи между фактами, поведением и мнениями[134].
План кодирования создается в два этапа
План Кодирования данных опроса возникает не сразу после завершения интервью: его разработка осуществляется в два этапа. Первый этап проводится параллельно с подготовкой проекта анкеты. Анкета в том виде, в каком она отсылается интервьюеру, уже содержит большую часть плана кодирования, в частности в нем указаны многие категории для классификации ответов, а также содержатся технические пометки для машинной обработки: на каких колонках перфокарты должны быть записаны ответы на те или иные вопросы, какие строки в колонках должны быть резервированы для некоторых категорий ответов. Поэтому уже при составлении анкеты надо в общих чертах знать, как позднее будет осуществляться анализ или по крайней мере какие возможности следует предусмотреть.
Категории ответов в плане кодирования включаются в анкету заранее, их интервьюер использует для классификации ответов конкретных респондентов. Эти категории для классификации предлагаются также во время опросаввиде перечней и накарточках.
Эти вспомогательные средства для обеспечения единообразия и полноты сведений в интервью одновременно служат целям обработки. Поэтому исследователи стараются целесообразно использовать их в этих двух аспектах. В случае противоречия, однако, предпочтение отдают тому приему анкетной техники, который обеспечивает легкое и беспрепятственное течение интервью.
Это предвосхищение процедуры кодирования при создании анкеты, естественно, предполагает тщательную подготовительную работу по созданию полной и реалистической системы ответов в схеме вопросника.
Если есть Сомнения, набор предлагаемых ответов в анкете всегда можно расширить с помощью «открытой двери» в виде примечания: «Если другой ответ — пожалуйста, впишите его здесь!» Полученный ответ проверяется на второй стадии работы над планом кодирования: укладывается ли он в набор предусмотренных ответов или лучше выразить его дополнительными категориями. Предусмотренные ответы всегда сильнее, всегда имеют больше шансов быть отмеченными, чем ответы, сформулированные самими респондентами и записанные интервьюерами от руки.
Каким же образом при указании предполагаемых ответов могут возникнуть рассогласования между техникой сбора и техникой обработки данных? Возьмем два примера. Для обработки и анализа употребляется грубая классификация, а опрашиваемые отвечают более дифференцированно, более конкретно. Интервьюеру же не следует поручать объединение ответов в группы и обозначение их с помощью понятия — отчасти, чтобы избавить его от лишнего труда, а прежде всего потому, что объединение конкретных ответов в группы предполагает знание о целях исследования. В таких случаях можно рекомендовать следующее решение: в анкете указаны несколько ответов —в формулировке опрашиваемых, однако все ответы, попадающие при кодировании в одну группу, обозначены одинаково — например, 6 в колонке 24. Это гарантирует, что при обработке, они будут рассматриваться как одна группа.
Второй пример: при обработке и анализе желательно получить более тонкую дифференциацию ответов — сколько дней, недель или месяцев назад респондент был в последний раз у врача. Если необходимые 12 категорий включить в анкету, то интервьюеру будет трудно найти соответствующую группу. Для него проще работать со следующейсхемой:
(__ дней...недель ------ месяцев...лет назад
НИКОГДА НЕБЫЛУВРАЧА ()
В этом случае интервьюер записывает данные в том виде, в каком он получает их от опрашиваемого, а позже в институте осуществляется классификация ответов по 12 желательным категориям, а также соответствующая кодировка: рядом с вопросом на полях анкеты пишется номер кода, который соответствует ответу, или отмечается кружком уже имеющаяся в анкете цифра. Например, номер 2 для ответа «последнее посещение врача 8—14 дней назад». Это значит, что в колонке перфокарты к этому вопросу будет сделана прорезь на месте «2». Эти примеры показывают практическое действие общего принципа в конкретных случаях. Здесь этот принцип означает: разгрузить интервьюера, передать работу центру по обработке данных в институте.
План кодирования не может быть разработан в один этап одновременно с подготовкой анкеты по двум причинам.
1. Некоторые вопросы должны быть открытыми,потомучтоневсегдаможнопредусмотретьответыбезглубокого предварительного изучения, а для этого не хватает времени или средств, или это неэкономично, поскольку предлагаемые в анкете закрытия могут повлиятьна высказывания опрашиваемого или на восприятие интервьюера, таккаквозможнотакое огромноеколичествоответов, что анкета становится необъятной.
2. Для обработки и анализа ответы на вопросы должныбытьперенесенына перфокарты в обобщенном виде(обобщающее кодирование) — как дополнение или вместозаписи многочисленных подробностей, которые неизбежныдля процедуры интервьюирования. Например, необходимовыявить типы радиослушателей и изучить их мнениео радиопрограммах. Эти типы можно вычленить на основании ответов на следующие вопросы: «Что предпочитаетеслушать?»,«Насколько внимательноотноситесь к передачам?», «В какой обстановке обычно слушаете?», «Какиеи сколько радиопередач пользуются популярностью?»,«Сколько часов в день в среднем затрачивается на прослушивание?», «Насколько привлекательны программы передач?»— И т. п. Обобщенное кодирование здесь возможнолишь после получения заполненных анкет. Часто обобщенияподобногородавозможнылишьтогда, когдаужеимеются перфокарты с нанесенными на них даннымии с помощью машины найдены целесообразные группировки. Подготовленные машиной группировки дополнительнонаносятся на отдельные перфокарты. Этот путь предполагаетпереноснаперфокартывсехполученных данных, а также результатов обобщенного кодирования. Часто это невозможно из-за нехватки места, тогда обобщенное кодирование проводится непосредственно на анкетах.
Приведенный выше вопрос «...осуществления какого желания Вы больше всего хотели бы в наступающем году?», как и другие открытые вопросы, должен обрабатываться на втором этапе подготовки плана кодирования. Иногда уже на первом этапе для открытых вопросов предусматривается «полевое кодирование». В этих случаях текст вопроса не дает никаких указаний на тип возможного ответа, в анкетах содержится значительное число категорий, и интервьюеры должны в соответствии с этими категориями классифицировать ответы респондентов. Это предъявляет очень высокие требования к интервьюеру и может привести к неисчислимым ошибкам. Однако этот метод все же можно применять, когда желательны спонтанные ответы (что достигается обычно в случае открытых вопросов) и если в то же время хотелось бы предложить интервьюеру в сложных случаях самостоятельно принимать решение о наилучшей классификации ответов: он слышит ответ целиком, видит опрашиваемого и непосредственно воспринимает действительность. Два примера:
1. «КакойцветВамбольшевсегонравится?» Голубой(V),фиолетовый (X),зеленый (0),красный (1),желтый (2),оранжевый (3), коричневый (4), серый (5), черный (6), белый (7), ДРУГИЕЦВЕТА (записать):
2. «Видели ли Вы в последние месяцы сон, о котором Вы вспоминаете до сих пор?» Если да, то —«Что Вам снилось?» (Интервьюеру: «Пожалуйста, классифицируйте ответ; возможны несколькоответов!»)
О работе, о профессии (V). О членах семьи, родственниках (X). О войне (0). О смерти (1). Об умерших (2). Путешествия, поездки (3). О деньгах (4). О змеях, о пауках, неприятных насекомых (5). Много воды (6). О том, как я летаю (7). О том, как я падаю в пропасть (8). О том, как я хочу и не могу пошевелиться, побежать (9). О том, что меня преследуют (V). НИЧЕГО ИЗ ПЕРЕЧИСЛЕННОГО (X).
«Общее впечатление», которое имеется у интервьюера и которое хотят уловить с помощью «полевого кодирования», безусловно, имеет много привлекательного, бывает постоянным соблазном при работе с данными опросов. На первый взгляд кажется, что «полевое кодирование»— лучший метод. Однако такое применение метода не всегда надежно. При этом часто подвергается опасности статистическое качество исследования.
Семь правил разработки категорий подсчета для ответов на открытые вопросы
Обратимся снова к примеру о «самой большой надежде в наступающем году». Работа начинается с просмотра около 200 анкет — своеобразной небольшой выборки внутри всего опроса. Предстоит найти подходящие категории для кодирования полученных ответов.
Можно сформулировать некоторые правила, которые следует учитывать при разработке такого кодирования.
1-е правило', один логический уровень.
Группы ответов должны логически относиться к одному уровню. Это правило нарушено в следующих группах кодирования:
1. Надеждаостатьсяздоровым.
2. Надежда на благополучие членов семьи.
3. Надежда на улучшение материального положения, на улучшениеэкономического положения в стране.
4. Надежданасохранениемира.
5....и т.д.
Единая логика нарушена здесь включением «надежды на благополучие детей, членов семьи». Если требуется одновременное кодирование на различных логических уровнях, то классифицировать ответы приходится многократно по нескольким основаниям,например:
A. 1. Пожелания, надежды относительно самого себя.2. Пожелания, надежды относительно членовсемьи,
близких.
3. Пожелания и надежды относительно всего общества. Б.1. Пожелания относительно материального, финансовогоположения.
2. Пожелания здоровья.
3. Пожелания относительно профессии.
4....и т.д.
B. 1. Пожелания и надежды на укрепление, сохранение
существующего положения.
2. Пожелания, надежды на изменения, на достижение цели.
3. Пожелания, надежды на восстановление прежнего положения.
2-е правило: четкие различия между категориями. Категории одногологического уровня должныбыть четко различимы, чтобы при сортировке ответов не возникали сомнения, относится ли ответ к той или иной категории. Приблизительный перечень категорий кодирования, приводимый ниже, не обладает четкостью, категории частичнопересекаются:
1. Пожелания относительно приобретений (телевизор,стиральная машина, автомобиль и т. д.).
2. Пожелания относительно профессии, работы, повышенияуровня жизни.
3. Надежда на выигрыш в лотерее или тотализаторе.
4.... и т. д.
Схема кодирования с более четкими категориями может выглядеть следующим образом:
1. Надежды в связи с материальным положением, а также пожелания о приобретении чего-либо. В случае^если должна быть зафиксирована частота пожеланий о выигрыше в лотерею или тотализатор, то в схеме кодирования дополнительнок пункту1предусматривается:
2. Дополнительныйпункт: надеждана выигрыш в лотерею или тотализатор.
Тогда ответ о лотерее будет отмечен кодом «1» и дополнительно кодом «2».:3. Пожелания в связи с профессией.
4.... ит. д.
Другая подробная кодировка того же материала может выглядеть следующимобразом:
1. Конкретные пожелания о приобретении предметов длительного пользования (автомашина, холодильник, телевизор, мебель и т.д.);
2. Желаниеприобрести недвижимое имущество: земельный участок, дом,собственную квартиру;|
3. Повышение заработка, дохода (зарплата рабочего, служащего, доходы самостоятельных предпринимателей, повышениепенсий,повышениедоходаоткапиталовложений);
4. Стабильность или снижение цен;
5. Выигрыш влотерею,тотализатор;
6. Другие пожелания, связанные с материальным (финансовым)положением;
7. В общем виде выраженные надежды на улучшение материальногоположения, повышение жизненно гоуровня.
Так же подробно можно классифицировать пожелания в связи с профессией — выдержать экзамены, отношение к конкретному предприятию, к определенной деятельности, продвижение, сохранение рабочего места, успешная смена профессии, возвращение к приобретенной специальности, благоприятные изменения в профессиональной сфере: в отношениях с руководством, с коллегами и т. д. Пробное распределение ответов малой выборки из 100—200 анкет покажет, какие из этих категорий на практике действительно будут работать и какой тип ответов будет встречаться так редко, что их придется либо включить в категорию более высокого уровня абстракции, либо просто оставить в разделе «прочие».
Удалось ли разработать схему кодирования, обладающую четкими различимыми категориями, — это можно легко проверить в практическом кодировании: в рамках одного логического уровня каждый ответ (или каждый аспект сложного высказывания) может быть отнесен лишь к одной категории.
Материал может быть многократно закодирован на более высоких и более низких уровнях абстракции — например, как дополнительная, подчиненная позиция кодирования {дополнительный пункт в схеме): «Пожелание выиграть в лотерею или тотализатор» в дополнение к категории «Пожелания в связи с материальным положением». Наоборот, к детализированным категориям (см. выше семь категорий «Конкретные пожелания приобрести товары длительного пользования») можно добавить собирательные, обобщающие категории: «Финансовые, экономические пожелания». Собирательные категории технически облегчают подсчеты и составление таблиц, так как тем самым уже осуществляется процедура обобщения. Просто цитаты из высказываний опрашиваемых не пригодны для обозначения категорий кодирования («И дальше чтобы был мир и спокойствие в стране», «Маленький домик»). В них не содержится необходимого четкого отличия от других категорий, нет достаточной степени обобщения. Категории должны быть безупречно оформлены с помощью понятий.
3-е правило: не ориентироваться на буквальную словесную форму высказываний респондентов, различные слова могут обозначатьодноитоже, оченьпохожие слова могут значить разное.
Статистические подсчеты требуют большой степени абстракции, которая необходима также для «кристаллизации» категорий кодирования. Это зависит от выявления общего элемента в пестрых, на первый взгляд совершенно разнотипных высказываниях опрашиваемых, от того, насколько четко при кодировании выявлен смысл сказанного респондентом. С другой стороны, это зависит от умения узнавать различные первоосновы в одинаково звучащих ответах и от соответствующего кодирования таких ответов в различных категориях.
Два простых примера в качестве иллюстрации. Вопрос: «Какую скатерть Вы предпочитаете для обеденного стола — матерчатую или пластиковую?» Ответ: «Матерчатую». Дополнительный вопрос: «Почему?» На этот вопрос были получены такие ответы: «С материей стол уютнее»— «Матерчатые скатерти приятнее и теплее»—«Они выглядят более празднично»—«Матерчатые скатерти симпатичнее»—«Они выглядят приятнее и уютнее». Другие ответы гласили: «Пластик кажется холодным»—«Пластик неуютный» и т. д.
Первыйвариантсхемыкодированиявыглядел 'так: Категория 1: Матерчатые скатерти уютнее, теплее, симпатичнее, приветливее. Категория 2: Скатерти из пластика холодные, неуютные.
Такая рубрикация ошибочна. Указанные ответы следует кодировать не двумя категориями, а одной: «Скатерть из материи уютнее, теплее, приветливее, красивее, чем скатерть из пластика».
Второй пример. Вопрос интервью: «Американцы потребовали от нас, чтобы мы выделили четыре миллиона марок на экономическую помощь развивающимся странам, и наше правительство в Бонне согласилось с этим требованием. Как Вы к этому относитесь? Считаете ли Вы, что наше правительство действовало правильно, соглашаясь с американскими требованиями, или Вы считаете, что правительстводолжнобылоотклонить их?»[135]
Респонденты следующим образом объясняли свои ответы «Правильно поступило»[136]:
«Правильно, потому что американцы помогли нам»— «Мы перед ними в долгу»—«Правильно, потому что мы им должны деньги, свой долг надо всегда возвращать»— «Долги всегда нужно возвращать»—«Если берешь в долг, надо отдавать деньги»—«Правильно, потому что мы им много должны». !
Эти ответы следует кодировать не как одну группу «Мы им должны и обязаны возвратить свой долг», а в двух разных категориях:
'Это было сделано правильно потому, что:
1. «Американцы нам помогли» (сюда относится также«Мы многим обязаны американцам»—«Немцы в долгуперед (американцами»—«Мы им должны»).
2. «Мы должны им деньги» («Следует выплачиватьдолги»).
В этом примере необходимо отделить моральные обязательства от финансовых, хотя в обоих случаях употребляется слово «долг».
4-е правило: для каждого ответа соответствующая категория.
Ответы респондентов должны быть возможно полно отражены в категориях кодирования (разумеется, без натяжек). Если в пробной классификации 100—200 ответов больше 5% попадает в графу «прочее», то схема кодирования несовершенна. Проверка «непослушных» ответов, которые не включены ни в одну группу из предложенных, ведет к обнаружению конструктивных ошибок в схеме в целом. После перестройки схемы клубок «прочих ответов» обычно легко разматывается.
5-е правило: избегать лишней «бережливости», некоторыми ответами можно пренебречь.
Действие названного выше принципа не беспредельно. Не всегда следует стремиться включить все ответы, записанные интервьюерами для открытых вопросов, якобы из бережливости — чтобы ничего «не пропало». По крайней мере в двух случаях следует решительно отказаться от имеющихся ответов.
Во-первых, в детальном кодировании нет необходимости,если цельисследованиянетребует полногоучета всех обстоятельств, нужно лишь выяснить частоту и взаимозависимости между определенными типами ответов. Это может проиллюстрировать пример о «Пожеланиях в будущем году»: может быть, для целей небольшого исследования важно лишь узнать, сколько и какие люди — если спросить их неожиданно — пожелают себе в первую очередь здоровья. Все другие ответы в этом случае при кодировании можно оставить без внимания («выборочное кодирование»).
Во-вторых, не нужно кодировать «интересные ответы», если они не относятся к предмету опроса. Предположим, в ответах на вопрос о «пожеланиях в наступающем году» часто встречаются записи интервьюера такого рода: «Прошедший год принес мне большие разочарования». Этот ответ не причина для включения новой категории в схему кодирования. Мнение о прошедшем годе не интересовало исследователей. Записан ли этот ответ в анкете или нет — зависит от разговорчивости респондента и от прилежания интервьюера. Поэтому кодирование таких ответов не даст статистически значимых результатов.
6-е правило: разрабатывать однозначные категории.
Категории кодирования должны быть сформулированы однозначно. Для проверки их однозначности обычно организуют параллельное кодирование выборки в 100— 200 ответов несколькими участниками группы обработки независимо друг от друга. Для этого берут новый материал: не те ответы, на основе которых разрабатывалась схема кодирования. Затем сравнивают, насколько совпадают результаты распределения ответов по одинаковым категориям.
В хорошо сработавшейся группе обработки эта проверка еще не дает полной гарантии качества. Такая группа справилась бы с заданием, если бы работала с такими нечеткими категориями кодирования, как «политически настроен очень правильно»—«политически настроен довольно правильно»—«политически настроен не совсем правильно»-—«политически настроен неправильно».
7-е правило: категории кодирования определяются целью исследования в сочетании с конкретным собранным материалом.
При разработке категорий кодирования нужно учитывать одновременно два обстоятельства: цели исследования и материал, фактически полученный в анкетах.
Было бы ошибкой составлять категории кодирования, не просмотрев предварительно 100—200 ответов. Существует риск, что некоторые из тщательно продуманных категорий не будут работать, потому что не окажется соответствующих им ответов. В то же время другие категории теоретически подготовленной схемы будут поглощать от 80 до 90 процентов всех ответов и многие непредвиденные мнения «пропадут» при обработке. Одинаково вредно забывать, увлекаясь обилием материала, с какой целью вопрос был включен в анкету. Тогда, например, разрабатывается схема кодирования, включающая восемь сортов мяса, десять видов овощей, четыре картофельных блюда — для одного только вопроса: «Что у Вас было на обед в прошлое воскресенье?» Ответы на этот вопрос должны показать, в каких и скольких семьях в воскресенье готовится праздничный обед.
Только задача исследования показывает, насколько оправдано тщательное кодирование ответов, например, на такой вопрос: «На что Вы обращаете внимание, покупая пальто?»—«Не мнется, не стесняет движений, удобное»—«Не очень грязнится, хорошо носится, легко чистится»—«Цвет, рисунок, хороший вид»—«Цена»— «Ценю хорошее обслуживание при покупке и совет»— «Пальто должно мне идти»—«Чтобы оно было из искусственного волокна» и т. д. Вполне вероятно, что при кодировании в одну категорию попадут все ответы, в которых речь идет о шерсти: «Смотрю, чтобы была хорошая шерсть»—«Хорошая шерстяная материя».
Нельзя механически относить в графу «прочие» те ответы, которые в результатах подсчета на предварительном этапе редко встречаются. При обработке вопроса о том, чему стоит посвятить свою жизнь, может оказаться важным специально выделить ответы «христианству», хотя они редко встречаются. Или другой пример (из исследований спроса и предложения товаров). Владельцев предприятий, выпускающих игрушечные железные дороги, очень заинтересовал бы тот факт, что родители практически не упоминают (за исключением незначительного меньшинства) об «опасности игрушки для детей». Для дальнейшего изучения подобных случаев соответствующие анкеты легко найти по перфокартам, на которых отмечена необходимая категория ответов и указан номер анкеты. Можно сделать общий вывод: лучше сначала составить более подробную систему кодов, объединив позднее различные группы в одну. Это не означает, что следует отказываться от тщательной разработки плана анализа и проводить неэкономные процедуры кодирования, после чего подробная сортировка материала все же не будет использована.
Категории надежды: пример схемы кодирования
Здесь приводится отрывок из схемы кодирования ответов на вопрос о самых больших надеждах в наступающем году Для кодирования требуются две колонки на перфокарте. Оно предусматривает несколько уровней абстракции и несколько логических уровней. Каждая группа кодирования иллюстрирована несколькими ответами респондентов. Спорные случаи кодирования при обработке материала заносятся в протокол и учитываются при подготовке окончательного вариантасхемы кодирования.
С 7151% V
Личная сфера Дополнение к (V)
14% X Надежды, связанные с материальным положением, улучшение экономического положения, планы приобретений
Выигрыш в лотерею — шесть раз выиграть в «вест»-лотерею — никаких денежных затруднений — погасить свои долги в новом году — хотел бы заработать больше денег — чтобы мне прибавили пенсию — урегулирование вопроса о пенсиях по старости для крестьян — купить участок под строительство — купить мотороллер — купить автомобиль — иметь газовую плиту
25% 0 Надежды на сохранение здоровья, выздоровление Дополнительнок (0):
20% 1Собственноездоровье, выздоровление.
Чтобыоставатьсявобщем здоровым — чтобывыздороветь или по крайнеймере чтобыбольшене было болей — полностью выздороветь
5% 2Здоровье членовсемьи Чтобы все были здоровы — чтобы выздоровела мать — здоровье дочери — должна думать о своем больном ребенке и надеюсь, что господь бог исполнит мою самую большую просьбу и надежду
9% 3Пожелания в связи с профессией, с работой Дополнительнок (3):
8% 4Пожеланияотносительно собственной профессиональной деятельности.
Получить хорошее место — получить перевод за границу — получить место чиновника — вернуться к работе по профессии — хорошего урожая (фермер) — хорошей погоды (управляющий в сельском хозяйстве)
1% 5 Пожелания успехов в работе для членов семьи
Чтобы сын хорошо учился в школе — успешное окончание школы для дочери — чтобы мой внук успешно сдал экзамены в университет — чтобы муж получил повышение
5% 6Надежды и пожелания для семьи
Свадьба и дети — моя свадьба — родить маленького мальчика — чтобы у меня улучшились отношения в семье — чтобы мой парень женился на мне — я хотела бы переехать к дочери — чтобы мои дети из ГДР еще раз приехали в гости — возвращение сына, пропавшего без вести
2% 7Мечты о путешествии, отпуске, поездке
Несколько дней отпуска — путешествие с мужем во время отпуска — прекрасный отпуск на юге — путешествие в ГДР — поездка в Берлин
3% 8Квартира
Получить большую квартиру — собственная квартира — чтобы вскоре после свадьбы мы тоже нашли квартиру
2% 9 Прочие надежды, пожелания
„Хэппиэнд" в моих сердечных делах — чтобы моя футбольная команда перешла в высшую лигу — чтобы телепрограммы стали интереснее — мне хотелось бы иметь маленького черного пуделя С 7260% VОбщественная сфера Дополнительно к (V)
42% X Сохранение мира и улучшение международного положения
Чтобы не было войны — мир и спокойствие в стране — сохранение мира в Европе и во всем мире — чтобы американцы или русские не начали войны — чтобы нас наконец оставили в покое и избавили от политических махинаций. И т. д.
Кодирование количественных данных
Совершенно другие проблемы возникают при кодировании не слов («качественная информация»), а чисел («количественные данные»): сведений о длине, весе, количестве, отрезках времени, о расходах — сколько денег тратится в год на одежду, сколько в квартире комнатных цветов, каков рост опрашиваемых и т. д. В этих случаях после предварительных расчетов на маленькой выборке нужно также составить классификацию. Например, для расходов на одежду: менее 50 марок, от 50 до 99 марок, от 100 до 149 марок, от 150 до 199 марок и т. д. Для расчета средних величин такие категории имеют ряд недостатков, так как действительная средняя величина в отдельных группах, как правило, лежит не точно посередине. Если нужно определить средние величины для различных групп опрашиваемых — а это обычно бывает необходимо для возможно большего обобщения данных,— то приходится достигать более точных результатов, кодируя данные по бинарной системе:
(1) — 1 марка
(2) — 2 марки
(3) — 4 марки
(4) — 8 марок
(5) — 16 марок
(6) — 32 марки и т. д.[137]
Расходы кодируются комбинацией наибольших величин. Расход в 55 марок получает, например, условное обозначение 6, 5, 3, 2, 1. После получения результатов вычисления с машины можно для каждой исследуемой группы вычислить с точностью до одной марки, какие данные содержались в анкете. При таком кодировании сохраняется возможность разделить всех опрашиваемых на четыре группы в зависимости от величины их расходов.