17. Анализ данных
социологического исследования
Назначение анализа данных
В данной теме будет представлено общее понимание того, что есть обработка и анализ данных массового социологического обследования. Связано данное ограничение с тем, что на кафедре социологии для студентов предусмотрен отдельный курс «Измерение и методы анализа социологической информации».
Проведя исследование, и получив данные, надо заметить, что они (эти данные) далеко не являются выводами, они даже не позволяют сделать эти выводы. То есть социологические данные не могут решить задач исследования. Для этого их необходимо каким-то образом преобразовать, обработать, проанализировать, только после этого появится возможность сформулировать выводы (рекомендации). Этому и служит весь этап анализа информации. То есть социологическое исследование завершается этапом анализа данных.
Назначение данного этапа заключается в том, чтобы:
а) зафиксировать информацию об объекте в количественном виде;
б) определить надежность информации;
в) обобщить результаты, получить выводы;
г) установить (в прикладном исследовании) направление практических рекомендаций.
Таким образом, этап анализа является комплексной процедурой, цель которой – преобразовать полученные данные.
Напомним, что под данными социологического исследования понимается информация, относящаяся к предмету исследования и направленная на решение исследовательских задач. Существуют различные виды данных:
а) внешняя первичная информация – полученная без специально подготовленного инструментария (это документы, статистические данные);
б) первичная информация – полученная с помощью специально подготовленного социологом инструментария (анкеты, бланки наблюдения, интервью и т. д.);
в) данные первичной обработки – обработанная информация в виде таблиц, графиков;
г) индексы – определенным образом сконструированные показатели, мыслительная конструкция, состоящая из нескольких индикаторов.
Этап анализа данных достаточно протяжен во времени и состоит из нескольких стадий: обработки, анализа, описания и интерпретации. Рассмотрим более подробно каждую из них. В широком смысле слова, в этап анализа включают и подготовительную стадию, смысл которой связан с методологической и процедурной частью программы, ведь именно здесь определяется состав признаков объекта, подлежащих измерению; формулируются гипотезы, которые в последствие проверяются; строится инструментарий (шкалы в анкете).
17.2. Понятие обработки социальной информации
и методы обработки
Первая важная стадия этапа анализа – обработка данных .Под обработкой данных понимается преобразование информации, полученной в ходе социологического исследования. Цель этой стадии – сделать данные обозримыми и пригодными для последующего анализа и интерпретации. Обработка – это простейшие механические преобразования, в отличие от анализа, предполагающего более сложные комбинации.
Содержание процедуры обработки заключается в том, чтобы зафиксировать результаты исследования с помощью выбранной системы обозначения. В процедуру обработки входят три компонента: а) эмпирические данные – информация; б) система обозначений, придающая информации строгую форму, наглядность; в) научные понятия, отражающие предметную область изучаемых явлений. Все эти компоненты закладываются еще в программе.
Условно обработку данных делят на первичную и вторичную. Первичная обработка связана с тремя основными действиями, шагами. Во-первых, редактирование, исправление ошибок, уточнение пропусков ответов всего массива собранного материала (анкет). А также устранение противоречивых ответов, выбраковка тех анкет, в которых оказались незаполненными один-два вопроса о социально-демографических характеристиках (пол, возраст и т. д.).
Во-вторых, кодировка как закрытых, так и открытых ответов. Сам процесс кодирования заключается в формализации содержания информации, перевод ее на язык формальной логики. Кодирование выступает связующим звеном между качественной и количественной формализацией информации. Кодируется не содержание ответа, а факт его наличия (отсутствия). Кодировка включает группировку и преобразование ответов в удобную форму. Преобразование ответов осуществляется через систему кодов, обозначений, т. е. информация превращается в упорядоченную систему чисел. В этой системе важно не значение числа, а порядок кодов, который должен быть непрерывным, строго заданным. Каждая группа ответов получает числовой код: либо в строгой линейной последовательности, например, каждому признаку объекта присваивается число (код): мужчина – 1, женщина – 2, руководитель – 3, рабочий – 4 и т. д. Либо фиксируется не ответ, а группа, например, по полу: мужчина – 1, женщина – 2; по статусу: руководитель – 1, рабочий – 2 и т. д. Все типы кодировки предусмотрены программой математической обработки. Социолог чаще всего имеет дело с результатами этой обработки.
В-третьих, начинается непосредственная простейшая обработка: вручную или на компьютере (ЭВМ). Ручная обработка используется при небольших массивах (около 100 анкет), в пилотажах, в экспертном опросе, в социометрии. Но на больших массивах данных этот вид обработки неоправдан, так как неточен и медлителен.
На стадии первичной математической обработки используется совокупность методов расчета показателей, группировка и классификация. В целом – это процедуры упорядочения данных исследования. Посредством этих процедур «уплотняется» имеющаяся информация для последующей работы с ней.
Группировка – это форма обобщения социологических данных, упорядочение единиц наблюдения по какому-либо признаку. Различают простую группировку, где упорядочение данных происходит по одному признаку. Данная процедура состоит из шагов: выбирается признак для группировки; затем осуществляется простое суммирование однородных признаков; составляются номинальные группы; подсчитываются абсолютные величины; высчитываются проценты проявления признака по совокупности. Например, выборочная совокупность группируется по полу, возрасту или лицам, имеющих автомобиль, и т. д. Число лиц, обладающих данным признаком, называют частотой варианты (или численностью группы). Отношение данной частоты к общему числу обследованных называют долей. Так, деление частоты на общее число респондентов есть доля. Сумма долей равна единице. Доля, умноженная на 100, дает процентное соотношение проявления данного признака в выборке. Например, мы опросили 300 человек, из них 100 мужчин, доля варианты «мужчины» равна (100: 300) = 0,3 или 30 %.
Таким образом, группировка позволяет зачислить респондента в ту или иную группу в соответствии с выбранным признаком. Это делается для того, чтобы легче было соотносить данные, сравнивать их между собой. Выбор признака не произвольная процедура, а определяется в соответствии с задачами и гипотезами исследования. В зависимости от шкалы измерения, группировка может представлять собой:
– зачисление респондентов в номинальную группу (по полу, образованию и т. д.);
– упорядочение информации в ранжированном ряду (по степени удовлетворенности, информированности и т. д.);
– упорядочение респондентов по количественному признаку (стаж работы и т. д.).
Перекрестная группировка –это упорядочение (подсчет) данных по двум и более признакам. Задача такой группировки обнаружить какие-либо связи, зависимости, влияющие на изучаемое явление. Для этого необходимо составить ряды чисел (при математической обработке это сделает компьютер, точнее математическая программа), они называются ряды распределений. Эти ряды оформляются в таблицы, которые должны быть соответственным образом оформлены (цифровой материал представлен в абсолютных цифрах и в процентах) и иметь название. После этого социолог и анализирует данные этих таблиц. Можно сравнивать характеристики распределений по средним значениям признака (средняя арифметическая, медиана, мода), анализировать степень разбросанности показателя, рассчитать отклонения. Например, выявить зависимость или соотношение успеваемости студента, живущего с родителями или в общежитии (пример см. ниже.).
Таблица 1
Соотношение успеваемости студентов от места проживания
(в % по столбцу)
Место проживания | Успевает на «отлично» и «хорошо» | Успевает на «удовлетворительно» | Не успевает |
С родителями | 58 | 22 | 5 |
В общежитии | 18 | 53 | 75 |
Отдельно, на квартире | 24 | 25 | 20 |
Итого | 100 | 100 | 100 |
Помимо группировки существует такой метод обработки как типология. Но скорее данный метод относится ко вторичной обработке. Вторичная обработка – это по сути дела анализ, точнее преобразование данных первичной обработки. Понятие тип, типология, типологизация в социологии используется достаточно часто. Под типологией обычно понимается метод разбиения изучаемого объекта на группы. Следует отметить, что типологией называют как процесс разбиения, так и результат этого процесса; по этому для четкости: под типологизацией понимается – процесс разбиения объекта на группы (типы), а под типологией – результат этого разбиения. Полученные в результате разбиения группы, принято называть типами (Иногда в литературе типами называют «идеальные модели»). Данный метод вызван необходимостью либо упорядоченного описания множеств весьма неоднородных объектов, либо изучения каких-то закономерностей на основе анализа таких множеств.
Различают эмпирическую типологизацию, суть которой заключается «в поиске устойчивых сочетаний свойств социальных объектов (или явлений), рассматриваемых в соответствии с описательными гипотезами в нескольких измерениях одновременно» [55. С. 323]. И теоретическую типологизацию – это обобщение признаков социальных явлений на основе идеальной теоретической модели по теоретически обоснованным критериям. Теоретическая отличается тем, что если в эмпирической типологизации устойчивость свойств типа находится путем многократного перебора, (т. е. эмпирически), то в теоретической – критерии свойств выявляются путем логического анализа. Исходной информацией для типологизации является совокупность значений объекта изучения (некоторого набора признаков объекта). Затем на основе содержательного анализа этого набора признаков формируются типы [Подробно: 55. С. 321–334].