Элементарные понятия статистики 2.1. Группировка наблюдений
Измеряя характеристики объекта, исследователь собирает первичный статистический материал. Дальнейшая его задача состоит в систематизации и обобщении результатов измерения
Глава 21. Анализ и интерпретация эмпирических данных «1-5
для выявления характерных, существенных черт тех или иных
типов явлений, обнаружения закономерностей изучаемых про-
цессов и проверки гипотез, лежащих в основе исследования.
В основе используемых методов обработки полученных мате-
риалов исследования лежит предварительное упорядочение
первичных данных главным образом при помощи статистичес-
кой группировки и составления статистических таблиц.
Ряды распределения. Результат группировки единиц наблю-
дения по какому-либо признаку называется статистическим
рядом. Обозначим группировочный признак х. Пусть это будет
уровень образования каждого человека в данном списке лиц:
10, 5, 7, 8, 8, 10, 10, 10 (классов). Если отдельные наблюде-
ния расположить в порядке возрастания указанных выше зна-
чений признака, то получим так называемый вариационный
ряд: 5, 7. 8, 8, 10, 10, 10, 10.
По вариационному ряду количественного признака можно
подсчитать, как часто каждое значение этого признака встре-
чается в совокупности. В результате получим частотное распре-
деление для данного признака. Иногда его называют эмпири-
ческим или статистическим распределением.
Для вышеприведенного примера частотное распределение
выглядит так:
Отдельные значения признака (х) 567 8 9 10
Частота(й.) 1 01 204
Объем совокупности (п всего человек) 8
Условимся каждое отдельное значение признака х обозначать
х,, Ху Ху.... х^ (в данном примере это 5, 7, 8, 9, 10 классов).
Абсолютное число, показывающее, сколько раз встречается
то или иное значение признака х, называется частотой и обо-
значается соответственно «р Пу Пу..., п^.
Относительной частотой (чаще всего выражаемой в процен-
тах) называется доля значений признака в общем числе на-
блюдений и обозначается т^, ту ту..., т^.
Сгруппированные данные. Как правило, для последующей
статистической обработки или более наглядного представле-
ния данных отдельные значения признаков объединяются в
группы (интервалы). В этом случае частоты соотносят уже не с
каждым отдельным значением признака, как это делалось в
предыдущем примере, а с рядом значений, попадающих в оп-
ределенный интервал.
816,.Раздел шестой. (Социологическое исследование
Например, распределение уровня образования в вышепри-
веденном примере может быть представлено в виде интерваль-
ного ряда следующем образом:
Образование (классы) (5—7) (8) (9—10)
Частота,,.,-- 2 2 4
Статистические таблицы. Предусмотренные программой ис-
следования и методикой обработки группировки объектов по
каждому из признаков являются основой статистических таб-
лиц, обобщающих исходные данные. По таким таблицам уста-
навливаются, измеряются и анализируются связи между при-
знаками исследуемой совокупности объектов.
Построение таблицы подчинено определенным правилам.
Основное содержание таблицы должно быть отражено в назва-
нии: круг рассматриваемых вопросов, географические границы
статистической совокупности, время, единицы измерения.
Простые таблицы представляют собой перечень, список от-
дельных единиц совокупности с количественной (или каче-
ственной) характеристикой каждой из них в отдельности. В бо-
лее сложных таблицах группировка единиц совокупности мо-
жет осуществляться по нескольким признакам.
Примером последнего типа таблиц может служить таблица 21.1.
Таблица 21.1
Распределение голосовавших во втором туре выборов
Президента России (3 июля 1996 г.) по полу и возрасту'
Проголосовало за | Против обоих | ||
Б. Ельцина | Г. Зюганова | ||
Пол голосовавших | |||
мужской | 54°/, | 41%| | 5%, |
женский | 56% | 39%, | 5%, |
Возраст голосовавших | |||
18—29 лет | 71% | 23%, | 6%) |
30—44 года | 58% | 36%, | 6%, |
45—59 лет | 48%, | 47%, | 5%, |
60 лет и старше | 48%, | 50%, | 2%, |
' По данным всероссийского Ехй Ро11 (опроса на выходе), проведен-
ного Институтом сравнительных социальных исследований (ЦЕССИ)
3'июля 1996 г. Объем выборки — 10 500 человек.
следование
вышепри-
[нтерваль-
Глава 21. Анализ и интерпретация эмпирических данных 81 Т
Такая таблица представляет собой нечто гораздо большее, чем
простой перечень данных, — она является способом и вместе с
тем результатом определенной организации данных. Хорошо
сконструированная таблица позволяет исследователю более четко
представить и описать смысл и сущность изучаемого явления.
Графическая интерпретация
Эмпирических зависимостей
Частотные распределения изображаются также в виде диаг-
рамм и графиков. Главным достоинством графического изобра-
жения является его наглядность. -
Круговые диаграммы. Круговые диаграммы (в виде «пирога»
или др.) чаще всего применяются для представления каче-
ственных характеристик. Например, результаты ответов на воп-
рос анкеты о религиозной принадлежности наглядно можно
представить в следующем виде.
Затрудняюсь ответить 6%
Рис. 21.2. Распределение ответов на вопрос «Считаете ли Вы себя
последователем какого-либо вероучения или нет?»'
Эти же данные могут быть представлены и множеством дру-
гих способов, например в виде столбиковых диаграмм, различ-
ных рисунков..-
Данные всероссийского опроса «Ценности-96», проведенного
ЦЕССИ в марте 1996 г. Репрезентативная выборка населения с 18 лет,
объем выборки — 1500 человек.
834 Раздел шестой. Социологическое исследование
структуры вопросника, но и одновременно программно конт-
ролировать разнообразные ошибки, которые возникают на
этом этапе. Существуют и отечественные разработки программ
данного типа.
Тем не менее ввод данных остается предметом для интенсив-
ного поиска более совершенных решений. Одно из кардиналь-
ных решений, по всей видимости, может быть найдено в про-
цессе поиска эффективных средств прямого считывания скане-
ром информации с анкет. Здесь также наблюдается постоянный
прогресс, и уже сейчас во многих случаях имеет смысл (в целях
экономии времени) обращаться к подобной технологии.
Особо следует остановиться на новых возможностях, кото-
рые открываются перед специалистами в контент-анализе.
В большинстве случаев ввод текста в ЭВМ с помощью скане-
ров и преобразование его в электронный вид не является более
неразрешимой проблемой. Кроме того, все больше СМИ рас-
пространяют информацию электронным способом, и получить
доступ к ней можно, например, через глобальную информаци-
онную компьютерную сеть Интернет.
Статистический анализ данных. Универсальные статистичес-
кие программы для персональных компьютеров обладают та-
кой же мощью и набором сервисных функций, как и системы
для больших машин в прошлом. Среди наиболее известных на-
зовем зарубежные продукты 5Р55 (статистический пакет для
социальных наук), 5А5, 51а1§гарЫсх Р1и5. Все эти компании —
производители программ распространяют их и в России. Ко-
нечно, помимо названных программ существует множество
других, которые решают примерно тот же круг задач.
Среди простейших базовых функций этих программ — пре-
образование переменных в нужный исследователю вид, вычис-
ление любых процентных таблиц распределений признаков.
вычисление средних, дисперсий и других подобных показате-
лей, всевозможных коэффициентов связи. Далее следуют мето-
ды многомерного анализа данных — регрессионный, фактор-
ный, дисперсионный и др. Таким образом, в этих пакетах про-
грамм исследователь-социолог может найти для себя большую
часть того, с чем ему приходится сталкиваться в более или ме-
нее типичных ситуациях. Важно то, что все эти методы интег-^
рированы в одну систему. Правда, если исследователю захочет-
ся воспользоваться разными пакетами программ, то здесь пе-