Комбинированная выборка – соединение в многоступенчатой выборке различных приемов отбора.
Многоступенчатая выборка – на каждой ступени меняется единица отбора в силу отсутствия информации обо всех единицах генеральной совокупности.
При этом совокупность объектов, отобранных на предыдущем этапе (ступени) становится исходной для отбора на следующем. Соответственно различают единицы отбора первой ступени (первичные единицы), единицы отбора второй ступени (вторичные единицы) и т.д. Объекты самой нижней ступени, с которых ведется непосредственный сбор информации, называются единицами наблюдения.
В многоступенчатой выборке каждая единица отбора представляет собой гнездо единиц более низкого уровня, поэтому многоступенчатый отбор позволяет локализовать выборку в меньшем числе точек. Большой массив социолог начинает последовательно сужать, проходя множество ступеней.
При этом не стоит забывать: чем больше ступеней в многоступенчатом отборе, тем больше ошибка выборки. В любом случае при многоступенчатом отборе ошибка всегда больше, чем при простом случайном. И еще: на каждой ступени все равно применяется случайный отбор.
К многоступенчатому отбору прибегают в тех случаях, когда генеральная совокупность имеет настолько большой объем, что простой случайный или систематический отбор элементов привел бы к чрезмерному распылению выборки по всей территории. Попросту говоря, такой метод применяют в тех случаях, когда изучают достаточно большие группы людей или крупные общности, скажем регион или город.
+см.выше
45. Понимание ошибки выборки. Её типология. Определение фактической ошибки выборки.
Ошибка выборки — отклонение средних характеристик выборочной совокупности от средних характеристик генеральной совокупности.
На практике ошибка выборки определяется путем сравнения известных характеристик генеральной совокупности с выборочными средними.
Сравнение средних генеральной и выборочной совокупностей, на основе этого определение ошибки выборки и ее уменьшение называется контролированием репрезентативности.
Ошибка выборки обусловливается двумя факторами: методом формирования выборки и размером выборки.
В методике проведения социологических исследований существует два вида ошибок выборки:
1. систематические.
2. случайные или вероятностные.
Систематические ошибки выборки являются производными непрофессиональных действий самих социологов и поэтому характеризуются множественностью своих проявлений. Они отражают:
• неверное знание социолога о тех признаках, характеристиках и свойствах, которые присущи данной генеральной совокупности (эмпирического объекта);
• отсутствие точной информации о границах генеральной совокупности;
• неверный принцип подбора и обучения технических сотрудников - анкетёров, наблюдателей, кодировщиков, интервьюеров и др.;
• неверную оценку качественных характеристик респондентской аудитории, в которой будет проводиться данное социологическое исследование – уровень информированности о данной проблеме, уровень личной заинтересованности и др.;
• терминологический язык инструментария (бланков, анкет), который не воспринимается аудиторией в таком контексте, в котором его позиционировали социологи. Терминологический язык должен быть максимально приближённым к обыденной речи.
Эти ошибки негативно влияют на репрезентативность выборки и, как правило, приводят к сложно устранимым искажениям и неверным результатам всего социологического исследования. В этом случае единственным выходом является повтор полевого этапа социологического исследования.
Кроме того, существуют также случайные или вероятностные ошибки, которые допускает социолог нечаянно. Это связано с тем, ряд эмпирических объектов являются недоступными для непосредственного изучения характерных особенностей, эмпирических признаков единиц исследования, которые формируют генеральную совокупность. Поэтому, социологи вынуждены на основе анализа документальных источников создавать так называемую гипотетическую генеральную совокупность, что в свою очередь способствует формированию случайных ошибок, которые искажают существующую реальность.
В отличие от случайных ошибок систематические ошибки при возрастании объема выборки не уменьшаются.
Систематические ошибки легче предупредить (по сравнению со случайными), но их очень трудно устранить. Предупреждать систематические ошибки, точно предвидя их источники, лучше всего заранее — в самом начале исследования.
Вот некоторые способы избежать ошибок:
♦ каждая единица генеральной совокупности должна иметь равную вероятность попасть в выборку;
♦ отбор желательно производить из однородных совокупностей;
♦ надо знать характеристики генеральной совокупности;
♦ при составлении выборочной совокупности надо учитывать случайные и систематические ошибки.
Фактическая ошибка выборки – разность между известными характеристиками генеральной совокупности и полученными результатами
Оф = Рг% – Рв%,
Рг% - величина в процентах данного параметра в генеральной совокупности.
Рв% - величина в процентах данного параметра в выборочной совокупности.
Теоретическая ошибка выборки
Она исчисляется только для случайного отбора.
m 2 = m 2сл + В2, где
m сл - характеризует величину отклонений выборочной совокупности от ее математического ожидания, т.е. от средней из выборочных средних,
В – характеризует систематическую ошибку и является разностью между математическим ожиданием выборочных средних и истинным значением средней, т.е. средней генеральной совокупности.
46. Подготовка и обработка данных в социологическом исследовании: содержание и последовательность осуществления. Способы и возможности использования ЭВМ.
С социологическими данными можно производить следующие операции: 1) подготавливать их для обработки; шифровать, кодировать и т.д.; 2) обрабатывать (вручную или с помощью компьютера); табулировать, рассчитывать многомерные распределения признаков, классифицировать и т.д.; 3) анализировать; 4) интерпретировать.
Обработка данных включает в себя следующие компоненты: Редактирование и кодирование информации. Основное назначение этого шага состоит в унификации и формализации той информации, которая была получена в ходе исследования.
С точки зрения использования технических средств выделяют два вида обработки социологической информации: ручную и машинную (с использованием средств вычислительной техники). Ручную обработку используют в основном в качестве первичной при небольших массивах информации (от нескольких десятков до сотни анкет), а также при относительно простых алгоритмах ее анализа. Вторичную обработку информации проводят с помощью микрокалькулятора или другой вычислительной техники. Примером социологических исследований, в которых часто используется ручная обработка, являются пилотажные, экспертные и социометрические опросы.
Однако основным средством анализа и обработки данных в настоящее время являются ЭВМ, в том числе персональные компьютеры, на которых осуществляется первичная и большинство видов вторичной обработки и анализа социологической информации. При этом анализ и обработка социологической информации на ЭВМ проводятся, как правило, посредством специально разрабатываемых машинных программ, реализующих методы анализа и обработки социологических данных. Эти программы обычно оформляются в виде специальных наборов программ или так называемых пакетов прикладных программ анализа социологической информации.
Между тем анализ и обработка социологической информации как целостное образование составляет этап эмпирического социологического исследования, в ходе которого с помощью логико-содержательных процедур и математико-статистических методов на основе первичных данных раскрываются связи исследуемых переменных. С определенной долей условности методы обработки информации можно разделить на первичные и вторичные. Для первичных методов обработки исходной информацией служат данные, полученные в ходе эмпирического исследования, т. е. так называемая `первичная информация`: ответы респондентов, оценки экспертов, данные наблюдения и пр. Примерами таких методов являются группировка, табулирование, расчет многомерных распределений признаков, классификация и др.
Вторичные методы обработки используют, как правило, для данных первичной обработки, т. е. это методы получения показателей, рассчитываемых по частотам, сгруппированным данным и кластерам (средних величин, мер рассеяния, связей, показателей значимости и т. д.). К методам вторичной обработки можно также отнести методы графического представления данных, исходной информацией для которых служат проценты, таблицы, индексы.