Задача построения выборки возникает всякий раз, когда необходимо собрать информацию о некоторой группе или большой совокупности людей. Выборку в той или иной форме используют в ориентированных на «жесткие» статистические методы опросах, в исследованиях политических и культурных элит и даже при отборе «случаев» для включенного наблюдения и качественного анализа.
Статистические (или квазистатистические) обследования населения и ресурсов, судя по всему, зародились одновременно с первыми формами централизованной социальной и политической организации: развитые аграрные общества и древние города-государства нуждались в такой информации и использовали ее при решении разнообразнейших управленческих задач — от фискальной политики до строительства общественных бань. Эти обследования иногда принимали форму сплошных переписей населения. (Об одной такой переписи, имевшей, правда, самые печальные последствия, рассказывает нам книга пророка Самуила: когда царь Давид (X в. до н. э.) осуществил перепись населения древнего Израиля, в стране разразилась страшная эпидемия (2 Цар. 24). Однако значительно чаще приходилось довольствоваться сведениями о какой-то части совокупности: об урожайности судили по пробному обмолоту, о партии товара — по образцу, а о прихожанах — по их духовному наставнику.
Выборка — это подмножество заданной совокупности (популяции), позволяющее делать более или менее точные выводы относительно совокупности в целом. Зачем нужно строить выборки? Прежде всего, из практических соображений, так как выборка экономит силы и средства исследователей. Проведение полномасштабной переписи или сплошного опроса населения требует значительных финансовых и трудовых затрат, которые к тому же могут пропасть впустую в случае, если в разработке методики исследования были допущены принципиальные просчеты.
Другая причина заинтересованности в выборках связана с тем, что выборочная процедура представляет собой удобную и экономичную форму индуктивного вывода [1]. Третья причина заключается в том, что эта процедура реализует фундаментальный принцип рандомизации, т. е. случайного отбора (от англ. random — случайный, выбранный наугад).
Представление о том, что отбор наблюдений должен носить случайный, непредумышленный характер, в общем соответствует нашему интуитивному знанию обусловиях вынесения объективного и непредвзятого суждения. Однако строгая, т. е. математико-статистическая, теория случайной выборки вплоть до конца XIX — начала XX вв. не пользовалась популярностью в среде профессиональных статистиков. Многим исследователям казалось, что в основе отбора должна лежать не «игра случая», а поиск типичных, характерных наблюдений. Это убеждение препятствовало применению в массовых обследованиях методов теории вероятности, достигшей высочайшего уровня развития уже в XVIII— первой половине XIX вв. Применимость выборочного метода для изучения случайно распределенных признаков, например дохода или размера семьи, была впервые обоснована в работах норвежца А. Киэра, англичан А. Боули и К. Пирсона, а также русского статистика А. И. Чупрова[2].
Следующим принципиально важным шагом в развитии выборочного метода стала осуществленная Р. Фишером разработка техники рандомизации в эксперименте и выборочном наблюдении[3]. О роли рандомизации в планировании эксперимента говорится в главе 4. Что же касается выборочного обследования, то оно часто используется как «замена» экспериментального метода. Нельзя провести эксперимент, в котором людям в случайном порядке присваиваются определенные значения переменных «пол» или «цвет кожи». Однако применение выборочного метода и статистического анализа, как мы увидим в дальнейшем, позволяет справляться с этими ограничениями и делать выводы о взаимосвязях между самыми разными переменными, включая вышеупомянутые. Но для того, чтобы такие выводы были обоснованы, нужно устранить любое систематическое влияние «посторонних», смешивающих факторов на изучаемые переменные. Единственным средством для достижения этой цели является абсолютно случайный характер отбора наблюдений. Лишь равенство шансов попадания в выборку для каждого наблюдения, т. е. отбор «наугад», гарантирует от намеренных или ненамеренных искажений. Пусть, например, в ходе опроса мы изучаем влияние пола и рода занятий респондента на его отношение к планированию семьи и ограничению рождаемости. Если используемая нами выборочная процедура ведет к тому, что работающие женщины имеют несколько меньшие шансы стать респондентами, чем домохозяйки и пенсионерки (последних, как известно, проще застать дома), наши результаты наверняка окажутся смещенными.
Поэтому наилучшей моделью отбора считается вероятностная, или случайная, выборка [4], в которой строго соблюдается принцип равенства шансов попадания в выборку и для всех единиц изучаемой совокупности, и для любых последовательностей таких единиц.
Именно с рассмотрения разных подходов к построению вероятностной выборки мы и начнем наше обсуждение, чтобы в дальнейшем перейти к не столь совершенным видам целевого, т. е. не основанного на вероятностях отбора, и их роли в практике социологических исследований.
Выше мы определили, что такое выборка. Сейчас нам необходимо строго определить еще несколько элементарных понятий. Переписью называют процедуру сбора информации о каждом члене изучаемой группы или популяции. Все члены интересующей исследователя группы (популяции) составляют генеральную совокупность. Выборочная процедура обеспечивает обоснованность и «законность» выводов о генеральной совокупности, сделанных на основании небольшой выборки.