На кожному ступені відбору виділяють проміжні об'єкти репрезентації, які у більшості випадків є "природними одиницями", тобто утвореннями природними, такими як політико-адміністративні райони, населені пункти, підприємства, установи, цехи, академічні групи, бригади тощо.
Виділяють два типи об'єктів репрезентації: політико-адміністративні одиниці (область, різні види населених пунктів, сільради тощо) і промислові та сільськогосподарські підприємства, установи, заклади освіти тощо. На кожному проміжному ступені відбору процес виділення об'єктів репрезентації починається з групування їх за певними ознаками у типологічні групи, з яких виділяються один або кілька найтиповіших представників. Під способом районування виділених на проміжних ступенях відбору об'єктів репрезентації розуміють алгоритми або методи типологізації їх (або одиниць спостереження) у групи, з яких відбирають найтиповіших представників.
У соціологічній і статистичній літературі описано низку алгоритмів і методів типологізації елементів у групи. Наведені методи та алгоритми типологізації можна класифікувати по-різному. Залежно від мети типологізації за основу класифікації беруть різні ознаки.
Можна виділити кілька найзагальніших видів алгоритмів і методів типологізації. До першого виду належать усі методи, що ґрунтуються на автоматичній класифікації об'єктів дослідження. Другий вид об'єднує всю сукупність методів, що послідовно пов'язані з застосуванням факторного та кластерного аналізів, за допомогою яких відбувається дальша типологізація об'єктів дослідження. Третій вид описує методи якісного, змістовного аналізу ознак (що, зрозуміло, не виключає використання статистичних методів, що ґрунтуються на взаємозв'язку кількості страт з оцінкою дисперсії базової ознаки або з величиною витрат на проведення дослідження).
Дві вибірки подібні лише тоді, коли тотожні не тільки характеристики, що описують структуру процесу формування вибіркової сукупності, а й набори ознак, на підставі яких відбувається районування об'єктів репрезентації на проміжних ступенях відбору. Інакше застосування одних і тих самих алгоритмів і методів типологізації може призвести до того, що в типові групи буде об'єднано різні об'єкти репрезентації. Отже, незважаючи на те що структура вибіркового процесу залишається незмінною, в результаті матимемо вибіркову сукупність, яка складається з якісно відмінних об'єктів репрезентації на останньому ступені відбору.
Тип відбору об'єктів репрезентації та одиниць спостереження
Побудуємо складну класифікацію типів та видів відбору (тобто відбори класифікуватимуться не за однією, а за кількома ознаками).
На першому етапі класифікації за основний критерій поділу існуючих типів відбору правитиме спосіб виділення одиниць відбору. Це дасть нам змогу виділити три типи відбору: суцільний, випадковий та невипадковий.
Під суцільним мається на увазі відбір, у процесі якого всі одиниці сукупності підлягають обстеженню або всі об'єкти репрезентації переходять на наступний ступінь відбору. Під випадковим відбором одиниць сукупності будемо розуміти відбір, за якого кожна одиниця генеральної сукупності матиме однакову або майже однакову ймовірність потрапити до вибіркової сукупності. Невипадковим (спрямованим) будемо називати відбір, за якого одиниці вибіркової сукупності відібрані за певним критерієм. Випадкові та невипадкові типи відборів мають кілька видів. Коротко охарактеризуємо кожний з них.
Імовірнісні відбори
Під імовірнісними розуміють відбори, за яких, по-перше, кожна одиниця генеральної сукупності зберігає рівну або майже рівну ймовірність бути відібраною до вибіркової сукупності і, по-друге, сформована таким чином вибіркова сукупність має бути досить великою за обсягом. За такого відбору елементи генеральної сукупності представлені у вибірці з імовірністю, близькою до відповідного значення в генеральній сукупності. Отже, у вибірковій сукупності немовби відтворюється розподіл ознак генеральної сукупності, що нас цікавлять.
У теорії вибіркового методу виділяють два різновиди ймовірнісних відборів: повторні та безповторні. Вони різняться між собою не тільки технікою відбору одиниць з генеральної сукупності, а й ступенем точності результатів. Під час повторного відбору одиниці сукупності зберігають однакову ймовірність потрапити до вибіркової сукупності. Це досягається шляхом повернення відібраних одиниць до генеральної сукупності. Відбір немовби починається спочатку. Під чає безповторного відбору ймовірність одиниць потрапити до вибіркової сукупності постійно зростає, оскільки відібрані одиниці вже не беруть участі в подальшому відборі. Зазначимо, що середні квадратичні помилки без-повторних відборів завжди менші від середніх квадратичних помилок повторних відборів такого самого обсягу. Тому використання формул розрахунку статистичних помилок повторної вибірки підвищує надійність результатів, одержаних у безповторному відборі.
Практично ймовірнісна вибірка може використовуватися лише за умови вивчення невеликих об'єктів. Це пов'язане з труднощами складання списків одиниць спостереження, включених до об'єкта дослідження. Ймовірнісний відбір застосовується в тому разі, коли відсутні попередні дані про розподіл потрібних характеристик генеральної сукупності. Це пояснюється тим, що питання про репрезентативність імовірнісної вибірки розв'язується переважно на етапі відбору одиниць дослідження. Цей етап потребує створення умов, за яких елементи генеральної сукупності мають однакову ймовірність потрапити до вибіркової сукупності.
Районований відбір
Одним із видів випадкового відбору є районований відбір. Теорія та практика вибіркового методу свідчать, що ймовірнісний відбір використовується порівняно рідко (лише у 8 % загальної кількості типів відборів), оскільки, з одного боку, в більшості випадків його можна помітно поліпшити, виходячи з економічних критеріїв, а з іншого — дуже часто його просто неможливо застосовувати. Однак імовірнісна вибірка, одержана внаслідок застосування будь-якої техніки відбору, стає районованою, якщо процедурі відбору одиниць спостереження передує розподіл генеральної сукупності на однорідні частини.
Районування не є відхиленням від принципу випадковості при побудові вибірки, тобто в цьому разі кожна одиниця сукупності, як і раніше, має однакові шанси потрапити до вибірки, оскільки районовану вибірку можна вважати рівнозначною ряду випадкових вибірок із підсукупностей — типових районів. Разом з тим районування за умови умілого використання має своїм результатом меншу, ніж імовірнісна вибірка, дисперсію оцінок. Найточніші результати одержують, коли типові групи виділені так, що одиниці всередині кожної з них мають найбільшу схожість, тоді як одиниці з різних районів помітно різняться, оскільки помилка районованої вибірки зумовлена лише варіацією всередині виділених типових груп. Як ознаки розшарування використовуються тільки ознаки, що корелюють з досліджуваними характеристиками. Представництво таких ознак у відсотках у генеральній сукупності відоме, наявність або відсутність їх у кожній одиниці сукупності можна чітко визначити ще до початку дослідження.
Незважаючи на очевидні переваги районованого відбору, цей метод застосовується рідко, оскільки потребує повної інформації про характер зв'язків між параметрами генеральної сукупності, а це, у свою чергу, пов'язане з необхідністю попереднього аналізу об'єкта дослідження, його "розшарування". Ось чому сучасне вибіркове дослідження відбувається у два етапи: перший етап є описом об'єкта дослідження на підставі попередньої інформації про нього, яку одержують до проведення самого дослідження. Другий етап — це безпосереднє формування вибіркової сукупності відповідно до завдань дослідження й результатів опису.
Гніздовий відбір
Під гніздом розуміють проміжний об'єкт дослідження, який відбирається на кожному ступені і є висхідною сукупністю для наступного відбору. Гніздами можуть бути різні одиниці відбору, починаючи з міста, району і закінчуючи виробничими бригадами, сім'ями та ін. Використання гнізд суттєво ускладнює методику вибіркового обстеження, оскільки вивчення одиниць дослідження, які належать до одного й того самого гнізда, дасть значно менше інформації, ніж вивчення тієї ж кількості одиниць, розміщених у різних гніздах.
Розподіляючи генеральну сукупність на гнізда, слід звернути увагу на такі обставини: 1) кожний елемент генеральної сукупності може належати тільки одному гнізду; 2) гнізда мають бути якомога одноріднішими за рядом показників; 3) самі гнізда (як і генеральна сукупність) мають мати однорідну структуру за цими самими показниками. Отже, гніздова вибірка є прямою протилежністю районованій, яка вимагає, щоб виділені страти мали однорідний склад, але значно відрізнялись одна від одної.
Гніздовий відбір має суттєві організаційні переваги порівняно з імовірнісним і районованим відбором. Легше зробити відбір та вивчити кілька колективів, бригад, цехів тощо, які знаходяться в одному місці, ніж кілька сотень розкиданих у просторі респондентів. Процедура відбору дає змогу сконцентрувати вибірку у порівняно невеликій кількості пунктів. У більшості випадків генеральна сукупність має чітке природне розчленування на гнізда (хоча можливі також "штучні" гнізда).
Ефективність гніздового відбору багато в чому залежить від того, які саме структурні одиниці вибрані за гнізда. Особливе значення має співвідношення кількості відібраних гнізд і обсягу вибірки з кожного гнізда. За будь-яких умов краще збільшувати кількість гнізд, включених до вибірки, і зменшувати обсяг вибірки з кожного гнізда. Проте конкретні співвідношення між параметрами вибірки залежать від організаційних можливостей та наявних ресурсів. Великі гнізда мають більшу дисперсію, тому за будь-яких умов вони мають певні переваги над дрібними.
Опитування за вибіркою з використанням великих гнізд потребує менших матеріальних коштів та часу. Однак у великих гніздах слід робити відбір усередині гнізда, що ускладнює проведення дослідження і збільшує загальну помилку вибірки за рахунок помилок, які виникають на нових етапах дослідження. Позитивною ж є та обставина, що дрібні гнізда можна розташувати на більшій території та краще врахувати специфіку різних регіонів.
Систематичний відбір
Систематична вибірка — це, як правило, вибірка з різних алфавітних списків, картотек тощо. Відбір одиниць відбувається через один і той самий інтервал (крок) у вихідному алфавітному чи пронумерованому списку, до того ж номер у списку, з якого починається відбір, визначається випадково.
Вважати систематичну вибірку варіантом імовірнісної неправильно, оскільки за умови систематичної вибірки порушується основне обмеження, що накладається на одиниці генеральної сукупності. Відбір першої одиниці, по суті, визначає всю вибіркову сукупність. Отже, не всі елементи генеральної сукупності мають однакову ймовірність потрапити до вибірки. Таких відборів можна здійснити певну кількість, але не стільки, скільки дозволив би випадковий відбір. За систематичної вибірки відбір наступного елемента залежить від відбору попереднього, тоді як за умов імовірнісної вибірки такої залежності немає. Застосування систематичної вибірки звичайно виправдовується тим, що порядок перелічення елементів відбору в списках можна розглядати як більш-менш випадковий, а також тим, що ознака, за якою впорядкований список, ніяк не стосується самого предмета дослідження.
Систематична вибірка — одна з найбільш поширених. Це пояснюється, мабуть, тим, що вона, по-перше, значно простіша за ймовірнісну, яка передбачає вміння користуватися таблицями випадкових чисел. По-друге, систематична вибірка економічніша й зручніша для формування вибіркової сукупності, хоч і можливі помилки зміщення, оскільки списки одиниць спостереження, які використовуються для систематичної вибірки, нерідко складаються за певними критеріями та принципами, що можуть бути пов'язані з предметом дослідження. В деяких ситуаціях наявність їх допомагає поліпшити вибірку за рахунок наближення систематичного відбору до районованого. Наприклад, ми формуємо вибіркову сукупність для вивчення політичної активності студентів у вищому навчальному закладі за допомогою систематичного відбору респондентів із загального списку, складеного не за алфавітом, а відповідно до факультетів та курсів. За такого відбору ми збережемо пропорційне представництво студентів усіх курсів та факультетів. Можна стверджувати, що у вибірковій сукупності в тих самих пропорціях, що і в генеральній сукупності, збережено основні соціально-демографічні ознаки. Такий систематичний відбір наближений до районованого відбору, тому в деяких випадках помилки репрезентативності за умови систематичних відборів можуть бути нижчими, ніж при ймовірнісному. Проте, якщо у складеному списку елементів генеральної сукупності спостерігається деяка систематичність або періодичність, можуть виникнути систематичні помилки.
Є низка засобів і методів, за допомогою яких можна позбавитися систематичних помилок зміщення або принаймні звести їх до мінімуму. Насамперед для вибору першої одиниці відбору слід використовувати таблиці випадкових чисел. Застосовується також зміна початкової одиниці через певну кількість інтервалів. Можна також вибрати на початку списку кілька вихідних одиниць і здійснювати відбір через однакові або різні інтервали.
Квотний відбір
Найпоширенішим серед невипадкових методик формування вибіркової сукупності є квотний відбір. Відбір за квотами відрізняється від випадкових методик кількома ознаками. На відміну від імовірнісного (як одного з видів випадкового відбору), він передбачає наявність статистичних даних за низкою суттєвих або корелюючих з ними характеристик генеральної сукупності. Відповідно до складу генеральної сукупності встановлюють квоти для певних суттєвих ознак (переважно соціально-демографічних). У такий спосіб намагаються досягти адекватності вибіркової та генеральної сукупностей. Інтерв'юер, одержуючи завдання опитати заплановану кількість одиниць у квоті, сам здійснює вибір одиниць, що потраплять до вибірки.
При квотному відборі обсяг вибіркової сукупності формується наперед, з урахуванням попередньої інформації про генеральну сукупність. Спільною проблемою ймовірнісного і квотного відбору є труднощі, що виникають при визначенні суттєвих характеристик об'єкта дослідження. Джерело цих труднощів криється в недостатній вивченості останнього з погляду питання, що цікавить соціолога. Щоб уникнути цих ускладнень, у відборах звичайно використовують тісно корелюючі ознаки.
Для квотного відбору репрезентативна вибіркова сукупність створюється теоретично: її структура та обсяг визначаються відповідно до структури та обсягу генеральної сукупності.
Реалізація квотного відбору залежить від правильності організації процесу відбору одиниць дослідження, але на відміну від імовірнісного відбору тут правильність відбору одиниць дослідження залежить не від випадкових обставин, а від свідомої, цілеспрямованої діяльності інтерв'юерів. Міра репрезентативності квотних відборів збільшується прямо пропорційно до міри стійкості характеристик, за якими задаються квоти. Тому до статистичних даних треба ставитися особливо обережно.
Намагаючись удосконалити квотний метод, до квотного відбору включали елементи ймовірнісної вибірки, квотний відбір застосовували також у багатоступеневій вибірці.
У першому випадку мається на увазі, що інтерв'юер втрачає свободу пошуку респондента з потрібним поєднанням ознак. Як і за умови ймовірнісного відбору, він одержує список осіб, з якими має увійти в контакт. Інтерв'ю він проводить тільки з тими респондентами, які виявилися носіями необхідного поєднання параметрів. Іноді інтерв'юер отримує схему відбору респондентів безпосередньо перед опитуванням. Завдяки цим нововведенням переваги квотної вибірки певною мірою поєднуються з перевагами ймовірнісного відбору.
У другому випадку квотна вибірка використовується тільки на останньому ступені відбору. Така стратегія забезпечує так зване самозважування вибірки (пропорційне щодо генеральної сукупності представництво одиниць спостереження) за найважливішими ознаками, використаними при виділенні ступенів, і тому ризик, пов'язаний з квотним відбором, помітно зменшується. Водночас обсяг вибірки скорочується.
Метод основного масиву
Одним з видів невипадкового відбору є метод основного масиву. Спостереженню підлягає така група одиниць генеральної сукупності, частка якої, на думку дослідника, "цілком достатня" або "досить значна". Не виключені випадки, коли одиниці генеральної сукупності беруться довільно, на підставі "інтуїції" дослідника. Позитивним моментом такого підходу є його економічність. Проте "цілеспрямовані" відбори, як і відбори методом основного масиву, переважно довільні щодо ознак, суттєвих стосовно явищ, що вивчаються, та інтерпретації одержаних даних. Застосування методу основного масиву можливе лише в тому разі, коли дослідник цілком упевнений, що частина сукупності, яка не потрапила до вибірки, не може впливати на висновки дослідження. Якщо такої впевненості немає, застосовувати метод не можна.
Стихійний відбір
Одним з видів невипадкового відбору є стихійний відбір. Будуючи вибіркову сукупність методом стихійного відбору, соціолог не має можливості забезпечити відповідність вибіркової сукупності генеральній за всіма ознаками, що характеризують одиницю спостереження.
Головними чинниками, що визначають природу стихійного відбору, є готовність соціолога мати справу з максимально доступними одиницями сукупності (чинник доступності), а також його прагнення гарантувати за умови обмежених ресурсів вихід на ті одиниці сукупності, які мають шукані ознаки (чинник цілеспрямованості). Перший чинник означає, що організатор дослідження готовий погодитися з тим, що рішення про занесення до вибірки належить потенційному респонденту. Другий чинник передбачає, навпаки, що це рішення належить досліднику.
Прикладами опитувань, що проводяться за допомогою стихійного відбору, є дослідження "маятникової міграції" населення. Опитування респондентів відбувається в електропоїздах, автобусах тощо. Для інтерв'юера важлива лише належність респондента до "мігрантів" та згода його відповісти на запитання інтерв'юера (респондент сам заносить себе до вибірки).
Часто дослідника змушують звертатися до "послуг" стихійного відбору різні обставини. Одна з них — обмежені ресурси, які не завжди дають йому змогу досягти необхідного представництва у сформованій сукупності. Друга обставина стосується етичних принципів. Участь в опитуванні є добровільною, що обмежує коло респондентів. Часто відбір неможливо провести із суто технічних причин, оскільки нічого невідомо про межі генеральної сукупності, а соціолог лише за допомогою стихійного відбору має можливість визначити ці межі.
Є кілька різновидів стихійного відбору.
1. Так званий відбір першого зустрічного. Соціолог опитує тих, кого випадково зустрічає на вулицях та в інших багатолюдних місцях. Однак при організації такого відбору велике значення мають місце і час опитування, оскільки в різний час та в різних місцях соціолог має можливість взяти інтерв'ю лише в окремих категорій респондентів: у центрі великого міста в робочий час він частіше натрапить на пенсіонерів, студентів, наукових співробітників, ніж на промислових робітників. Крім того, за такого відбору соціолог несвідомо може керуватися почуттям особистої симпатії та антипатії, міркуваннями зручності тощо.
2. Відбір "подібного до себе". Інтерв'юер добирає для опитування або спостереження респондента з власного оточення. За такого відбору вибіркова сукупність буде зміщеною, порівняно з вихідною сукупністю, щодо однієї чи низки суттєвих ознак.
3. Пресові опитування — це опитування, що проводяться за допомогою теле- та радіоанкет, а також анкет, оприлюднених у пресі. За умови таких опитувань рішення про включення до вибірки приймають самі респонденти, що докорінно змінює трактування одержаних даних, оскільки в опитуванні бере участь найкомунікабельніша частина респондентів.
Усі види стихійного опитування мають істотні недоліки. По-перше, для вихідної сукупності не можна побудувати репрезентативну вибірку. По-друге, неможливо визначити теоретичну помилку, що виникає за такої схеми відбору. Вказані недоліки не означають, однак, що стихійний відбір недоцільний. У деяких випадках за його допомогою можна дізнатися, наприклад, про варіанти поведінки телеаудиторії, ставлення до політичних партій, їхніх лідерів тощо. Стихійний відбір часто буває корисним у пробних та пілотажних дослідженнях. Незамінний він і для дослідження інтимних сторін життя людей. Так, принцип випадкового відбору для дослідження такого об'єкта використати практично неможливо, оскільки частка відмов від бесіди набагато перевищує граничну норму. Різні способи стихійного відбору мають неоднакову міру ефективності. Однак чим більша міра випадковості у відборі одиниць дослідження і чим більше цей відбір поширюється на об'єкт вивчення, тим точнішим, за інших однакових умов, є його результат. Водночас недбало здійснений імовірнісний відбір, по суті, може перетворитися на стихійний.
Обсяг вибірки
Визначаючи обсяг вибіркової сукупності, соціолог, як правило, виходить з вимог одержання інформації певної точності. Вибірка вважається статистично точною тоді, коли випадкові помилки є незначними. Точність одержаних результатів прямо пропорційна залежності від обсягу сформованої вибіркової сукупності: збільшується обсяг вибірки — підвищується точність. Проте точність одержаних результатів дослідження — важливий, але не єдиний чинник, що впливає на обсяг вибіркової сукупності.
Іноді під час дослідження виникає ситуація, коли обсяг сформованої вибіркової сукупності не дає змоги повністю реалізувати всі поставлені завдання. І якщо обсяги вибірок у таких дослідженнях, як правило, є достатніми для аналізу одновимірного розподілу ознак у вибірковій сукупності, то їх явно не вистачає для двовимірних (тим паче тривимірних) таблиць розподілу ознак. У цьому разі незначна заповненість "клітинок" таблиці не дає змоги з високою мірою ймовірності й точності стверджувати значущість відмінностей досліджуваних ознак.
Отже, ще до початку збирання інформації, тобто на підготовчій стадії дослідження (під час опису об'єкта і предмета дослідження, інтерпретації основних понять, формування робочих гіпотез), слід планувати не тільки точність зібраної інформації (величину випадкових помилок вибірки), а й бажану значущість відмінностей ознак, що аналізуються. Це, у свою чергу, вимагає апріорного опису об'єкта дослідження і чіткого формулювання гіпотез, що перевірятимуться. Усі ці вимоги об'єднуються в групу аналітичних вимог до обсягу вибіркової сукупності. Таким чином, під аналітичними вимогами розуміють обмеження, що накладаються на формування обсягу вибіркової сукупності та на міру подрібнення досліджуваних ознак, а також залежать від завдань подальшого аналізу одержаної інформації. Основне правило визначення обсягу вибіркової сукупності, залежно від висунутих аналітичних вимог, можна сформулювати так: обсяг вибіркової сукупності має бути кратним добутку кількості клітин в аналізованій таблиці сполученості ознак на кількість (вибрана з урахуванням значущості відмінностей різниці часток) одиниць спостереження, що містяться в клітині.
Отже, аналітичні вимоги до обсягу вибірки не тільки випливають з методичних питань, що розв'язуються під час дослідження, а й значно більшою мірою зумовлюються змістом завдань (апріорним описом об'єкта та предмета дослідження, формуванням робочих гіпотез, теоретичною та емпіричною інтерпретацією основних понять, що застосовуються в соціологічному дослідженні).
Визначаючи обсяг вибірки, не можна не враховувати й економічних критеріїв. Ресурсно-економічні критерії є суттєвими чинниками, що визначають стратегію дослідження. Тому під час проектування вибірки соціолог повинен визначити точність отримуваних результатів у межах заданих витрат і ресурсів. Якщо лімітуючим ресурсним чинником є час, відведений на проведення дослідження, проект вибірки має забезпечити одержання очікуваної точності у визначений термін.
Слід зазначити, що вимога економічності дослідження суперечить тим аналітичним вимогам, які визначають обсяг вибірки. Тому вкрай важливо, щоб під час проектування вибіркового соціологічного дослідження авторський колектив насамперед визначив пріоритети серед сформульованих вимог. Далі доцільно сформувати ряд моделей вибірок, які б передбачали варіації кожної з вимог. Оптимальною для такого дослідження визнається та модель вибіркової сукупності, яка дає змогу на порівняно невеликій за обсягом вибірковій сукупності з мінімальними витратами розв'язати поставлені дослідниками змістовні завдання.