Способ отбора определяет конкретный механизм выборки единиц из генеральной совокупности. В практике выборочных обследований наибольшее распространение получили следующие виды выборки:
n собственно случайная;
n механическая;
n типическая;
n серийная;
n комбинированная.
Собственно случайная выборка заключается в отборе единиц из генеральной совокупности наугад или наудачу без каких-либо элементов системности. Прежде чем производить собственно случайный отбор, необходимо убедиться, что все без исключения единицы генеральной совокупности имеют абсолютно равные шансы попадания в выборку.
Технически собственно случайный отбор проводят методом жеребьевки или по таблице случайных чисел.
Собственно случайный отбор может быть как повторным, так и бесповторным.
После проведения отбора для определения возможных границ генеральных характеристик рассчитываются средняя и предельная ошибки выборки. Эти два вида ошибок связаны следующим соотношением:
D = t * m, (10.2.1)
где D – предельная ошибка выборки;
m – средняя ошибка выборки;
t – коэффициент доверия, определяемый в зависимости от уровня
вероятности p.
Ниже приведены некоторые значения t:
Вероятность, p | 0,683 | 0,866 | 0,954 | 0,988 | 0,997 | 0,999 |
Значение t | 1,0 | 1,5 | 2,0 | 2,5 | 3,0 | 3,5 |
Величина средней ошибкивыборки рассчитывается дифференцированно в зависимости от способа отбора и процедуры выборки. Так, при случайном повторном отборе средняя ошибка определяется по формуле:
s
m = -----,
Ö n (10.2.2)
а при бесповторном:
______________
/ s 2 n
m = Ö ----- * (1 - ----),
N N
(10.2.3)
где s2 – выборочная дисперсия;
s – выборочное среднее квадратическое отклонение;
n– объем выборочной совокупности;
N– объем генеральной совокупности.
Расчет средней и предельной ошибок выборки позволяет определить возможные пределы, в которых будут находиться характеристики генеральной совокупности. Например, для выборочной средней такие пределы устанавливаются на основе следующих соотношений:
~ _ ~
x - Dx £ x £ x + Dx , (10.2.4)
~ _
где x и x -- генеральная и выборочная средние соответственно;
Dx -- предельная ошибка выборочной средней.
Пример 1. При проверке веса импортируемого груза на таможне методом случайной повторной выборки было отобрано 200 изделий. В результате был установлен средний вес изделия 30г при среднем квадратическом отклонении 4г. С вероятностью 0,997 определите пределы, в которых находится средний вес изделия в генеральной совокупности.
Решение. Рассчитаем предельную ошибку выборки. Так как при p = 0,997 t = 3, предельная ошибка равна:
sx 4
Dx = t * ------ = 3 * --------- = 0,84.
Ö n Ö 200
Определим пределы генеральной средней:
_
30 - 0,84 £ x £ 30 + 0,84
или: _
29,16 £ x £ 30,84.
Следовательно, с вероятностью 0,997 можно утверждать, что средний вес изделий в генеральной совокупности находится в пределах от 29,16 г до 30,84 г.
Пример 2. С целью определения средней фактической продолжительности рабочего дня в учреждении с численностью работающих 480 человек было проведено 25%-е случайное бесповторное выборочное обследование. По его результатам выяснилось, что у 10% обследованных потери рабочего времени достигали более 45 мин. в день. С вероятностью 0,683 установите пределы, в которых находится генеральная доля работников с потерями рабочего времени более 45 мин. в день.
Решение. Определим объем выборочной совокупности:
n = 480 * 0,25 = 120 чел.
Выборочная доля w равна по условию 10%.
Учитывая, что при p = 0,683 t = 1, вычислим предельную ошибку выборочной доли: ____________________ ___________
| w * (1 - w) n | 0,1*(1-0,1) 120
Dw = | -------------- * (1 - ----) = 1 * | --------------- * (1 - ------) = 0,0237» 2,4%.
Ö n N Ö 120 480
Пределы доли признака в генеральной совокупности:
10 - 2,4 £ p £ 10 + 2,4
или
7,6 £ p £ 12,4.
Таким образом, с вероятностью 0,683 можно утверждать, что доля работников учреждения с потерями рабочего времени более 45 мин. в день находится в пределах от 7,6 % до 12,4%.
Механическая выборка применяется в случаях, когда генеральная совокупность каким-либо образом упорядочена, то есть имеется определенная последовательность в расположении единиц (табельные номера работников, алфавитный список и т.д.).
Для проведения механической выборки устанавливается пропорция отбора, которая определяется соотнесением объемов выборочной и генеральной совокупностей. Так, если из совокупности в 500 единиц предполагается получить 2%-ю выборку, то есть отобрать 10 единиц, то пропорция отбора составит 1/50 (1/500:10). То есть мы будем отбирать каждую 50-ю единицу. При пропорции 1/20 (5%-я выборка) отбирается каждая 20-я единица и т.д.
Генеральную совокупность при механическом отборе можно ранжировать или упорядочить по величине изучаемого или коррелирующего с ним признака, что несомненно повысит репрезентативность выборки. Однако в этом случае возрастает опасность систематической ошибки, связанной с занижением значений изучаемого признака (если из каждого интервала регистрируется первое значение) или с его завышением (если из каждого интервала регистрируется последнее значение). Поэтому отбор начинают с середины первого интервала: например, при 5%-ой выборке отобрать 10-ю, 30-ю, 50-ю, 70-ю и с таким же интервалом последующие единицы.
Для определения средней ошибки механической выборки используется формула средней ошибки для собственно случайного бесповторного отбора.
Типический отбор. Этот способ используется в тех случаях, когда все единицы генеральной совокупности можно разбить на несколько типических групп. При обследовании населения такими группами могут быть районы, возрастные, социальные или образовательные группы, при обследовании предприятий – отрасль или подотрасль, форма собственности и т.д. Типический отбор предполагает выборку единиц из каждой типической группы собственно случайным или механическим способом. Поскольку в выборочную совокупность в той или иной пропорции обязательно попадают представители всех групп, типическая выборка позволяет исключить влияние межгрупповой дисперсии на среднюю ошибку выборки, которая в этом случае определяется только внутригрупповой вариацией.
Отбор единиц в типическую выборку может быть организован либо пропорционально объему типических групп, либо пропорционально внутригрупповой дифференциации признака.
При выборке, пропорциональной объему типических групп, число единиц, подлежащих отбору из каждой группы, определяется следующим образом:
Ni
ni = n* --------, (10.2.5)
N
где Ni -- объем i-й группы;
ni -- объем выборки из i-й группы.
Средняя ошибка такой выборки находится по формулам:
______
½ __
½ s 2i
m = ½ ------- (повторный отбор);
Ö n (10.2.6)
_________________
½ __
½ s 2i n
m = ½ ------- * (1 - ----) (бесповторный отбор),
Ö n N (10.2.7)
__
где s 2i – средняя из внутригрупповых дисперсий.
Пример 3. При 10%-м бесповторном типическом отборе рабочих предприятия, пропорциональном размеру цехов, выяснилось, что потери рабочего времени по причине временной нетрудоспособности составили:
Цех | Всего рабочих, чел. | Обследовано, чел. | Число дней временной нетрудоспосбности за год | |
средняя | дисперсия | |||
I | ||||
II | ||||
III |
Рассчитаем среднюю из внутригрупповых дисперсий:
___ å s2i* fi 49 * 100 + 25 * 140 + 16 * 80
s2i= -------------------- = -------------------------------------= 30,25.
å fi 100 + 140 + 80
Определим среднюю и предельную ошибки выборки (с вероятностью 0,954):
____________________
½ 30,25 320
m = Ö -------- * (1 - --------) = 0,29 ; Dx = 2 * 0,29 = 0,58.
320 3200
Рассчитаем выборочную среднюю:
~ å xi * ni 18 * 100 + 12 * 140 + 15 * 80
x = --------------- = ---------------------------------------- = 14,6 дня.
åni 100 + 140 + 80
С вероятностью 0,954 можно сделать вывод, что среднее число дней временной нетрудоспособности одного рабочего в целом по предприятию находится в пределах
_
14,6 - 0,58 £ х £ 14,6 + 0,58.
Серийный отбор. Данный способ отбора удобен в тех случаях, когда единицы совокупности объединены в небольшие группы или серии. В качестве таких серий могут рассматриваться упаковки с определенным количеством готовой продукции, партии товара, студенческие группы, бригады и другие объединения. Сущность серийной выборки заключается в собственно случайном или механическом отборе серий, внутри которых производится сплошное обследование единиц.
Поскольку внутри групп (серий) обследуются все без исключения единицы, средняя ошибка серийной выборки зависит от величины только межгрупповой (межсерийной) дисперсии и определяется по следующим формулам:
_____
½ d2
m = ½ ------- (повторный отбор);
Ö r (10.2.8)
_______________
½ d2 r
m = ½ ------ * (1 - ----) (бесповторный отбор),
Ö r R
(10.2.9)
где r – число отобранных серий;
R – общее число серий.
Межгрупповую дисперсию вычисляют следующим образом:
~ ~
å (xi - xо) 2
d2 = -------------------,
R (10.2.10)
~
где xi – средняя i-й серии;
~
xо – общая средняя по всей выборочной совокупности.
Пример 4. На опытном поле площадью 20 га проводилось выборочное обследование урожайности сельхозкультур. Были обследованы пять делянок площадью по 1 га. Средние урожайности на них составили соответственно 14,5 ц/га, 16 ц/га, 15,5 ц/га, 15 ц/га и 14ц/га. С вероятностью 0,954 определите пределы урожайности во всей области.
Решение. Рассчитаем общую среднюю:
~ 14,5 + 16 + 15,5 + 15 + 14
х = --------------------------------------- = 15 ц/га.
5
Межгрупповая (межсерийная) дисперсия равна:
(14,5 - 15)2 + (16 - 15) 2 + (15,5 - 15) 2 + (15 - 15) 2 + (14 - 15) 2
d2 = ------------------------------------------------------------------------------- = 0,5.
5
Определим предельную ошибку серийной (бесповторной) выборки (t = 2 при p = 0,954): _________________
½ 0,5 5
Dx = 2 * Ö ------- * (1 - ------)» 1,7.
5 20
Следовательно, урожайность на опытном поле будет с вероятностью 0,954 находиться в пределах: _
15 - 1,7 £ х £ 15 + 1,7
или _
13,3 ц/га £ х £ 16,7 ц/га.