Ћекции.ќрг


ѕоиск:




 атегории:

јстрономи€
Ѕиологи€
√еографи€
ƒругие €зыки
»нтернет
»нформатика
»стори€
 ультура
Ћитература
Ћогика
ћатематика
ћедицина
ћеханика
ќхрана труда
ѕедагогика
ѕолитика
ѕраво
ѕсихологи€
–елиги€
–иторика
—оциологи€
—порт
—троительство
“ехнологи€
“ранспорт
‘изика
‘илософи€
‘инансы
’ими€
Ёкологи€
Ёкономика
Ёлектроника

 

 

 

 


–асчет характеристик простой случайной выборки




÷ель любого выборочного исследовани€ состоит в том, чтобы, сформировав вы≠борку, собрать по ней информацию и на основе этой информации оценить искомые характеристики генеральной совокупности.

Ќаиболее распространенной в социологических исследовани€х задачей €вл€етс€ оценка среднего значени€ признака (или доли в случае качественного признака) в генеральной совокупности.

ѕроиллюстрируем на примере нахождение выборочной оценки среднего генеральной совокупности. ѕредположим, что оцениваетс€ среднее число газет и общественно-политических журналов, выпи≠сываемых сотрудниками некоторого производственного коллектива. –ассмотрим по пор€дку все необходимые операции и их результаты.

—оставл€етс€ основа выборки, т. е. список всех единиц отбора. ¬ качестве такой основы может быть вз€т алфавитный список всех сотрудников, пронумерованных последовательно (табл. 15). ¬ цел€х нагл€дности вместе с основой выборки привод€тс€ и все истинные значени€ единиц отбора, еще неизвестные исследователю. ¬ дальнейшем сопоставим истинное значение искомого параметра и выборочную оценку.

ќбща€ сумма выписываемых газет и журналов равна 150. —реднее число выписываемых газет и журналов на каждого сотрудника равно = 150/50 = 3.

—реднее квадратическое отклонение дл€ генеральной совокупности равно

—умма квадратов отклонений равна 146 при условии, что одно значение квадрата отклонени€, а именно от единицы отбора 28, было исключено из суммы. Ёто значение, равное 49, резко увели≠чивает сумму, будучи нетипичным дл€ генеральной совокупности.

“акое Ђисключениеї экстремального отклонени€ нередко примен€≠етс€ при обработке первичной социальной информации в том случае, когда предусмотрено возведение в квадрат, а само отклонение в 2Ч3 раза превышает среднее значение параметра.

ќднако ни среднее значение параметра, ни среднее квадратическое отклонение перед началом исследовани€ не известны. ¬ про≠тивном случае само исследование было бы излишним.

≈стественно предположить при анализе вышеприведенного примера, что каждый респондент (единица отбора и единица наблюде≠ни€) выписывает несколько газет и журналов и что количество выписываемых газет и журналов не слишком сильно варьирует (если бы путем выборочного исследовани€ потребовалось определить, скажем, объем личных библиотек, положение исследовател€ ослож≠нилось бы). »сход€ из этих соображений, полагаем достаточной вы≠борку, состо€щую из п€ти респондентов. ѕроверить правильность определени€ объема выборки можно только после обработки резуль≠татов пилотажного исследовани€.

ѕредположим, что случайный выбор из табл., 15 дал следующие результаты: выбраны номера 18, 4, 28, 39, 22; они соответствуют «начени€м признаков 4, 0, 10, 4, 4.

—реднее арифметическое но выборке х = 22/5 = 4,4, дисперси€

“акое значительное отклонение от истинного значени€ средней объ€сн€етс€ тем, что в выборку попал респондент є 28, исключен≠ный при подсчете дисперсии дл€ генеральной совокупности как нетипичный. ќднако при формировании выборки еще неизвестно, что данный респондент нетипичен. Ќо сам факт, что среднее квадратическое отклонение приближаетс€ по величине к средней, дол≠жен насторожить исследователей.

ƒл€ большей нагл€дности выразим s в процентах от величины средней: (3,5:4,4) Х 100%= 79%, т. е. среднее отклонение значений признака от выборочной средней арифметической величины Ђоставл€ет 79%. ¬ таких случа€х целесообразно увеличить объем выборки, например, в 2 раза. ¬ результате были отобраны номера: 44, 2, 12, 26, 14, 27, 35, 9, 8, 49; значени€ признака 5, 2, 4, б, 1, -3,2,5,3, 4.

—реднее арифметическое Ч 3,6, дисперси€ s2 = 2,26, среднее квадратическое отклонение s = 1,5. “еперь оно составл€ет прибли≠зительно 40% от величины средней. ѕри больших дисперси€х объем выборки увеличивают с учетом практических возможностей до тех пор, пока дисперси€ не перестает уменьшатьс€. ƒальнейшее увеличение объема выборки €вл€етс€ нецелесообразным. ќбычно исследователь приходит к некоторому компромиссному решению от≠носительно объема выборки в зависимости от требуемой точности, атакже средств и времени, которыми он располагает.

—водка необходимых формул дл€ простой случайной выборки. ¬ рассмотренном гипотетическом примере легко было оценить ка≠чество выборочной оценки среднего (перед глазами была информаци€ дн€ обо всей генеральной совокупности). Ќо как провести его оценку в реальном исследовании, когда имеетс€ только информаци€, полученна€ из выборки?

Ќа помощь приходит статистическа€ теори€ выборочного метода. ќна позвол€ет при условии реализации случайного отбора достичь, по крайней мере, следующих двух целей:

1. ѕо заданной априори необходимой степени точности выводов (формализуемой с помощью пон€ти€ доверительной веро€тности) найти возможные интервалы, изменени€ характеристик генеральной; совокупности (доверительные интервалы). » наоборот, рассчитать доверительную веро€тность отклонени€ характеристики генеральной совокупности от выборочной по заданной величине доверительного интервала.

2. Ќайти объем планируемой выборки, позвол€ющей достигнуть в пределах требуемой точности расчета выборочных характеристик необходимую доверительную веро€тность.

ƒадим сводку необходимых дл€ достижени€ этих целей формул3. „тобы уметь примен€ть приведенные формулы при планирова≠нии выборки в эмпирическом социологическом исследовании, позна≠комимс€ несколько подробнее с основными пон€ти€ми выборочного методаЧ Ђдоверительна€ веро€тностьї и Ђдоверительный интервалї.

“еоретико-веро€тностные теоремы, восход€щие к закону больших чисел, позвол€ют с определенной веро€тностью, обозначаемой (1 Ча), утверждать, что дл€ изучаемого признака отклонени€ вы≠борочной средней от генеральной не превыс€т некоторой величины D, называемой предельной ошибкой выборки.

¬ одной из формулировок это утверждение записываетс€ сле≠дующим образом:

—мысл приведенного соотношени€ следующий: с доверительной веро€тностью (1-a) можно утверждать, что генеральное среднее лежит в интервале

 

который и называетс€ доверительным интервалом, а определ€ет как бы степень довери€ к данным, получаемым по рассчитанным с его помощью выборочным характеристикам. ќтсюда и название а Ч уровень значимости.

ѕрин€тие того или иного уровн€ значимости, например 5%-ного (a = 0,05), зависит от целей данного социологического исследовани€, требований к степени гарантии его результатов. —оциолог должен четко понимать, что, выбрав, скажем, уровень значимости, равный 5 %, и, рассчитав на основе его выборочные характеристики, мы будем утверждать наличие некоторого эффекта, который на самом деле может оказатьс€ несправедливым приблизительно в п€ти про≠центах случаев.

ѕример. ѕри обследовании 900 человек Ч лиц трудоспособного возраста Ч определен их средний возраст. ƒл€ веро€тности (1 Ч a) =0,90 необходимо найти доверительный интервал, в котором содер≠житс€ генеральное среднее. ѕоскольку дисперси€ признака неиз≠вестна, оценим ее приблизительно по значению размаха дл€ гене≠ральной совокупности.

— этой целью воспользуемс€ соотношением св€зи среднего квад≠ратичного отклонени€ с размахом

справедливым в предположении нормального характера распреде≠лени€. «десь ’max Ч ’min Ч вариационный размах генеральной сово≠купности, а VЧ величина, завис€ща€ от объема выборки, значени€ которой можно найти в табл. 17.

“ак как по всей генеральной совокупности верхн€€ граница трудоспособности в ———– Ч 60 лет, а нижн€€ Ч 16, то хmax Ч хmin =60Ч16 = 44, следовательно (дл€ п> 100 Ч последний столбец

табл. 17), получим приближенное значение среднеквадратичного отклонени€ s=44:5= 8,8.

¬еличина Z находитс€ по табл. ј приложени€ при a/2. “аким образом, если 1 Ч a = 0,9, то Z = 1,64,

ѕодставл€€ найденные значени€ ћ и Z в формулу предельной ошибки, получаем D = ZM = 1,64 Х 0,29 = 0,48.

“аким образом, округл€€ значение ошибки до половины года (0,5), можно утверждать, что с веро€тностью 0,9 генеральное сред≠нее не выйдет за пределы интервала х Ч 0,5 < ћ < х + 0,5, т. е. точность выборочной оценки среднего, рассчитанной по нашей вы≠борке (если она организована методом простого случайного повтор≠ного отбора), оказываетс€ равной половине года. ”тверждать это мы можем с веро€тностью 0,9. »нтервал (х Ч 0,5, х + 0,5) и задает доверительный, интервагй, рассчитанный по доверительной веро€тности, равной 0,9.

“еперь рассмотрим методику нахождени€ доверительного интер≠вала по заданной доверительной веро€тности дл€ качественного ѕризнака.

ѕример. ¬ыборочное обследование 900 человек, организованное до способу простого случайного повторного отбора, показало, что 18 человек не информированы о крупном событии в стране. ƒл€ ƒоверительной веро€тности 0,95 нужно найти доверительный интервал.

ѕользу€сь выражением дл€ формулы средней ошибки (см.

табл. 16)

получаем

 

ƒалее по табл. ј приложени€, как уже описывалось выше, дл€ a/2 находим Z= 1,96.

“еперь можно определить величину предельной ошибки (см табл. 16):

“аким образом, доверительные границы дл€ доли не информированных в генеральной совокупности равны 0,02 ± 0,009, или от 1,1 до 2,9%.

ѕриведем иллюстративный пример определени€ объема простой повторной случайной выборки.  ак видно из формул, чтобы опре≠делить объем (см. табл. 16), дл€ его оценки необходимо знать дис≠персии генеральной средней или хот€ бы ее оценки.

ƒл€ применени€ соответствующей формулы необходимо оценить значение дисперсии, что можно сделать (при отсутствии информа≠ции о ней и о размахе значений признака в генеральной совокупно≠сти) путем проведени€ одной-двух пилотажных (пробных) выборок.

ƒопустим, что в результате пилотажа выборочна€ оценка дис≠персии равна 12,24. ќпределим каким должен быть объем выборки чтобы с веро€тностью 0,95 предельное отклонение выборочной средней от генеральной не превышало одного экземпл€ра газет. ѕри этих услови€х получаем численность планируемой выборки

“аким образом, объем выборки должен составл€ть 24 человека.

 





ѕоделитьс€ с друзь€ми:


ƒата добавлени€: 2015-11-05; ћы поможем в написании ваших работ!; просмотров: 587 | Ќарушение авторских прав


ѕоиск на сайте:

Ћучшие изречени€:

Ќеосмысленна€ жизнь не стоит того, чтобы жить. © —ократ
==> читать все изречени€...

1396 - | 1215 -


© 2015-2024 lektsii.org -  онтакты - ѕоследнее добавление

√ен: 0.016 с.