Лекции.Орг


Поиск:




Категории:

Астрономия
Биология
География
Другие языки
Интернет
Информатика
История
Культура
Литература
Логика
Математика
Медицина
Механика
Охрана труда
Педагогика
Политика
Право
Психология
Религия
Риторика
Социология
Спорт
Строительство
Технология
Транспорт
Физика
Философия
Финансы
Химия
Экология
Экономика
Электроника

 

 

 

 


Нормальное распределение. Статистические гипотезы




 

Адекватное применение количественных методов, вошедших в практику социологических исследований, в той или иной степени впирается на предположение, что изучаемый признак (или сово­купность признаков) подчиняется определенному статистическому закону распределения. Таким наиболее часто встречающимся рас­пределением является нормальный закон, представление о котором дано здесь в очень краткой форме.

Вторая группа вопросов, рассмотренных в этом разделе, связана с проверкой гипотез. Можно выделить две функции статистических процедур: во-первых, это описание элементов совокупности, во-вто­рых, помощь исследователю в принятии некоторых решений о них. В предыдущих разделах этой главы их рассмотрение было связано с дескриптивной функцией статистики. Здесь же кратко описаны основные понятия и принципы статистического вывода.

Нормальное распределение. Наиболее широко известным теоре­тическим распределением является нормальное, или гауссовское, распределение. Нормальное распределение признака наблюдается в тех случаях, когда на величину его значений действует множество случайных независимых или слабозависимых факторов, каждый из которых играет в общей сумме примерно одинаковую и малую роль (т. е. отсутствуют доминирующие факторы). Функция плотности гауссовского распределения имеет вид

где s2 — дисперсия случайной величины (s2 — это теоретическая дисперсия, отличающаяся от s2, вычисляемой по выборочным дан­ным); m — среднее значение (математическое ожидание) (рис. 7).

В практических расчетах часто используется так называемое правило трех сигм, которое заключается в том, что лишь 0,26% всех значений нормально распределенного признака лежат вне ин­тервала m± Зs, т. е. почти все значения признака укладываются в интервале из шести сигм (рис. 8).

Статистические гипотезы.

Статистической называют гипотезу о виде неизвестного распределения либо о параметрах известных рас­пределений20. Так, статистической будет гипотеза о том, что пере­менная в генеральной совокупности распределена по нормальному закону. Проверяемую гипотезу называют нулевой (основной) гипоте­зой и обозначают Я0. Наряду с нулевой рассматривается конкури­рующая гипотеза Я, (альтернативная), которая ей противоречит.

Статистический критерий и проверка гипотез. Для проверки ну­левой гипотезы (используется специально подобранная случайная величина, точное либо приближенное распределение которой из­вестно и обычно сведено в таблицы. Эта величина называется ста­тистическим критерием. Обозначим его пока К.

Для критерия К фиксируется так называемая критическая об­ласть, т. е. совокупность значений критерия, при. которых нулевую гипотезу отвергают. Точка Ккр называется критической, если она отделяет критическую область от области принятия гипотезы.

Различают правостороннюю, левостороннюю и двустороннюю критические области.

Принятие или отвержение гипотезы производится на основе со­ответствующего статистического критерия с определенной вероятно­стью. Считают, что нулевая гипотеза справедлива, если вероятность того, что критерий К примет значение, большее Ккр, т. е. попадет в критическую область, равна выбранному значению вероятно­сти a т. е.

Принятая вероятность а называется уровнем значимости.

Практически принятие или отвержение нулевой гипотезы прово­дится следующим образом: выбирается соответствующий критерий (этот вопрос будет обсуждаться далее); вычисляется наблюдаемое значение критерия КИ, исходя из эмпирического распределения; вы­бирается уровень статистической значимости (обычно 0,05 или 0,01).

По таблице распределения критерия К для данного уровня зна­чимости находят критическую точку Ккр. Если Кя > КК1>, нулевую гипотезу отвергают, если же КИ < Кку, то ее отвергать нет основа­ния.

Делая такие выводы (т. е. принимая или отвергая гипотезу), можно совершить ошибки двух типов: отвергнуть гипотезу, когда она верна; принять ее, когда она неверна. Поэтому при принятии гипотезы было бы неверным считать, что она тем самым полно­стью доказана. Для большей уверенности необходимо ее проверять другими способами (например, увеличить объем выборки).

Отвергают гипотезу более категорично, чем принимают.

Примеры статистических гипотез: а) нормальное распределение имеет заданное среднее и дисперсию либо имеет заданное среднее (о дисперсии ничего не говорится); б) распределение нормальное либо два неизвестных распределения одинаковы.

В качестве критериев чаще всего используются случайные ве­личины, распределенные нормально (Z — критерий), по закону «Фи­шера (F — критерий Фишера), по закону Стьюдента (t — критерий Стьюдента), по закону хи-квадрат (критерий c2) и т. д.

В качестве конкретного примера рассмотрим применение крите­рия хи-квадрат для проверки гипотезы о виде распределения изу­чаемого признака.

Критерий хи-квадрат. Популярность критерия хи-квадрат обусловлена главным образом тем, что применение его не требует пред­варительного знания закона распределения изучаемого признака. Кроме того, признак может принимать как непрерывные, так и дискретные значения, причем измеренные хотя бы на номинальном уровне.

Если закон распределения признака неизвестен, но есть основа­ния предположить, что он имеет определенный вид А, то критерий X2 позволяет проверить гипотезу: исследуемая совокупность распре­делена по закону А. Для проверки такой гипотезы сравниваются эмпирические (наблюдаемые) и теоретические (вычисленные в пред­положении определенного распределения А) частоты. Выпишем эти частоты:

Как правило, эмпирические и теоретические частоты будут раз­личаться. Возможно, что наблюдаемое различие случайно (стати­стически незначимо) и объясняется либо малым числом наблюде­ний, либо способом их группировки, либо иными причинами. Но возможно, что расхождение частот значимо и объясняется тем, что теоретические частоты вычислены исходя из неверной гипотезы о характере распределения значений рассматриваемых признаков, генеральной совокупности. Критерий c2 отвечает на вопрос, случай­но или пет такое расхождение частот. Как любой критерий, c2 не доказывает справедливость гипотезы, а лишь с определенной веро­ятностью а устанавливает ее согласие или несогласие с данными

наблюдениями., Критерий c2 имеет вид

Критическая точка распределения c2 находится (см. табл. Б прило­жения} по заданному уровню значимости а и числу степеней свободы df. Число степеней свободы находят по формуле

df=k – l – r,

где k — число интервалов вариационного ряда; r— число парамет­ров предполагаемого распределения, которые оценены по данным выборки (например, для нормального распределения оценивают два параметра: m и s2).

Рассмотрим пример, когда признак оценивался в терминах «очень низкий», «средний», «очень высокий» и был получен сле­дующий ряд распределения для этих трех категорий:

Проверим гипотезу о том, что в генеральной совокупности зна­чения этого признака распределены равномерно.

Теоретическое распределение для этих групп получим, если предположим, что эти категории независимы, т. е. респондент с одинаковой вероятностью может попасть в любую группу. Очевид­но, ожидаемая (теоретическая) частота будет равна 24/3 = 8 человек.

Таким образом, имеем следующие эмпирические и теоретические частоты:

Проверяется гипотеза, что число респондентов во всех трех катего­риях одинаково, т. е. отличие распределения от равномерного ста­тистически незначимо.

 

По таблице распределения c2, например, для уровня значимости 0,05 и степени свободы, равной df = 3 — 1 = 2, находим критиче­скую точку c2 кр = 5,991. Таким образом, наблюдаемое значение c2 меньше c2 кр следовательно, данные наблюдений согласуются с ну­левой гипотезой и не дают оснований ее отвергнуть.

Хи-квадрат критерий применим и для проверки нулевой гипо­тезы об отсутствии связей между признаками в случае, если эмпи­рические данные сгруппированы не по одному, как выше, а гкг не­скольким признакам. Например, пусть имеется выборка в 190 чело­век, чье мнение относительно какого-то определенного вопроса ис­следовалось (табл. 5). Расчленим эту выборку на три независимых категории по возрасту. Рассмотрим следующие гипотезы: — не существует различия мнений относительно этого вопроса среди различных возрастных групп; Н—существует различие. Проверим гипотезу для уровня значимости а = 0,05.

Для нахождения ожидаемой (теоретической) частоты в любой клетке таблицы необходимо просто перемножить соответствующие маргинальные частоты и разделить произведение на итоговую сум­му. Например, ожидаемая частота для клетки (а) равна

 

Для нашего примера df= (4 — 1)(3 — 1) = 6. По табл. Б прило­жения находим, что c2 кр = 16,812. Следовательно, нужно отвергнуть гипотезу о том, что нет различий в мнении среди неодинаковых возрастных групп, т. е. можно предположить, что существует зна­чимая статистическая взаимосвязь между тем, к какой возрастной группе принадлежит респондент, и тем мнением, которое он высказывает. Однако величина c2 не говорит о силе связи между переменными, а лишь указывает на вероятность существования такой свя­зи. Для Определения интенсивности связи необходимо использовать Соответствующие меры связи.

Для корректного применения методов, основанных на c2, иссле­дователь должен обеспечить выполнение следующих условий. Вы­борку необходимо получить из независимых наблюдений. Данные могут быть измерены на любом уровне, но ни одна из ожидаемых частот не должна быть слишком мала (минимум 5). Если же часто­ты оказываются менее 5, то необходимо либо уменьшить степень дробности группировки признаков, объединив соседние категории, либо обратиться к другому критерию21.





Поделиться с друзьями:


Дата добавления: 2015-11-05; Мы поможем в написании ваших работ!; просмотров: 1533 | Нарушение авторских прав


Поиск на сайте:

Лучшие изречения:

Большинство людей упускают появившуюся возможность, потому что она бывает одета в комбинезон и с виду напоминает работу © Томас Эдисон
==> читать все изречения...

2531 - | 2189 -


© 2015-2024 lektsii.org - Контакты - Последнее добавление

Ген: 0.01 с.