Ћекции.ќрг


ѕоиск:




 атегории:

јстрономи€
Ѕиологи€
√еографи€
ƒругие €зыки
»нтернет
»нформатика
»стори€
 ультура
Ћитература
Ћогика
ћатематика
ћедицина
ћеханика
ќхрана труда
ѕедагогика
ѕолитика
ѕраво
ѕсихологи€
–елиги€
–иторика
—оциологи€
—порт
—троительство
“ехнологи€
“ранспорт
‘изика
‘илософи€
‘инансы
’ими€
Ёкологи€
Ёкономика
Ёлектроника

 

 

 

 


„асть I. »змерени€ и  лассификаци€




—ќƒ≈–∆јЌ»≈

ѕ–≈ƒ»—Ћќ¬»≈.. 4

¬¬≈ƒ≈Ќ»≈.. 9

„ј—“№ I. »«ћ≈–≈Ќ»я »  Ћј——»‘» ј÷»я. 19

√лава 1. »«ћ≈–≈Ќ»я » Ў јЋџ. 19

¬опросы дл€ самосто€тельной работы.. 22

√лава 2.  лассификаци€ наблюдений.  ластерный анализ. 23

„ј—“№ II. Ќ≈ѕј–јћ≈“–»„≈— »≈ ћ≈“ќƒџ. 39

√лава 3. «адача сопоставлени€ и сравнени€. 39

3.1.  ритерии различий. 39

Q - критерий –озенбаума. 40

ѕримеры дл€ самосто€тельного решени€. 45

3.2 U- критерий ћанна-”итни. 54

ѕримеры дл€ самосто€тельного решени€. 58

3.3. ¬ыбор критери€ различий. 64

√Ћј¬ј 4. «јƒј„ј »——Ћ≈ƒќ¬јЌ»я »«ћ≈Ќ≈Ќ»…. 64

 ритерии изменений. 64

4.1 G Ц критерий знаков. 65

ѕримеры дл€ самосто€тельного решени€. 67

4.2. T Ц критерий ¬илкоксона. 75

ѕримеры дл€ самосто€тельного решени€. 79

4.3 ¬ыбор критери€ оценки сдвига. 83

√лава 5. «адача вы€влени€ различий в распределении признака. 84

 ритерии согласи€ распределений. 84

5.1. λ Ц критерий  олмогорова Ц —мирнова. 84

ѕримеры дл€ самосто€тельного решени€. 88

5.2. χ2 Ц критерий ѕирсона. 92

ѕримеры дл€ самосто€тельного решени€. 99

√лава 6. ћногофункциональные статистические критерии. 101

6.1. φ* Ц критерий ‘ишера. 101

ѕримеры дл€ самосто€тельного решени€. 104

6.2 Ѕиноминальный m Ц критерий. 106

ѕримеры дл€ самосто€тельного решени€. 109

6.3  лассификаци€ задач и непараметрических методов их решени€. 110

„ј—“№ III. ѕј–јћ≈“–»„≈— »≈ ћ≈“ќƒџ. 111

√лава 7. ќднофакторный дисперсионный анализ. 111

√лава 8. јнализ и моделирование парной коррел€ционной св€зи. 118

8.1 Ќазначение коррел€ционного анализа. 119

—войства выборочного коэффициента коррел€ции: 120

8.2. –егрессионный анализ. 124

8.3. –ангова€ коррел€ци€. 129

«ј Ћё„≈Ќ»≈.. 133

Ћитература. 136

ѕ–≈ƒ»—Ћќ¬»≈

 

ѕрименение математических методов в экономике, социологии, психологии позвол€ет на базе реальных статистических данных строить, анализировать и совершенствовать модели реальных процессов, количественно оценивать и сравнивать различные €влени€, делает обозримыми длинные словесные описани€, про€сн€ет мысль. ¬ частности, одним из важнейших направлений, в котором используютс€ методы математической статистики, €вл€етс€ построение обоснованных прогнозов будущих событий по различным статистическим показател€м. —оциологические процессы выражаютс€ в массовых, а не в единичных фактах. »менно массовость этих €влений требует применени€ статистических методов исследовани€ и статистических показателей, характеризующих массовые случайные €влени€ и св€зи между ними Ц средних величин, характеристик распределени€, коррел€ции, динамики и структуры массовых €влений. ѕоэтому основой используемых в социологии математических методов служит математическа€ статистика.

¬ св€зи с демократизацией общественных процессов в –оссии к середине 90-ых годов прошлого века актуальной социально-политической задачей становитс€ анализ общественного мнени€ с целью оптимальной организации федеральных и региональных избирательных компаний. ƒругой, не менее важной, задачей €вл€етс€ получение объективной информации о предпочтени€х покупателей потребительских рынков в услови€х конкуренции производителей. –ешение этих проблем на современном уровне невозможно без использовани€ методов математической статистики дл€ анализа социума.

–езультаты исследовани€, полученные с помощью математических методов Ц это не строго подлежаща€ исполнению Ђинструкци€ї, а лишь общие указани€ о пут€х и методах возможных решений практических задач. »зучившему их специалисту самому придетс€ решать, насколько в реальной обстановке применима та или ина€ методика, насколько полна и надежна имеюща€с€ информаци€, какими требовани€ми науки можно поступитьс€, а какими нельз€ пренебречь ни в коем случае.

¬ насто€щее врем€ имеетс€ достаточное количество публикаций по этим проблемам в различных пособи€х по социальным исследовани€м, в том числе и в учебно-методических издани€х. ќднако, как правило, эти издани€ не учитывают реальные учебные планы обучени€ студентов вузов по социологическим специальност€м. Ќасто€щее пособие должно помочь тем, кто осваивает этот раздел методов математической обработки данных.

«а основу пособи€ прин€т материал курсов лекций, читаемых в –оссийском государственном социальном университете. ѕо каждой теме после необходимого минимума теоретических сведений подробно разбираютс€ примеры, затем привод€тс€ задачи дл€ самосто€тельного решени€. Ћекционна€ практика показала, что рассмотрение реальных исследований в качестве учебных примеров слишком сложно дл€ понимани€ студентами. ѕоэтому в насто€щем пособии примеры, с помощью которых демонстрируетс€ сущность математических методов, специально были составлены с приданием этим примерам правдоподобной окраски. ¬ тоже врем€ приводитс€ информаци€ о некоторых реальных социологических исследовани€х, которые проводились в –оссии со ссылкой на литературу, которую можно рекомендовать студентам дл€ самосто€тельного изучени€.

ѕредполагаетс€, что студенты, изучающие методы математической обработки данных в экономике, социологии, психологии уже прослушали курс теории веро€тностей и математической статистики, поэтому во введении привод€тс€ лишь необходимые дл€ понимани€ последующего материала основные пон€ти€ математической статистики. ¬ первой главе описаны основные шкалы измерени€ социологических данных. √лава втора€ посв€щена одному из методов классификации статистической информации Ц методу кластерного анализа. √лавы с третьей по шестую посв€щены непараметрическим методам, которые, по мнению зарубежных и отечественных социологов, при работе с реальными социологическими и социально-экономическими данными дают гораздо более надежные результаты. ¬ главе седьмой рассматриваетс€ однофакторный дисперсионный анализ. √лава восьма€ посв€щена вопросам парной линейной регрессии. ѕредставлен фундаментальный метод оценки параметров уравнени€ регрессии Ц метод наименьших квадратов.  роме того, рассмотрен метод ранговой коррел€ции.

јвтор глубоко благодарен декану факультета информационных технологий-профессору √алине —евасть€новне ∆уковой за создание на кафедре атмосферы дружеской поддержки и высоких интеллектуалных требований.

јвтор признателен за помощь и поддержку в работе сотрудникам кафедры математики и информатики ƒ.¬. ’акимовой, к.э.н. —.Ќ. Ѕойкову, а также своей дочери к.м.н. —.¬. Ћомидзе.

јвтор выражает благодарность студентам кафедры социологии –√—”, которые принимали активное участие в составлении примеров дл€ этого пособи€.

 

 


¬¬≈ƒ≈Ќ»≈

 

ћетодической основой математической статистики €вл€ютс€ законы теории веро€тностей. ѕравомерность их использовани€ доказана законом больших чисел, который €вл€етс€ св€зующим звеном между теорией веро€тностей как математической наукой и закономерност€ми случайных €влений при массовых наблюдени€х над ними. “еоремы, €вл€ющиес€ различными формами закона больших чисел устанавливают факт асимптотического приближени€ средних характеристик массовых случайных €влений при большом числе опытов к некоторым определенным посто€нным. Ётот факт позвол€ет уверенно оперировать с этими величинами, предсказывать результаты массовых случайных €влений почти с полной определенностью. Ќапример, теорема Ѕернулли устанавливает тот факт, что при неограниченном увеличении числа опытов n частота событи€ ј сходитс€ по веро€тности к его веро€тности –. “еорема Ѕернулли обосновывает статистическое определение веро€тности, заключающеес€ в том, что веро€тность событи€ ј Ц посто€нна€ величина, вокруг которой колеблютс€ значени€ частот m/n при неограниченном возрастании числа n.

”слови€ теорем закона больших чисел свод€тс€ к требованию большой серии независимых и однородных наблюдений. Ћюбые социальные системы по своей природе €вл€ютс€ стохастическими. —ерьезные объемы выборочных данных и независимость наблюдений в прикладной социологии обеспечиваютс€.

 

ќсновные пон€ти€ математической статистики

√енеральной совокупностью называетс€ полное множество объектов, свойства которых интересуют исследовател€. √енеральна€ совокупность может быть очень большой, поэтому с целью экономии времени и материальных ресурсов случайным образом производ€т выборку из генеральной совокупности.

¬ыборка Ц это часть генеральной совокупности, подмножество статистических данных, свойства которых реально изучаютс€. ѕусть некоторый признак генеральной совокупности описываетс€ случайной величиной . –ассмотрим выборку объема из генеральной совокупности. Ёлементы этой выборки представл€ют собой значени€ случайной величины . Ќа первом этапе статистической обработки производ€т упор€дочивание чисел по возрастанию. –азличные элементы выборки называютс€ вариантами.

„астотой варианты называетс€ число , которое показывает, сколько раз эта варианта встречаетс€ в выборке.

ќтносительной частотой называетс€ число . „исло называетс€ накопленной частотой, а отношение накопленной частоты к общему числу наблюдений - накопленной относительной частотой.

Ёмпирической функцией распределени€ называетс€ функци€, значение которой в точке равно накопленной частоте, т.е. .

ќсновной характеристикой вариационного р€да €вл€етс€ его средн€€ выборочна€

.

ћода случайной величины Ц это ее наиболее веро€тное значение. ¬ социологических исследовани€х часто мода показательнее, чем среднее выборочное в тех случа€х, когда необходимо знать наиболее типичное значение признака, а не его усредненное значение.

¬ыборочной дисперсией называетс€ средн€€ арифметическа€ квадратов отклонений вариант от их выборочной средней

.

¬ыборочное среднее квадратическое отклонение определ€етс€ как корень из дисперсии:

.

 

—редн€€ выборочна€, выборочна€ дисперси€, выборочное среднее квадратическое отклонение называютс€ точечными статистическими оценками параметров и дают лишь приближенные значени€ этих параметров. „тобы получить представление о точности и надежности этих оценок, используют интервальные оценки.

»нтервальной оценкой любого параметра генеральной совокупности называетс€ интервал (α, β), который с заданной веро€тностью γ Ђнакрываетї истинное неизвестное значение параметра генеральной совокупности. Ётот интервал называетс€ доверительным интервалом, а веро€тность γ доверительной веро€тностью или уровнем надежности. ќбычно доверительный интервал симметричен относительно точечной оценки параметра и имеет вид: , то есть неравенства < < выполн€ютс€ с веро€тностью γ.

¬ этих неравенствах точечна€ оценка параметра, - истинное значение параметра генеральной совокупности.

Ќаибольшее отклонение ε выборочного значени€ параметра от его истинного значени€ дл€ генеральной совокупности называетс€ предельной ошибкой выборки.

ƒоверительный интервал уровн€ надежности γ дл€ генеральной средней ћ имеет вид

< Μ < ,

где ε - предельна€ ошибка выборки, завис€ща€ от γ и вычисл€ема€ по формуле в случае, если известно среднее квадратическое отклонение σ, то t вычисл€етс€ из услови€ ‘(t)=γ, где ‘(t)-функци€ Ћапласа, в случае если среднее квадратическое отклонение неизвестно, то ε вычисл€етс€ по формуле

. «десь S определ€ют по выборочным данным, а t в этом случае наход€т в таблице распределени€ —тьюдента по известным значени€м γ, n.

ѕо известным из литературы [6, 7] формулам доверительный интервал можно определить дл€ любого параметра генеральной совокупности.

‘ункцией распределени€ случайной величины называетс€ функци€ , равна€ при каждом веро€тности того, что в результате испытани€ примет значение, меньшее : .

‘ункци€ распределени€ случайной величины , распределенной по равномерному закону на отрезке , имеет вид: .

ќчень важным в статистических исследовани€х €вл€етс€ нормальный закон распределени€. ‘ункци€ распределени€ нормальной случайной величины дл€ выборки с параметрами и св€заны с функцией Ћапласа соотношением:

.

«начени€ функции Ћапласа затабулированы (см. приложение, таблица 11)

ƒл€ решени€ статистических задач используютс€ специальные распределени€ случайных величин, сконструированных на основе нормального распределени€, но при этом закон распределени€ зависит только от объема выборки и от вида распределени€ случайной величины , и не зависит от неизвестных параметров этого распределени€. “акими распределени€ми €вл€ютс€ распределение , распределение —тьюдента, распределение ‘ишера. Ёти распределени€ приведены в статистических таблицах 12, 13, 14 в приложении.

 ак оценить свойства генеральной совокупности, зна€ эти свойства дл€ выборки? — этой целью провод€т проверку статистических гипотез. —татистической гипотезой называетс€ предположение исследовател€ о свойствах распределени€ веро€тностей, лежащих в основе наблюдаемых €влений. ѕо своему содержанию статистические гипотезы можно разделить на несколько основных типов:

1. √ипотезы о виде закона распределени€ случайностей. 2. √ипотезы о числовых значени€х параметров случайных величин. 3. √ипотезы о принадлежности некоторого признака к тому или иному классу. 4. √ипотезы об общем виде модели, описывающей статистическую зависимость между признаками.

√ипотеза €вл€етс€ основной в том смысле, что нам было бы желательно убедитьс€ в ее справедливости. √ипотезе противопоставл€ют гипотезу , которую называют альтернативной.

¬еро€тность отвергнуть гипотезу , если она верна (т.е. прин€ть гипотезу ) называетс€ веро€тностью ошибки первого рода или уровнем значимости и обозначаетс€ : .

¬еличина , равна€ веро€тности прин€ть верную гипотезу, называетс€ доверительной веро€тностью, отражает степень уверенности исследовател€ в том, что выдвинута€ им основна€ гипотеза верна.

¬еро€тность прин€ть основную гипотезу, если она неверна, называетс€ ошибкой второго рода и обозначаетс€ : .

¬еро€тность прин€ть гипотезу , если она верна, называетс€ мощностью критери€ .

ѕравило , по которому принимаетс€ или отвергаетс€ гипотеза, называетс€ критерием. ѕроцедура построени€ критери€ происходит следующим образом. ѕо результатам обработки данных выборки определ€етс€ величина, которую будем называть эмпирическим значением статистического критери€. јлгоритм вычислени€ эмпирического значени€ критери€ зависит от типа решаемой задачи. Ќо в любом случае статистический критерий €вл€етс€ такой случайной величиной, чтобы в случае, если гипотеза верна, закон распределени€ был бы известным. –аспределени€ критериев, используемых в описываемых в насто€щем издании статистических методах, приведены в приложении. “аким образом, дл€ проверки статистической гипотезы сначала по выборочным данным вычисл€етс€ эмпирическое значение критери€ , имеющее известное распределение, затем задаетс€ доверительна€ веро€тность (или уровень значимости ) дл€ прин€ти€ гипотезы, и, наконец, делаютс€ выводы о справедливости гипотезы .

—хема проверки статистической гипотезы не дает точного вывода о ее верности или неверности, так как прин€тие решени€ происходит на некотором (субъективно) прин€том уровне надежности и основываетс€ на значени€х конечной выборки. ѕрин€тие гипотезы означает, что на прин€том уровне надежности гипотеза не противоречит имеющимс€ у нас выборочным данным. ѕо значени€м α и n в соответствующих решаемой задаче таблицах наход€т значение величины, которую называют критическим значением критери€. ѕо соотношению статистического и критического значений критери€ можно судить о том, подтверждаетс€ или опровергаетс€ нулева€ гипотеза . ѕравила прин€ти€ или опровержени€ приведены в описании каждого из представленных в пособии критериев.

ѕризнаками называют те свойства выборки, которые интересуют исследовател€. ”ровень признака Ц это количественно измеренное значение признака. »менно эти значени€ и €вл€ютс€ элементами выборки, которые подвергаютс€ статистической обработке. »спользуемые при этом статистические критерии дел€т на параметрические и непараметрические.

ѕараметрические критерии включают в формулу расчета параметры распределени€ признака (средние и дисперсии) и позвол€ют пр€мо оценить различи€ в параметрах двух выборок, при этом параметрические критерии следует примен€ть только тогда, когда известно или доказано, что значени€ признака распределены по нормальному закону.

Ќепараметрические критерии не включают в формулу расчета средние значени€ и дисперсию, не требуют проверки совпадени€ эмпирического распределени€ признака с нормальным законом распределени€. — их помощью можно ответить на вопрос, чаще ли в выборке ј встречаютс€ более высокие значени€, а в выборке ¬ Ц более низкие значени€ признака. ќни позвол€ют также оценить различи€ в диапазонах изменени€ признака, вы€вить тенденции в изменении признака при переходе от услови€ к условию. Ѕольшинство непараметрических критериев не требуют длительных и сложных расчетов. » в социологических исследовани€х их использование занимает значительное место. ћетоды, которые рассматриваютс€ в главах 3-6, €вл€ютс€ непараметрическими, что значительно расшир€ет их возможности по сравнению с традиционными параметрическими методами. Ќекоторые из методов могут быть применимы по отношению к любым данным, имеющим хоть какое-то числовое выражение.

 

 

„ј—“№ I. »«ћ≈–≈Ќ»я »  Ћј——»‘» ј÷»я.





ѕоделитьс€ с друзь€ми:


ƒата добавлени€: 2015-11-05; ћы поможем в написании ваших работ!; просмотров: 499 | Ќарушение авторских прав


ѕоиск на сайте:

Ћучшие изречени€:

80% успеха - это по€витьс€ в нужном месте в нужное врем€. © ¬уди јллен
==> читать все изречени€...

1506 - | 1344 -


© 2015-2024 lektsii.org -  онтакты - ѕоследнее добавление

√ен: 0.038 с.