Лекции.Орг


Поиск:




Тема 2. Генеральная совокупность и выборка

Краткий курс по методам математической статистики

 

 

КРАТКИЙ КУРС «Методы математической статистики» - позволяет на основе базовых знаний

 

о статистических методах правильно подойти к выбору необходимой методики для обработки данных. Ведь правильно выбранная статистическая методика – это 80% успеха Вашей работы.

 

Данный КРАТКИЙ КУРС посвящен Вам, студенты и аспиранты, которые столкнулись с проблемой статистической обработки своих экспериментальных данных, но не имеющих представление какими методами пользоваться, с чего начать, а иногда и задающимися вопросом: «А что это такое? И зачем мне это нужно?».

 

Вы вероятно в данный момент не поверите мне, но статистическая обработка данных очень интересное и увлекательное занятие. Правда, при одном условии – статистика без страшно утомительных ФОРМУЛ!

 

Имея огромный опыт работы со студентами и аспирантами, прекрасно знаю, в чем они нуждаются. А большинство учебников, курсов и сайтов с материалами по статистике содержат только материал какие формулы необходимы для вычисления того или иного статистического метода.

 

В данном курсе Вы не найдете ни одной формулы, так как я прекрасно понимаю, что Вам нужно лишь объяснение сути методов, без огромного количества формул, которые могут запутать и сбить с толку.

 

Глава 1: Основные понятия статистики и дескриптивный анализ.

 

Шкалы измерений.

Генеральная совокупность и выборка.

Нормальное распределение. Уровень статистической достоверности.

Свойства описательных статистик (Часть 1).

Свойства описательных статистик (Часть 2).

 

Меры изменчивости.

 

Глава 2: Методы проверки статистических гипотез. Корреляции и методы сравнения.

 

Коэффициент корреляции. Частная корреляция.

Коэффициент корреляции Пирсона, Спирмена и Кендалла.

Параметрические методы сравнения данных.

 

Непараметрические методы сравнения для независимых выборок.

Непараметрические методы сравнения для зависимых выборок.

 

Методы сравнения номинальных данных.

 

Глава 3: Методы проверки статистических гипотез. Дисперсионный и регрессионный анализы.

 

Дисперсионный анализ (Часть 1).

Дисперсионный анализ (Часть 2).

Дисперсионный анализ (Часть 3).

 

Регрессионный анализ. Простая линейная регрессия.

Регрессионный анализ. Множественная линейная регрессия.


Www. statwork. net

 

 

ОГЛАВЛЕНИЕ

 

Темы курса:

 

Шкалы измерений. стр. 3
Генеральная совокупность и выборка. стр. 5
Нормальное распределение. Уровень статистической достоверности. стр. 7
Свойства описательных статистик (Часть 1)

стр. 11

Свойства описательных статистик (Часть 2)

стр. 13

Меры изменчивости.

стр. 15

Коэффициент корреляции. Частная корреляция.

стр. 17

Коэффициент корреляции Пирсона, Спирмена и Кендалла

стр. 19

Параметрические методы сравнения данных

стр. 22

Непараметрические методы сравнения для независимых выборок.

стр. 24

Непараметрические методы сравнения для зависимых выборок.

стр. 27

Методы сравнения номинальных данных.

стр. 29

Дисперсионный анализ (Часть 1).

стр. 32

Дисперсионный анализ (Часть 2).

стр. 34

Дисперсионный анализ (Часть 3).

стр. 36

Регрессионный анализ. Простая линейная регрессия.

стр. 38

Регрессионный анализ. Множественная линейная регрессия.

стр. 40

 

 

2


Www.statwork.net

 

Тема 1. Шкалы измерений

 

Глава 1. Основные понятия статистики и дескриптивный анализ.

 

 

Первый шаг на пути к успешной обработке данных, - это выяснить, в какой же, все-таки, шкале измерены ваши данные и подчиняются ли они закону нормального распределения. От этого зависит то, какими методами Вы будете обрабатывать данные, а значит, зависит верность ваших результатов и выводов. К тому же, Вы будете точно знать ответ на вопрос преподавателей: "Почему Вы выбрали в качестве метода именно этот анализ?".

 

Так же как нельзя съесть апельсин, не очистив его от кожуры, так и здесь, нельзя начать изучать статистические методы, не зная самых главных основ статистики.

 

В этом и будут заключаться первые несколько тем этого курса – знакомство с различными шкалами измерения, нормальным распределением и выборкой.

 

Обычно используют следующие типы шкал измерений: номинальная (названий или категорий), порядковая (ординальная), интервальная и относительная (шкала отношения или абсолютная шкала). Соответственно имеются четыре типа переменных: номинальная, порядковая (ординальная), интервальная, относительная (абсолютная).

 

1) Номинальные переменные используются только для качественной классификации.Этоозначает, что данные переменные могут быть измерены только в терминах принадлежности к некоторым существенно различным классам, при этом вы не сможете определить количество или упорядочить эти классы. Часто номинальные переменные называются категориальными.

 

ПРИМЕРОМ номинальных переменных являются фирма-производитель, тип товара, признак (болен - здоров) и т. д.

 

2) Порядковые переменные позволяют ранжировать(упорядочить)объекты,если указано,какие из них в большей или меньшей степени обладают качеством, выраженным данной переменной. Однако они не позволяют определить «на сколько больше» или «на сколько меньше» данного качества содержится в переменной. Порядковые переменные иногда также называют ординальными.

 

ПРИМЕР 1 - социоэкономический статус семьи. Мы понимаем, что верхний средний уровень выше среднего уровня, однако сказать, что разница между ними равна, допустим, 18%, мы не можем. Само расположение шкал в порядке возрастания их информативности - номинальная, порядковая, интервальная - является хорошим примером порядковой переменной.

 

ПРИМЕР 2 - интенсивность использования определенного цвета в картине художника.

 

 

Категориальные и порядковые переменные особенно часто возникают при анкетировании, т. к. естественно отражают характер мышления человека. Например, измерение интенсивности посещение ресторанов можно проводить в следующей шкале: не посещаю, посещаю редко, посещаю, посещаю часто.

 

3


Www. statwork. net

 

 

Категориальные и порядковые шкалы часто используются для описания качественных признаков.

 

3 ) Интервальные переменные позволяют не только упорядочивать объекты измерения, но и численно выражать и сравнивать различия между ними. Такого рода переменные часто возникают в естественных науках, при снятии показателей с физических приборов, в медицине и т. д.

 

ПРИМЕР - температура, измеренная в градусах Фаренгейта или Цельсия, образует интервальную шкалу. Вы можете не только сказать, что температура 40 градусов выше, чем температура 30 градусов, но и то, что увеличение температуры с 20 до 40 градусов вдвое больше увеличения температуры от 30 до 40 градусов.

 

4) Относительные переменные очень похожи на интервальные переменные.Их характернойчертой является наличие определенной точки абсолютного нуля, таким образом, для этих переменных являются обоснованными утверждения типа: X в два раза больше, чем Y.

 

ПРИМЕР - температура по Кельвину образует шкалу отношения, и вы можете не только утверждать, что температура 200 градусов выше, чем 100 градусов, но и то, что она вдвое выше. Интервальные шкалы (например, шкала Цельсия) не обладают данным свойством шкалы отношения. Однако в большинстве статистических процедур не делается тонкого различия между свойствами интервальных шкал и шкал отношения.

 

Перечисленные шкалы полезно характеризовать еще и по признаку их дифференцирующей способности (мощности). В этом отношении шкалы по мере возрастания мощности располагаются следующим образом: номинальная, ранговая, интервальная, абсолютная. Таким образом, неметрические шкалы заведомо менее мощные - они отражают меньше информации о различии объектов (испытуемых) по измеренному свойству, и, напротив, метрические шкалы более мощные, они лучше дифференцируют испытуемых. Поэтому, если у исследователя есть возможность выбора, следует применить более мощную шкалу.

 

Однако всегда можно перейти от более мощной шкалы к менее мощной. Так, непрерывные переменные можно искусственно превратить в категориальные.

 

Так, непрерывная переменная «рост человека в сантиметрах» может быть превращена в порядковую переменную с градациями: низкий, средний, высокий или очень низкий; низкий, средний, высокий; для размера одежды используют следующую порядковую шкалу: XS, S, M, L, XL, XXL и т. д.

 

 

4


Www. statwork. net

 

 

Тема 2. Генеральная совокупность и выборка

 

Глава 1. Основные понятия статистики и дескриптивный анализ.( В основе дескриптивного (описательного) анализа лежат такие статистические показатели как средняя величина, мода, медиана, стандартное отклонение и другие. Они представляют собой характеристики переменных - величин, которые в исследованиях можно измерять, контролировать или варьировать)

 

 

Исследование обычно начинается с некоторого предположения, требующего проверки с привлечением фактов. Это предположение - гипотеза - формулируется в отношении связи явлений или свойств в некоторой совокупности объектов.

 

Для проверки подобных предположений на фактах необходимо измерить соответствующие свойства у их носителей. Но невозможно измерить тревожность у всех женщин и мужчин, как невозможно измерить агрессивность у всех подростков. Поэтому при проведении исследования ограничиваются лишь относительно небольшой группой представителей соответствующих совокупностей людей.

 

Генеральная совокупность -это все множество объектов,в отношении которогоформулируется исследовательская гипотеза.

 

В первом примере такими генеральными совокупностями являются все мужчины и все женщины. Во втором - все подростки, которые смотрят телепередачи, содержащие сцены насилия. Генеральные совокупности, в отношении которых исследователь собирается сделать выводы по результатам исследования, могут быть по численности и более скромными.

 

Таким образом, генеральная совокупность - это хотя и не бесконечное по численности, но, как правило, недоступное для сплошного исследования множество потенциальных испытуемых.

 

Выборка -это ограниченная по численности группа объектов(в психологии-испытуемых,респондентов), специально отбираемая из генеральной совокупности для изучения ее свойств. Соответственно, изучение на выборке свойств генеральной совокупности называется выборочным исследованием.

 

Таким образом, после того, как сформулирована гипотеза и определены соответствующие генеральные совокупности, перед исследователем возникает проблема организации выборки. Выборка должна быть такой, чтобы была обоснована генерализация выводов выборочного исследования - обобщение, распространение их на генеральную совокупность. Основные критерии обоснованности выводов исследования - это репрезентативность выборки и статистическая достоверность (эмпирических) результатов.

 

Репрезентативность выборки -иными словами,ее представительность-это способностьвыборки представлять изучаемые явления достаточно полно - с точки зрения их изменчивости в генеральной совокупности.

5


Www. statwork. net

 

Конечно, полное представление об изучаемом явлении, во всем его диапазоне и нюансах изменчивости, может дать только генеральная совокупность. Поэтому репрезентативность всегда ограничена в той мере, в какой ограничена выборка. И именно репрезентативность выборки является основным критерием при определении границ генерализации выводов исследования. Тем не менее, существуют приемы, позволяющие получить достаточную для исследователя репрезентативность выборки.

 

Первый и основной прием - это простой случайный (рандомизированный) отбор. Он предполагает обеспечение таких условий, чтобы каждый член генеральной совокупности имел равные с другими шансы попасть в выборку.

 

Второй способ обеспечения репрезентативности - это отбор по свойствам генеральной совокупности. Он предполагает предварительное определение тех качеств, которые могут влиять на изменчивость изучаемого свойства (это может быть пол, уровень дохода или образования и т.д.). Затем определяется процентное соотношение численности различающихся по этих качествам групп в генеральной совокупности и обеспечивается идентичное процентное соотношение соответствующих групп в выборке. Далее в каждую подгруппу выборки испытуемые подбираются по принципу простого случайного отбора.

 

Статистическая достоверность, или статистическая значимость, результатов исследования определяется при помощи методов статистического вывода, которые предъявляют определенные требования к численности, или объему выборки.

 

Общие рекомендации по численности выборки:

 

- Наибольший объем выборки необходим при разработке диагностической методики - от 200

 

до 1000-2500 человек.

 

- Если необходимо сравнивать 2 выборки, их общая численность должна быть не менее 50 человек; численность сравниваемых выборок должна быть приблизительно одинаковой.

 

- Если изучается взаимосвязь между какими-либо свойствами, то объем выборки должен быть не меньше 30-35 человек.

 

- Чем больше изменчивость изучаемого свойства, тем больше должен быть объем выборки. Поэтому изменчивость можно уменьшить, увеличивая однородность выборки, например, по полу, возрасту и т. д. При этом, естественно, уменьшаются возможности генерализации выводов.

 

Зависимые и независимые выборки. Обычна ситуация исследования,когда интересующееисследователя свойство изучается на двух или более выборках с целью их дальнейшего сравнения. Эти выборки могут находиться в различных соотношениях - в зависимости от процедуры их организации. Независимые выборки характеризуются тем, что вероятность отбора любого испытуемого одной выборки не зависит от отбора любого из испытуемых другой выборки. Напротив, зависимые выборки характеризуются тем, что каждому испытуемому одной выборки поставлен в соответствие по определенному критерию испытуемый из другой выборки.

 

В общем случае зависимые выборки предполагают попарный подбор испытуемых в сравниваемые выборки, а независимые выборки – независимый отбор испытуемых.

 

6


Www. statwork. net

 

Следует отметить, что случаи «частично зависимых» (или «частично независимых») выборок недопустимы: это непредсказуемым образом нарушает их репрезентативность.

 



<== предыдущая лекция | следующая лекция ==>
Произведения  А.П. Чехова | Тема 3. Нормальное распределение. Уровень достоверности.
Поделиться с друзьями:


Дата добавления: 2018-10-15; Мы поможем в написании ваших работ!; просмотров: 307 | Нарушение авторских прав


Поиск на сайте:

Лучшие изречения:

Настоящая ответственность бывает только личной. © Фазиль Искандер
==> читать все изречения...

806 - | 688 -


© 2015-2024 lektsii.org - Контакты - Последнее добавление

Ген: 0.012 с.