Лекции.Орг


Поиск:




Категории:

Астрономия
Биология
География
Другие языки
Интернет
Информатика
История
Культура
Литература
Логика
Математика
Медицина
Механика
Охрана труда
Педагогика
Политика
Право
Психология
Религия
Риторика
Социология
Спорт
Строительство
Технология
Транспорт
Физика
Философия
Финансы
Химия
Экология
Экономика
Электроника

 

 

 

 


Правила принудительного ранжирования




Учебно-методическое пособие

Для студентов психологических и

Педагогических специальностей

 

 

 

 

 

Петропавловск 2004


ББК 88

УДК 311:189.9

П 43

Издается по решению

Учебно-методического Совета

СКГУ им. М.Козыбаева

(протокол № 9 от 24.06.2004г.)

 

Рецензент:

кандидат физико-математических наук, доцент Е. Акжигитов

 

 

Погребицкая М.В.

П 43 Математические методы в психологии: Учебно-методическое пособие. – Петропавловск, СКГУ, 2004.- 228 с.

 

 

Учебно-методическое пособие содержит системное изложение математических методов в применении к задачам экспериментальных психологических исследований. В доступной форме, не требующей значительной подготовки, рассматриваются основные методы обработки данных, включая непараметрические критерии оценки различий и корреляционный анализ. Приведены многочисленные примеры такой обработки и предложены многовариантные лабораторные работы для развития практических навыков решения задач.

Пособие предназначено для студентов психологических и педагогических специальностей, а также может быть использовано студентами, обучающимися по кредитной и дистанционной технологиям, исследователями в области психологии, социологии, педагогики, медицины и биологии.

 

 

УДК 311:189.9

 

Ó Погребицкая М.В., 2004

Ó Северо-Казахстанский государственный университет им. М.Козыбаева, 2004

 

 

СОДЕРЖАНИЕ

 

  От автора……………………………………………………... 7
  Введение……………………………………………………... 9
     
Раздел I. ОПИСАТЕЛЬНАЯ СТАТИСТИКА  
     
  Тема 1. Измерения в психологии……………………….. 15
  1.1. Признаки и переменные…………………………. 15
  1.2. Шкалы измерения………………………………… 16
  Вопросы и упражнения…………………………... 18
  Тема 2. Представление данных………………………… 20
  2.1. Группировка данных……………………………… 20
  2.2. Табулирование данных………………………….. 21
  2.3. Ранговый порядок ………………………………... 23
  2.4. Распределение частот…………………………… 25
  2.5. Статистические ряды…………………………….. 27
  2.6. Понятие распределения и гистограммы……… 29
  Вопросы и упражнения…………………………... 33
  Тема 3. Меры центральной тенденции………………... 34
  3.1. Мода………………………..……………………….. 34
  3.2. Медиана………………………..…………………... 36
  3.3. Среднее………………………..…………………… 38
  3.4. Мода, медиана и среднее значение объединенных групп……………………………… 40
  3.5. Интерпретация моды, медианы и среднего….. 41
  3.6. Выбор меры центральной тенденции…………. 42
  Вопросы и упражнения…………………………... 45
  Тема 4. Меры изменчивости…………………………….. 46
  4.1. Размах………………………..…………………….. 47
  4.2. Дисперсия и стандартное отклонение………… 47
  4.3. Стандартизированные данные…………………. 51
  Вопросы и упражнения…………………………... 53
  Тема 5. Распределение признака. Нормальное распределение…………………………………… 55
  5.1. Параметры распределения……………………... 55
  5.2. Нормальное распределение……………………. 56
  5.3. Асимметрия………………………………………... 60
  5.4. Эксцесс………………………..……………………. 61
  5.5. Применение нормального распределения…… 62
  Вопросы и упражнения…………………………... 64
  Тема 6. Понятие выборки………………………………… 65
  6.1. Полное и выборочное исследования………….. 66
  6.2. Зависимые и независимые выборки…………... 67
  6.3. Требования к выборке…………………………… 67
  6.4. Репрезентативность выборки…………………... 69
  6.5. Формирование выборки…………………………. 71
  6.6. Определение объема выборки…………………. 72
  Вопросы и упражнения…………………………... 76
     
Раздел II. ОБЩИЕ ПРИНЦИПЫ ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ  
     
  Тема 7. Статистические гипотезы и критерии………. 78
  7.1. Статистические гипотезы………………………... 79
  7.2. Статистические критерии……………………….. 81
  7.3. Параметрические и непараметрические методы……………………………………………… 83
  7.4. Уровни статистической значимости…………… 85
  7.5. Правило отклонения нулевой и принятия альтернативной гипотезы……………………….. 86
  7.6. Мощность критериев……………………………... 89
  Вопросы и упражнения…………………………... 90
  Тема 8. Классификация психологических задач, решаемых с помощью статистических методов………………………..…………………... 92
  8.1. Классификация задач……………………………. 92
  8.2. Принятие решения о задаче и методе обработки ………………………..………………… 97
  Вопросы и упражнения…………………………... 98
     
Раздел III. СТАТИСТИЧЕСКИЕ КРИТЕРИИ  
     
  Тема 9. Корреляционный анализ……………………….. 100
  9.1. Понятие корреляционной связи………………... 100
  9.2. Коэффициент ранговой корреляции rs Спирмена………………………..…………………. 105
  9.3. Коэффициент линейной корреляции Пирсона 110
  9.4. Расчет уровней значимости коэффициентов корреляции………………………..……………….. 114
  9.5. Коэффициент корреляции j……………………. 115
  Вопросы и упражнения…………………………... 118
  Тема 10. Выявление различий в уровне исследуемого признака………………………... 120
  10.1. Постановка задачи……………………………….. 120
  10.2. Q - критерий Розенбаума………………………... 122
  10.3. S - критерии тенденций Джонкира……………... 126
  Вопросы и упражнения…………………………... 131
  Тема 11. Оценка достоверности сдвига в значениях исследуемого признака………………………... 132
  11.1. Постановка задачи……………………………….. 132
  11.2. Т - критерий Вилкоксона…………………………. 136
  Вопросы и упражнения…………………………... 140
  Тема 12. Критерии согласия распределений и многофункциональные критерии…………… 141
  12.1. Постановка задачи……………………………….. 141
  12.2. c2 критерий Пирсона……………………………… 142
  12.3. l- критерий Колмогорова-Смирнова………….. 160
  12.4. Критерий j* - угловое преобразование Фишера……………………………………………... 167
  Вопросы и упражнения…………………………... 175
     
  Заключение………………………..………………………… 176
  Приложение 1. Статистические таблицы критических значений………………………..……………………………… 179
  Приложение 2. Лабораторные работы по дисциплине «Математические методы в психологии» ………………. 194
  Приложение 3. Описание статистических функций табличного процессора Microsoft Excel………………….. 210
  Приложение 4. Применение пакета анализа табличного процессора Microsoft Excel для решения статистических задач………………………..……………… 220
  Приложение 5. Литература………………………………... 227

 

ОТ АВТОРА

 


Применение математических методов для обработки экспериментального материала в психологии – неотъемлемая часть профессиональных навыков современного психолога.

Математические методы – это мощный инструмент, позволяющий успешно ориентироваться в море экспериментальных данных и избегать логических и содержательных ошибок в работе психолога.

Наиболее естественным путем, которым математика проникает в психологию, является математическая статистика, применение которой позволяет психологу обосновывать экспериментальные планы, обобщать данные экспериментов, выявлять различия между группами испытуемых, находить зависимости между экспериментальными данными, строить статистические прогнозы.

Настоящее учебно-методическое пособие призвано решить следующие задачи:

§ повысить уровень математической культуры студентов-психологов;

§ привить навыки самостоятельной работы в условиях кредитной технологии и дистанционного обучения;

§ дать представление об основных статистических 

процедурах;

§ научить студентов самостоятельно проводить первоначальную статистическую обработку экспериментальных данных;

§ сформировать основы статистического мышления студентов;

§ научить студентов правильно выбирать методы обработки экспериментальных данных и оценивать полученные результаты;

§ научить студентов грамотно подготавливать данные для работы со статистическими пакетами на ЭВМ;

§ привить навыки использования инструментов среды Microsoft Excel для нахождения различного рода статистик.

Материал для пособия подобран с учетом требований Государственных общеобязательных стандартов образования РК к содержанию первой части дисциплины «Математические методы в психологии» по специальностям 520930 «Психология», 020940 «Психология», 031440 «Педагогика и психология», 050106 «Педагогика и психология» и 050503 «Психология».

Большинство рассматриваемых в руководстве методов являются непараметрическими, что расширяет их возможности применения в психологии по сравнению с традиционными параметрическими методами. Пособие содержит большое количество практических примеров и задач.

В руководство включены также 10 многовариантных лабораторных работ, выполнение которых возможно с применением и без применения статистических пакетов на ЭВМ. В одном из приложений приводятся описания статистических функций табличного процессора Excel, входящего в состав пакета программ Microsoft Office. Приложение 4 содержит рекомендации к использованию встроенного пакета анализа в Excel.

 

 

 


ВВЕДЕНИЕ

 

 


В настоящее время использование математических методов в развитии новых психологических теорий стало необходимостью. Математические процедуры входят в такие разделы психологии, как психометрика, психодиагностика, дифференциальная психология, психогенетика. Многие психологические концепции подвергаются сомнению на основании того, что они не подтверждены статистически.

С другой стороны, психологу можно совершать открытия, не привлекая математики. Существует множество теорий в психологии, сформулированных без поддержки математики, например, теория психоанализа, бихевиоральная концепция, аналитическая психология.

Психология отличается от многих наук тем, что не имеет собственных единиц измерения и берет их «напрокат», например, у физики (секунды, миллиметры, градусы). Тем не менее, применение математического аппарата в большинстве исследований проще, чем доказательство, что в этом не было необходимости. В любом случае математика систематизирует мышление и позволяет выявить закономерности, на первый взгляд, не всегда очевидные.

Можно выделить три стадии процесса математизации психологической науки.

Первая стадия – это применение математических методов для анализа и обработки результатов экспериментов и наблюдений и установление простейших количественных закономерностей (психофизический закон, экспоненциальная кривая научения).

Вторая стадия заключалась в попытке моделирования психических процессов и явлений с помощью готового математического аппарата, разработанного ранее для других наук.

Третий этап математизации (современный этап) характеризуется разработкой специализированного математического аппарата для исследования и моделирования психических процессов и явлений, формирования математической психологии как самостоятельного раздела теоретической (абстрактно-аналитической) психологии.

В основе предмета «Математические методы в психологии» лежит «математическая статистика» – наука о случайных явлениях, включающая описание случайных явлений, проверку гипотез, изучение причинных зависимостей.

Распространенное отношение к статистике – смесь благоговения с цинизмом, подозрением и презрением. Однажды кто-то заметил: «Есть маленькая ложь, есть большая ложь, а есть статистика». Необоснованное применение методов статистики может повлечь за собой ситуацию, в которой человек, держа голову в холодильнике, а ноги в печи, говорит: «В среднем я чувствую себя прекрасно». Отказ от широко распространенного мнения о статистике – это не только путь к новым открытиям и закономерностям в различных областях познания, но и лучшая защита от цифрового абсурда.

Первоначально статистикой (statistics) называлось изучение государственных дел. В XVII в. в Европе горстка математиков проводила небольшие част­ные исследования, которые впоследствии оформились в теорию вероятностей. Эти исследования, проведенные, в частности, Блезом Паскалем (1623-1662гг.) и Пьером Ферма (1601-1665гг.), выполнялись по просьбе Шевалье де Мере, азартного игрока, которому было особенно важно понять природу удачи.

На первоначальное развитие статистических методов оказало вли­яние их происхождение. У статистики были «мать», которой нужно было представлять регулярные отчеты правительственных подразделений (слова «штат» и «статистика» происходят от одного латинского корня –status), и «отец» – честный карточный игрок, который полагался на мате­матику, усиливавшую его ловкость – умение брать решающие взятки в азартных играх. От «матери» ведут свое происхождение счет, измерение, описание, табулирование, упорядочение и проведение переписей, т.е. все то, что привело к современной описательной статистике. От предприимчивого интеллектуала – «отца» – в конечном счете, возникла современная теория статистического вывода, непосредственно бази­рующаяся на теории вероятностей. Недавнее дополнение, называемое планированием экспериментов, опирается в основном на сочетание теории вероятностей с несколько элементарной, но удивительной ло­гикой.

Начала статистической теории измерений положены Карлом Фрид­рихом Гауссом – королем математиков, как его называли современни­ки, – в первой половине XIX века в связи с его занятиями астрономией и геодезией. С 1807 г. и до самой смерти в 1855 г. Гаусс заведовал кафедрой математики Геттингенского университета и одновременно был директором обсерватории в Геттингене. В его основном труде по астрономии «Теория движения небесных тел» содержится способ опре­деления орбит планет по наблюдениям, который опирается на разви­тую им же классическую теорию ошибок измерений. Таким образом, метрология оказывается тесно связанной со статистической теорией измерений.

Естественно было ожидать, что дальнейшее развитие математи­ческой статистики будет стимулироваться новыми проблемами метро­логии.

Важной сферой применения методов математической статистики является массовое производство. Первые идеи в этой области при­надлежат одному из директоров крупных пивоваренных заводов Гиннеса в Англии. В начале XX в. он прочитал книгу по теории вероятностей и подумал, что «из этого можно делать деньги». Позвав к себе Уильяма Госсета, младшего служащего завода, директор предложил ему поехать в единственный в то время центр статистических исследований в Лон­доне для учебы под руководством крупнейшего статистика, биолога и философа Карла Пирсона, основателя журнала «Биометрика».

У.Госсет проявил инициативу и выдающиеся способности и вско­ре приступил к самостоятельным исследованиям. Их результаты были весьма значительны: одни представляли несомненную ценность для пивоварения, другие – большой теоретический интерес. Естественно возникла проблема их публикации. Но устав пивоваренной компании Гиннеса запрещал работникам публикацию результатов исследований. Однако компания дала согласие на публикацию работ по теоретичес­ким вопросам статистики (что было нарушением устава), но решила не связывать результаты с именем одного из служащих компании, дабы конкуренты не могли догадаться о пользе, которую несет статистика для пивоварения. В результате научный мир был изумлен рядом перво­классных статей в журнале «Биометрика», опубликованных начиная с 1908 г. под псевдонимом «Student», что значит «Студент», но внашей литературе принято писать «Стьюдент». Эти работы совершили перево­рот в статистике, так как они содержат неклассическую постановку за­дачи и точное ее решение.

Сейчас положение совершенно иное: не только плодотворно раз­виваются области психологии, широко использующие математические методы, но даже на психологических факультетах и в ряде гуманитар­ных, биологических и медицинских вузов читается обязательный курс математики, включающий элементы математической статистики.

Основными разделами математической статистики считаются разделы описательной статистики, теория статистического вывода, планирование и анализ экспериментов.

Описательная статистика включает в себя табулирование, представ­ление и описание совокупностей данных. Эти данные могут быть либо количественными, как, например, измерения роста и веса, либо каче­ственными, как, например, пол и тип личности. Описательная статистика упорядочивает и систематизирует имеющуюся информацию, облегчает понима­ние изучаемого явления.

Наиболее ярким примером статисти­ческого описания служат результаты переписи населения, пред­ставленные в виде соответствующих таблиц, графиков и показателей распределения населения по демографическим и социальным признакам.

Всякая большая группа испытуемых, относительно которых мы хотим провести исследование и собираемся делать выводы, называется генеральной совокупностью.

Выборка – это часть испытуемых, выделенная из генеральной совокупности для проведения эксперимента.   

Теория статистического вывода – это формализованная система методов решения задач, в которой выводятся свойства генеральной совокупности данных путем исследования выборки.

Например, директор крупного концерна хочет определить долю сотрудников, которые положительно относятся к введению нового графика работы. Излишне было бы опрашивать каждого сотрудника, если бы можно было надежно опреде­лить такую долю по выборке минимальным объемом, скажем, в 100 человек. Но какова доля тех сотрудников, которые положительно отнеслись в этой выборке из 100 человек, по отношению к доле во всей совокупности сотрудников? Ответ можно получить благодаря теории статистического вывода. Таким образом, задача статистического вывода состоит в том, чтобы предсказать свойства всей совокупности, зная свойства только выборки из этой совокупности. Эти выводы делаются и производятся с помощью методов описательной статистики посредством описания как свойств выборок, так и совокупностей.

Планирование и анализ экспериментов представляет собой третью важную ветвь статистических методов, разработанную для обнаружения и проверки причинных связей между переменными.

К особенностям применения математических методов обработки в психологии относятся следующие утверждения:

- чем ближе к реальности экспериментальные данные, тем надежнее результат математического исследования;

- при использовании математических методов для анализа и обработки результатов экспериментов и наблюдений большую часть успеха исследования составляют определение типа решаемой задачи и выбор метода решения;

- важную часть решения задачи занимает интерпретация полученного результата.


РАЗДЕЛ I

 

 

 

 

 


 


ТЕМА 1

 

 


ИЗМЕРЕНИЯ В ПСИХОЛОГИИ

 

 

ПРИЗНАКИ И ПЕРЕМЕННЫЕ

 

Существует множество определений «измерения», несколько отличающихся друг от друга. Общим во всех определениях является следующее: измерение – это приписывание числовых форм объектам или событиям в соответствии с определенными правилами (например, вес, рост, IQ). Измерить рост человека – значит приписать число расстоянию между макушкой человека и подошвой его ног, найденному с помощью линейки. Измерение коэффициента интеллектуальности человека – это присвоение числа характеру ответной реакции, возникающей у него на группу типовых задач.

Измеряемые психологические явления называют признаками (переменными или наблюдениями).  Такими явлениями могут быть решения задачи, показатель интеллектуальности, уровень тревожности, количество допущенных ошибок в тесте.

Переменные в психологии считаются случайными, т.к. нельзя определить заранее, какое значение они принимают.

Математическая обработка подразумевает оперирование с показателями переменных, полученных в психологических исследованиях.

Показатель (уровень или наблюдаемое значение) – это количественная характеристика измеряемого психологического явления. Значения признака определяются при помощи специальных шкал измерения.

 

 

ШКАЛЫ ИЗМЕРЕНИЯ

 

С. Стивенсом предложена классификация из 4 типов шкал измерения:

1) номинативная, или номинальная, или шкала наименований;

2) порядковая, или ординальная шкала;

3) интервальная, или шкала равных интервалов;

4) шкала равных отношений.

Номинативная шкала – это шкала, классифицирующая по названию: nomen (лат.) – имя, название. Название же не измеряется количественно, оно лишь позволяет один объект отличить от другого. Номинативная шкала – способ классификации объектов и субъектов, распределение их по ячейкам классификации.

 Например, классификация объектов по следующим признакам:

§ пол (мужской, женский);

§ цвет глаз (голубой, зеленый и т.д.);

§ клинические диагнозы;

§ автомобильные номера;

§ номера на футболках.

Шкала, состоящая только из двух групп объектов, называется дихотомической, например: « иностранец – соотечественник»; «проголосовал «за» – проголосовал «против»»; «имеет братьев или сестер – единственный ребенок в семье» и т.п.

Единица измерения в номинативной шкале – количество наблюдений или частота, например, в группе 12 женщин и пять мужчин. Точнее, единица измерения – это одно наблюдение. В этой шкале используется лишь отличие классов, но ничего не утверждается относительно того, больше или меньше у объекта А измеряемого свойства в сравнении с объектом В.

Порядковая шкала – это шкала, классифицирующая по принципу «больше – меньше». Если в шкале наименований было безразлично, в каком порядке располагаются классы, то порядковая шкала подразумевает расположение объектов в каком-либо порядке или распределение на классы. К типичным примерам порядковой шкалы можно отнести военные ранги, школьные классы, шкалу человеческих ценностей.

В порядковой шкале должно быть не менее трех классов, например, «подходит для должности – подходит с оговорками – не подходит».

В порядковой шкале не известно истинное расстояние между классами. Чем больше в шкале классов, тем больше возможностей для математической обработки полученных данных и проверки статистических гипотез. Оптимальное количество классов – 12-15.

От классов легко перейти к числам, если условимся считать, что высший класс получает ранг 1, средний – ранг 2, низший – ранг 3, или наоборот. Присвоение каждому классу числового значения – ранга называется ранжированием.

Единица измерения в порядковой шкале – расстояние в 1 класс или 1 ранг, при этом расстояние между классами и рангами может быть разным. Из арифметических операций возможна проверка на соответствие и сравнение.

Интервальная шкала – это шкала, классифицирующая по принципу «больше на определенное количество единиц – меньше на определенное количество единиц». Каждое из возможных значений признака отстоит от другого на равном расстоянии. Например, шкала по Цельсию, шкала по Фаренгейту, исчисление лет по годам, шкалы в единицах стандартного отклонения, процентильные шкалы.

Числа, приписываемые в процессе интервального измерения, имеют свойства однозначности и упорядоченности. Число, присвоенное предмету, представляет собой количество единиц измерения, которое он имеет. Сегодня температура 16° по Цельсию, вчера была 13°. Сегодня на 3° теплее, чем вчера. Если завтра температура будет 22°, то вчера и сегодня имеют больше сходства с точки зрения температуры, чем вчера и завтра.

Основная особенность интервальных шкал, – что свойства предмета не пропадают, если результат измерения равен нулю; например, 0°С не обозначает отсутствие температуры.

Из арифметических операций возможна проверка на соответствие, сравнение и сложение.

Шкала равных отношений – это шкала, классифицирующая объекты и субъекты пропорционально степени выраженности измеряемого свойства. В шкалах отношений классы обозначаются числами, которые пропорциональны друг другу. Главное отличие шкалы равных отношений – наличие абсолютной точки отсчета, т.е. если результат измерения равен нулю, то это говорит об отсутствии измеряемого свойства.

Примером переменных, измеряемых в шкале равных отношений, могут являться абсолютная температура по Кельвину, рост, время, вес.

К переменным в этой шкале применимы все арифметические операции.

 

 

 ?             ВОПРОСЫ И УПРАЖНЕНИЯ

 

1. Дайте определения следующим понятиям:

§ измерение, признаки и показатели в психологии;

§ номинативная шкала;

§ дихотомическая шкала;

§ порядковая шкала;

§ шкала отношений;

§ интервальная шкала.

2. Приведите примеры переменных и показателей в психологии.

3. В исследовании фиксировалась скорость решения новой задачи учащимися 1-го класса. Результаты исследования:

§ Верещагина – 4 минуты;

§ Голодов – 2 минуты;

§ Андреева – 3,5 минуты.

Выделите в этой ситуации признак и показатели.

4. Отнесите каждое из следующих измерений к одному из типов шкал:

§ метрическая система измерений расстояний;

§ числа, кодирующие темпераменты;

§ телефонные номера;

§ результаты контрольной работы по чтению (количество прочитанных слов в минуту);

§ числовая ось;

§ умение водить машину;

§ школьные оценки.

5. Перечислите, какие математические операции можно производить с показателями вышеперечисленных шкал.

6. Может ли показатель в какой-нибудь шкале отнести одновременно к двум классам.

7. Группу испытуемых разделили на два класса:

§ стаж работы до 10 лет;

§ стаж работы более 10 лет.

Можно ли отнести это разбиение к порядковой шкале?

8. К какому типу шкал относиться часто используемый в психологии семантический дифференциал Ч. Осгуда для измерения социальных установок, ценностных ориентацией и т.п.:

 

-3

 

-2

 

-1

 

0

 

+1

 

+2

 

+3

 

 

 

 

 

 

 

 

абсолютно не согласен

 

не знаю

 

абсолютно согласен

                                       

 


 

ТЕМА 2

 

 


ПРЕДСТАВЛЕНИЕ ДАННЫХ

 

Любой метод исследования, будь то наблюдение, опрос или анализ документов, позволяет получить разнообразную информацию об изу­чаемом объекте. Обработать и обобщить эту информацию – значит по­лучить новые знания, сделать их доступными для других специалистов, использовать для выработки рекомендаций при принятии решений. С этой целью сведения, полученные в ходе исследования, нужно преоб­разовать в форму исходных данных для обработки.

Принципы упорядочения, преобразования и отображения эмпири­ческих психологических данных включают: во-первых, подготовку дан­ных к статистической обработке (группировку, табулирование), во-вто­рых, графическое представление данных (в форме гистограмм, поли­гона и кумуляты), в-третьих, статистическую обработку данных.

 

 

ГРУППИРОВКА ДАННЫХ

 

Группировка – это объединение вариант в интервалы, границы ко­торых устанавливаются произвольно и непременно указываются. Полу­чаемая в итоге величина называется частотой появления признака. Груп­пировка данных – это суммирование частоты появления признака или некоторых значений признаков в изучаемом массиве объектов по определенным позициям. Математический смысл обработки исходных данных при использовании метода группировки заключается в сумми­ровании данных по частоте появлений некоторых значений.

Наиболее легким из известных методов обработки является метод простой группировки данных. Например, результаты тестирования студентов 1-го курса по философии распределились следующим образом:

1 – ответили на «отлично» – 10 чел.;

2 – ответили на «хорошо» – 34 чел.;

3 – ответили на «удовлетворительно» – 94 чел.;

4 – получили «неудовлетворительно» – 18 чел.;

5 – не участвовали в тестировании – 12 чел.

 

 

ТАБУЛИРОВАНИЕ ДАННЫХ

 

Наиболее распространенной формой группировки экспериментальных данных являются статистические таблицы. Таблицы бывают сложные и простые. К простым относятся таблицы, применяемые при альтернативной группировке, когда одна группа испытуемых противопоставляется другой; например, здоровые – больным, высокие люди – низким и т.п. Пример простой таблицы приведен ниже (см. таблицу 2.1). В ней представляются результаты обследования мануальной асимметрии у 110 учащихся 3-6-х классов.

 

Таблица 2.1

 

Классы Праворукие Леворукие Сумма
3 и 4 43 6 49
5 и 6 44 17 61
Сумма 87 23 110

 

Усложнение таблицы рекомендуется использовать, когда измерение изучаемых признаков производится  в номинативной или порядковой шкале.

Усложнение таблицы происходит за счет возрастания объема и степени дифференцированности представленной в них информации. К сложным таблицам относятся так называемые многопольные таблицы, которые могут использоваться при выяснении причинно-следственных отношений между варьирующими признаками. Примером сложной таблицы служит таблица 2.2, в которой представлены классические данные Ф.Гальтона, иллюстрирующие наличие положительной зависимости между ростом родителей и их детей. Таблица организована таким образом, что позволяет оценить частоту встречаемости в популяции однозначно фиксируемых соотношений роста родителей и роста ребенка.

 

Таблица 2.2

 

Рост родителей

Рост детей в дюймах

Всего

60,7 62,7 64,7 66,7 68,7 70,7 72,7 74,7
74             4   4
72     1 4 11 17 20 6 62
70 1 2 21 48 83 66 22 8 251
68 1 15 56 130 148 69 11   430
66 1 15 19 56 41 11 1   144
64 2 7 10 14 4       37
Всего 5 39 107 255 387 163 58 14 928

 

Правильно составленные таблицы – это большое подспорье в экспериментальной работе, позволяющее одновременно осуществлять разные варианты группировки полученных данных.


 

РАНГОВЫЙ ПОРЯДОК

Ранжирование – это расположение данных в порядке возрастания или убывания.

Ранжирование может быть простым и принудительным. При простом ранжировании количество рангов меньше количества ранжируемых признаков. Например, если разделить группу людей, претендующих на должность менеджера, по признаку соответствия предъявляемым требованиям, ранг 1 получат претенденты, соответствующие предъявляемым требованиям, ранг 2 – претенденты частично соответствующие требованиям, ранг 3 – претенденты, не соответствующие требованиям.

В этих случаях не всегда можно все признаки уместить в несколько рангов. Признаки, имеющие один ранг, могут сильно отличаться.

Принудительное ранжирование используется в случае, когда количество рангов равно количеству признаков.

При принудительном ранжировании разные ранги могут искусственно преувеличивать расстояние между рангами. В разных группах один испытуемый может иметь ранг, отличный от того, какой он имел бы в другой группе.

Правила принудительного ранжирования

1) Наименьшему числовому значению начисляется ранг 1.

2) Наибольшему числовому значению – ранг, равный n – количеству ранжируемых величин.

3) Если несколько числовых значений равны, то им начисляется ранг, равный среднему значению из тех рангов, которые они получили бы, если бы не были равны.

4) Правильность начисления рангов проверяется формулой:

,                                           (2.1)

где  – сумма всех рангов,

n – количество ранжируемых величин.

5) Не рекомендуется ранжировать более 20 величин, поскольку в этом случае ранжирование в целом окажется малоустойчивым.

6) При необходимости ранжирования достаточно большого числа объектов их следует объединять по какому-либо признаку в достаточно однородные классы, а затем уже ранжировать полученные классы.

Пример начисления рангов для результатов тестирования представлен в таблице 2.3.

 

Таблица 2.3

 

Нумерация результатов (механическое ранжирование) Фамилия Результат Ранг
1 Сорокин А. 71 1
2 Андрейченко Н. 73 2
3 Алексеев Л. 75 4
4 Иванов В. 75 4
5 Ростова А. 75 4
6 Липова О. 84 6
7 Кочеткова А. 87 7
8 Васильев Н. 88 8,5
9 Шепетов А. 88 8,5
10 Гроз И. 90 10
Сумма     55

 

В примере встречаются три значения 75, в обычной нумерации они получили бы ранг 3, 4, 5. Таким образом, каждое из них получает ранг, равный .

Для проверки правильности начисления рангов найдем:

, .

 

 

РАСПРЕДЕЛЕНИЕ ЧАСТОТ

При описании общей картины результатов теста список студентов из таблицы можно сократить, классифицируя баллы по распределению частот, иногда называемому распределением.

Числа, показывающие, сколько раз варианты встречаются в данной совокупности, называются частотами, или весами вариант. Они обозначаются fi и имеют индекс «i», соответствующий номеру переменной.

  Частость (относительная частота) – доля каждой частоты fi в общем объеме выборки n:

.                                                (2.2)

В таблице 2.4 приведен пример нахождения частоты и частости результатов тестирования из таблицы 2.3.

В случае большого диапазона разброса данных имеет смысл обобщение данных в виде группирования по интервалам. Правила выбора количества интервалов не существует, но предпочтительно группировать по 12-15 интервалам (классам).

Ширина интервалов (класса) должна быть одинаковой и равной

,                                             (2.3)


где h – ширина интервалов;

k – количество классов;

Xmax – максимальное значение из данных;

Xmin – минимальное значение из данных.

 

Таблица 2.4

 

Баллы Х i Частота fi Частость wi
71 1 0,1
73 1 0,1
75 3 0,3
84 1 0,1
87 1 0,1
88 2 0,2
90 1 0,1
Сумма 10 1,0

 

Количество классов выбирается таким образом, чтобы ширина была целым числом. 

Задача 2.1

Данные из таблицы 2.4 необходимо разбить на интервалы, найти середины интервалов, а также частоту и частость в интервалах.

Максимальный балл равен 90 баллам, минимальный – 71. Ширина определяется по формуле (2.3):

.

Для того чтобы ширина была целым числом, количество интервалов должно быть или 4, или 5, или 10.

Найдем ширину интервалов при количестве интервалов, равном пяти:

.

Определение середины интервала состоит в усреднении зафиксированных границ интервала. Например, для первого интервала середина будет (74+71)/2=72,5. Занесем все вычисления в таблицу 2.5.

                              

Таблица 2.5

 

Интервал Середина интервала Частота Относительная частота
71-74 72,5 2 0,2
75-78 76,5 3 0,3
79-82 80,5    
83-86 84,5 1 0,1
87-90 88,5 4 0,4
Сумма   10 1,0

 

 

 

СТАТИСТИЧЕСКИЕ РЯДЫ

 

Особую форму группировки данных представляют так назы­ваемые статистические ряды, или числовые значения признака, расположенного в определенном порядке.

В зависимости от того, какие признаки изучаются, статисти­ческие ряды делят на атрибутивные, вариационные, ряды дина­мики, регрессии, ряды ранжированных значений признаков и ряды накопленных частот. Наиболее часто в психологии исполь­зуются вариационные ряды, ряды регрессии и ряды ранжированных значений признаков.

Вариационным рядом распределения называют двойной ряд чисел, показывающий, каким образом числовые значения при­знака связаны с их повторяемостью в данной выборке. Напри­мер, результаты вступительного тестирования ока­зались следующими: 71, 75, 84, 75, 87, 84, 75, 88, 90, 88. Как видим, некоторые циф­ры попадаются в данном ряду по несколько раз. Следовательно, учитывая число повторений, данные ряда можно представить в более удобной, компактной форме:

Варианты xi 73 71 75 87 84 88 90 (2.4)
Частоты вариант fi 1 1 3 1 1 2 1  

Это и есть вариационный ряд. Числа, показывающие, сколь­ко раз отдельные варианты встречаются в данной совокупности, называются частотами, или весами, вариант. Они обозначаются строчной буквой латинского алфавита и имеют индекс «i», со­ответствующий номеру переменной в вариационном ряду.

Общая сумма частот вариационного ряда равна объему вы­борки, т.е.

.

Частоты можно выражать и в процентах. При этом общая сумма частот или объем выборки принимается за 100%. Процент каждой отдельной частоты или веса подсчитывается по формуле:

.                                         (2.5)

Процентное представление частот полезно в тех случаях, ког­да приходится сравнивать вариационные ряды, сильно различа­ющиеся по объемам. Например, при тестировании школьной го­товности детей города, поселка городского типа и села были об­следованы выборки детей численностью 1000, 300 и 100 челове­к соответственно. Различие в объемах выборок очевидно. Поэто­му сравнение результатов тестирования лучше проводить, ис­пользуя проценты частот.

Приведенный выше ряд (2.4) можно представить по-другому. Если элементы ряда расположить в возрастающем порядке, то получится так называемый ранжированный вариационный ряд:

 

Варианты xi 71 73 75 84 87 88 90 (2.6)
Частоты вариант fi 1 1 3 1 1 2 1  

Подобная форма представления (2.6) более предпочтитель­на, чем (2.4), поскольку лучше иллюстрирует закономерность варьирования признака.

Частоты, характеризующие ранжированный вариационный ряд, можно складывать или накапливать. Накопленные частоты получаются последовательным суммированием значений частот от первой частоты до последней.

В качестве примера вновь обратимся к ряду 2.6. Преобразуем его в ряд 2.7, в котором введем дополнительную строчку и назо­вем ее «кумуляты частот».

 

Варианты xi 71 73 75 84 87 88 90  
Частоты вариант fi 1 1 3 1 1 2 1 (2.7)
Кумуляты частот   1 2 5 6 7 9 10  

 

ПОНЯТИЕ РАСПРЕДЕЛЕНИЯ

И ГИСТОГРАММЫ

В статистике под рядом распределения понимают распределе­ние частот по вариантам. Измеренные величины признака в выборке варьируют в пределах от минимального до максимального значения. Этот предел разбивают на так называемые классовые интервалы, которые, в зависимости от конкретных данных, мо­гут быть как равными по величине, так и неравными.

Существует четыре общих метода графического представления распределения частот: гистограмма, полигон распределения и сглаженная кривая, кумулятивный полигон.

Если по оси абсцисс – OX откладывать величины классовых интервалов, а по оси ординат – OY  величины частот, попадаю­щих в данный классовый интервал, то получается так называе­мая гистограмма распределения частот. При этом над каждым классовым интервалом строится колонка или прямоугольник, площадь которого оказывается пропорциональной соответствую­щей частоте. Пример построения гистограммы представлен на рисунке 2.1.

 

Рис.2.1. Гистограмма результатов тестирования 43 абитуриентов.

 

Гистограмма представляет собой графическое изоб­ражение данного частотного распределения. Виды распределения представлены на рисунке 2.2.

Построение полигона распределения во многом напоминает построение гистограммы. В гистограмме каждый столбец заканчивается горизонтальной линией, причем на высоте, соответствующей частоте в этом разряде. А в полигоне он заканчивается точкой над серединой своего разрядного интервала на той же высоте. Далее точки соединяются отрезками прямых (см. рисунок 2.3). – это и будет полигон распределения.

Если эти же точки соединить плавной линией – получим сглаженную кривую распределения (см. рисунок 2.4).

Если по оси OY откладывать кумуляты частот, то получим кумулятивный полигон (см. рисунок 2.5).


                

               а) Обычный тип                                   б) Гребенка

 

           

             в) Положительно                                      г) Распределение с  

       скошенное распределение                              обрывом слева

 

           

                 д) Плато                                        е) Двухпиковый тип

 

ж) Распределение с изолированным пиком

 

Рис. 2.2. Виды гистограмм.

Рис.2.3. Полигон распределения,

представляющий результаты тестирования 43 абитуриентов.

 

Рис.2.4. Кривая распределения результатов тестирования 43 абитуриентов.

 

Рис.2.5. Кумулятивный полигон.


 

?              ВОПРОСЫ И УПРАЖНЕНИЯ

 

 

1. Дайте определение следующим понятиям: группировка данных, ранжирование, ранг, частота, частость, статистический и вариационный ряды, распределение, гистограмма, полигон распределения и сглаженная кривая.

2. В исследовании

3. Эта задача – на построение группового распределения частот. Следующие данные представляют собой оценки 75 взрослых людей в тесте на определение коэффициента интеллектуальности Стенфорда-Бине:

141 104 101 130 148
92 87 115 96 91
100 133 124 123 92
132 118 98 107 101
97 124 118 107 146
110 111 138 129 121
106 135 97 108 108
107 110 101 105 129
105 110 116 123 113
83 127 112 105 114
127 114 113 139 106
95 105 95 106 105

В задаче:

· сгруппируйте результаты наблюдений;

· определите частоту и частость показателей;

· выберите интервал группирования разрядов;

· постройте распределение сгруппированных частот, полигон распределения и сглаженную кривую.

  1. Проведите ранжирование следующих результатов наблюдений: 10, 12, 11, 13, 12, 7, 8, 6, 11, 8, 12, 14, 11.

 


ТЕМА 3

 

 






Поделиться с друзьями:


Дата добавления: 2018-10-18; Мы поможем в написании ваших работ!; просмотров: 373 | Нарушение авторских прав


Поиск на сайте:

Лучшие изречения:

Студенческая общага - это место, где меня научили готовить 20 блюд из макарон и 40 из доширака. А майонез - это вообще десерт. © Неизвестно
==> читать все изречения...

4411 - | 4302 -


© 2015-2026 lektsii.org - Контакты - Последнее добавление

Ген: 0.01 с.