Элементы математической статистики в
"Высшая математика"
Элементы математической статистики. Методические указания к лабораторно-практическим занятиям №1, №2, №3, №4 по курсу «Высшая математика». -
Магнитогорск: Изд. МГТУ, 1987. - 37 с.
Составители: ст. преп. Н.И. Кимайкина
ст. преп. И.Г. Серебренникова
Рецензент: доц.канд.техн.наук Д.Х. Девятов
Темплан 1987, п.195
1. ВВЕДЕНИЕ
Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении с помощью теории вероятности статистических данных - результатов измерений. Везде, где приходится иметь дело с обработкой экспериментальных результатов, необходимыми вспомогательными средствами являются методы математической статистики.
Задачи математической статистики:
1) указать способы и группировки статистических данных;
2) разработать методы анализа статистических данных:
а) оценки неизвестных функций распределения, плотности распределения вероятностей, оценки неизвестных параметров распределения, оценка зависимости между случайными величинами;
б) проверка статистических гипотез о виде неизвестного распределения или параметрах распределения, вид которого известен.
При изучении дисциплины «Математическая статистика» студент должен проработать соответствующий материал, изложенный в лекциях, используя рекомендованную литературу, выполнить четыре лабораторно-практических работы. Предполагается, что один вариант выполняется двумя студентами. Первичную обработку статистических данных, группирование данных, построение корреляционного поля и корреляционной таблицы оба студента выполняют совместно. Оценка неизвестных параметров распределения, проверка нормальности распределения выполняется отдельно: один студент изучает совокупность х, другой - у. Первый студент изучает зависимость х от у и рассчитывает
^
коэффициенты уравнения линейной регрессии х ' y = φ* (у), второй изучает зависимость у от х и рассчитывает
^
коэффициенты линейной регрессии ух = φ* (х).
Отчеты всех лабораторных работ заносятся в специальную тетрадь, которую студент предъявляет на экзамене по высшей математике.
При выполнении лабораторных работ рекомендуется использовать следующую литературу:
1. Гмурман В.Е. Теория вероятностей и математическая статистика. М.: Высшая школа, 1977. 397 с.
2. Рыжов П.Л. Математическая статистика в горном деле. М.: Высшая школа, 1973. 127 с.
3. Львовский Е.Н. Статистические методы построения эмпирических формул. М.: Высшая школа, 1982. с. 10-27.
4. Кимайкина Н.И. Теория вероятностей и математическая статистика. Учебные карты: Методические указания. Магнитогорск: МГМИ, 1991.20с.
Система обозначений, принятых в математической статистике
Лабораторный практикум.
При изучении дисциплины «Математическая статистика» студент должен проработать соответствующий материал, изложенный в лекциях, используя рекомендованную литературу, выполнить четыре лабораторно-практических работы. Предполагается, что один вариант выполняется двумя студентами.
После выполнения лабораторной работы студенты должны написать отчет, содержащий краткое теоретическое введений и все расчеты, связанные с выполнением работы, и защитить ее.
Лабораторная работа №1
Вопросы к защите:
1. Понятие выборочного метода.
2. Генеральная и выборочная совокупность. Выборка и способы ее организации. Повторная и бесповторная выборки. Репрезентативная выборка.
3. Статистический ряд. Вариационный ряд, их элементы.
4. Частота, относительная частота.
5. Группирование данных - образование массива интервалов статистических данных. Размах варьирования, шаг варьирования.
6. Получение корреляционного поля - диаграммы рассеяния двумерной совокупности .
7. Получение корреляционной таблицы - двумерного эмпирического распределения случайных величин.
8. Получение интервальных вариационных рядов эмпирического распределения составляющих х и у. Определение эмпирического закона выборочной совокупности.
9. Распределение частот, относительных частот (частостей). Графическое изображение частот: полигон распределения и гистограмма распределения - графические оценки плотности распределения вероятностей генеральной совокупности.
10. Эмпирическая функция распределения . Графики накопленных частостей. Накопленная частота. Кумулятивная линия - оценка интегральной функции распределения генеральной совокупности.
Тема: «Первичная обработка результатов наблюдений двух измеримых признаков и их эмпирические распределения».
Цель работы. Изучить основные понятия выборочного метода. Ознакомиться с методикой первичной обработки статистических данных. Оценить распределение генеральной совокупности по сгруппированным данным, т.е. получить эмпирические распределения каждого признака.
Результаты наблюдений. На металлообрабатывающем заводе у 100 марок стали проводят замеры предела текучести F - признак , кг/мм² и предела прочности σβ - признаки , кг/мм2 (данные выборочной совокупности представлены в виде статистического ряда).
Задачи работы:
1. сгруппировать данные наблюдений;
2. найти выражение двумерного эмпирического распределения - найти корреляционное поле и корреляционную таблицу;
3. найти эмпирические распределения составляющих и ;
4. построить графическое отображение распределений.
Замечание. Генеральная совокупность и считаем непрерывными случайными величинами.
Ход работы:
Найти минимум и максимум выборочной совокупности - статистического ряда | , | , | |
Найти размах варьирования каждого измеримого признака | |||
Найти число интервалов по формуле - число марок (объем выборки), - целая часть полученного числа | |||
Найти шаг варьирования каждого признака -длину интервала (точность Е = 0,01) | |||
Найти границы интервалов каждого признака | … | … | |
Построить корреляционное поле (см. пример – рис.1) | В системе координат ХOY 1) за начало взять точку ; 2) разбить оси на интервалы и ; 3) через границы интервалов провести прямые, параллельные осям; 4) отметить точки пары , попавшие в образовавшиеся квадраты. Условимся, что при расположении какой-либо точки на границе, ее относят к правому и верхнему квадрату. | ||
Составить корреляционную таблицу абсолютных частот (см. пример – табл.1) | 1) найти середины интервалов по формуле … | 1) найти середины интервалов по формуле … | |
2) составить таблицу в которой столбцов и строк; 3) в 1-ой строке записать значения , в 1-ом столбце - ; 4) В каждой клетке указать кол-во тех пар , компоненты которых попадают в соответствующие интервалы группировки по каждой переменной – это будут частоты ; | |||
5)в последнюю строку записать сумму частот по столбцам - . | 5)в последний столбец записать сумму частот по строкам - . | ||
Получить ряды составляющих и (см. пример – табл.2) | Взять данные из корреляционной таблицы и составить интервальные вариационные ряды | ||
и | и | ||
Составить статистическую совокупность каждого признака (см. пример – табл.3) | Составить таблицу из 7 столбцов и заполнить их | ||
1) интервалы | |||
2) середины интервала | |||
3)абсолютные частоты | |||
4) относительная частота | |||
5)накопленная частота, принять 1-ое значение за 0, далее последовательно суммировать абсолютные частоты | |||
6)накопленная частость | |||
7)плосность частостей | |||
Построить полигон и гистограмму распределения (см. пример - рис.2) | |||
Построить полигон накопленных частостей - график эмпирической функции распределения (см. пример – рис.3) |
Примеры:
Диаграмма рассеяния двумерной выборочной совокупности случайных величин
(корреляционное поле)
Рис.1
Таблица 1
Корреляционная таблица абсолютных частот
Таблица 2
Эмпирические распределения составляющих х и у
(интервальные вариационные ряды, и отнесены к серединам интервалов)
X | 55,6 | 78,2 | 100,8 | 123,4 | 146,0 | 168,6 | |
Y | 74,6 | 97,2 | 119,8 | 142,4 | 187,6 | 210,2 | ||
Таблица 3
Статистическую совокупность признака
Графическое изображение распределения частот
Рис.2
1) полигон распределения;
2) гистограмма распределения.
Графическое изображение эмпирической функции
Рис.3
1) полигон накопленных частот (ступенчатая линия);
2) кумулятивная линия.
Лабораторная работа №2
Вопросы к защите:
1. Свойства числовых характеристик случайной величины М(Х), D(X), σ(X). Их расчетные формулы. Вероятный смысл.
2. Что значит оценить генеральные параметры по выборке? Определение точечной оценки (статистики).
3. Требования, предъявляемые к точечным оценкам генеральных параметров. Определение выборочных оценок статистического ряда по сгруппированным данным xb, DB, σB. Их расчетные формулы.
4. Определение выборочных начальных и центральных моментов.
5. Оценка математического ожидания по выборочной средней.
6. Оценка дисперсии по исправленной дисперсии. Число связей. Число степеней свободы.
7. Выборочная асимметрия и эксцесс, их оценки по исправленным асимметрии и эксцессу.
8. Мода и медиана, определяем по сгруппированным данным.
9. Коэффициент вариации V.
Тема: «Статистическое течение оценки генеральных параметров».
Цель работы. Оценить генеральные параметры по сгруппированной выборочной совокупности: характеристики положения и рассеяния. Статистика числовых характеристик одного измеримого признака. Несмещенные, состоятельные, эффективные оценки. Оценки отклонения эмпирического распределения от нормального.
Задачи работы:
1. Найти среднее значение и среднеквадратическую ошибку предела прочности σβ - признак , кг/мм2 (или предела текучести F - признак , кг/мм²) по100 маркам стали.
2. Оценить степень отклонения эмпирического распределения измеримого признака от нормального распределения: асимметрия, эксцесс.
Ход работы:
- Заполнить расчетную таблицу:
- Записать выборочные оценки
- выборочное среднее
- выборочная дисперсия
- выборочная асимметрия
- выборочный эксцесс
- Найти исправленные оценки (статистики)
- выборочное среднее
- исправленная дисперсия
- исправленное среднеквадратическое отклонение
- исправленная асимметрия
- исправленный эксцесс
Выводы:
1. ;
2. А* = 0,46>0 - полигон распределения скошен, правая ветвь длиннее левой, начиная от вершины. Имеет место левосторонняя асимметрия.
Е* = -0,14<0 - полигон распределения по сравнению с нормальной кривой имеет более плоскую вершину. А* и Е* близки к нулю.
3. V = 31,75 - значение V выражает среднее квадратическое отклонение S в процентах от среднего значения ряда измерений. V - признак относительной изменчивости случайной величины.
4. Можно предположить, что выборка произведена из генеральной совокупности, имеющей нормальное распределение.
Лабораторная работа №3
Статистическая проверка статистической гипотезы о совпадении с нормальным распределением одного измеримого признака генеральной совокупности
Цель: 1. Ознакомиться с основными задачами статистической проверки гипотез;
2. Ознакомиться с часто используемыми методами проверки гипотезы нормальности распределения.
При решении задачи о согласовании теоретического распределения с нормальным найти интервальные оценки параметров а и σ нормального распределения. Уровень значимости принять равным 0,05.
Программные требования. Статистическая проверка гипотез. Критерии значимости. Критерии согласия. Ошибка первого и второго рода. Основные методы проверки нормальности распределения. Интервальные оценки. Доверительные интервалы для параметров а и о нормального распределения.
Вопросы для самопроверки
1. Почему говорят о статистической проверки статистических гипотез?
2. Нулевая и альтернативная гипотезы.
3. Статистический критерий. Виды критериев: критерий значимости, критерий согласия.
4. Статистика U для проверки гипотез.
5. Уровень значимости. Ошибки первого и второго рода.
6. Критическая область, область принятия, критические точки.
7. Проверка гипотезы нормальности распределения по:
а) среднее абсолютное отклонение (САО);
б) размаху варьирования R (прикидочная проверка);
в) показателям исправленных асимметрии А* и эксцесса Е*;
г) критерию Пирсона (основательная проверка).
8. Схема применения критерия Пирсона.
9. Интервальные оценки. Доверительные интервалы для параметров а и σ нормального распределения.
Ход работы
Проверка нормальности распределения проводится только при V < 33 %.
1. Выписать статистики распределения одного измеримого признака:
_
Rx, x, Sx, A*x, E*x, Vx (или Ry, у, Sy, А*у, Е*у, Vу –результаты работы №2).
Выдвинуть гипотезу Н0: генеральная совокупность измеримого признака х (или у), из которой извлечена выборка,
где а и σ - параметры нормального распределения.
3. Выполнить прикидочную проверку гипотезы Н0 по размаху варьирования. Статистика для проверки гипотезы U = RX/S, где Rx = xmax-xmin (или Ry = ymax - ymin) - размах варьирования.
3.1 Найти отношение R/S и по таблице значений нижней и верхней границ отношения для данных n и σ определить uкр ниже, uкр верхнее (Учебные карты. Ч. Ш; прил.№9).
3.2 При выполнение неравенства икр нижнее
верхнее гипотеза Н0 принимается.
4. Выполнить проверку гипотезы Н0 по показателям асимметрии и эксцесса (несмещенные оценки А* и Е*, найденные в работе 2, показывают, что имеют место некоторая асимметрия и небольшой эксцесс).
распределенная по закону х2 („ХИ-КВАДРАТ").
с k= r - S - 1 степеням свободы,
где r - число интервалов;
S - число параметров нормального распределения;
1 -число связей;
n1 - наблюдаемая частота, соответствующая i-му интервалу;
п¹i - теоретическая частота, п¹i=n·р*i
Рекомендации. Проверка нормальности по САО и по показателям асимметрии и эксцесса (п.4, п.5) удобна при проведении расчетов на ЭВМ. Для практического применения (особенно при расчетах с использованием настольных ЭВМ) рекомендуются в основном две методики: по размаху варьирования (п.З) и по критерию х² (или Пирсона, п.6). Первая служит для быстрой «прикидочной» проверки, а вторая - для основной проверки.
Задача 3
Рассмотрим задачу 1. Требуется проверить, взята ли данная выборка из нормально распределенной генеральной совокупности.
Статистическую гипотезу формулируем следующим образом, Н0: генеральная совокупность у, из которой извлечена
корреляции. Сделать статистическое оценивание коэффициентов регрессии. Уровень значимости принять равным 0,05.
Программные требования. Функциональная и статистическая зависимости между двумя измеримыми признаками. Корреляционная зависимость. Линии регрессии. Две задачи теории корреляции. Нахождение параметров выборочного уравнения регрессии по методу наименьших квадратов. Влияние выборочного коэффициента корреляции на тесноту линейной зависимости. Статистическое оценивание результатов расчетов коэффициентов линейной регрессии.
Вопросы для самопроверки
1. Виды зависимости между двумя признаками: функциональная, стохастическая, статистическая, корреляционная. Условное среднее Y на X или X на Y. Функции регрессии. Выборочные регрессии.
2. Эмпирическая линия регрессии, ее построение.
3. Две задачи теории корреляции: 1) становление вида функции регрессии; 2) оценка тесноты связи между признаками.
4. статистики тесноты связи: остаточная и межгрупповая дисперсия, корреляционное отношение, корреляционный момент, коэффициент корреляции. Их расчетные формулы и свойства.
5. Выборочное уравнение линейной регрессии. Коэффициент линейной регрессии, их расчетные формулы. Построение линии регрессии.
6. Критерий независимости двух измеримых признаков.
7. Критерий значимости линейной связи между двумя измеримыми признаками.
8. Интервальное оценивание коэффициента корреляции и коэффициентов регрессии.
Ход работы
1. Выписать результаты лабораторной работы №2.
2. Выписать корреляционную таблицу (лабораторная работа №1)
^
9. Найдем значения yxi и занесем в корреляционную таблицу:
^
ух = 33 = 0,93 · 33 + 27,34 = 58,03;
^
ух = 55,6 = 0,93 · 55,6 + 27,34 = 79,05 и т.д.
^
Аналогично ху = 52 = 0,81 · 52 + 1,25 - 43,4 и т. д.
10. Построим на корреляционном поле эмпирическую линию регрессии и теоретическую (выборочную) линию регрессии (см.табл. 2)
11. Построим линии прямой и обратной регрессии, найдем точку пересечения.
С(94,8; 115,5) - центр совместного распределения:
ρ*yx = tgα = 0,93;
ρ*yx = tgβ = 0,81.
– ^ – ^
Вывод. Сравнивая уxхи уxх, хy и хy, (табл. 9), видим, что уравнения регрессии хорошо согласуются с данными выборки. В силу того, что значение R* положительно и очень близко к единице, расчет подтверждает вытекающее уже из графика (см. табл.2) предположение о том, что марки стали с высоким пределом текучести в общем обладают и высоким пределом, прочности.