Гипотезу, утверждающую, что различие между сравниваемыми характеристиками отсутствует, а наблюдаемые отклонения объясняются лишь случайными колебаниями в выборках, на основании которых производится сравнение, называют нулевой (основной) гипотезой и обозначают Н 0. Наряду с этой гипотезой рассматривают и альтернативную (конкурирующую, противоречащую) ей гипотезу Н 1. Если нулевая гипотеза будет отвергнута, то будет иметь место альтернативная гипотеза.
Гипотезуназывают простой, если она однозначно характеризует параметр распределения случайной величины. Например, если l является параметром экспоненциального распределения, то гипотеза Н 0 о равенстве l = 10–простая гипотеза. Сложной называют гипотезу, которая состоит из конечного или бесконечного множества простых гипотез. Сложная гипотеза Н 0 о неравенстве l > 10 состоит из бесконечного множества простых гипотез Н 0 о равенстве l =bi , где bi – любое число, большее 10. Гипотеза Н 0 о том, что математическое ожидание нормального распределения равно двум при неизвестной дисперсии, тоже является сложной.
Принцип проверки нулевых гипотез состоит в следующем:
- нулевую гипотезу отвергают, если наблюдаемое значение критерия принадлежит критической области;
- гипотезу принимают, если наблюдаемое значение критерия принадлежит области принятия гипотезы.
1) Что называется ошибкой первого рода, второго рода, уровнем значимости?
Ошибка первого рода состоит в том, что отвергается правильная гипотеза.
Вероятность ошибки первого рода называют уровнем значимости α.
Ошибка второго рода заключается в том, что принимается неправильная гипотеза. Вероятность ошибки второго рода принято обозначать β.
2) Как находятся критические точки (квантили) статистических критериев значимости в случае двусторонней и в случае правосторонней критической области?
Для нахождения критической области задается уровень значимости α и находится критическая точка исходя из таких соотношений, когда kкр > 0:
- для двусторонней симметричной области P (K > kкр) = α / 2 и P (K < - kкр) = α / 2
- для правосторонней области P (K > kкр) = α..
3) Что называется критерием согласия?
Критерием согласия называют критерий, который позволяет установить, является ли расхождение эмпирического и теоретического распределений случайным или значимым, т. е. согласуются ли данные наблюдений с выдвинутой статистической гипотезой или не согласуются.
Дайте общую схему проверки гипотезы о виде функции распределения с помощью критерия согласия Пирсона.
Чтобы при уровне значимости α проверить гипотезу о нормальном распределении генеральной совокупности надо:
1) вычислить выборочную среднюю x и выборочное среднеквадратическое отклонение S, причем в качестве вариант Ci принимают среднее арифметическое концов интервала
Ci = (xi + xi+1) / 2
2) пронормировать X, т.е. перейти к случайной величине u = (X – x) / S и вычислить ui = (xi – x) / S и ui+1 = (xi+1 – x) / S, причем наименьшее значение u, т.е. u1 полагают равным -∞, а наибольшее значение uk+1 полагают равным +∞, т.е. u1 = -∞, uk+1 = +∞
3) вычислить теоретические частоты ni* = n · Pi,
где n – объем выборки, Pi – функция, равная Ф(ui+1) – Ф(ui) – это вероятность попадания X в интервал (xi; xi+1), а Ф(u) – это функция Лапласа.
4) сравнить эмпирические и теоретические частоты с помощью критерия Пирсона.
5) На основании каких признаков или критериев можно сделать предварительный выбор закона распределения?
Наглядное представление о статистическом распределении дают полигон и гистограмма.
Полигоном называют ломаную, отрезки которой соединяют точки
(x1; n1), (x2; n2),…, (xk; nk) или [(x1; w1), (x2; w2),…, (xk; wk)]
Гистограммой называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы h, а высоты равны отношению ni / h (отношение частоты к длине частичного интервала называют плотностью частоты).