2.3.1 Основные понятия теории проверки гипотез.
2.3.2 Проверка гипотез о числовых значениях.
2.3.3 Проверка гипотез о равенстве средних.
Основные понятия теории проверки гипотез
Проверка статистических гипотез.
Предположим, что x1,…,xn – выборка из генеральной совокупности с функцией распределения F(x). F(x) может быть полностью неизвестна, тогда можно поставить следующую гипотезу:
H0: F(x)=F0(x), где F0(x) – конкретная функция распределения. Если вид функции распределения
известен с точностью до каких-то m неизвестных параметров. Тогда гипотеза
- заданные числа. Пусть x1,…,xn - берется из нормальной генеральной совокупности.
Допустим
-известно и оно равно 1, т.е. ГС ~ N(a,1). Тогда
или
.
Пусть известно a=0, т.е. выборка берется из
.
или
.
Пусть a и
неизвестны:
или
Подчеркнутые гипотезы называются простыми, поскольку задают единственную точку в пространстве параметров. Если гипотеза задает 2 и большее число точек в пространстве, то такая гипотеза называется сложной.
H0 – основная или нулевая гипотеза.
H1 – конкурирующая гипотеза или альтернатива.
Пример: Пусть x1,x2,…,xn – выборка из нормальной генеральной совокупности с параметрами 
или или и т.д

Мы будем предполагать, что одна из H0 или H1 обязательно верна.
Пусть X- выборочное пространство, т.е. это множество возможных значений вектора
. Для построения критерия проверки гипотезы в выборочном пространстве выбирается критическая область
таким образом, что если
, то нулевая гипотеза H0 отвергается, т.е. принимается гипотеза H1, а если
не попадает в область K, т.е.
, то H0 – принимается.
Обычно K выбирается следующим образом:
D=D(x1,x2,…,xn) - некоторая функция от выборочных ранных значений, т.е. случайная величина.
Обычно критическая область K выбирается одним из следующих 3-х способов:
односторонние критические области

двусторонняя критическая область
| 1. |
| Правосторонняя критическая область |
| 2. |
| Левосторонняя критическая область |
| 3. |
| Двусторонняя критическая область |
Чаще всего двусторонняя область строится в виде:
|
|
О. Случайная величина D=D(x1,x2,…,xn) называется статистикой критерия.
Ошибки:
Ошибка 1-го рода возникает, если H0 – отвергается при условии, что H0 – верна.
-вероятность ошибки 1-го рода.
.
О. Вероятность ошибки 1-го рода называется уровнем значимости критерия.
Ошибка 2-го рода возникает тогда, когда H0 принимается, хотя она неверна (т.е. верна H1).
-вероятность ошибки 2-го рода.
.
Одновременно
невозможно. Если
увеличивать, то
будет уменьшаться и наоборот.
Классическая постановка задачи заключается в следующем:
- фиксированное (
=0,01,
=0,05) так чтобы
и при этом условии K выбирают из того условия, чтобы
была как можно меньше.
Чаще всего на практике выдвигается H0, а H1 не выдвигается, и задают уровень значимости
=0,05; 0,01; 0,005; 0,001.
задают таким образом, чтобы событие, имеющее вероятность
было практически невозможно. Поэтому
находится K, исходя из условия, что
.
Если
, то произошло событие с вероятностью
, значит, H0 отвергается.
Если
, то произошло событие с вероятностью 1-
, значит H0 согласуется с экспериментальными данными.
О. Все критерии, построенные на таком принципе, называются критериями значимости.
Предположим, что имеется выборка x1,x2,…,xn из генеральной совокупности с неизвестной функцией распределения F(x). Предположим, что имеется гипотеза H0 : F(x)=F0(x), где F0(x) – заданная функция распределения.






