Пусть - выборка объема , представляющая собой результат независимых наблюдений над случайной величиной , относительно распределения которой выдвинута простая гипотеза
( - теоретическая функция распределения, соответствующая гипотезе ). Наиболее распространенным критерием проверки этой гипотезы является критерии Пирсона.
Чтобы воспользоваться критерием Пирсона, выборочные данные следует предварительно сгруппировать, представив их в виде интервального статистического ряда. Пусть -интервалы группировки; - частоты попадания выборочных значений в интервалы соответственно ().
Обозначим теоретическую (соответствующую ) вероятность попадания случайной величины в интервал
.
Статистикой критерия является величина:
,
которая характеризует отклонение эмпирической функции распределения от теоретической функции распределения (значение является приращением эмпирической функции на интервале , а - приращением теоретической функции на том же интервале). Поскольку относительные частоты сближаются с вероятностями при , то в случае справедливости гипотезы значение величины не должно существенно отличаться от нуля. Поэтому критическая область критерия задается в виде , где – значение величины , полученное для заданной выборки, а порог определяется по заданному уровню значимости так, чтобы . Нахождение основано на том факте (известном как теорема Пирсона), что случайная величина имеет при предельное распределение хи - квадрат с степенью свободы.
На практике предельное распределение можно использовать с хорошим приближением при и . При выполнении этих условий для заданного уровня значимости можно положить , где является (1— )-квантилью распределения .
Таким образом, критерий согласия Пирсона состоит в следующем:
1. По заданному уровню значимости находится по табл. П4 порог
.
2. По заданной выборке объема определяется число интервалов группировки так, чтобы . Вычисляется значение статистики .
3. Если , то гипотезу отвергают.
4. Если , то гипотезу принимают.
Если случайная величина дискретная, - различные выборочные значения, а в случае справедливости , то всегда можно определить интервалов, содержащих ровно по одному выборочному значению. Поэтому в данном случае можно сразу считать, что , где – частота выборочного значения .
На практике теоретическое распределение полностью бывает определено редко. Чаще известен предположительно только тип распределения, но неизвестны параметры его определяющие. В этом случае гипотеза о виде распределения, подлежащая проверке, имеет вид и является сложной параметрической гипотезой.
Критерий согласия Пирсона применим для проверки такой гипотезы со следующими изменениями:
а) вероятности , вычисляют, заменяя неизвестные параметры их оценками максимального правдоподобия : ;
б) число степеней свободы предельного распределения хи - квадрат должно быть уменьшено на число неизвестных параметров и считаться равным .