На практике одной из частых задач научного исследования является определение соответствия эмпирического и теоретического распределений или нескольких эмпирических распределений.
При решении выдвигается нулевая гипотеза - предположение об отсутствии существенных различий между сравниваемыми данными, в частности между встречаемостью признака при различных методах лечения.
Пользуясь данным предположением, производят расчет теоретических данных:
1. Высчитывают, какой процент от общего числа наблюдаемых (n) составляет общее число встречаемости признака (а+с).
2. Поскольку, согласно нулевой гипотезе, различий во встречаемости признака в методах лечения нет, то найденный процент должен сохраняться для встречаемости признака каждого метода лечения. Т.о. рассчитываются ожидаемые (теоретические) числа.
встречаемость признака | не встречаемость признака | итого | |
1 метод лечения | %*(a+b)/100 | a+b | |
2 метод лечения | %*(c+d)/100 | c+d | |
всего | (a+c)/n*100=% | b+d | n |
Для таблицы 2х2 расчет ведется так:
1. (a+c)/n*100=%
2. %*(a+b)/100=Х
встречаемость признака | не встречаемость признака | итого | |
1 метод лечения | Х | a+b-Х | a+b |
2 метод лечения | a+c-Х | c+d- (a+c-Х) | c+d |
всего | a+c | b+d | n |
Обратите внимание: теоретические числа рассчитываются до второго знака после запятой.
Определение соответствия эмпирических и теоретических данных. Критерий χ2.
Критерий χ2 для произвольной таблицы.
Для принятия или отклонения нулевой гипотезы используется непараметрический критерий χ2. Общая формула для вычисления критерия , где О – фактически наблюдаемое число, Е – теоретически ожидаемое число.
Следовательно, чтобы определить χ2 необходимо:
1. Найти ожидаемые величины;
2. Определить разности (отклонения) между фактическими и ожидаемыми величинами;
3. Возвести эти разности в квадрат;
4. Разделить полученные квадраты разностей на ожидаемые величины;
5. Суммировав результаты деления, получить χ2.
Полученную величину χ2 необходимо оценить, сравнив ее с табличными значениями, которые зависят от числа степеней свободы df и принятого уровня значимости. df =(число строк - 1)*(число столбцов - 1). Для таблицы 2х2 df =(2 - 1)*(2 - 1)=1.
Нулевая гипотеза отвергается, если вычисленная величина χ2 больше табличного значения χ2 при уровне значимости 0,01, т.е. . И принимается, если .
При полном совпадении эмпирических и теоретических величин χ2 равен нулю. По мере увеличения различий между сравниваемыми частотами значение χ2 возрастает.
Критерий χ2 для таблицы 2х2.
+ | - | итого | |
+ | a | b | a+b |
- | c | d | c+d |
всего | a+c | b+d | a+b+c+d=n |
В таблице 2х2 расчет χ2 можно производить также по следующей формуле: .