В качестве способа оценки близости распределения выборки экспериментальных данных к принятой аналитической модели закона распределения используются критерии согласия. Известен целый ряд критериев согласия, предложенных разными авторами. Наибольшее распространение в практике получил критерий Пирсона. Идея этого метода состоит в контроле отклонений гистограммы экспериментальных данных от гистограммы с таким же числом интервалов, построенной на основе распределения, совпадение с которым определяется. Использование критерия Пирсона [3, 48] возможно при большом числе измерений (п > 50) и заключается в вычислении величины c2 (хи-квадрат):
(8.1)
где ni, Ni — экспериментальные и теоретические значения частот в i-м интервале разбиения; m — число интервалов разбиения; Pi — значения вероятностей в том же интервале разбиения, соответствующие выбранной модели распределения; .
При n ® ¥ случайная величина c2 имеет распределение Пирсона с числом степеней свободы v = m - 1- r, где г — число определяемых по статистике параметров, необходимых для совмещения модели и гистограммы. Для нормального закона распределения г = 2, так как закон однозначно характеризуется указанием двух его параметров — математического ожидания и СКО.
Если бы выбранная модель в центрах всех m столбцов совпадала с экспериментальными данными, то все m разностей (ni –Ni) были бы равны нулю, а следовательно, и значение критерия c2 также было бы равно нулю. Таким образом, c2 естьмера суммарного отклонения между моделью и экспериментальным распределением.
Критерий c2 не инвариантен к числу столбцов и существенно возрастает с увеличением их числа. Поэтому для использования его при разном числе столбцов составлены таблицы квантилей распределения c2, входом в которые служит так называемое число степеней свободы v = (m – 1 - r). Чтобы совместить модель, соответствующую нормальному закону, с гистограммой, необходимо совместить координату центра, а для того, чтобы ширина модели соответствовала ширине гистограммы, ее нужно задать как г = 2 и v = m-3. Часть квантилей распределения c2q приведена в табл. 8.1.
Таблица 8.1
Значения c2 при различном уровне значимости
v | cq2 при уровне значимости q, равном | ||||||||
0,99 | 0,95 | 0,9 | 0,8 | 0,5 | 0,2 | 0,1 | 0,05 | 0,02 | |
0,02 | 0,1 | 0,21 | 0,45 | 1,39 | 3,22 | 4,61 | 5,99 | 7,82 | |
0,3 | 0,71 | 1,06 | 1,65 | 3,36 | 5,99 | 7,78 | 9,49 | 11,67 | |
0,87 | 1,63 | 2,20 | 3,07 | 5,35 | 8,56 | 10,65 | 12,59 | 15,03 | |
1,65 | 2,73 | 3,49 | 4,59 | 7,34 | 11,03 | 13,36 | 15,51 | 18,17 | |
2,56 | 3,94 | 4,87 | 6,18 | 9,34 | 13,44 | 15,99 | 18,31 | 21,16 | |
3,57 | 5,23 | 6,30 | 7,81 | 11,34 | 15,81 | 18,55 | 21,03 | 24,05 | |
4,66 | 6,57 | 7,79 | 9,47 | 13,34 | 18,15 | 21,06 | 23,69 | 26,87 | |
5,81 | 7,96 | 9,31 | 11,2 | 15,34 | 20,46 | 23,54 | 26,3 | 29,63 | |
8,26 | 10,85 | 12,44 | 14,58 | 19,34 | 25,04 | 28,41 | 31,41 | 35,02 | |
11,52 | 14,61 | 16,47 | 18,94 | 24,34 | 30,68 | 34,38 | 37,65 | 41,57 | |
14,95 | 18,46 | 20,60 | 23,36 | 29,34 | 36,25 | 40,26 | 43,77 | 47,96 |
Если вычисленная по опытным данным мера расхождения c2 меньше определенного из таблицы значения cq2, то гипотеза о совпадении экспериментального и выбранного теоретического распределений принимается. Это не значит, что гипотеза верна. Можно лишь утверждать, что она правдоподобна, т.е. она не противоречит опытным данным. Если же c2выходит за границы доверительного интервала, то гипотеза отвергается как противоречащая опытным данным.
Методика определения соответствия экспериментального и принятого законов распределения заключается в следующем:
• определяют оценки среднего арифметического значения х и СКО Sx по формулам (6.9) и (6.11);
• группируют результаты многократных наблюдений по интервалам длиной h, число которых определяют "так же, как и при построении гистограммы;
• для каждого интервала разбиения определяют его центр xio и подсчитывают число наблюдений П|, попавших в каждый интервал;
• вычисляют число наблюдений для каждого из интервалов, теоретически соответствующее выбранной аналитической модели распределения. Для этого сначала от реальных середин интервалов хi0 производят переход к нормированным серединам zi = (хi0 - x̅)/Sx. Затем для каждого значения ziспомощью аналитической модели находят значение функции плотности вероятностей f(zi). Например, для нормального закона
По найденному значению f(zi) определяют ту часть Ni имеющихся наблюдений, которая теоретически должна быть в каждом из интервалов Ni = nhf(zi)/Sх, где n — общее число наблюдений;
• если в какой-либо интервал теоретически попадает меньше пяти наблюдений, то в обеих гистограммах его соединяют с соседним интервалом. После этого определяют число степеней свободы v = m-1-r, где m — общее число интервалов. Если было произведено укрупнение, то m — число интервалов после укрупнения;
• по формуле (8.1) определяют показатель разности частот c2;
• выбирают уровень значимости критерия q. Он должен быть небольшим, чтобы была мала вероятность совершить ошибку первого рода. По уровню значимости и числу степеней свободы v по табл. 8.1 находят границу критической области cq2, такую, что P{c2 > cq2} = q. Вероятность того, что полученное значение c2 превышает cq2, равна q и мала. Поэтому, если оказывается, что c2 > cq2, то гипотеза о совпадении экспериментального и теоретического законов распределения отвергается. Если же c2 < cq2, то гипотеза принимается.
Чем меньше q, тем больше значение cq2 (при том же числе степеней свободы v), тем легче выполняется условие c2 < cq2и принимается проверяемая гипотеза. Но при этом увеличивается вероятность ошибки второго рода. В связи с этим нецелесообразно принимать 0,02 < q < 0,01.
Иногда вместо проверки с односторонней критической областью применяют проверки с двусторонними критическими областями. При
этом оценивается вероятность P{cqн2 < c2 < cqв2}.Уровень значимости критерия q делится на две части: q = q1 + q2. Как правило, принимают q1 = q2. По табл. 8.1 для P{c2 > cq2} = q находят c12 при уровне значимости q, и числе степеней свободы v и c22 уровня значимости 1 — q2 и том же n. Гипотеза о совпадении распределений принимается, если