P [ – D x < (x ист – < x >) < D x ] = a (20)
или
P [(< x >–D x) < x ист < (< x > + D x)] = a (21)
Вероятность a носит название доверительной вероятности, или коэффициента надежности. Интервал значений от (< x > – D x ) до (< x > + D x )называется доверительным интервалом.
Выражение (21) означает, что с вероятностью, равной a, результат измерений не выходит за пределы доверительного интервала от (< x >+D x ) до (< x >–D x ). Разумеется, чем большей надежности мы требуем, тем большим получается соответствующий доверительный интервал и, наоборот, чем больший доверительный интервал мы задаем, тем вероятнее, что результаты измерений не выйдут за его пределы.
Мы пришли к очень важному заключению: для характеристики величины случайной погрешности необходимо задать два числа, а именно величину самой погрешности (или доверительного интервала) и величину доверительной вероятности. Указание одной только величины погрешности без соответствующей ей доверительной вероятности в значительной мере лишено смысла, так как при этом неизвестно, сколь надежны наши данные. Знание доверительной вероятности позволяет оценить степень достоверности полученного результата. Необходимая степень его надежности опять-таки задается характером производимых измерений.
Естественно, что в этом отношении к деталям мотора самолета предъявляются более жесткие требования, чем к лодочному мотору, а к последнему значительно большие, чем, скажем, к ручной тачке.
Более высокая степень надежности, требуемая при ответственных измерениях, означает, что при их производстве нужно выбирать большой (в долях s) доверительный интервал. Иначе говоря, для получения той же величины погрешности D x следует производить измерения с большей точностью, то есть нужно тем или иным способом уменьшить в соответствующее число раз величину s. Одна из возможностей такого увеличения состоит в многократном повторении измерений (см. стр. 69).
При обычных измерениях можно ограничиться доверительной вероятностью 0.9 или 0.95.
Для измерений, по условиям которых требуется чрезвычайно высокая степень надежности, иногда задают доверительную вероятность 0.999. Большая величина доверительной вероятности в подавляющем большинстве измерительных задач не требуется.
Удобство применения среднеквадратической погрешности в качестве основного численного выражения степени точности, вернее, -воспроизводимости измерений заключается в том, что этой величине соответствует вполне определенная доверительная вероятность, равная 0.68. (Мы, разумеется, здесь и дальше полагаем, что погрешности распределены по нормальному закону). Для любой величины доверительного интервала по формуле Гаусса может быть рассчитана соответствующая доверительная вероятность. Эти вычисления были проделаны, и их результаты сведены в табл.11, помещенную в Приложении.
Приведем примеры пользования табл.11.
Пусть для некоторого ряда измерений мы получили < x > = 1.27, s = 0.03. Какова вероятность того, что результат отдельного измерения не выйдет за пределы, определяемые неравенством 1.26 < xi < 1.28?
Доверительные границы нами установлены в ±0.01, что составляет (в долях s) 0.01: 0.03 = 0.31. Из табл.11 находим, что доверительная вероятность для e = 0.3 равна 0.24,
Иначе говоря, приблизительно 1/4 измерений уложится в интервал ошибок ±0.01. Определим теперь, какова доверительная вероятность для границ 1.20 < хi < 1.34. Значение этого интервала, выраженное в долях s, будет e = 0.07: 0.03» 2.3. По табл.11 находим значение a для e = 2.3, оно равно 0.97. Значит, результаты приблизительно 97% всех измерений будут укладываться в этот интервал.
Поставим теперь другой вопрос: какой доверительный интервал нужно выбрать для тех же измерений, чтобы примерно 98% результатов попадали в него? Из табл.11 находим, что значению a = 0.98 соответствует значение e = 2.4, следовательно se = 0.03´2.4» 0.077, и указанной доверительной вероятности соответствует интервал 1.193 < x < 1.347 или, округляя, 1.19 < x < 1.35; иногда этот результат записывают в виде x = 1.27 ± 0.08 с доверительной вероятностью 0.98.
Итак, для нахождения случайной погрешности нужно определить два числа, а именно: доверительный интервал (значение погрешности) и доверительную вероятность. Средней квадратической погрешности s соответствует доверительная вероятность 0.68, удвоенной средней квадратической погрешности (2s) соответствует доверительная вероятность 0.95, утроенной (3s) – доверительная вероятность 0.997.
Для других значений погрешностей доверительная вероятность определяется по табл.11.
Приведенные здесь три значения a полезно помнить, так как обычно, когда в книгах или статьях дается значение средней квадратической погрешности, уже не указывается соответствующая ей доверительная вероятность. Если же мы помним три приведенных выше числа, то этого достаточно, чтобы ориентироваться в оценке надежности измерений, когда нам известна их средняя квадратичеекая погрешность.
Наряду со среднеквадратической погрешностью иногда пользуются средней арифметической погрешностью r, вычисляемой по формуле (3), При достаточно большом числе наблюдений (практически для n > 30) между S и r существуют простые соотношения:
S = 1.25× r или r = 0.8× S, (22)
Строго говоря, они верны только для s и r, но не для S и r. Для малых n отношение S/ r существенно отличается от предельного значения, причем, как правило, S/r > s/r. Величины r иr связаны соотношением r = 0.95× r.
В большинстве случаев целесообразнее пользоваться s, а не p или r.
В первую очередь потому, что применяя среднеквадратическую погрешность s, легче определять доверительные вероятности, так как для этого имеются соответствующие таблицы. Известным преимуществом средней арифметической погрешности r является то, что ее вычислять несколько проще, чем s. Примененние микрокалькулятора практически полностью устраняет это преимущество[8]).
Разумеется, при большом значении n вообще безразлично, какой из погрешностей пользоваться, так как между ними существует соотношение (22). При малом n по причине, указанной выше, следует всегда применять среднеквадрнтическую (абсолютную или относительную) погрешность.
Если пользоваться и при малом п средней арифметической погрешностью, то правильнее ее вычислять не по обычной формуле (18), а по соотношению
r = 1S n |< x > – xi |/[ n ×(n –1)]1/2. (23)
При большом n различие, даваемое этими двумя формулами, очень невелико.
4. НЕРАВЕНСТВО ЧЕБЫШЕВА
Мы приводили расчет доверительного интервала для случая, ког-да результаты измерений распределены по нормальному закону.
Однако, как было сказано, далеко не всегда закон распределения погрешностей известен и иногда он заведомо отличается от нормального.
Вычисление дисперсии и в этом случае позволяет оценить доверительную вероятность, воспользовавшись так называемым неравенством Чебышева, которое получено для произвольного закона распределения и имеет, таким образом, весьма общий характер.
Положим по-прежнему, что s – среднеквадратическое уклонение, а a – произвольное число, большее 1. Неравенство Чебышева можно записать следующим образом:
P ( | x ист – < x >| < s×a ) > 1 –1/a2. (24)
Если известно, что закон распределения погрешностей симметричен относительно единственного максимума, то неравенство Чебышева будет иметь вид
P ( | x ист – < x >| < s×a ) > 1 – 4/9a2. (25)
В табл.3 сопоставлены доверительные интервалы и соответствующие им вероятности, вычисленные для случая нормального распределения по формуле Гаусса и для случаев произвольного и симметричного распределений, оцененные по неравенству Чебышева.
Таблица 3. Доверительные вероятности
as | P норм | P Чеб | PЧеб.сим |
0.68 | – | – | |
1.5 | 0.87 | 0.2 | 0.7 |
0.95 | 0.75 | 0.89 | |
0.997 | 0.89 | 0.95 |
Из приведенной таблицы видно, что вероятности больших уклонений в случае произвольных распределений существенно больше, чем для нормального. Это естественное следствие того обстоятельства, что при произвольном законе распределения мы располагаем значительно меньшей информацией о вероятности появления погрешностей того или иного численного значения, чем в случае известного закона распределения. Неравенство Чебышева дает доверительные интервалы, так сказать, на все случаи жизни, и, разумеется, они оказываются больше (при заданной доверительной вероятности), чем интервалы для любого конкретного распределения.
Поэтому всегда по возможности следует убедиться в близости исследуемого распределения к нормальному и пользоваться соответствующими оценками доверительных интервалов, не прибегая к неравенству Чебышева, дающему слишком грубые оценки.
5. ЗАКОН СЛОЖЕНИЯ СЛУЧАЙНЫХ ПОГРЕШНОСТЕЙ
Пусть наша измеряемая величина Z является суммой (или разностью) двух величин – X и Y, результаты измерений которых независимы. Тогда, если SX 2, SY 2, SZ 2 – дисперсии величин X, Y и Z то можно доказать, что
SZ 2 = SX 2 + SY 2, (26)
или
SZ = |(SX 2 + SY 2)1/2|. (27)
Если Z является суммой не двух, а большего числа слагаемых, то закон сложения погрешностей будет таким же, то есть средняя квадратическая погрешность суммы (или разности) двух (или нескольких) независимых величин равна корню квадратному из суммы дисперсий отдельных слагаемых.