Для получения оценки измеряемой величины, максимально близкой к истинному значению, необходимо по экспериментальным данным найти оценку математического ожидания отдельных результатов наблюдений, оценить систематическую погрешность и исключить ее из оценки математического ожидания.
Точность оценки математического ожидания ряда наблюдений зависит от количества выполненных измерений и от дисперсии случайной составляющей погрешности. Поэтому по экспериментальным данным оценивается не только математическое ожидание, но и дисперсия.
Оценкой математического ожидания случайной величины по результатам отдельных наблюдений х 1, x2,..., хп этой величины является среднее арифметическое:
(1)
где п — число наблюдений величины х.
Дисперсия суммы (разности) случайных величин определяется выражением
где rxy, rxz, rxy,... — коэффициенты корреляции соответствующих пар ху, xz, yz... случайных величин, входящих в рассматриваемую сумму (разность) этих величин.
При ограниченном числе измерений, результатявляется случайной величиной, основные характеристики которой (математическое ожидание и дисперсия) получают на основании
(2)
Оценку дисперсии случайной величины х по результатам отдельных наблюдений х1, х2,..., хп этой величины находят по формуле
(3)
Оценка среднего квадратического отклонения случайной величины х равна
При неограниченно большом числе наблюдений оценки S2 [х] и S [х] стремятся, соответственно, к s2 [х] и s [х] При ограниченном п эти оценки являются случайными величинами.
Оценка случайной составляющей погрешности результатов измерений осуществлялась в соответствии с приведенными выше правилами.
Для обнаружения систематической погрешности, природа которой неизвестна, необходима постановка специального эксперимента для измерения искомой величины того же размера с использованием более точных методов и средств измерений. Сравнение результатов измерения х1 и х2, полученных в первом и во втором (более точном) эксперименте, позволяет оценить систематическую погрешность первого эксперимента. Если результат измерения х1 содержит только постоянную систематическую погрешность, то она может быть оценена по однократным результатам измерения х1 и x2 как . Погрешность этой оценки определяется погрешностью результата измерения х2.
Результат измерения х1 кроме систематической погрешности содержит и случайную составляющую погрешности, поэтому — случайная величина, математическим ожиданием которой является систематическая погрешность
.
Погрешность этой оценки определяется погрешностью оценок математических ожиданий результатов измерения в экспериментах.
Если причины возникновения систематической погрешности известны, то в первую очередь необходимо постараться исключить или уменьшить влияние этих причин. При невозможности устранения источников погрешности необходимо на основании теоретического анализа или путем постановки специальных экспериментов получить количественные оценки систематических погрешностей. Например, путем предварительной поверки используемых средств измерений выявляется систематическая погрешность этих средств при разных значениях измеряемой величины. Анализируя влияние внешних факторов, можно составить таблицы или графики зависимости систематической погрешности от внешних факторов. В этом случае для введения поправки на систематическую погрешность необходимо в процессе измерения контролировать значение соответствующего влияющего внешнего фактора. Существуют и другие приемы, позволяющие путем постановки специальных экспериментов либо учесть, либо исключить систематическую погрешность, не производя ее количественной оценки.
Прямые измерения. Предположим, что при многократном измерении интересующей нас величины получены п отдельных результатов наблюдений. Исключив систематическую погрешность из каждого наблюдения, получаем исправленный ряд значений х1, x 2,..., хп, математическим ожиданием которого является истинное значение измеряемой величины . За действительное значение измеряемой величины принимаем среднее арифметическое, определяемое по формуле (1), в которой xi — исправленное значение ряда наблюдений.
Для контроля правильности подсчета использовано свойство - алгебраическая сумма остаточных погрешностей равна нулю, т. е. где ri = xi — х - остаточные погрешности - отклонения между отдельными значениями наблюдений и средним арифметическим
Когда дисперсия s2 полученного ряда наблюдений известна из предыдущих экспериментов или из технической документации на применяемые средства измерений, тогда дисперсия среднего арифметического на основании выражения (4.2.2) , где s2 [х] — дисперсия исправленного ряда наблюдений; s2 [ ] - дисперсия действительного значения (среднего арифметического) измеряемой величины этого ряда.
Если дисперсия ряда неизвестна, то на основании соотношения (3) ее оценивают по формуле
где ri – остаточные погрешности исправленного ряда наблюдений. В этом случае за оценку дисперсии действительного значения измеряемой величины принимают
. (4)
Для нахождения доверительного интервала погрешности измерения необходимо найти закон распределения для величины
(5)
при известной дисперсии или для величины
(6)
при неизвестной дисперсии.
Так как в выражение (5) входит только одна случайная величина , то вид закона распределения величины, определяемой этим выражением, определяется видом закона распределения величины х. При нормальном законе распределения отдельных результатов закон распределения тоже нормальный. Таким образом, при нормальном законе распределения случайная величина z, определяемая выражением (5), имеет нормальный закон распределения с математическим ожиданием равным нулю и дисперсией равной единице.
Выражение (6) содержит две случайные величины и S [ ], поэтому закон распределения величины, определяемой этим выражением, отличается от закона распределения величины, определяемой выражением (5). При нормальном законе распределения случайная величина t, определяемая выражением (6), имеет закон распределения Стьюдента. Для таких функций zpи tp(f) существуют таблицы, по которым можно найти значения, определяющие с доверительной вероятностью P границы доверительного интервала. Число f - число степеней свободы и в данном случае .
Чем больше число измерений в ряду наблюдений, тем ближе оценка S [х] совпадает с действительным средним отклонением s [х]. Следовательно, с увеличением числа наблюдений закон распределения Стьюдента приближается к нормальному закону. Практически при .
Зная z р или tp (f), на основании выражений (5) и (6) с учетом (2) и (4), результат измерения с доверительной вероятностью Р можно записать в виде
(7)
при известной дисперсии или в виде
(8)
при неизвестной дисперсии.
Если закон распределения отдельных результатов измерения xi отличается от нормального, то найти закон распределения случайных величин, определяемых выражениями (5) и (6) затруднительно. В этом случае пользуются следующей рекомендацией: закон распределения с увеличением числа наблюдений стремится к нормальному закону. Практически при n > 5 можно считать, что закон распределения х близок к нормальному закону и при известном s[х] для приближенной оценки доверительного интервала можно пользоваться выражением (7). Если дисперсия s 2[х] неизвестна, то необходимо увеличить число наблюдений n, так чтобы оценка S [х] была близка к s [х]. Практически это условие выполняется при n > 30. В этом случае для приближенной оценки доверительного интервала можно также пользоваться выражением (7).
Если ряд наблюдений х1, х2,..., хп содержит результат xk, существенно отличающийся от остальных, то необходимо проверить, не является ли он промахом. При нормальном законе распределения отдельных результатов измерения xi обнаружение промаха сводится к проверке неравенства
(14-15)
при известной дисперсии или
(14-16)
при неизвестной дисперсии.
В этих выражениях Р — вероятность, с которой обнаруживается промах; — граница доверительного интервала нормально распределенной величины z при доверительной вероятности Рn; tp(n) — граница доверительного интервала случайной величины t, имеющей специальное распределение (таблицы этого распределения, по которым можно определитьV(n), имеются в литературе по теории вероятностей и математической статистике), зависящее от n, при доверительной вероятности Р. Если неравенства (14-15) и (14-16) не; выполняются, то xk следует считать промахом. Его необходимо исключить из ряда наблюдений, и для оценки результата измерения необходимо заново пересчитать и .
На практике часто встречается однократное измерение, когда измеряемая величина оценивается по результату одного наблюдения. Этот случай можно рассматривать как частный случай многократных измерений (при n=1). Тогда выражения (14-13) и 14-14 примут вид:
; (14-17)
. (14-18)
Здесь за действительное значение х измеряемой величины следует принять результат однократного измерения, из которого исключена систематическая погрешность. Нужно иметь в виду, что по однократному измерению нельзя определить s (или S). Поэтому для того чтобы можно было записать результат измерения в виде (14-17), среднее квадратическое отклонение s нужно знать на основании предварительных измерений или из технической документации на применяемое средство измерений. Если вместо σ известна его оценка S, найденная по некоторому числу предварительных измерений, то для определения tp(f) в выражении (14-18) число степеней свободы f нужно взять равным этому числу предварительных измерений минус единица.
Сравнение выражений (14-13), (14-14) и (14-17), (14-18) показывает, что увеличение числа наблюдений позволяет получить более точную оценку истинного значения измеряемой величины. Однако следует иметь в виду, что число наблюдений п не может быть сколь угодно большим, так как в течение длительного времени, необходимого для получения большого числа результатов наблюдений, нельзя гарантировать неизменность не только условий проведения эксперимента, но и размера самой измеряемой величины. Практически п следует ограничивать таким значением, при котором случайная составляющая погрешности результата измерения будет существенно меньше не исключенных остатков систематических погрешностей отдельных результатов наблюдений.
Косвенные измерения. Допустим, что измеряемая величина у является функцией аргументов а, b, с,..., измеряемых прямыми измерениями, т.е. у = F(а, b, с,...). Проведя обработку ряда наблюдений для каждого аргумента методом, изложенным для прямых измерений, можно найти действительные значения аргументов
и оценки дисперсий A, B, C,...
; ; ….,
где n а, nb, пc,... — число измерений соответствующего аргумента.
Дальнейшую обработку результатов наблюдений можно проводить по-разному. Наиболее распространенным является метод линеаризации, основанный на разложении функциональной зависимости Y = F (A, B, C,...) в ряд Тейлора с ограничением ряда членами, содержащими только первые производные:
(14-19)
где аи, bИ, си,... — истинные значения аргументов.
Запишем выражение (14-19) в более компактной форме:
(14-20)
где Y и — истинное значение косвенно измеряемой величины; DA, DB, DC,... — погрешности результата измерения соответствующего аргумента;, … - значения частных производных от функции по соответствующему аргументу в точке, где аргументы имеют истинное значение. В правой части выражения (14-20) случайными величинами являются DA, DB, DC,... Если результаты измерения аргументов независимы друг от друга (что чаще всего и бывает на практике), то эти случайные величины являются независимыми.
Применяя к выражению (14-20) сформулированные выше правила, найдем математическое ожидание и дисперсию случайной величины Y, полученной при подстановке в функциональную зависимость значений аргументов A, B, C,...:
(14-21)
(14-22)
где ...— дисперсии значений A, В, С,... аргументов.
Если при определении действительных значений аргументов A, В, С,... систематические погрешности были исключены, то М [DA] = М [DB] = М [DC] =... = 0. В этом случае М [Y] = Yи и, следовательно, значение Y=F (А, В, С,...) можно принять за оценку действительного значения косвенно измеряемой величины. Что касается дисперсии полученного результата Y, то вычислить ее непосредственно по выражению (14-22) нельзя, так как для расчета значений частных производных требуется знание истинных значений аргументов. Вместо истинных значений аргументов известны их оценки A, В, С,.... Поэтому вместо значений
Нужно использовать их оценки вычисляя производные в точке, где аргументы принимают значения A, B, C, …
Если дисперсии аргументов известны, то оценка дисперсии результата измерения s2 [Y] для косвенно измеряемой величины вычисляется по формуле
(14-23)
Для того чтобы найти доверительный интервал погрешности результата косвенного измерения, нужно определить закон распределения величины или
Закон распределения этих величин может быть весьма сложным даже при нормальном законе распределения случайных погрешностей аргументов.
Если систематические погрешности при измерении аргументов не исключаются, то результат измерения косвенно измеряемой величины тоже
(14-24)
содержит систематическую погрешность, равную математическому ожиданию погрешности На основании (14-21) эту погрешность можно представить в виде
где ...— систематическая погрешность результата измерения соответствующего аргумента. Заменяя значения частных производных, входящих в выражение (14-24), на значения этих производных в точке, где аргументы принимают значения A, В, С,..., получим выражение для оценки систематической погрешности результата косвенного измерения в виде
(14-25)
При этом необходимо иметь в виду следующее. Очевидно, что оценить систематическую погрешность результата косвенного измерения по выражению (14-25) невозможно, не зная оценок систематических погрешностей измерения аргументов. Но если они известны, то их необходимо сразу исключить из результатов измерения аргументов и оценивать результат косвенного измерения по значениям аргументов, не содержащих систематических погрешностей. Поэтому выражением (14-25) следует пользоваться в том случае, когда систематические погрешности измерения аргументов не могли быть выявлены и оценены в процессе эксперимента, а были оценены лишь после него. Это выражение может использоваться также при подготовке к эксперименту. Например, если предполагается, что погрешность результата косвенного измерения определяется только погрешностью средств измерений аргументов, причем у этих средств преобладающей является систематическая погрешность (случайной погрешностью можно пренебречь), то, пользуясь выражением (14-25), можно выбрать средства измерений с такими допустимыми предельными значениями систематических погрешностей, чтобы погрешность результата измерения косвенно измеряемой величины не превысила заданного значения.
При однократных измерениях аргументов процедура определения результата косвенно измеряемой величины сохраняется такой же, как и при многократных измерениях, с учетом замечаний, сделанных при рассмотрении однократных прямых измерений.
Совместные измерения. Целью совместных измерений является установление функциональной зависимости между величинами, например зависимости сопротивления от температуры. Отыскивая зависимость между величинами а и b, необходимо устанавливать и измерять различные размеры величины а и одновременно измерять величину b. Таким образом, можно получить координаты исследуемой зависимости Так как результаты измерения этих величин содержат погрешности, то полученные координаты не будут принадлежать истинной исследуемой зависимости. Исключив систематическую погрешность из каждого результата измерения, можно уточнить эти координаты, но и уточненные координаты все-таки будут отклоняться (рассеиваться) относительно истинной зависимости из-за случайных погрешностей.
Степень рассеивания характеризуется дисперсией. Правильной зависимостью, построенной по полученным координатным точкам, следует считать такую зависимость, при которой дисперсия координатных точек относительно этой зависимости будет минимальной. Для оценки дисперсии нужно вычислить сумму квадратов отклонений координатных точек от истинной зависимости. Минимальной дисперсии будет соответствовать минимальное значение суммы квадратов этих отклонений. Поэтому метод, с помощью которого отыскивается истинная зависимость, называется методом наименьших квадратов.
Рассмотрим применение этого метода на примере линейной зависимости между а и b. Предположим, нам известно, что зависимость между а и b должна описываться уравнением
(14-26)
Результаты эксперимента после исключения систематических погрешностей дают нам координаты исследуемой зависимости а1, Необходимо решить, как провести прямую линию, наилучшим образом согласующуюся с полученными координатами. Иными словами, зная координаты, полученные экспериментально, и вид функции, нужно определить коэффициенты и в уравнении (14-26).
В соответствии с уравнением (14-26), если b принимает значение то значение а должно быть равно , а эксперимент дает значение . Следовательно, экспериментальная точка отклоняется от истинной точки на значение . Сумму квадратов отклонений экспериментальных точек от истинной зависимости можно найти по выражению
(14-27)
где п — число экспериментальных точек.
Найдем значения коэффициенто и в, обращающие выражение (14-
27) в минимум. Для этого продифференцируем это выражение по и и приравняем производные нулю:
(14-28)
Систему уравнений (14-28) с учетом (14-26) приведем к виду
(14-29)
Решая эту систему уравнений, получим выражение для коэффициента b:
(14-30)
а, зная β, находим выражение для a:
(14-31)
Полученные значения a и b в общем случае отличаются от истинных значений коэффициентов уравнения и
и являются случайными величинами, так как координаты , искаженные случайными погрешностями, тоже являются случайными величинами. Погрешностями определения коэффициентов являются и Дисперсии этих погрешностей равны дисперсиям соответствующих коэффициентов, т. е. и Найдем эти дисперсии.
Сначала рассмотрим влияние погрешностей измерения а i и bi на рассеивание экспериментальных точек относительно исследуемой зависимости. Предположим, что мы хотим измерить величину а при b = bi. Если измерения выполняются без погрешностей, то, установив значение bi, получим значение величины а, соответствующее координатной точке 1 (рис. 1), лежащей на исследуемой зависимости. Теперь допустим, что величина а измеряется без погрешности, а величина b с погрешностью. Тогда при установке значения bi истинное значение величины b может оказаться равным bи за счет погрешности Db. Значение величины а при этом будет соответствовать координатной точке 2, лежащей на исследуемой зависимости. Однако, полагая, что мы установили значение bi, вместо координатной точки 2 мы будем рассматривать координатную точку 2', которая смещена с исследуемой зависимости на, где — истинный коэффициент наклона исследуемой зависимости. Если же и величина а измеряется с погрешностью, то координатная точка 2' сместится на величину этой погрешности D а a и окажется в точке 3. Именно эту точку мы и рассматриваем как точку с координатами аi, bi. Точка 3 смещена с исследуемой зависимости на . Очевидно, что экспериментальная точка 3 не изменит своего положения, если при изменении погрешностей D аа и D b значение Dа будет оставаться неизменным. При этом значения коэффициентов b и a, рассчитанных по выражениям (14-30) и (14-31), будут одни и те же, так как они определяются только положением экспериментальных точек. Поэтому мы можем считать, что измерение величины b осуществляется без погрешности, а рассеивание экспериментальных точек относительно исследуемой зависимости обусловлено только погрешностью измерения величины а, причем эта погрешность . Погрешности D аа и D b являются независимыми случайными величинами. Применяя правила нахождения дисперсий, устанавливаем, что дисперсия, характеризующая рассеивание экспериментальных точек,
Считаем, что эта дисперсия одинакова при измерении любых значений аi.
Перейдем теперь к непосредственной оценке дисперсий коэффициентов b и a. Считая, что величина b измеряется без погрешности, мы имеем право рассматривать любые значения bi, входящие в выражения для расчета коэффициентов, как неслучайные числа.
Выражение (14-30) путем алгебраических преобразований можно привести к виду
где - среднее арифметическое значение координат величины b.
Так как все аi — независимые случайные величины с дисперсией , то дисперсию коэффициента b согласно ( 14-4) и (14-5) можно найти по выражению
(14-32)
Для нахождения дисперсии коэффициента, а удобнее вместо выражения (14-31) использовать выражение, которое можно получить, исключая из системы уравнений (14-29) коэффициент b и решая эту систему относительно коэффициента a:
Отсюда находим дисперсию коэффициента α:
(14-33)
Для расчета дисперсий по выражениям (14-32) и (14-33) необходимо знать дисперсию рассеивания экспериментальных точек . Точное значение этой дисперсии найти нельзя даже при известных дисперсиях погрешностей измерения величин а и b, так как еще необходимо знать истинный коэффициент наклона bи. Поэтому вместо дисперсий и получают их оценки и , используя вместо одну из следующих ее оценок:
1) при известных дисперсиях погрешностей измерения
2) при известных оценках дисперсий погрешностей измерения и
3) при отсутствии предварительной информации о дисперсиях погрешностей или их оценках
Последнее выражение является аналогом выражения (14-9). В числителе этих выражений стоят суммы квадратов отклонений отдельных результатов измерения от оценок их истинных значений, в знаменателе — число степеней свободы. В математической статистике доказано, что при обработке совместных измерений число степеней свободы определяется числом координатных точек п минус число неизвестных коэффициентов т в исследуемой функциональной зависимости. В рассматриваемом случае т = 2 (коэффициенты a иb), поэтому число степеней свободы равно п — 2.
Совокупные измерения. Если число проведенных различных совокупных измерений равно числу измеряемых величин, то по результатам измерений можно составить систему уравнений, в которой число уравнений равно числу измеряемых величин. Решая систему уравнений, каждую измеряемую величину можно косвенно выразить через результаты совокупных измерений. Дальнейшую обработку можно проводить по правилам обработки результатов наблюдений при косвенных измерениях. Если число различных совокупных измерений больше числа измеряемых величин, то обработку результатов измерения проводят с помощью метода наименьших квадратов.
СУММИРОВАНИЕ ПОГРЕШНОСТЕЙ
В практике измерений часто встает задача определения результирующей (суммарной) погрешности по известным значениям составляющих этой погрешности.
При рассмотрении составляющих погрешности как случайных величин, результирующую погрешность следует определять по правилу суммирования случайных величин. Это правило основано на известных из теории вероятностей положениях:
1) математическое ожидание (систематическая погрешность) результирующей погрешности определяется алгебраической суммой математических ожиданий (систематических погрешностей) составляющих (14-1);
2) дисперсия результирующей погрешности определяется согласно (14-4) выражением
(14-34)
где — дисперсия i-и составляющей погрешности; п — число суммируемых составляющих погрешностей; rij— коэффициент корреляции между i- и j-и составляющими, знак под суммой означает, что суммирование распространяется на все возможные попарные сочетания составляющих погрешностей, для которых
Нахождение результирующей систематической погрешности по известным систематическим погрешностям суммируемых составляющих не вызывает трудностей. Использование же выражения (14-34) для расчета затруднительно, так как точное значение коэффициента корреляции между составляющими обычно неизвестно. В этом случае при расчетах полагают r равным нулю, если случайные составляющие можно считать независимыми, или равным единице со знаком плюс или минус, если заметна корреляция между суммируемыми случайными составляющими погрешностей. Рассмотрим подробнее суммирование случайных погрешностей.
Суммирование случайных погрешностей при нормальных законах их распределения. Будем считать, что результирующая погрешность измерения состоит из п случайных составляющих, имеющих нормальный закон распределения; ±sim — границы доверительного интервала i-й случайной составляющей.
Зная доверительную вероятность и доверительный интервал для каждой составляющей погрешности, можно найти среднее квадратическое отклонение каждой из них по формуле
(14-35)
где — коэффициент, взятый из таблиц для нормального распределения и соответствующий доверительной вероятности Pi. Если доверительная вероятность для всех составляющих одинакова и равна Р, то, используя выражения (14-34) и (14-35), получаем:
а) для коррелированных составляющих (r ij равен + 1 или - 1)
(14-36)
где знак «±» означает, что для составляющих с положительной корреляцией si и sim нужно брать со знаком «+», а для составляющих с отрицательной корреляцией — со знаком «—»;
б) для независимых составляющих (rij = 0)
(14-37)
При суммировании составляющих, имеющих нормальный закон распределения, результирующая погрешность будет иметь тоже нормальный закон распределения. Поэтому границы доверительного интервала результирующей погрешности с доверительной вероятностью Р
(14-38)
С учетом (14-36) и (14-37) выражение (14-38) принимает вид
а) для коррелированных составляющих
(14-39)
б) для независимых составляющих
(14-40)
Если в выражении (14-39) все составляющие имеют положительную корреляцию, то
(14-41)
Суммирование погрешностей по выражению (14-41) называется арифметическим суммированием, а по выражению (14-40) — геометрическим суммированием.
Действительные значения коэффициентов корреляции по абсолютному значению могут находиться в пределах от нуля до единицы, поэтому арифметическое суммирование обычно дает завышенное значение суммарной погрешности.
Если для суммируемых составляющих погрешностей известны их предельные значения, то предельное значение результирующей погрешности находят путем арифметического суммирования предельных значений составляющих.
Суммирование случайных погрешностей при их законах распределения, отличных от нормального. Трудность нахождения суммарной погрешности в этом случае заключается в том, что закон ее распределения зависит от конкретных видов и характеристик законов распределения суммируемых составляющих. Например, при сложении двух независимых случайных погрешностей, имеющих равномерные законы распределения с одинаковыми дисперсиями, результирующая погрешность будет распределяться по треугольному закону. Если же эти равномерные законы имеют разные дисперсии, то результирующая погрешность будет распределяться по трапецеидальному закону. Поэтому для установления доверительного интервала результирующей погрешности необходимо в каждом конкретном случае искать методами теории вероятностей закон распределения результирующей погрешности.
Зная закон распределения результирующей погрешности, можно найти доверительный интервал этой погрешности по выражению, аналогичному (14-38):
где — коэффициент, зависящий от закона распределения результирующей погрешности и доверительной вероятности Р.
Возможны приближенные способы определения доверительного интервала суммарной погрешности без установления закона распределения результирующей погрешности.
Первый способ базируется на центральной предельной теореме: если число суммируемых независимых составляющих достаточно велико (практически при среди этих составляющих не должно быть существенно преобладающих над остальными.), то закон распределения результирующей погрешности близок к нормальному и в качестве коэффициента можно принимать zp.
Второй способ основан на исследовании (Петров В. П., Рясный Ю. В. Оценка суммарной погрешности средств измерений//Измерительная техника.— 1977.— № 2.), показавшем, что при суммировании независимых составляющих, имеющих законы распределения, изложенные в ГОСТ 8.011—72, можно пользоваться приближенными значениями : при доверительной вероятности Р = 0,90 коэффициент , а при доверительной вероятности . При этом погрешность в определении не превышает ±10%.