1. ЗАДАЧА ИНТЕРПОЛЯЦИИ
Очень часто исследуемая величина меняется с изменением условий опыта, а задача измерений состоит в нахождении функциональной зависимости, которая наилучшим образом описывает закон изменения интересующей нас величины,
Примером таких измерений является исследование зависимости сопротивления провода от его температуры, плотности газа от давления, вязкости жидкости от температуры и т.п. В результате измерений получаем несколько значений измеряемой величины,
Положим, что мы измеряем некоторую величину у, зависящую только от величины x. Для каждого значения xi проводим ряд измерений и получаем соответствующие значения < y > i для которых устанавливаем доверительные интервалы D yi. Если значения xi не могут быть заданы точно, а также измеряются с некоторой погрешностью, то и для них известны средние значения < x > i, и соответствующие доверительные интервалы D xi. Все < y > i и < x > i могут рассматриваться как координаты точек на плоскости, что дает возможность представить графически совокупность наших измерений в виде графика рис.15, а.
Отрезки, отложенные у каждой точки, означают величину доверительных интервалов, соответствующих измеренным средним значениям < x > i и < y > i. Обычно откладывают значение доверительного интервала для доверительной вероятности 0.7 или 0.95. Значение выбранной доверительной вероятности (одно и то же для всех точек данного графика) следует указать. Если значения одной из координат, скажем xi, известны практически точно, то на графике показывают только величину доверительного интервала для координаты yi, и он будет выглядеть, как на рис.15, б. (Разумеется доверительные интервалы в разных точках могут оказаться разными по величине, как показано на рисунке). Диаграммы рис.15 позволяют установить с некоторой степенью вероятности ту функциональную зависимость, которой связаны величины y = f (x). Однако, как и все задачи, в которые входят зависимости между случайными величинами, выбор функции у = f (x) может быть сделан с той или иной степенью надежности. Более того, существует бесчисленное множество функций, как угодно хорошо согласующихся с диаграммой рис.15,
Лучше всего, с точки зрения математического согласования, выбрать в качестве такой функции ломаную линию (x 1, y 1), (x 2, y 2),..., (xn, yn), как это показано на рис.15, б пунктиром. Однако очевидно, что такая линия не дает ничего нового по сравнению с имеющейся диаграммой, и обычно задача ставится так, что нужно на основании каких–то физических законов подобрать плавную кривую, хорошо описывающую полученные экспериментальные результаты, В гаком виде задача тоже остается достаточно неопределенной, но во всяком случае имеются пути к ее аналитическому решению. Основным путем этого решения является метод наименьших квадратов, хотя он, конечно, не единственный,
Применение этого метода мы иллюстрируем конкретными примерами.
2. МЕТОД НАИМЕНЬШИХ КВАДРАТОВ
Если из теоретических соображений можно считать, что между x и y существует линейная зависимость, то для интерполяции следует искать не какую–то функцию, лучше всего удовлетворяющую данным точкам, а прямую линию, менее всего уклоняющуюся от них, Уравнение искомой прямой может быть записано в виде
y = ax + b. (66)
Коэффициенты уравнения a и b надлежит выбрать наилучшим образом, Для нахождения по способу наименьших квадратов уравнения искомой прямой поступим следующим образом: проведем ординаты точек xi, yi доих пересечения с искомой прямой (рис.16). Значение этих ординат будет (axi + b). Расстояние по ординате от точки xi, yi до прямой равно (axi + b – yi). Положим, что прямая будет наилучшей, если сумма квадратов всех расстояний (axi + b – yi) имеет наименьшее значение. Минимум этой суммы ищется по правилам дифференциального исчисления,
Для нахождения коэффициентов a и b искомой прямой мы должны, таким образом, найти минимум суммы 1S n (axi + b – yi).
Поэтому, как обычно, приравниваем нулю производные этой суммы по параметрам a и b. Получаем
d [1S n (axi + b – yi)2]/ da = 0,
d [1S n (axi + b – yi)2]/ db = 0. (67)
Отсюда легко выводим
a ×1S nxi + n × b – 1S nyi = 0,
b ×1S nxi + a ×S1S nxi + a ×1S nxi 2 – 1S nxiyi = 0. (68)
Такая система уравнений называется нормальной и легко решается относительно параметров a и b:
a = [ n ×1S nxiyi – 1S nxi 1S nyi ]/[ n ×1S nxi 2 – (1S nxi)2], (69)
b = [1S nxi 21S nyi – 1S nxi 1S nxiyi ]/[ n ×1S nxi 2 – (1S nxi)2]. (70)
n – число наблюдений.
Суммирование производится по всем точкам. Теория дает возможность определить также дисперсию уклонения точек от прямой и дисперсию коэффициентов a и b.
Если S 02 – дисперсия точек, Sa 2 и Sb 2 – дисперсия коэффициентов a и b. тогда
S 02 = 1S nyi 2 / (n – 2) – (1S nyi)2 / n ×(n – 2) – (n ×1S nxiyi – 1S nxi 1S nyi)2 / n ×(n – 2)×[ n ×1S nxi 2 – (1S nxi)2], (71)
Sa 2 = n×S 02 / [ n ×1S nxi 2 – (1S nxi)2], (72)
Sb 2 = S 02×1S nxi 2 / [ n ×1S nxi 2 – (1S nxi)2], (73)
Если разделить числители и знаменатели в этих формулах на n 2, то после несложных преобразований можно взамен сумм выразить все коэффициенты через средние значения входящих в них величин. Тогда получим
a = [(< xy >) – (< x >)×(< y >)] / [< x 2) – < x >2], (69а)
b = [< x 2>×< y > – < x >×(< xy >)] / [< x 2> – < x >2], (70а)
S 02 = [ n /(n – 1)]× { < y 2> – < y >2 – [< xy > - < x >< y >]2 / [< x 2) – < x >2] }, (71а)
Sa 2 = S 02 / n[< x 2) – < x >2], (72а)
Sb 2 = S 0×< x 2>. (73а)
Такой вид решения системы (68) облегчает вычисления на тех моделях микрокалькуляторов, которые непосредственно дают значения < x > и < x >2.
Существуют также микрокалькуляторы, которые имеют постоянно заложенную в них программу для вычисления параметров уравнения интерполирующей прямой. Для этого следует ввести в калькулятор значения xi, yi и нажать одну клавишу.
Разумеется, не всякая зависимость описывается уравнением прямой линии. Однако в ряде случаев можно путем простых преобразований привести к линейной более сложную зависимость. Так, например, если y = k / x + l, то, введя новую переменную z = 1/ x, получим линейную связь между y и z. Точно так же, если y = abx, то логарифмируя, придем к линейной связи между x и lg y. Поэтому, пользуясь линейными уравнениями, можно находить оптимальные функции в довольно большом числе важных случаев. Теория позволяет находить коэффициенты уравнений и тогда, когда связь между измеряемыми величинами описывается более сложными функциями.
Следует подчеркнуть, что способ наименьших квадратов не может дать ответа на вопрос о том, какого вида функция лучше всего аппроксимирует данные экспериментальные точки.
Вид интерполирующей функции должен быть задан на основании каких-то физических соображений. Метод наименьших квадратов позволяет нам лишь выбрать, какая из прямых, экспонент или парабол является лучшей прямой, лучшей экспонентой или лучшей параболой,
Вообще говоря, можно утверждать, что, чем больше произвольных параметров содержит интерполирующая функция, тем лучше она аппроксимирует данные точки. Поэтому задача оптимальной интерполяции, по-видимому, должна ставиться так: подобрать наилучшую интерполирующую функцию при наименьшем числе параметров. Очевидно, что в общем виде эта задача не решается, и выбор вида функции обычно осуществляется либо на основании физических соображений, либо рядом эмпирических проб.
Нетрудно составить систему линейных уравнений для интерполяции с помощью параболы: y = ax 2 + bx + c, а также полинома любой степени (разумеется, число используемых точек должно быть не меньше числа коэффициентов, подлежащих определению). Однако практически используются только уравнения первой, реже второй степени.
Применение многочленов более высоких степеней обычно лишено физического смысла, не говоря уже о трудностях вычислений, которые обычно возрастают по мере увеличения числа членов в интерполирующем уравнении.
Дело не столько в «трудностях вычислений», сколько в принципиальной бессмысленности такого рода занятия. В. Г.
Далее опускаю скучных 12 страниц (74-85).
3. О ТОЧНОСТИ ВЫЧИСЛЕНИЙ
Точность обработки числового материала должна быть согласована с точностью самих измерений. Вычисления, произведенные с большим числом десятичных знаков, чем это необходимо, требуют лишней затраты труда и создают ложное впечатление о большей точности измерений, В то же время, разумеется, не следует ухудшать результаты измерений, пользуясь излишне грубыми методами вычислений. Так, например, если погрешность измерений составляет около 1%, то для вычислений можно применять логарифмическую линейку, позволяющую надежно отсчитывать три значащие цифры. При измерениях, выполненных с погрешностью 1¸0.1%, можно пользоваться четырехзначными таблицами логарифмов.
Во всех случаях нужно придерживаться следующего простого правила:
Погрешность, получающаяся в результате вычислений, должна быть примерно на порядок (то есть в 10 раз) меньше суммарной погрешности измерений. При этом можно быть уверенным, что в процессе арифметических операций мы ощутимым образом не исказим результат.
Поясним это правило на примерах.
1. Для измерения электрического сопротивления провода определена сила протекающего через него тока, оказавшаяся равной 27.3 мА, и падение напряжения на нем 6.45 В. Применявшиеся приборы гарантировали относительную погрешность измерения этих величин не более 1%.
Найдем величину сопротивления из закона Ома:
R = V / I = 6.45/0.0273 = 236.2627 Ом;
так как V и I определены с точностью около 100, то погрешность определения R несколько больше 1%. Поэтому вычисления целесообразно делать не точнее, чем до четвертого знака, и результат записать в виде 236.3 Ом.
Оценка погрешности результата может быть сделана на том основании, что каждый из двух сомножителей V и 1/ I определен с точностью до 100. Их произведение вычисляется с погрешностью, несколько большей 1%, но не более 2%, Поэтому результат окончательно может быть записан в виде R = 236±4 Ом. Доверительную вероятность для погрешности в данном случае определить нельзя, ибо указание погрешности прибора дает только верхний ее предел, но не закон распределения погрешностей данного прибора.
2. Сопротивление провода определяется путем измерения его длины и диаметра. Удельное сопротивление известно с точностью, значительно большей, чем измеряемые величины.
В результате десяти измерений длины l и диаметра d получены l = 25.32 мм, S = 0.12 мм. d =1.54 мм. Sd = 0.021 мм.
Относительная среднеквадратическая погрешность R будет определена из соотношения
SR 2 = (Sd 2)2/(d 2)2 + Sl 2/ l 2.
Принимая во внимание, что Sd 2 = 2× Sd, имеем
SR/R = {(2 Sd / d 2)2 + Sl 2/ l 2}1/2.
Очевидно, что при окончательном подсчете погрешность измерения длины практически можно не учитывать.
Относительная среднеквадратическая погрешность измерений площади (квадрата диаметра) будет Sd 2/ d 2 = 2× Sd / d 2 = 1.8%. Если мы ограничиваемся доверительной вероятностью 0.95, то табл. IV дает для этого случая t a ,n = 2.3, и относительная погрешность среднего арифметического из наших десяти измерений будет
D< R >/< R > = 1.8×2.3/101/2» 1.3%.
Это погрешность, соответствующая доверительной вероятности 0.95.
Таким образом, R нужно вычислить с точностью немного большей 100, т.е. ограничиться третьей значащей цифрой.
В случае медного провода для комнатной температуры мы получим
R = 1.78×10-6 4l/pd2 = 2.42×10–4 Ом.
с относительной погрешностью 1.3% (для доверительной вероятности 0.95).
4. ЧИСЛО ЗНАКОВ ПРИ ОПРЕДЕЛЕНИИ ПОГРЕШНОСТЕЙ
Мы знаем, что величина случайной погрешности D x, как и сами результаты измерений, подвержена случайным колебаниям.
Примеры, приведенные ранее (см. стр.54), показывают, что даже при довольно большом числе измерений доверительные интервалы для nS получаются большие, то есть величину погрешности мы всегда определяем достаточно грубо.
При 10 измерениях S определяется с погрешностью более 30%. Поэтому, как правило, следует в этом случае для 10S приводить одну значащую цифру, если она больше 3, и две значащие цифры, если первая из них меньше 4.
Например, если 10 S получилось равным 0.523, то приводим только одну цифру – 10 S = 0.5; если 10 S = 0.124; то имеется возможность давать две значащие цифры 10 S = 0.12.
При n = 25 s nS = 1/7. Очевидно, что в этом случае нет смысла вычислять и приводить для nS более двух значащих цифр, т.е. нужно писать nS = 2.З, а не 2.34 или nS = 0.52, а не 0.523.
При расчетах на микрокалькуляторах необходимо помнить, что мы всегда автоматически получаем больше значащих цифр, чем это соответствует точности измерений. При этом совершенно необходимо в окончательных результатах делать соответствующие округления, так как большое число приводимых десятичных знаков создает ложное впечатление о большой точности измерений.
По этому поводу неоднократно писалось и, казалось бы, здесь все очевидно, однако до сих пор результаты некоторых экспериментальных исследований вызывают удивление излишним. числом значащих цифр, ликвидируя которые можно сделать эти результаты и более легко читаемыми и более убедительными.