Лабораторная работа № 4
Оценивание параметров генеральной совокупности
в диалоговой системе «STADIA»
Цель работы: освоить методику оценивания точечных и интервальных параметров генеральной совокупности с помощью современных программных продуктов.
Приборы и принадлежности: Персональный компьютер.
Краткие теоретические сведения
Точечные оценки параметров распределения. На практике все результаты измерений и случайные погрешности являются величинами дискретными, т.е. величинами xi возможные значения которых отделимы друг от друга и поддаются счету. При использовании дискретных случайных величин возникает задача нахождения точечных оценок параметров их функций распределения на основании выборок – ряда значений хi принимаемых случайной величиной х в n независимых опытах. Используемая выборка должна быть репрезентативной (представительной), т.е. должна достаточно хорошо представлять пропорции генеральной совокупности.
Оценка параметра называется точечной, если она выражается одним числом. Задача нахождения точечных оценок – частный случай статистической задачи нахождения оценок параметров функции распределения случайной величины на основании выборки. Любая точечная оценка, вычисленная на основании опытных данных, является их функцией и поэтому сама должна представлять собой случайную величину с распределением, зависящим от распределения исходной случайной величины, в том числе от самого оцениваемого параметра и от числа опытов n.
Точечные оценки могут быть состоятельными, несмещенными и эффективными.
Состоятельной называется оценка, которая при увеличении объема выборки стремится по вероятности к истинному значению числовой характеристики.
Несмещенной называется оценка, математическое ожидание которой равно оцениваемой числовой характеристике (параметру).
Оценка называется эффективной, если ее дисперсия меньше дисперсии любой другой оценки данного параметра, т.е. наиболее эффективной считают ту из нескольких возможных несмещенных оценок, которая имеет наименьшую дисперсию.
Требование несмещенности на практике не всегда целесообразно, так как оценка с небольшим смещением и малой дисперсией может оказаться предпочтительнее несмещенной оценки с большой дисперсией. На практике не всегда удается удовлетворить одновременно все три этих требования, однако выбору оценки должен предшествовать ее критический анализ со всех перечисленных точек зрения.
Наиболее распространенным методом получения оценок является, метод наибольшего (максимального) правдоподобия, теоретически обоснованный математиком Р. Фишером, который приводит к асимптотически несмещенным и эффективным оценкам с приближенно нормальным распределением. Среди других методов можно назвать методы моментов и наименьших квадратов.
Точечной оценкой математического ожидания результата измерений является среднее арифметическое значение измеряемой величины
(1)
При любом законе распределения оно является состоятельной и несмещенной оценкой, а также наиболее эффективной по критерию наименьших квадратов.
Точечная оценка дисперсии, определяемая по формуле
(2)
является несмещенной и состоятельной.
Среднеквадратическое отклонение случайной величины х определяется как корень квадратный из дисперсии. Соответственно его оценка может быть найдена путем извлечения корня из оценки дисперсии. Однако эта операция является нелинейной процедурой, приводящей к смещенности получаемой таким образом оценки. Для исправления оценки СКО вводят поправочный множитель k(n), зависящий от числа наблюдений n. Он изменяется от k(3)=1,13 до k(∞) = 1,03. Оценка среднего квадратического отклонения
Полученные оценки математического ожидания и СКО являются случайными величинами. Это проявляется в том, что при повторениях серий из n наблюдений каждый раз будут получаться различные оценки и . Рассеяние этих оценок целесообразно оценивать с помощью СКО и Sσ. Оценка СКО среднего арифметического значения
(3)
Оценка СКО среднего квадратического отклонения
Отсюда следует, что относительная погрешность определения СКО может быть оценена как
Она зависит только от эксцесса и числа наблюдений в выборке и не зависит от СКО, т.е. той точности, с которой производятся измерения. Ввиду того, что большое число измерений проводится относительно редко, погрешность определения, а может быть весьма существенной. В любом случае она больше погрешности из-за смещенности оценки, обусловленной извлечением квадратного корня и устраняемой поправочным множителем k(n). В связи с этим на практике пренебрегают учетом смещенности оценки СКО отдельных наблюдений и определяют его по формуле
(4)
т.е. считают k(n)=1.
Иногда оказывается удобнее использовать следующие формулы для расчета оценок СКО отдельных наблюдений и результата измерения:
; (5)
Точечные оценки других параметров распределений используются значительно реже. Оценки коэффициента асимметрии и эксцесса находятся по формулам
; (6)
(7)
Определение рассеяния оценок коэффициента асимметрии и эксцесса описывается различными формулами в зависимости от вида распределения.
Оценка с помощью интервалов. Рассмотренные точечные оценки параметров распределения дают оценку в виде числа, наиболее близкого к значению неизвестного параметра. Такие оценки используют только при большом числе измерений. Чем меньше объем выборки, тем легче допустить ошибку при выборе параметра. Для практики важно не только получить точечную оценку, но и определить интервал, называемый доверительным, между границами которого с заданной доверительной вероятностью
где q – уровень значимости; хн, xв – нижняя и верхняя границы интервала, находится истинное значение оцениваемого параметра.
В общем случае доверительные интервалы можно строить на основе неравенства Чебышева. При любом законе распределения случайной величины, обладающей моментами первых двух порядков, верхняя граница вероятности попадания отклонения случайной величины х от центра распределения хц интервал tSx описывается неравенством Чебышевa
где Sх – оценка СКО распределения; t– положительное число.
Для нахождения доверительного интервала не требуется знать закон распределения результатов наблюдений, но нужно знать оценку СКО. Полученные с помощью неравенства Чебышева интервалы оказываются слишком широкими для практики. Так, доверительной вероятности 0,9 для многих законов распределений соответствует доверительный интервал 1,6Sx. Неравенство Чебышева дает в данном случае 3,16Sx. В связи с этим оно не получило широкого распространения.
В метрологической практике используют главным образом квантильные оценки доверительного интервала. Под 100P-процентным квантилем хр понимают абсциссу такой вертикальной линии, слева от которой площадь под кривой плотности распределения равна Р%. Иначе говоря, квантиль – это значение случайной величины (погрешности) с заданной доверительной вероятностью Р. Например, медиана распределения является 50%-иым квантилем х0,5.
На практике 25- и 75%-ный квантили принято называть сгибами, или квантилями распределения. Между ними заключено 50% всех возможных значений случайной величины, а остальные 50% лежат вне их. Интервал значений случайной величины х между х0,05и х0,95 охватывает 90% всех ее возможных значений и называется интерквантильным промежутком с 90%-ной вероятностью. Его протяженность равна d0,9= х0,95 – х0,05.
На основании такого подхода вводится понятие квантильных значений погрешности, т.е. значений погрешности с заданной доверительной вероятностью Р – границ интервала неопределенности ±ΔД = ±(хp – х1–p)/2 = ±dp/2. На его протяженности встречается Р% значений случайной величины (погрешности), а q = (1–Р)% общего их числа остаются за пределами этого интервала.
Для получения интервальной оценки нормально распределенной случайной величины необходимо:
• определить точечную оценку МО и СКО Sx случайной величины по формулам (6.8) и (6.11) соответственно;
• выбрать доверительную вероятность Р из рекомендуемого ряда значений 0,90; 0,95; 0,99;
• найти верхнюю хB и нижнюю хH границы в соответствии с уравнениями
и
полученными с учетом (6.1). Значения хн и хв определяются из таблиц значений интегральной функции распределения F(t) или функции Лапласа Ф(t).
Полученный доверительный интервал удовлетворяет условию
где n – число измеренных значений; zР – аргумент функции Лапласа Ф(t), отвечающей вероятности Р/2. В данном случае zр называется квантильным множителем. Половина длины доверительного интервала называется доверительной границей погрешности результата измерений.
• центр распределения;
• начальные и центральные моменты и производные от них коэффициенты – математическое ожидание (МО), Среднее квадратическое отклонение(СКО), эксцесс, контрэксцесс и коэффициент асимметрии.
Понятие центра распределения. Координата центра распределения показывает положение случайной величины на числовой оси и может быть найдена несколькими способами. Наиболее фундаментальным является центр симметрии, т.е. нахождение такой точки Хм на оси х, слева и справа от которой вероятности появления различных значений случайной величины одинаковы и равны 0,5:
Точку Хм называют медианой или 50%-ным квантилем. Для ее нахождения у распределения случайной величины должен существовать только нулевой начальный момент.
Можно определить центр распределения как центр тяжести распределения, т.е. такой точки , относительно которой опрокидывающий момент геометрической фигуры, огибающей которой является кривая р(х), равен нулю:
Эта точка называется математическим ожиданием. При симметричной кривой р(х) в качестве центра может использоваться абсцисса моды, т.е. максимума распределения Хм. Однако существуют распределения, у которых нет моды, например равномерное. Распределения с одним максимумом называются одномодальными, с двумя – двухмодалъными и т.д. Те из них, у которых в средней части расположен не максимум, а минимум, называются антимодальными.
Для двухмодалъных распределений применяется оценка центра в виде центра сгибов:
,
где хс1, хс2 – сгибы, т.е. абсциссы точек, в которых распределение достигает своих максимумов.
Для ограниченных распределений (равномерного, трапецеидального и др.) применяется оценка в виде центра размаха:
где х1, х2 – первый и последний члены вариационного ряда, соответствующего распределению.
Разные оценки центра имеют различную эффективность. При статистической обработке экспериментальных данных важно использовать наиболее эффективную из них, т.е. оценку, имеющую минимальную дисперсию. Это связано с тем, что погрешность в определении Хц влечет за собой неправильную оценку СКО, границ доверительного интервала, эксцесса, контрэксцесса, вида распределения и др., т.е. всех последующих оценок, кроме энтропийных.