Лекция 8. Обработка опытных данных(ч.3).
Г). Нахождение неизвестных параметров распределения.
Для определения закона распределения необходимо располагать обширным статистическим материалом. На практике приходится иметь дело с материалом ограниченного объема – несколько десятков наблюдений. На основе ограниченного статистического материала можно определить основные числовые характеристики случайной величины, – и это – важнейшая задача математической статистики.
Необходимо отметить, что любое значение искомого параметра, вычисленное на основе ограниченного числа опытов, всегда содержит элемент случайности. Такое приближенное, случайное значение называют оценкой параметра. Любая из таких оценок случайна. При пользовании ею неизбежны ошибки. Желательно выбрать такую оценку, чтобы эти ошибки были по возможности минимальны.
Выясним, каким требованиям должна в таком случае удовлетворять оценка. Рассмотрим случайную величину X, закон распределения которой содержит неизвестный параметр a. Найдем оценку для параметра а по результатам n независимых опытов. В каждом опыте величина X принимала определенное значение, которое обозначим как . Будем рассматривать их как n независимых случайных величин. Такое рассмотрение правомерно, так как выбор n опытов из ограниченного материала произволен и результат 1-го, 2-го.... n-го из них, т.е. ; можно считать реализацией соответствующей случайной величины .
Обозначим оценку параметра а через . Она представляет собой функцию случайных величин , т.е.:
,
а потому сама является случайной величиной. Закон распределения определяется законом распределения величины Х и числом опытов n.
Оценка должна удовлетворять ряду требований, важнейшими из которых являются три следующих:
1. При увеличении числа опытов n оценка должна сходиться к оцениваемому параметру. Оценка, обладающая таким свойством называется состоятельной.
2. Использование оценки вместо параметра а не должно приводить к систематической ошибке в сторону завышения или занижения, т.е. необходимо, чтобы выполнялось условие . Оценка, удовлетворяющая этому условию называется несмещенной.
3. Несмещенная оценка должна обладать в сравнении с другими наименьшей дисперсией, т.е.
.
Оценка, обладающая этим свойством называется эффективной.
На практике всем этим требованиям удается удовлетворить не всегда.
Оценка для математического ожидания и дисперсии
Имеется случайная величина Х с математическим ожиданием m и дисперсией D; оба параметра неизвестны. Над величиной Х произведено n независимых опытов, давших результаты: . Необходимо найти оценки для параметров m и D.
Имеющийся материал о случайной величине Х следует рассматривать как первичный статистический или выборочный. Числовыми характеристиками распределения, построенного по этому материалу являются (как указывалось в 3.2.2.) выборочное среднее и выборочная дисперсия . Выясним возможность их использования в качестве оценок параметров m и D.
Оценка для математического ожидания.
В качестве оценки используем выборочное среднее :
,(запись вместо подчеркивает случайность получаемого результата, вероятность которого ).
Предлагаемая оценка является:
1. Состоятельной, т.к. при по вероятности сходится к m.
2. Несмещенной, т.к.: .
3. Эффективной, т.к.: .
Если величина X распределена по нормальному закону, то , а для других распределений – близка к минимуму.
Оценка для дисперсии.
В качестве оценки используем выборочную дисперсию : .
1. Проверка состоятельности. , но сходится по вероятности к , а сходится по вероятности к . Тогда , а следовательно оценка состоятельна
2. Проверка несмещенности.
Математическое ожидание выборочной дисперсии определяется:
.
Дисперсия не зависит от выбора начала координат. Выберем его в точке m. Тогда ; . В результате . Таким образом, оценка не является несмещенной. В качестве оценки для D следует выбрать скорректированную статистическую дисперсию , тогда . Предложенная оценка является несмещенной, что нетрудно показать.
В результате: если имеется ограниченный статистический материал, содержащий значения , принятые в n независимых опытах случайной величинах Х с неизвестными математическим ожиданием m и дисперсией D, то для определения этих параметров используются зависимости:
, (2.29)
. (2.30)