Рассмотренный выше метод моментов приводит обычно к относительно простым формулам для оценки параметров, однако в ряде случаев эти оценки малоэффективны или вовсе несостоятельны. Например, для применения метода моментов теоретические моменты должны существовать, что не для всех распределений выполняется. Например, у распределения Коши, имеющего плотность
,
все моменты бесконечны.
Поэтому необходимы и другие методы, лишенные отмеченных недостатков.
Метод наибольшего правдоподобия обладает важным достоинством: он всегда приводит к состоятельным оценкам, имеющим наибольшую точность. Этот метод наилучшим образом использует всю информацию о неизвестных параметрах распределения, имеющуюся в выборке. Однако на практике он часто приводит к необходимости решать весьма сложные системы уравнений.
Метод наибольшего правдоподобия был предложен Р.Фишером, одним из основоположников математической статистики и является наиболее обоснованным и проверенным методом, широко используемом в математической статистике.
Случай дискретных распределений. Рассмотрим случай оценки параметра распределения дискретной случайной величины X, вероятности значений которой определяются согласно распределению , где - неизвестный параметр, который нужно оценить по выборке .
Функция
называется функцией правдоподобия. Если число случаев, когда случайная величина X приняла значения равно соответственно , где - размер выборки, то функция правдоподобия
.
Согласно методу наибольшего правдоподобия в качестве оценки неизвестного параметра принимается то значение, при котором функция правдоподобия принимает наибольшее значение для данной выборки. То есть в качестве оценки для берется наиболее вероятное значение для данной выборки.
Это значение находится в результате решения уравнения
.
Практически удобнее находить максимум функции ln(L), тогда соответствующее уравнение примет вид:
.
Это уравнение принято называть уравнением правдоподобия. Решение этого уравнения дает максимум функции правдоподобия, если для него выполняется условие
.
Если распределение имеет два пара параметра и , то есть имеет вид , то для оценки этих параметров используются система из двух уравнений правдоподобия:
.
При большем числе параметров число подобных уравнений соответственно увеличивается.
Проиллюстрируем применение метода наибольшего правдоподобия на примерах.
Пример 1. При n- кратном повторении опыта событие А проявилось m раз. Оценим вероятность события А по методу наибольшего правдоподобия. Будем считать, что случайная величина X принимает значение 1, если произошло событие А и 0, если произошло противоположное событие .
Согласно (8.1.1) функция правдоподобия в данном случае имеет вид:
,
где - оцениваемая вероятность.
После логарифмирования получаем, что
.
После дифференцирования по получаем следующее уравнение:
,
после решения которого получаем, что
.
Крышечкой сверху будем отличать оценку параметра от его точного значения.
Пример 2. Рассмотрим случай оценки параметра дискретной случайной величины Х, распределенной по закону Пуассона
Согласно (8.1.1) функция правдоподобия равна
.
После логарифмирования получаем
.
После дифференцирования получаем:
,
Откуда
,
где - статистическая вероятность того, что X=i.
Таким образом, в качестве оценки параметра а распределения Пуассона следует брать статистическое среднее выборки.
Случай непрерывных распределений. Если случайная величина X имеет непрерывную плотность распределения , где - параметр распределения, который нужно оценить по выборке реализаций этой случайной величины , то в этом случае функция правдоподобия
.
Согласно методу наибольшего правдоподобия наилучшей оценкой параметра является значение, для которого функция правдоподобия достигает максимума.
Если функция дифференцируема по , то это значение находится из уравнения
.
Практически удобнее пользоваться логарифмической формой этого уравнения
.
Это уравнение называется уравнением правдоподобия.
Если плотность распределения случайной величины X имеет два параметра и , то есть имеет вид , то оценки наибольшего правдоподобия находятся из системы двух уравнений
К сожалению, эти уравнения не всегда дают явные выражения для оценок параметров и их приходится решать численными методами.
Если область определения плотности зависит от параметров, то максимум функции правдоподобия может достигаться на границе этой области. В этом случае надо анализировать непосредственно функцию правдоподобия.
Если уравнение правдоподобия имеет несколько корней, то надо брать то решение, при котором функция правдоподобия максимальна.
Пример 3. Оценим данным методом параметр показательного распределения случайной величины T по выборке ее реализаций .
В этом случае , а функция правдоподобия
.
Уравнение правдоподобия в этом случае имеет вид:
.
В результате решения этого уравнения получаем, что оценка наибольшего правдоподобия
.
Пример 4. Оценим параметры случайной величины Х, распределенной по нормальному закону с плотностью
по выборке реализаций .
Функция правдоподобия в этом случае равна
,
а уравнения правдоподобия:
Из первого уравнения получаем, что
.
Из второго уравнения получаем, что
.
В данном случае оценки наибольшего правдоподобия совпали с ранее выведенными оценками по методу моментов. Но это не всегда так.