2.2. Метод максимального правдоподобия

Прежде чем перейти к задачам с изменяющимися параметрами, рассмотрим более подробно оценивание постоянных параметров при равномерном априорном распределении . В этом случае оптимальным байесовским методом нахождения оценок при простой функции потерь является метод максимального правдоподобия. Этот же метод является основным и в том случае, когда априорное распределение не задано. Тогда говорят об оценке неизвестного параметра по наблюдениям .

Качество оценок неизвестных параметров принято определять с помощью следующих основных характеристик.

1. Несмещенность. Оценка называется несмещенной оценкой параметра , если математическое ожидание этой оценки равно оцениваемому параметру, т.е. .

2. Состоятельность. Оценка параметра называется состоятельной, если она сходится по вероятности к оцениваемому параметру при неограниченном увеличении числа опытов , т.е. при любом выполняется условие . С помощью неравенства Чебышева [1-3] можно показать, что достаточным условием состоятельности несмещенной оценки является уменьшение дисперсии ошибки до нуля при .

3. Эффективность. Оценка называется эффективной, если средний квадрат ошибки, вычисленный для , не больше, чем для любой другой оценки этого параметра:

Для несмещенной оценки средний квадрат ошибки равен дисперсии. Поэтому эффективная несмещенная оценка определяется из условия минимума дисперсии ошибки .

Существует неравенство [15], с помощью которого можно определить нижнюю границу дисперсии несмещенных оценок. Это позволяет на основе сравнения действительного значения дисперсии ошибки с минимальным дать характеристику качества той или иной оценки.

Предположим, что границы области значений , где ПРВ отлична от нуля, не зависят от . Пусть –несмещенная оценка параметра , т.е.

где .

Продифференцируем обе части этого равенства по , используя предположение о независимости пределов интегрирования от . В результате получим:

или

Последнее выражение с учетом основной теоремы о математическом ожидании можно компактно переписать следующим образом:

. (2.17)

Кроме того, из очевидного условия

дифференцированием по находим . Умножая правую и левую части этого равенства на и вычитая из (2.17), получим

. (2.18)

Левая часть (2.18) представляет ковариацию двух СВ и , имеющих нулевые средние. Как известно, или . После подстановки выражений для и в это неравенство получим с учетом (2.18) следующее соотношение:

. (2.19)

При соотношение (2.19) можно переписать в виде, известном как неравенство Рао-Крамера [15]:

, (2.20)

где – дисперсия ошибки оценивания параметра .

Неотрицательная величина называется информацией, содержащейся в выборке (по Р.Фишеру). При независимых наблюдениях

Так как , а дисперсия суммы независимыых СВ равна сумме дисперсий, то количество информации по Фишеру для независимых находится по формуле:

, (2.21)

где . При независимых наблюдениях с одним и тем же распределением количество информации пропорционально числу наблюдений. В этом случае (2.20) запишется в виде:

. (2.22)

Правая часть неравенства Рао-Крамера определяет нижнюю границу для дисперсии ошибки оценивания параметра при заданной ПРВ наблюдений. Если удается найти несмещенную оценку с дисперсией , то эта оценка будет эффективной. Однако далеко не всегда минимальная дисперсия ошибки, т.е. дисперсия эффективной оценки, совпадает с нижней границей . Во многих случаях .

Рассмотрим два примера нахождения нижних границ дисперсии ошибки при оценивании параметров нормального и экспоненциального распределений. Предположим, что производятся независимые наблюдения с ПРВ

содержащей неизвестный параметр – математическое ожидание СВ . Запишем выражение для , найдем производную и количество информации в одном наблюдении. Поскольку , то для дисперсии любой оценки параметра справедливо неравенство . В рассмотренной задаче для оценки математического ожидания можно предложить среднее арифметическое наблюдений . Дисперсия этой оценки

совпадает с нижней границей. Следовательно, предложенная оценка является эффективной.

Другим примером может быть оценка параметра экспоненциального распределения . Нижняя граница дисперсии ошибки равна , так как . Вместе с тем анализ всех возможных оценок показывает, что нижней границы достичь не удается. Минимальную дисперсию , но большую чем , имеет эффективная несмещенная оценка . Изменим условия этого примера и поставим задачу оценки параметра экспоненциального распределения:

. Тогда , и существует эффективная оценка , дисперсия которой совпадает с нижней границей .

В каких же случаях эффективные оценки имеют дисперсию, совпадающую с нижней границей ? Для ответа на этот вопрос обратимся к выводу соотношения (2.19). Точное равенство в (2.19) достигается, когда СВ и при каждом значении связаны линейной зависимостью

. (2.23)

Полученное выражение дает описание семейства ПРВ и соответствующих оценок , обеспечивающих равенство в формулах (2.19), (2.20), т.е. эффективное оценивание с дисперсией . После интегрирования (2.23) по семейство таких ПРВ может быть представлено в виде:

, (2.24)

где и – дифференцируемые функции ; – произвольная функция . При этом служит эффективной оценкой параметра с дисперсией . Для конкретных ПРВ запись в форме (2.24) обычно содержит функции и от собственных параметров соответствующих распределений, например, и – для экспоненциального или и – для нормального распределения. В этом случае параметр может быть найден как функция с помощью соотношения . Например, для , совместная ПРВ запишется в виде: , где ; ; . После дифференцирования находим параметр , для которого является оптимальной оценкой.

Таким образом, эффективные оценки с дисперсией, в точности равной нижней границе могут быть получены только для ПРВ , входящих в экспоненциальное семейство (2.24). К этому семейству относятся часто встречающиеся в задачах обработки сигналов нормальное, биномиальное, пуассоновское и гамма-распределение. Для каждого из этих распределений существует определенная условиями (2.24) форма записи и соответствующая оценка параметра (табл.2.1).

Таблица 2.1

Тип распределения	ПРВ
1	2	3	4
Нормальное
Нормальное
Гамма
Биномиальное
Пуассоновское

Рассмотрим, например, нормальное распределение

с неизвестным параметром . Запишем в экспоненциальном виде совместную ПРВ:

где ;;. При этом является эффективной оценкой параметра .

Полученные результаты позволяют определить нижнюю границу дисперсии ошибки (2.20), (2.21) и указать эффективные оценки с дисперсией определенных параметров ПРВ из экспоненциального семейства (2.24). В общем случае основным методом поиска эффективных оценок параметров служит метод максимального правдоподобия [1,11-16,26]. Наилучшей считается оценка , для которой функция правдоподобия или достигает максимума, т.е. . Если дифференцируема и максимум находится во внутренней точке области возможных значений параметра , то оценка может быть определена из уравнений или . Оценки совокупности параметров ПРВ находятся с помощью решения системы уравнений правдоподобия:

, (2.25)

где – функция правдоподобия. Напомним, что по определению получается после подстановки результатов наблюдений в ПРВ . Метод максимального правдоподобия позволяет найти эффективные оценки параметров, если такие оценки существуют. Поэтому оценки , представленные в табл. 2.1, могут быть получены и с помощью решения уравнений правдоподобия. Например, для нормального распределения , логарифм функции правдоподобия запишется в виде: . Из уравнения находим эффективную оценку .

Рассмотрим более сложный пример оценки неизвестного параметра равномерного распределения с ПРВ:

. (2.26)

Функция правдоподобия находится после подстановки экспериментальных данных в (2.26). Если переменное значение удовлетворяет неравенствам , т.е. , то. При функция правдоподобия , поскольку в этом случае хотя бы один из сомножителей обращается в ноль.

Рис. 2.1. Функция правдоподобия при оценке параметра равномерного распределения

Анализ зависимости , представленной на рис.2.1, показывает, что наибольшее значение функции правдоподобия находится в точке .

Следовательно, – оценка максимального правдоподобия (ОМП). Заметим, что эта оценка не может быть получена с помощью решения уравнения правдоподобия, так как в точке функция имеет разрыв, и производная не существует.

Определим математическое ожидание и дисперсию полученной оценки . Для наибольшего значения совокупности случайных величин вначале найдем функцию распределения

. При равномерном законе распределения , если . Поэтому , а . Теперь уже нетрудно вычислить математическое ожидание оценки . Как следует из этой формулы, ОМП оказывается смещенной, но смещение можно устранить, если использовать оценку . Точность скорректированной оценки характеризуется дисперсией

. (2.27)

Интересно, что дисперсия оценки параметра равномерного распределения при увеличении числа наблюдений убывает как . Это исключение из правила (2.20), (2.21), согласно которому, для всех «гладких» ПРВ при независимых наблюдениях .

Примером задачи оценивания векторного параметра может служить нормальное распределение с ПРВ

В этом случае ОМП находится из решения следующих уравнений правдоподобия:

В результате получаем совместные ОМП математического ожидания и дисперсии:

. (2.28)

Важным свойством ОМП является инвариантность относительно взаимно однозначных преобразований параметра . Это означает, что при известных ОМП и функции может быть легко найдена ОМП . Действительно, так как существует обратная функция , то .

Принцип инвариантности позволяет в каждой конкретной задаче выбирать наиболее удобную параметризацию, а ОМП получать затем с помощью соответствующих преобразований. Пусть в условиях нормальной модели с двумя неизвестными параметрами требуется оценить параметрическую функцию , представляющую собой вероятность . В этом случае можно положить, например, и, согласно принципу инвариантности, ОМП . Учитывая (2.28), находим

Метод максимального правдоподобия не всегда приводит к несмещенным оценкам. Так, при оценке (2.27) двух параметров нормального распределения ОМП имеет смещение , убывающее до нуля при . Доказано [15], что для широкого класса ПРВ оценки максимального правдоподобия асимптотически (при ) несмещенные и асимптотически нормальные с дисперсией ошибки, совпадающей при с нижней границей в неравенстве Рао-Крамера (2.20). Описанные свойства обусловили широкое применение метода максимального правдоподобия в разнообразных приложениях.

Рассмотрим пример нахождения ОМП углового положения цели в условиях работы импульсной радиолокационной станции (РЛС) кругового обзора. Отраженные от цели полезные сигналы на выходе приемника РЛС представим в виде: , где – максимальное значение сигнала в момент равенства углового положения антенны РЛС и углового положения цели. Функция описывает изменение уровня сигнала (рис.2.2.а) в дискретном времени при вращении антенны. Прием отраженных сигналов обычно сопровождается помехами. Поэтому наблюдения , включают независимые гауссовские СВ с нулевыми средними и дисперсиями . На основе анализа наблюдений необходимо дать оценку углового положения цели.

Рис. 2.2. Огибающая пакета отраженных сигналов (а) и ее производная (б)

Для решения поставленной задачи найдем функцию правдоподобия

После логарифмирования и дифференцирования по параметру получим следующее уравнение правдоподобия:

При симметричной диаграмме направленности антенны РЛС и уравнение правдоподобия принимает следующий вид:

, (2.29)

где – весовые коэффициенты (рис. 2.2, б).

Выражение (2.29) определяет необходимые операции над наблюдениями при оценивании углового положения цели. Основными из них являются следующие:

– прием и запоминание амплитуд суммы сигнала и помех;

– умножение этих амплитуд на весовые коэффициенты ;

– образование полусумм и , где – точка, в которой весовая функция обращается в ноль;

– сравнение накопленных полусумм по величине;

– фиксация равенства полусумм и формирование оценки .

Расчет дисперсии найденной оценки углового положения цели вызывает трудности, поскольку решить уравнение (2.29) относительно не удается. В подобных случаях вместо точного значения дисперсии часто используют нижнюю границу , определяемую неравенством Рао-Крамера (2.20). Рассмотренные свойства ОМП гарантируют, что при большом числе наблюдений такой подход не приведет к значительным ошибкам. Вместе с тем расчет по формулам (2.20), (2.21) оказывается довольно простым. Учитывая независимость наблюдений, находим количество информации

где – отношение сигнал/шум. Таким образом, нижняя граница дисперсии оценки легко вычисляется при заданной огибающей пакета отраженных сигналов. Заметим, что для малых объемов выборки действительные значения дисперсии оценки (2.29) могут оказаться больше, чем . Поэтому возможность применения приближенных соотношений должна контролироваться с помощью методов статистического моделирования [30].

Несмотря на отмеченные достоинства метода максимального правдоподобия, существует ряд задач оценивания, в которых его применение сталкивается со значительными математическими или вычислительными трудностями нахождения максимума . В таких случаях часто используется метод моментов [15,26], не обладающий свойствами асимптотической оптимальности, но часто приводящий к сравнительно простым вычислениям.

<< Предыдущая

Оглавление

Следующая >>