2.2. Метод максимального правдоподобия
                 Прежде чем перейти к задачам с изменяющимися параметрами, рассмотрим более подробно оценивание постоянных параметров при равномерном априорном распределении  . В этом случае оптимальным байесовским методом нахождения оценок при простой функции потерь является метод максимального правдоподобия. Этот же метод является основным и в том случае, когда априорное распределение не задано. Тогда говорят об оценке неизвестного параметра   по наблюдениям  . 
                 Качество оценок неизвестных параметров принято определять с помощью следующих основных характеристик. 
        
        
                 1. Несмещенность. Оценка   называется несмещенной оценкой параметра  , если математическое ожидание этой оценки равно оцениваемому параметру, т.е.  . 
                 2. Состоятельность. Оценка   параметра   называется состоятельной, если она сходится по вероятности к оцениваемому параметру при неограниченном увеличении числа опытов  , т.е. при любом   выполняется условие  . С помощью неравенства Чебышева [1-3] можно показать, что достаточным условием состоятельности несмещенной оценки является уменьшение дисперсии ошибки до нуля при  . 
                 3. Эффективность. Оценка   называется эффективной, если средний квадрат ошибки, вычисленный для  , не больше, чем для любой другой оценки   этого параметра: 
         . 
                 Для несмещенной оценки средний квадрат ошибки равен дисперсии. Поэтому эффективная несмещенная оценка определяется из условия минимума дисперсии ошибки  . 
                 Существует неравенство [15], с помощью которого можно определить нижнюю границу дисперсии несмещенных оценок. Это позволяет на основе сравнения действительного значения дисперсии ошибки с минимальным дать характеристику качества той или иной оценки. 
                 Предположим, что границы области значений  , где ПРВ   отлична от нуля, не зависят от  . Пусть  –несмещенная оценка параметра  , т.е. 
                               ,                                
         где  . 
                 Продифференцируем обе части этого равенства по  , используя предположение о независимости пределов интегрирования от  . В результате получим: 
          
        или 
         . 
                 Последнее выражение с учетом основной теоремы о математическом ожидании можно компактно переписать следующим образом: 
         .         (2.17) 
        Кроме того, из очевидного условия 
          
        дифференцированием по   находим   . Умножая правую и левую части этого равенства на   и вычитая из (2.17), получим 
         . (2.18) 
                 Левая часть (2.18) представляет ковариацию   двух СВ   и  , имеющих нулевые средние. Как известно,   или  . После подстановки выражений для   и   в это неравенство получим с учетом (2.18) следующее соотношение: 
         .           (2.19) 
                 При    соотношение (2.19) можно переписать в виде, известном как неравенство Рао-Крамера [15]: 
         ,                             (2.20) 
        где   – дисперсия ошибки оценивания параметра  . 
                 Неотрицательная величина     называется информацией, содержащейся в выборке (по Р.Фишеру). При независимых наблюдениях 
           
        и 
         . 
        Так как  , а дисперсия суммы независимыых СВ равна сумме дисперсий, то количество информации по Фишеру для независимых   находится по формуле: 
         ,                        (2.21) 
        где  . При независимых наблюдениях с одним и тем же распределением   количество информации   пропорционально числу    наблюдений. В этом случае (2.20) запишется в виде: 
         .                          (2.22) 
                 Правая часть неравенства Рао-Крамера определяет нижнюю границу   для дисперсии ошибки оценивания параметра   при заданной ПРВ   наблюдений. Если удается найти несмещенную оценку   с дисперсией  , то эта оценка будет эффективной. Однако далеко не всегда минимальная дисперсия ошибки, т.е. дисперсия   эффективной оценки, совпадает с нижней границей  . Во многих случаях   . 
                 Рассмотрим два примера нахождения нижних границ дисперсии ошибки при оценивании параметров нормального и экспоненциального распределений. Предположим, что производятся независимые наблюдения   с ПРВ 
                               , 
        содержащей неизвестный параметр   – математическое ожидание СВ  . Запишем выражение для  , найдем производную   и количество информации   в одном наблюдении. Поскольку  , то для дисперсии любой оценки   параметра   справедливо неравенство  . В рассмотренной задаче для оценки математического ожидания можно предложить среднее арифметическое наблюдений  .          Дисперсия этой оценки 
                                   
        совпадает с нижней границей. Следовательно, предложенная оценка является эффективной. 
                 Другим примером может быть оценка параметра   экспоненциального распределения  . Нижняя граница дисперсии ошибки равна  , так как  . Вместе с тем анализ всех возможных оценок   показывает, что нижней границы   достичь не удается. Минимальную дисперсию  , но большую чем  , имеет эффективная несмещенная оценка  . Изменим условия этого примера и поставим задачу оценки параметра   экспоненциального распределения: 
         . Тогда    , и существует эффективная оценка  , дисперсия которой   совпадает с нижней границей  . 
                 В каких же случаях эффективные оценки имеют дисперсию, совпадающую с нижней границей  ?  Для ответа на этот вопрос обратимся к выводу соотношения (2.19). Точное равенство в (2.19) достигается, когда СВ     и    при каждом значении   связаны линейной зависимостью 
         .    (2.23) 
                 Полученное выражение дает описание семейства ПРВ   и соответствующих оценок  , обеспечивающих равенство в формулах (2.19), (2.20), т.е. эффективное оценивание с дисперсией  . После интегрирования (2.23) по   семейство таких ПРВ может быть представлено в виде: 
         ,                 (2.24) 
        где   и   – дифференцируемые функции  ;   – произвольная функция  . При этом   служит эффективной оценкой параметра   с дисперсией  . Для конкретных ПРВ запись в форме (2.24) обычно содержит функции   и   от собственных параметров соответствующих распределений, например,   и   – для экспоненциального или   и   – для нормального распределения. В этом случае параметр   может быть найден как функция   с помощью соотношения  . Например, для  , совместная ПРВ запишется в виде:  , где  ;  ;  . После дифференцирования находим параметр  , для которого   является оптимальной оценкой. 
                 Таким образом, эффективные оценки   с дисперсией, в точности равной нижней границе   могут быть получены только для ПРВ  , входящих в экспоненциальное семейство (2.24). К этому семейству относятся часто встречающиеся в задачах обработки сигналов нормальное, биномиальное, пуассоновское и гамма-распределение.            Для каждого из этих распределений существует определенная условиями (2.24) форма записи и соответствующая оценка   параметра (табл.2.1). 
        Таблица 2.1 
        
          
            | 
               Тип 
              распределения 
             | 
            
               ПРВ 
             | 
            
                          
             | 
            
                      
             | 
           
          
            | 
               1 
             | 
            
               2 
             | 
            
               3 
             | 
            
               4 
             | 
           
          
            | 
               Нормальное 
             | 
            
                 
             | 
            
                 
             | 
            
                 
             | 
           
          
            | 
               Нормальное 
             | 
            
                 
             | 
            
                 
             | 
            
                 
             | 
           
          
            | 
               Гамма 
             | 
            
                 
             | 
            
                 
             | 
            
                 
             | 
           
          
            | 
               Биномиальное 
             | 
            
                 
             | 
            
                 
             | 
            
                 
             | 
           
          
            | 
               Пуассоновское 
             | 
            
                 
             | 
            
                 
             | 
            
                 
             | 
           
         
                 Рассмотрим, например, нормальное распределение    
           с неизвестным параметром  . Запишем в экспоненциальном виде совместную ПРВ: 
         , 
        где  ; ; . При этом   является эффективной оценкой параметра  . 
                 Полученные результаты позволяют определить нижнюю границу   дисперсии ошибки (2.20), (2.21) и указать эффективные оценки с дисперсией   определенных параметров ПРВ из экспоненциального семейства (2.24). В общем случае основным методом поиска эффективных оценок параметров служит метод максимального правдоподобия [1,11-16,26]. Наилучшей считается оценка  , для которой функция правдоподобия   или   достигает максимума, т.е.   . Если   дифференцируема и максимум   находится во внутренней точке области возможных значений параметра  , то оценка может быть определена из уравнений    или  . Оценки   совокупности   параметров   ПРВ   находятся с помощью решения системы уравнений правдоподобия: 
         ,                                             (2.25) 
        где   – функция правдоподобия. Напомним, что по определению   получается после подстановки результатов наблюдений   в ПРВ  . Метод максимального правдоподобия позволяет найти эффективные оценки параметров, если такие оценки существуют. Поэтому оценки  , представленные в табл. 2.1, могут быть получены и с помощью решения уравнений правдоподобия. Например, для нормального распределения   , логарифм функции правдоподобия запишется в виде:  . Из уравнения   находим эффективную оценку  . 
                 Рассмотрим более сложный пример оценки неизвестного параметра   равномерного распределения с ПРВ: 
         .                                  (2.26) 
        Функция правдоподобия   находится после подстановки экспериментальных данных   в (2.26). Если переменное значение   удовлетворяет неравенствам  , т.е.  , то . При   функция правдоподобия  , поскольку в этом случае хотя бы один из сомножителей   обращается в ноль. 
          
        Рис. 2.1. Функция правдоподобия при оценке параметра равномерного   распределения 
                 Анализ зависимости  , представленной на рис.2.1, показывает, что наибольшее значение функции правдоподобия находится в точке  . 
                 Следовательно,   – оценка максимального правдоподобия (ОМП). Заметим, что эта оценка не может быть получена с помощью решения уравнения правдоподобия, так как в точке   функция   имеет разрыв, и производная    не существует. 
                 Определим математическое ожидание и дисперсию полученной оценки  . Для наибольшего значения   совокупности   случайных величин вначале найдем функцию распределения 
         . При равномерном законе распределения  , если  . Поэтому  , а  . Теперь уже нетрудно вычислить математическое ожидание оценки  . Как следует из этой формулы, ОМП   оказывается смещенной, но смещение можно устранить, если использовать оценку  . Точность скорректированной оценки характеризуется дисперсией 
         .                    (2.27) 
                 Интересно, что дисперсия оценки параметра   равномерного распределения при увеличении числа     наблюдений убывает как  . Это исключение из правила (2.20), (2.21), согласно которому, для всех «гладких» ПРВ   при независимых наблюдениях  . 
                 Примером задачи оценивания векторного параметра   может служить нормальное распределение с ПРВ 
         . 
        В этом случае ОМП находится из решения следующих уравнений правдоподобия: 
         , 
         . 
        В результате получаем совместные ОМП математического ожидания и дисперсии: 
         . (2.28) 
                 Важным свойством ОМП является инвариантность относительно взаимно однозначных преобразований   параметра  . Это означает, что при известных ОМП   и функции   может быть легко найдена ОМП  . Действительно, так как существует обратная функция  , то  . 
                 Принцип инвариантности позволяет в каждой конкретной задаче выбирать наиболее удобную параметризацию, а ОМП получать затем с помощью соответствующих преобразований. Пусть в условиях нормальной модели с двумя неизвестными параметрами требуется оценить параметрическую функцию  , представляющую собой вероятность  . В этом случае можно положить, например,   и, согласно принципу инвариантности, ОМП  . Учитывая (2.28), находим 
         . 
                 Метод максимального правдоподобия не всегда приводит к несмещенным оценкам. Так, при оценке (2.27) двух параметров нормального распределения ОМП   имеет смещение  , убывающее до нуля при  . Доказано [15], что для широкого класса ПРВ   оценки максимального правдоподобия асимптотически (при  ) несмещенные и асимптотически нормальные с дисперсией ошибки, совпадающей при   с нижней границей   в неравенстве Рао-Крамера (2.20). Описанные свойства обусловили широкое применение метода максимального правдоподобия в разнообразных приложениях. 
                 Рассмотрим пример нахождения ОМП углового положения цели в условиях работы импульсной радиолокационной станции (РЛС) кругового обзора. Отраженные от цели полезные сигналы на выходе приемника РЛС представим в виде:  , где   – максимальное значение сигнала в момент равенства углового положения     антенны РЛС и углового положения   цели. Функция   описывает изменение уровня сигнала (рис.2.2.а) в дискретном времени при вращении антенны. Прием отраженных сигналов обычно сопровождается помехами. Поэтому наблюдения  , включают независимые гауссовские СВ   с нулевыми средними и дисперсиями  . На основе анализа наблюдений необходимо дать оценку   углового положения цели. 
          
        Рис. 2.2. Огибающая пакета отраженных сигналов (а) и ее производная (б) 
          
                 Для решения поставленной задачи найдем функцию правдоподобия 
          
        После логарифмирования   и дифференцирования по параметру   получим следующее уравнение правдоподобия: 
         . 
        При симметричной диаграмме направленности антенны РЛС    и уравнение правдоподобия принимает следующий вид: 
                                                   ,                                           (2.29) 
        где   – весовые коэффициенты (рис. 2.2, б). 
                 Выражение (2.29) определяет необходимые операции над наблюдениями   при оценивании углового положения цели. Основными из них являются следующие: 
        – прием и запоминание амплитуд   суммы сигнала и помех; 
        – умножение этих амплитуд на весовые коэффициенты  ; 
        – образование полусумм   и  , где    – точка, в которой весовая функция обращается в ноль; 
        – сравнение накопленных полусумм по величине; 
        – фиксация равенства полусумм и формирование оценки  . 
                 Расчет дисперсии найденной оценки углового положения цели вызывает трудности, поскольку решить уравнение (2.29) относительно   не удается. В подобных случаях вместо точного значения дисперсии часто используют нижнюю границу  , определяемую неравенством Рао-Крамера (2.20). Рассмотренные свойства ОМП гарантируют, что при большом числе наблюдений   такой подход не приведет к значительным ошибкам. Вместе с тем расчет по формулам (2.20), (2.21) оказывается довольно простым. Учитывая независимость наблюдений, находим количество информации 
         , 
        где     – отношение  сигнал/шум. Таким образом, нижняя граница дисперсии оценки   легко вычисляется при заданной огибающей   пакета отраженных сигналов. Заметим, что для малых объемов выборки действительные значения дисперсии оценки (2.29) могут оказаться больше, чем  . Поэтому возможность применения приближенных соотношений должна контролироваться с помощью методов статистического моделирования [30]. 
                 Несмотря на отмеченные достоинства метода максимального правдоподобия, существует ряд задач оценивания, в которых его применение сталкивается со значительными математическими или вычислительными трудностями нахождения максимума  . В таких случаях часто используется метод моментов [15,26], не обладающий свойствами асимптотической оптимальности, но часто приводящий к сравнительно простым вычислениям. 
         
  
         
         
       |