Читать в оригинале

<< ПредыдущаяОглавлениеСледующая >>


9.2 Оценивание при помощи условного среднего

В этом параграфе рассматриваются алгоритмы условного среднего или, другими словами, алгоритмы фильтрации с минимальной дисперсией ошибки для непрерывных во времени нелинейных систем. Оценка по наблюдению  определяется соотношением

.        (9.1)

Рассмотрим класс нелинейных систем, управляемых белым шумом. Само наблюдение представляет собой аддитивную смесь сигнала и белого шума. Таким образом,

                                                (9.2)

                                               (9.3)

где  и  - статистически независимые нормальные белые шумы с нулевыми средними и, кроме того,  выбрано так, что для

        (9.4)

План построения алгоритмов оценивания следующий. Сначала выразим уравнения для исходного сигнала и наблюдения в форме Ито, которая дана в § 4.4, а затем выпишем условное уравнение Фоккера—Планка в частных производных, решением которого является условная плотность вероятности вектора  при известном . Далее найдем два приближенных уравнения для оценки  с помощью разложения  и  в ряд Тейлора около точки . Наконец, дадим приближенные выражения для ковариационной матрицы ошибок и приведем несколько иллюстративных примеров, представляющих интерес для связи и управления.

Модель оценки. Выясним сначала, что представляют собой стохастические дифференциальные уравнения. Используем определение винеровского процесса и определяем новое наблюдение так, что  где  есть  и поэтому стохастические дифференциальные уравнения, описывающие нашу модель, можно записать в виде 

                               (9.5)

                                      (9.6)

причем

            (9.7)

Здесь  и  - независимые винеровские процессы, не коррелированные с . Как отмечалось в § 4.4, ур-ние (9.5) определяет непрерывный марковский векторный процесс.

Найдем некоторые характеристики моделей сообщения и наблюдения, которые понадобятся нам ниже, отметив, что их вычисление непосредственно следует из результатов § 4.4:

                                  (9.8)

Поскольку  определяется как винеровский процесс с ненулевым средним, то плотность вероятности  при условии  нормальна. Нам также потребуется ковариационная матрица случайного процесса :

                              (9.9)

где

                                                    (9.10)

Таким образом, для очень малых  отношение  детерминировано в том смысле, что

                                  (9.11)

Кроме того

           (9.12)

Для упрощения обозначений целесообразно ввести операторы условного среднего:

                (9.13)

Условное уравнение Фоккера—Планка. Теперь перейдем к определению условного или модифицированного уравнения Фоккера—Планка, решением которого является условная плотность вероятностей , по которой и находится условное среднее (9.1). Мы явно включаем параметр  в выражение для плотности, чтобы подчеркнуть зависимость этой функция от времени.

Прежде чем рассмотреть какой-либо из двух подходов определения уравнения Фоккера—Планка, приведем один вспомогательный результат, полученный Кушнером [124]. Сначала рассмотрим поведение условной плотности , в зависимости от дифференциала наблюдения , а затем поведение этой функции в зависимости от изменений .

Определим условную плотность как

.                   (9.14)

Этот результат следует из марковского свойства процесса. Так как , то, определяя  получаем

,

откуда следует, что в , представляемым  для  относительно , содержится не больше информации, чем в , представляемым  для . Поскольку

            (9.15)

то получаем соотношение (9.14). Уравнение (9.15) можно переписать следующим образом:

                 (9.16)

По причинам, которые станут понятными далее, целесообразно ввести отношение

                  (9.17)

Из (9.6) следует:  т. e. условная плотность вероятностей процесса  действительно не зависит от . Подстановка двух последних соотношений в (9.16) с учетом (9.8) дает

Сокращая члены, не содержащие  в числителе и знаменателе, получим

              (9.18)

Для того чтобы упростить  желательно выразить  через . Это можно сделать, раскладывая предыдущее соотношение в ряд Тейлора около точки  и . Удерживая члены порядка , получаем

(9.19)

Если теперь подставить вычисленные производные в (9.19) и учесть (9 18), то можно получить коэффициенты разложения искомого ряда:

Теперь займемся довольно утомительной процедурой подстановки полученных трех соотношений в (9.19), а затем упрощением результирующего выражения. Очевидное упрощение дают члены второго порядка . Например, первый член  , подставленный в выражение (9.19), дает

что с учетом, того что    — скаляр, легко может быть переписано в виде

Теперь, учитывая, что для бесконечно малого  производная    детерминирована, что  , получим 

Подобная процедура может быть проделана со всеми остальными членами разложения Тейлора, и тогда окончательно находим

          (9.20)

Подстановка этого соотношения в (9.17) дает

  (9.21)

Теперь приступим ко второй части вывода, которая идентична выводу уравнения Фоккера—Планка в гл. 4. Удобно в целях сокращения обозначений член в правой части (9.21) обозначить через . Тогда

                         (9.22)

   Первая половина нашего вывода касалась выяснения влияния на условную плотность вероятностей изменений . Сейчас мы рассмотрим, как влияют на поведение этой функции бесконечно малые приращения . Используя теорему умножения вероятностей, получаем

                 (9.23)

Далее применяем марковское свойство модели сообщения [см. (9.5)]:

и видим, что

поскольку при известном  в ,  или  никакой информации относительно  не содержится.  зависит только от прошлых и настоящих значений . A  или, что эквивалентно,  также не несет дополнительной информации по сравнению с той, что содержится в , так как мы предположили, что  и  независимы. Таким образом, имеем

                               (9.24)

Теперь разложим произвольную скалярную функцию  в ряд Тейлора около точки :

    (9.25)

Из уравнений для модели сообщения имеем с учетом (9.12) и (9.13)

 

Всеми моментами  более высокого порядка можно пренебречь, поскольку порядок всех их выше порядка . Таким образом, мы производим усечение ряда до -го члена, ибо порядок всех остальных членов разложения выше порядка .

Умножая ур-ние (9.24) на  и интегрируя по , получим

Окончательно интегрируем по частям  и  перенося два последних члена и правую часть равенства. Предполагаем, что граничные условия на  заданы на бесконечности, ;

Тогда, меняя порядок интегрирования, имеем

Поскольку  — произвольная функция, предыдущее соотношение должно быть верным для любого , поэтому

                (9.26)

Теперь можем заменить  на , так как ур-ние (9.26) не содержит члена . Полученное уравнение будет совершенно эквивалентно уравнению Фоккера—Планка [(4.128), гл. 4], если отбросить условие . Подстановка выражения для  из (9.22) в предыдущее соотношение дает модифицированное уравнение Фоккера—Планка

     (9.27)

в котором опущены члены, такие, как  и  поскольку они на порядок выше члена . Последний член в правой части уравнения отражает влияние наблюдаемой реализации . Если  не зависит от , то  равно нулю, так как в этом случае  равно просто . Тогда модифицированное уравнение переходит в обычное уравнение Фоккера—Планка (4.123).

В некоторых случаях целесообразно представлять модифицированное стохастическое дифференциальное уравнение Фоккера—Планка в ином виде:

                               (9.28)

Если исключить условную переменную  то последние члены в правых частях ур-ний (9.28) и (9.27) станут равными нулю, и тогда мы придем к исходному уравнению Фоккера—Планка, рассмотренному в гл 4.

Представляет интерес применить правило дифференцирования Ито для получения модифицированного уравнения Фоккера—Планка. Введем следующую функцию случайного процесса:

                         (9.29)

Тогда условная характеристическая функция этого процесса равна

Применение правила Ито [см. (4.108)] дает результат, эквивалентный соотношению (4.123):

(9.30)

Обратным преобразованием Фурье находим

(9.31)

что эквивалентно модифицированному уравнению Фоккера—Планка, полученному выше довольно сложными вычислениями. Многие авторы используют для произвольного скаляра обозначение прямого дифференциального оператора [37], [39]:

В этом случае можно показать, что модифицированное уравнение Фоккера—Планка может быть записано в виде

где

Оценка с минимумом ковариационной матрицы ошибок. Теперь займемся решением уравнения Фоккера—Планка для того, чтобы получить оценку  с минимальной ковариационной матрицей ошибок вектора состояний . Будем считать, что сообщение и наблюдаемый сигнал заданы ур-ниями (9.2) и (9.3) [или (9.5) и (9.6)] с априорными данными (9.4) или (9.7).

           Условная ковариационная матрица ошибок и оптимальная оценка определяются следующими соотношениями:

     (9.32)

                                    (9.33)

в которых можно заменить  на , поскольку в  содержится вся информация о .

            Если умножить обе части модифицированного уравнения Фоккера—Планка (9.27) на и проинтегрировать в бесконечных пределах по , то получим

                (9.34)

Это соотношение является точным выражением для оптимальной оценки.

В процессе получения этого результата мы попутно доказали теорему о нелинейном проецировании

                            (9.35)

В данном случае полагаем  и используем приведенное выше определение «обновляющего» процесса

Выведем теперь уравнение для ковариационной матрицы ошибок. Легко установить следующее тождество [см. (4.60)]:

   (9.36)

Для того чтобы получить уравнение для ковариационной матрицы ошибок, умножим это тождество на  и проинтегрируем в бесконечных пределах по . Если члены равных знаков правой части (9.36) умножить на члены с равными знаками левой части ур-иия (9.27), а члены левой части (9.36) с равными знаками умножить на члены правой части (9.27), то после интегрирования по частям можно получить

        (9.37)

Уравнения (9.34) и (9.37) определяют оценку (условное среднее) с минимумом ковариационной матрицы ошибок. В общем случае эти два уравнения связаны между собой. В линейном случае этой связи не существует.

Теперь найдем два приближенных решения этих уравнений.

Приближение первого порядка. Разложим  и  в ряд по оптимальной оценке и ограничимся линейными членами. Тогда имеем

                                             (9.38)

                                                              (9.39)

Положим также

  (9.40)

Подставляя эти выражения в (9.34) и (9.37) и усредняя, получим:

      (9.41)                            (9.42)

Здесь предполагается, что среднее вектора  равно нулю. Подставляя выражение для  из (9.41) в (9.42) и опуская члены второго порядка малости, получаем уравнение фильтрации первого порядка:

                (9.43)

                         (9.44)

где нужно учесть, что

Уравнения (9.43) и (9.44) являются приближенными (первого порядка) нелинейными алгоритмами фильтрации. В линейном случае эти алгоритмы сводятся к уравнениям фильтрации Калмана и представляют одну из форм «линеаризованного» фильтра Калмана для нелинейного случая. Мы должны ясно представлять, что уравнение для  нелинейно по , как и должно быть в случае действительно линеаризованного фильтра. Иногда целесообразно представить эти алгоритмы в виде

                           (9.45)

               (9.46)

Тогда их можно интерпретировать как стохастические дифференциальные уравнения. Отметим, что ур-ния (9.33) и (9.34) были получены при начальных условиях в момент  до наблюдения с априорно известными средним и дисперсией процесса:

                                                                 (9.47)

              (9.48)

  Рассмотренные алгоритмы сведены в табл. 9.1

Таблица 9.1. Уравнения фильтрации первого порядка в непрерывном времени

Модель сигнала

                                  (9.2)

Модель наблюдения

                                                (9.3)

Априорные данные

                     (9.4)

Уравнение фильтрации

              (9.45)

Вычисление ковариационной матрицы ошибок

                (9.46)

Начальные условия

                           (9.47)

                (9.48)

Приближение второго порядка. Уравнения (9.34) и (9.37) являются точными уравнениями для оценки при помощи условного среднего и ковариационной матрицы ошибок; выше мы получили приближенные уравнения, используя разложение в ряд ур-ния (9.38) и подстановкой его в (9.40). Таким же образом могут быть найдены приближенные алгоритмы фильтрации более высоких порядков точности. Так, можно получить:

                  (9.49)

 

                                   (9.50)

                    (9.51)

где                                    

,

то следует из (4.153). Теперь подставим полученные выражения для  и  в точные соотношения для  и , проделаем все указанные операции, опуская члены порядка  и выше. В результате полученное уравнение для оценки  будет таким же, как и в предыдущем случае. Однако уравнение для ковариационной матрицы ошибок получить значительно сложнее из-за вычисления одного члена. Поскольку эта операция довольно сложна, то без потери общности продемонстрируем ее на примере.

Пример 9.1. Исследуем выражение

,

которое является одним из членов ур-ния (9 37) Используя разложение (9 50) для  и предполагая, что моменты третьего порядка равны нулю , получим

Моменты четвертого порядка (в предположении нормальности плотностей) равны (см. (422)]

Тогда

откуда с учетом (4.13) получаем              

Это и есть тот единственный член, который отличает алгоритм решения второго порядка от полученного выше приближения первого порядка.

Используя этот пример, можно было бы найти алгоритм фильтрации второго порядка аналогично алгоритму фильтрации первого порядка. Дадим лишь окончательные результаты (см. табл. 9.2).

Таблица 9.2. Уравнения фильтрации второго порядка в непрерывном времени (модели сообщения и наблюдения и априорные данные те же, что и в табл. 9.1)

Уравнение фильтрации

                 (9.52)

Вычисление ковариационной матрицы ошибок

       (9.53)

Вычисление тензора

                        (9.54)

Начальные условия

                                                              (9.47)

                                                                                            (9.48)

Пример 9.2. Найдем алгоритмы фильтрации для следующей простой нелинейной задачи. Пусть сигнал и наблюдение задаются соотношениями:  где  и  — нормальные белые шумы с нулевыми средними. Применение соотношений (9.45) и (9.46) дает следующий результат:

Уравнения фильтрации второго порядка следуют из (9.52) и (9 53):

В каждом случае начальные условия задаются в виде известных априори среднего значения и дисперсии. Так как модель наблюдения линейна по , то, как и следовало ожидать, уравнения в обоих случаях одинаковы.

Пример 9.3. Теперь рассмотрим линейную модель сигнала и нелинейную модель наблюдаемого процесса: где  — известный сигнал на входе. Даже если мы предположим, что шум имеет нулевое среднее, то известный (контрольный) сигнал или ненулевое среднее входного сообщения можно просто рассматривать как составляющую члена , который входит в модель сообщения. Использование обычным образом приближенных уравнений фильтрации дает следующие соотношения:

                                                        

представляющие фильтр первого порядка, и уравнения

являющиеся приближением второго порядка. Заметим, что наблюдение  входит в уравнение для ошибки. Это происходит в том случае, когда модель наблюдения нелинейна.

Пример 9.4. Рассмотрим систему с фазовой модуляцией [246]. Здесь типичная для многих систем связи модель сообщения является линейной системой, управляемой скалярным белым нормальным шумом с параметрами: , где

Модель наблюдения определяется соотношением   где  и  - постоянные, а  - несущая частота,  - нормальный шум с нулевым средним и интенсивностью . Модели сообщения и наблюдения показаны на рис. 9.1

Рис. 9.1. Модели фазомодулированного сигнала и наблюдения

Рассмотрим уравнения первого порядка для условного среднего. Из (9.45) и (9.46) находим:

В выражении для ковариационной матрицы дисперсий ошибок естественно оставить только члены, которые медленно меняются по сравнению с несущей частотой. Это ведет к следующей аппроксимации: , из которой следует, что уравнение для ошибки может решаться независимо от наблюдения и оценки .

Если шум, порождающий сигнал, и шум наблюдения стационарны, то дисперсия ошибки довольно быстро достигает своего постоянного значения. Соответствующая структурная схема субоптимального фазового детектора показана на рис. 9.2. Членами с двойной частотой пренебрегаем. Этот демодулятор оказывается простой системой фазовой автоподстройки.

Рис. 9.2. Структурная схема подоптимального приемника фазомодулированиого сигнала

Для случая, когда  — скаляр, уравнения фильтрации первого порядка при стационарном шуме запишутся в виде

где  а члены с двойной несущей отброшены. Кроме того,

 .

это уравнение имеет стационарное решение

где отношение  можно трактовать как отношение сигнал/шум S/Nr, поэтому

.

Пример 9.5. Рассмотрим снова прием одного сообщения в системе с фазовой модуляцией [246] и моделью сигнала такой же, как и в предыдущем примере. Однако модель наблюдения в такой системе будет обладать «памятью». Для того чтобы ввести эту память в уравнение для состояний, мы можем «нарастить» вектор состояний. Таким образом, полагая  и определяя вектор размерностью

,

можно построить новую модель сообщения

,

где

Модель наблюдения определяется соотношением

Уравнение фильтрации первого порядка можно записать в виде

Используя аппроксимацию , уравнение для дисперсии ошибки можно сделать независимым от уравнения для оценки.

Если теперь предположить, что шумы стационарны, то тогда существует стационарное решение уравнения для дисперсии ошибки, а подоптнмальную структуру приемника можно представить структурной схемой, изображенной на рис. 9.3, на котором представлена также модель сигнала с фазовой модуляцией.

Рис. 9 3. структурные схемы модели с частотной модуляцией и подптимального приемника

 



<< ПредыдущаяОглавлениеСледующая >>