9.2 Оценивание при помощи условного среднегоВ этом параграфе рассматриваются алгоритмы условного среднего или, другими словами, алгоритмы фильтрации с минимальной дисперсией ошибки для непрерывных во времени нелинейных систем. Оценка по наблюдению
Рассмотрим класс нелинейных систем, управляемых белым шумом. Само наблюдение представляет собой аддитивную смесь сигнала и белого шума. Таким образом,
где
План построения алгоритмов оценивания следующий. Сначала выразим уравнения для исходного сигнала и наблюдения в форме Ито, которая дана в § 4.4, а затем выпишем условное уравнение Фоккера—Планка в частных производных, решением которого является условная плотность вероятности вектора Модель оценки. Выясним сначала, что представляют собой стохастические дифференциальные уравнения. Используем определение винеровского процесса и определяем новое наблюдение так, что
причем
Здесь Найдем некоторые характеристики моделей сообщения и наблюдения, которые понадобятся нам ниже, отметив, что их вычисление непосредственно следует из результатов § 4.4:
Поскольку
где
Таким образом, для очень малых
Кроме того
Для упрощения обозначений целесообразно ввести операторы условного среднего:
Условное уравнение Фоккера—Планка. Теперь перейдем к определению условного или модифицированного уравнения Фоккера—Планка, решением которого является условная плотность вероятностей Прежде чем рассмотреть какой-либо из двух подходов определения уравнения Фоккера—Планка, приведем один вспомогательный результат, полученный Кушнером [124]. Сначала рассмотрим поведение условной плотности Определим условную плотность как
Этот результат следует из марковского свойства процесса. Так как
откуда следует, что в
то получаем соотношение (9.14). Уравнение (9.15) можно переписать следующим образом:
По причинам, которые станут понятными далее, целесообразно ввести отношение
Из (9.6) следует: Сокращая члены, не содержащие
Для того чтобы упростить
Если теперь подставить вычисленные производные в (9.19) и учесть (9 18), то можно получить коэффициенты разложения искомого ряда: Теперь займемся довольно утомительной процедурой подстановки полученных трех соотношений в (9.19), а затем упрощением результирующего выражения. Очевидное упрощение дают члены второго порядка что с учетом, того что Теперь, учитывая, что для бесконечно малого Подобная процедура может быть проделана со всеми остальными членами разложения Тейлора, и тогда окончательно находим
Подстановка этого соотношения в (9.17) дает
Теперь приступим ко второй части вывода, которая идентична выводу уравнения Фоккера—Планка в гл. 4. Удобно в целях сокращения обозначений член в правой части (9.21) обозначить через
Первая половина нашего вывода касалась выяснения влияния на условную плотность вероятностей изменений
Далее применяем марковское свойство модели сообщения [см. (9.5)]: и видим, что поскольку при известном
Теперь разложим произвольную скалярную функцию
Из уравнений для модели сообщения имеем с учетом (9.12) и (9.13)
Всеми моментами Умножая ур-ние (9.24) на Окончательно интегрируем по частям Тогда, меняя порядок интегрирования, имеем Поскольку
Теперь можем заменить
в котором опущены члены, такие, как В некоторых случаях целесообразно представлять модифицированное стохастическое дифференциальное уравнение Фоккера—Планка в ином виде:
Если исключить условную переменную Представляет интерес применить правило дифференцирования Ито для получения модифицированного уравнения Фоккера—Планка. Введем следующую функцию случайного процесса:
Тогда условная характеристическая функция этого процесса равна Применение правила Ито [см. (4.108)] дает результат, эквивалентный соотношению (4.123):
Обратным преобразованием Фурье находим
что эквивалентно модифицированному уравнению Фоккера—Планка, полученному выше довольно сложными вычислениями. Многие авторы используют для произвольного скаляра обозначение прямого дифференциального оператора [37], [39]: В этом случае можно показать, что модифицированное уравнение Фоккера—Планка может быть записано в виде где Оценка с минимумом ковариационной матрицы ошибок. Теперь займемся решением уравнения Фоккера—Планка для того, чтобы получить оценку Условная ковариационная матрица ошибок и оптимальная оценка определяются следующими соотношениями:
в которых можно заменить Если умножить обе части модифицированного уравнения Фоккера—Планка (9.27) на
Это соотношение является точным выражением для оптимальной оценки. В процессе получения этого результата мы попутно доказали теорему о нелинейном проецировании
В данном случае полагаем Выведем теперь уравнение для ковариационной матрицы ошибок. Легко установить следующее тождество [см. (4.60)]:
Для того чтобы получить уравнение для ковариационной матрицы ошибок, умножим это тождество на
Уравнения (9.34) и (9.37) определяют оценку (условное среднее) с минимумом ковариационной матрицы ошибок. В общем случае эти два уравнения связаны между собой. В линейном случае этой связи не существует. Теперь найдем два приближенных решения этих уравнений. Приближение первого порядка. Разложим
Положим также
Подставляя эти выражения в (9.34) и (9.37) и усредняя, получим:
Здесь предполагается, что среднее вектора
где нужно учесть, что Уравнения (9.43) и (9.44) являются приближенными (первого порядка) нелинейными алгоритмами фильтрации. В линейном случае эти алгоритмы сводятся к уравнениям фильтрации Калмана и представляют одну из форм «линеаризованного» фильтра Калмана для нелинейного случая. Мы должны ясно представлять, что уравнение для
Тогда их можно интерпретировать как стохастические дифференциальные уравнения. Отметим, что ур-ния (9.33) и (9.34) были получены при начальных условиях в момент
Рассмотренные алгоритмы сведены в табл. 9.1 Таблица 9.1. Уравнения фильтрации первого порядка в непрерывном времени
Приближение второго порядка. Уравнения (9.34) и (9.37) являются точными уравнениями для оценки при помощи условного среднего и ковариационной матрицы ошибок; выше мы получили приближенные уравнения, используя разложение в ряд ур-ния (9.38) и подстановкой его в (9.40). Таким же образом могут быть найдены приближенные алгоритмы фильтрации более высоких порядков точности. Так, можно получить:
где
то следует из (4.153). Теперь подставим полученные выражения для Пример 9.1. Исследуем выражение
которое является одним из членов ур-ния (9 37) Используя разложение (9 50) для Моменты четвертого порядка (в предположении нормальности плотностей) равны (см. (422)] Тогда откуда с учетом (4.13) получаем Это и есть тот единственный член, который отличает алгоритм решения второго порядка от полученного выше приближения первого порядка. Используя этот пример, можно было бы найти алгоритм фильтрации второго порядка аналогично алгоритму фильтрации первого порядка. Дадим лишь окончательные результаты (см. табл. 9.2). Таблица 9.2. Уравнения фильтрации второго порядка в непрерывном времени (модели сообщения и наблюдения и априорные данные те же, что и в табл. 9.1)
Пример 9.2. Найдем алгоритмы фильтрации для следующей простой нелинейной задачи. Пусть сигнал и наблюдение задаются соотношениями: Уравнения фильтрации второго порядка следуют из (9.52) и (9 53): В каждом случае начальные условия задаются в виде известных априори среднего значения и дисперсии. Так как модель наблюдения линейна по Пример 9.3. Теперь рассмотрим линейную модель сигнала и нелинейную модель наблюдаемого процесса: представляющие фильтр первого порядка, и уравнения являющиеся приближением второго порядка. Заметим, что наблюдение Пример 9.4. Рассмотрим систему с фазовой модуляцией [246]. Здесь типичная для многих систем связи модель сообщения является линейной системой, управляемой скалярным белым нормальным шумом с параметрами: Модель наблюдения определяется соотношением Рис. 9.1. Модели фазомодулированного сигнала и наблюдения Рассмотрим уравнения первого порядка для условного среднего. Из (9.45) и (9.46) находим: В выражении для ковариационной матрицы дисперсий ошибок естественно оставить только члены, которые медленно меняются по сравнению с несущей частотой. Это ведет к следующей аппроксимации: Если шум, порождающий сигнал, и шум наблюдения стационарны, то дисперсия ошибки довольно быстро достигает своего постоянного значения. Соответствующая структурная схема субоптимального фазового детектора показана на рис. 9.2. Членами с двойной частотой пренебрегаем. Этот демодулятор оказывается простой системой фазовой автоподстройки. Рис. 9.2. Структурная схема подоптимального приемника фазомодулированиого сигнала Для случая, когда где
это уравнение имеет стационарное решение где отношение
Пример 9.5. Рассмотрим снова прием одного сообщения в системе с фазовой модуляцией [246] и моделью сигнала такой же, как и в предыдущем примере. Однако модель наблюдения в такой системе будет обладать «памятью». Для того чтобы ввести эту память в уравнение для состояний, мы можем «нарастить» вектор состояний. Таким образом, полагая
можно построить новую модель сообщения
где Модель наблюдения определяется соотношением Уравнение фильтрации первого порядка можно записать в виде Используя аппроксимацию Если теперь предположить, что шумы стационарны, то тогда существует стационарное решение уравнения для дисперсии ошибки, а подоптнмальную структуру приемника можно представить структурной схемой, изображенной на рис. 9.3, на котором представлена также модель сигнала с фазовой модуляцией. Рис. 9 3. структурные схемы модели с частотной модуляцией и подптимального приемника
|