8.3. Сглаживание и предсказаниеВ вводных замечаниях относительно задачи оценивания, приведенных в § 7.2, упоминалось, что задачи оценивания состояния разделяются на три класса: предсказание, фильтрацию и сглаживание. В задаче предсказания требуется оценить Предсказание. В основополагающих работах Калмана и Бьюси решение задачи предсказания (прогнозирования) было представлено в виде простого обобщения алгоритмов фильтрации. Алгоритм одношагового предсказания был получен в качестве промежуточного результата при выводе алгоритма дискретной фильтрации, основанном на методе ортогонального проецирования (см. § 7.2). Предположим, что необходимо оценить
Здесь
В дальнейших рассуждениях более удобно рассматривать дифференциальное уравнение для
Из ур-ний (8.63) и (8.64) получаем или
Если вычислить условное среднее от левой и правой частей ур-ния (8.62) при заданном
Теперь, используя обычные определения
Так как
и из ур-ния (8.67) следует
Это уравнение представляет собой искомый алгоритм предсказания. Хотя при выводе алгоритма за основу была принята непрерывная модель сообщения, аналогичный подход может быть использован и для дискретного случая. Конечно, окончательное выражение (8.69) справедливо как для непрерывного, так и для дискретного случаев — для этого достаточно рассматривать В задаче последовательного предсказания состояния либо — предсказание с фиксированным интервалом: — предсказание с фиксированной точкой: фиксировано — предсказание с фиксированным упреждением Алгоритм (8.69) применим для всех этих типов предсказания, хотя процедура вычислений все же должна быть незначительно видоизменена. Наиболее простым случаем является предсказание с фиксированным интервалом. Здесь требуется оценить текущее состояние по данным фиксированного множества наблюдений в прошлом, т. е. при фиксированном
где
с начальным условием В задаче предсказания с фиксированной точкой требуется оценить состояние в фиксированный момент времени в будущем как функцию текущего момента времени. Например, в начальных стадиях запуска искусственного спутника Земли желательно предсказать состояние в момент выхода на орбиту (в момент выключения маршевых двигателей) как функцию текущего времени. В этом случае ур-ние (8 69) принимает вид
Так как в данной задаче второй аргумент переходной матрицы состояния является переменной величиной, то можно использовать ур-ние (8.65) и записать
Используя граничное условие Предсказание с фиксированным упреждением является, очевидно, тем случаем, который обычно и описывается как собственно предсказание. В этой задаче требуется предсказать состояние на время
Так как оба аргумента переходной матрицы состояния являются в данном случае функциями текущего времени, то ни одно из стандартных ур-ний (8.63), (8.65) не описывает полностью эволюцию
Необычная форма записи этого уравнения выбрана для того, чтобы подчеркнуть истинную переменную для операции дифференцирования. После подстановки выражений (8.63) и (8.65) для соответствующих производных получаем уравнение
Необходимое граничное условие Ошибка предсказания записывается в виде
Используя ур-ния (8.62) и (8.69), находим
так что дисперсия ошибки равна
При выводе ур-ния (8.79) использовалось то обстоятельство, что
Так как подынтегральное выражение в ур-нии (8.80) является неотрицательно определенным, дисперсия Пример 8.1. Рассмотрим три приведенных выше вида предсказания для моделей сообщения и наблюдения: которые имеют переходную матрицу состояния Тогда алгоритм предсказания записывается в виде
или же как система уравнений Алгоритм предсказания с фиксированным интервалом записывается в виде Алгоритм предсказания с фиксированной точкой имеет вид Наконец, алгоритм с фиксированным упреждением записывается как
При постоянной Как и следовало ожидать, дисперсия ошибки предсказания с фиксированным интервалом неограниченно возрастает, так как Сглаживание. В задаче сглаживания необходимо получить оценку состояния — сглаживание с фиксированным интервалом: интервал наблюдения фиксирован, так что — сглаживание с фиксированной точкой: фиксирован момент времени — сглаживание с фиксированной задержкой: в этом случае ни К сожалению, в отличие от задачи предсказания, три вида сглаживания требуют для своего осуществления трех различных алгоритмов, хотя, как будет показано ниже, некоторые алгоритмы следуют непосредственно из других. Брайсон и Фрэзер опубликовали одну из первых работ по последовательным алгоритмам сглаживания [33]. Они показали, что сглаживание (так же, как и фильтрация) может рассматриваться как задача оптимизации и решаться с использованием обычных методов вариационного исчисления. Аналогичные алгоритмы сглаживания, а также некоторые их обобщения были предложены в работах [192], [195], в которых были получены алгоритмы для дискретного времени с помощью оценивания по максимуму апостериорной вероятности и алгоритмы для непрерывного времени путем использования предельного перехода (см. § 7.3). Медич, опубликовавший ряд фундаментальных статей по сглаживанию [151]—[156], первый четко определил три вида задач сглаживания. Он распространил предельный переход, примененный в работе [195], на сглаживание с фиксированной точкой и сглаживание с фиксированной задержкой, а также дал для непрерывного случая непосредственный вывод уравнения сглаживания с фиксированной точкой из уравнения Винера — Хопфа. При выводе алгоритмов дискретного сглаживания Медичем был развит 1уетод ортогонального проецирования, впервые использованный Калманом [109]. В недавних работах [70], [158] обсуждалась новая форма алгоритмов сглаживания, которые используют комбинацию двух оценок, полученных при фильтрации с помощью прямого и обратного фильтров Калмана. Как было указано выше, Мера и Брайсон [160] и Брайсон и Хенриксон [34] распространили алгоритмы сглаживания на случай небелого шума соответственно для непрерывных и дискретных процессов. Один из подходов к задаче сглаживания и фильтрации, предложенный Кайлатцом [101] и Кайлатцом и Фростом [103, 104], основан на теории «обновляющих» процессов. Этот подход позволяет существенно упростить вывод алгоритмов фильтрации и сглаживания и будет использован в настоящем разделе при выводе алгоритмов сглаживания для случая непрерывного времени. В первую очередь будет рассмотрен случай непрерывного времени, а затем будут получены алгоритмы для дискретного времени. Подход, основанный на теории «обновляющих» процессов и впервые использованный Волдом и Колмогоровым в задаче линейного оценивания по критерию наименьших квадратов, заключается в «обелении» последовательности наблюдений и переходе к более простой задаче для белого шума. Боде и Шеннон [29] успешно применили этот подход к выводу уравнения классического стационарного фильтра Винера. Другим преимуществом такого подхода являются более общая постановка задачи оценивания и его возможное применение к некоторым нелинейным задачам. Для простоты изложения ограничимся рассмотрением линейных систем с сосредоточенными параметрами; интересующиеся могут познакомиться с другими применениями этого подхода в статьях [101], [103], [104]. Основной задачей при использовании подхода, основанного на теории «обновляющих» процессов, является получение при помощи физически реализуемой и обратимой линейной операции из наблюдаемого процесса
является белым шумом. Так как
то очевидно, Как указывалось в § 7.2 и 7.3, «обновляющий» процесс
Интересным и очень полезным дополнительным свойством Как отмечалось (см. § 6.6), ошибка оценивания
Так как
то из ур-ния (8.84) следует уравнение Винера—Хопфа так что
Это обычная форма записи уравнения Винера—Хопфа. Однако вследствие того, что «обновляющий» процесс является белым шумом [см. (8.83)],
Благодаря фильтрующему свойству дельта-функции это уравнение преобразуется в
Следовательно, интегральное уравнение Винера—Хопфа для
Поэтому
Этот результат имеет принципиально важное значение и представляет собой решение задач сглаживания Хотя основным предметом нашего рассмотрения является не фильтрация, а сглаживание, оказывается, что решение задачи фильтрации играет большую роль при выводе алгоритмов сглаживания. Поэтому необходимо кратко остановиться на решении задачи фильтрации в терминах «обновляющего» процесса, прежде чем перейти к выводу алгоритмов сглаживания. Для задачи фильтрации из ур-ния (8.90) при
Если продифференцировать обе части ур-ния (8.91) по
Используя уравнение модели сообщения, можно записать но
Поэтому ур-ние (8.92) принимает вид
Интеграл просто равен
Далее
Подставляя этот результат в ур-ние (8.95), получим
или
Это уравнение может быть приведено к стандартной форме, если использовать соотношение
Теперь обратимся к алгоритму сглаживания. Уравнение (8.90) может быть записано в виде Так как первый интеграл в этом выражении равен
Аналогично можно показать, что
Ковариационная матрица
где
Иными словами,
с
Так как
Если подставить ур-ния (8.101) и (8.100) в (8.99), то для
или
где
Оценка состояния Дисперсия оценки, как результат сглаживания, может быть найдена из ур-ния (8.106) как функция дисперсии оценки, полученной в результате фильтрации В соответствии с определением ошибки имеем
Поэтому дисперсия ошибки сглаживания
Ковариация
При подстановке (8.111) в ур-ние (8.110) после очевидных алгебраических преобразований имеем
Это очень интересный результат, так как из него ясно видно, насколько уменьшается дисперсия ошибки оценки состояния Рассмотрим каждый из трех видов сглаживания отдельно. В первую очередь рассмотрим сглаживание с фиксированным интервалом, для которого
Если продифференцировать последнее выражение по текущему времени
Так как
Используя этот результат и то, что Интеграл в правой части уравнения равен
Теперь вернемся к началу и продифференцируем ур-ние (8.113) по
В результате подстановки ур-ний (7.82) и (7.85) для
Выражение для
так что ур-ние (8.119) принимает вид
Для компактной записи этого выражения введем матрицу коэффициентов усиления при сглаживании
и запишем ур-ние (8.121) в виде
Форма записи ур-ния (8.123) очень сходна с формой записи уравнения исходного фильтра Калмана, за исключением того, что ошибка здесь представляет собой разность между оценкой как результатом сглаживания и оценкой как результатом фильтрации, а не между действительным и ожидаемым наблюдениями. Начальное условие для ур-ния (8.123) определяется при ур-нии (8.123), то Используя обычные определения и обозначения, запишем ошибку сглаживания в виде
так что или
Следует обратить внимание на сходство полученного выражения с ур-нием сглаживания (8.123). Данное выражение может быть получено из (8.109), если воспользоваться теми же рассуждениями, что и при выводе алгоритма сглаживания (8.123). Уравнение (8.125) решается в обратном направлении по времени при начальном условии Дисперсия ошибки сглаживания с фиксированным интервалом может быть получена из ур-ния (8.112) при
В такой форме это выражение неудобно с той точки зрения, что сначала необходимо вычислить
Используя ур-ния (7.85) и (8.116), после несложных алгебраических преобразований получим
Это уравнение также решается в обратном направлении по времени с граничным условием Таблица 8.3.Непрерывные алгоритмы сглаживания с фиксированным интервалом
При сглаживании с фиксированной точкой фиксируется момент времени, в который необходимо получить оценку, а далее увеличивается время наблюдения. Следовательно, в ур-нии (8.106)
Если взять производные по
Используя (8.105), этот результат можно записать в виде
Начальное условие Желательно выразить или
Решая ур-ние (8.132) с граничным условием Следует заметить что для получения Дифференцируя выражение Так как
Уравнение дисперсии ошибки для сглаживания с фиксированной точкой легко получается из (8.112):
Вычисляя производные по
с начальным условие Таблица 8.4. Непрерывные алгоритмы сглаживания с фиксированной точкой
Медич [157] предложил непрерывный алгоритм сглаживания с фиксированной точкой несколько в ином виде:
где Непрерывный алгоритм сглаживания с фиксированной задержкой был получен Медичем из дискретного алгоритма Рауха [192] путем довольно сложного предельного перехода. Для сглаживания с фиксированной задержкой ( Сначала запишем ур-ние (8.107), которое в этом случае принимает вид
и ур-ние (8.108)
Так же, как и при выводе ур-ния (8.117), вычисляем производную
Это уравнение имеет такой же вид, что и (8.117), за исключением первого члена, который обусловлен наличием переменной Вычисляя, как и в предыдущем случае, производную от (8.137), получим Подставляя в это выражение ур-ние (7.102) и (7.105) для
Из ур-ния (8.137) следует, что
Граничное условие Чтобы завершить вывод данного алгоритма, обратим внимание на то, что дифференциальное уравнение
получается тем же способом, который использовался при выводе уравнения предсказания с фиксированным упреждением (3.76). Граничное условие Уравнение ошибки сглаживания с фиксированной задержкой определяется путем дифференцирования выражения
Начальное условие Дисперсия ошибки сглаживания с фиксированной задержкой, как и в предыдущем случае, получается из ур-ния (8.112). После несложных алгебраических преобразований получаем
Здесь граничное условие Таблица 8.5. Непрерывные алгоритмы сглаживания с фиксированной задержкой
Подход, основанный на теории «обновляющих» процессов, может быть также использован для вывода алгоритмов сглаживания для дискретных процессов. В дискретном случае «обновляющий» процесс хотя и является белым шумом, но уже не имеет ту же самую дисперсию, что и Для того чтобы подчеркнуть многообразие подходов, которые могут использоваться при решении задач оценивания, при выводе дискретных алгоритмов сглаживания используем подход, основанный на критерии максимальной апостериорной вероятности. Как уже было отмечено ранее, такой подход первоначально был предложен в работе [195]. Модели сообщения и наблюдения записываются, как обычно, в виде
где В качестве оценки состояния
Как будет показано ниже, необходимо, чтобы удовлетворялось только ур-ние (8.147). Согласно формуле Байеса условная плотность вероятности
Воспользовавшись теоремой умножения, получим или
Еще раз применяя теорему умножения, находим
Если известно Еще раз применим теорему умножения, и исключая аргумент
Уравнение (8.149) представляет собой удобную форму записи условной вероятности, так как только две плотности вероятности в данном выражении включают в себя Для распределения Поэтому
где предполагается, что Для плотности
где Если подставить ур-ния (8.150) и (8.151) в (8.149), то получим
Чтобы упростить это выражение, прологарифмируем обе его части. В результате получим
Следовательно, оценки, как результат сглаживания, должны удовлетворять уравнению
Если решить это уравнение относительно Используя лемму об обращении матрицы и выполняя некоторые алгебраические преобразования, получаем
где коэффициент усиления Используя соотношение для априорной дисперсии выражение для
Выражение (8.155) представляет собой уравнение для чтобы получить Так как Уравнение в конечных разностях для ошибки сглаживания получается непосредственно из
с начальным условием Уравнение для дисперсии ошибки сглаживания с фиксированным интервалом может быть получено, если вычесть
Если определить ковариации обеих частей ур-ния (8.158), учитывая, что то получается рекуррентное уравнение для
Это уравнение также решается в обратном направлении по времени с граничным условием Вычисление дисперсии ошибки сглаживания с фиксированным интервалом также требует знания дисперсии ошибки фильтрации. Так как ур-ние (8.159) требуется решить в обратном направлении по времени, то обычно необходимо предварительно вычислить и запомнить дисперсии
Эти два уравнения должны использоваться с большой осторожностью, так как они являются матричными уравнениями и обычно нестабильны. Сводка уравнений дискретного алгоритма сглаживания с фиксированным интервалом приведена в табл. 8.6. Таблица 8.6. Дискретный алгоритм сглаживания с фиксированным интервалом
Вывод алгоритма сглаживания с фиксированной точкой начнем с алгоритма сглаживания с фиксированным интервалом, описываемого ур-нием (8.155). Но теперь конечный момент времени Если заменить
Можно получить алгоритм сглаживания с фиксированной точкой, полагая
Если теперь в ур-нии (8.161) считать
Продержан увеличивать Этот результат может быть записан в виде
где
и Так как
Используя простые преобразования матриц получим
где
Преимуществом такой формы записи является то, что теперь не надо вычислять матрицу, обратную Начальное условие Для вычисления дисперсии ошибки применяется тот же ход рассуждений, что и для случая сглаживания с фиксированным интервалом, что приводит к выражению
Сводка уравнений алгоритма сглаживания с фиксированной точкой для дискретных процессов приведена в табл. 8.7. Таблица 8.7. Дискретный алгоритм сглаживания с фиксированной задержкой
Алгоритм сглаживания с фиксированной задержкой для дискретных процессов получается в виде комбинации алгоритмов с фиксированным интервалом и фиксированной точкой. Начнем с решения ур-ния (8.155) для сглаживания с фиксированным интервалом
Заменяя
Перепишем алгоритм сглаживания с фиксированной точкой, определяемый ур-нием (8.166) при
Подставляя теперь ур-ние (8.171) и (8.172) для того, чтобы заменить
Можно упростить выражение (8.173), учитывая, что Если подставить это выражение в ур-ние (8.173), то получим
Для завершения вывода алгоритма необходимо получить рекуррентное соотношение для
Начальные условия для Алгоритм вычисления ошибки сглаживания получается непосредственно из определения ошибки для сглаживания с фиксированной точкой и алгоритма сглаживания, описываемого ур-нием (8 174), как
Можно показать, что дисперсия ошибки сглаживания определяется уравнением
Начальное условие Таблица 8.8. Дискретный алгоритм сглаживания с фиксированной задержкой
|