8.3. Сглаживание и предсказание

В вводных замечаниях относительно задачи оценивания, приведенных в § 7.2, упоминалось, что задачи оценивания состояния разделяются на три класса: предсказание, фильтрацию и сглаживание. В задаче предсказания требуется оценить по данным наблюдения, полученным до момента времени ; при фильтрации оценивается при заданном ; в задаче сглаживания известно наблюдение при . В гл. 7 рассматривалась только задача фильтрации, так как она наиболее часто встречается на практике и, как будет видно из дальнейших выкладок, является основой для исследования задач предсказания и сглаживания. Для простоты ограничимся в данном параграфе рассмотрением случая, когда шум наблюдения белый. Методы, представленные в предыдущем параграфе, применительно к небелому шуму могут быть распространены (с небольшими изменениями) и на задачу сглаживания. Уже опубликованы результаты, полученные в этом направлении [343, 159].

Предсказание. В основополагающих работах Калмана и Бьюси решение задачи предсказания (прогнозирования) было представлено в виде простого обобщения алгоритмов фильтрации. Алгоритм одношагового предсказания был получен в качестве промежуточного результата при выводе алгоритма дискретной фильтрации, основанном на методе ортогонального проецирования (см. § 7.2). Предположим, что необходимо оценить при заданном множестве наблюдений , где . Используя обычную форму записи модели сообщения, получим

(8.62)

Здесь — переходная матрица состояния, связанная с невозмущенной моделью сообщения и удовлетворяющая уравнению

(8.63)

В дальнейших рассуждениях более удобно рассматривать дифференциальное уравнение для при условии, что — переменная, a — фиксирована. Это можно получить, вычислив производную от выражения [которое равно единичной матрице, так как ]:

(8.64)

Из ур-ний (8.63) и (8.64) получаем

или

(8.65)

Если вычислить условное среднее от левой и правой частей ур-ния (8.62) при заданном , то получим

(8.66)

Теперь, используя обычные определения

(8.67)

Так как - белый шум, то никакая информация о его прошлом, содержащаяся в , не может быть использована для предсказания при . Поэтому

для (8.68)

и из ур-ния (8.67) следует

для (8.69)

Это уравнение представляет собой искомый алгоритм предсказания.

Хотя при выводе алгоритма за основу была принята непрерывная модель сообщения, аналогичный подход может быть использован и для дискретного случая. Конечно, окончательное выражение (8.69) справедливо как для непрерывного, так и для дискретного случаев — для этого достаточно рассматривать и как непрерывные или как дискретные моменты времени. Фактически, если данные поступают в дискретные моменты времени, ур-ние (8.69) может быть использовано для непрерывного предсказания до момента поступления следующей выборки. Таким образом, данный алгоритм действует как устройство восстановления сообщения.

В задаче последовательного предсказания состояния либо либо , либо оба вместе возрастают с течением времени. В зависимости от характера изменения и различаются три вида предсказания:

— предсказание с фиксированным интервалом: и - фиксировано;

— предсказание с фиксированной точкой: фиксировано и ;

— предсказание с фиксированным упреждением и , где — фиксированное время упреждения.

Алгоритм (8.69) применим для всех этих типов предсказания, хотя процедура вычислений все же должна быть незначительно видоизменена.

Наиболее простым случаем является предсказание с фиксированным интервалом. Здесь требуется оценить текущее состояние по данным фиксированного множества наблюдений в прошлом, т. е. при фиксированном . Практическим примером служит оценивание орбитальных параметров космического корабля в предположении того, что данные телеметрии и визуального наблюдения известны до некоторого определенного момента времени в прошлом. Уравнение (8.69) для предсказания с фиксированным интервалом принимает вид

(8.70)

где фиксировано. Оценка получается с помощью алгоритма фильтрации. Поэтому единственное, что требуется определить в ходе вычислений, — это вычислить элементы переходной матрицы состояния путем решения матричного дифференциального уравнения

(8.71)

с начальным условием .

В задаче предсказания с фиксированной точкой требуется оценить состояние в фиксированный момент времени в будущем как функцию текущего момента времени. Например, в начальных стадиях запуска искусственного спутника Земли желательно предсказать состояние в момент выхода на орбиту (в момент выключения маршевых двигателей) как функцию текущего времени. В этом случае ур-ние (8 69) принимает вид

. (8.72)

Так как в данной задаче второй аргумент переходной матрицы состояния является переменной величиной, то можно использовать ур-ние (8.65) и записать

. (8.73)

Используя граничное условие , следует решить ур-ние (8.73) в направлении прошлого. Можно или запомнить решение ур-ния (8.73) и обращаться к нему по мере необходимости или получить начальное условие ( — время начала наблюдения) путем обратного прохода в начальное состояние, а затем интегрировать уравнение в прямом направлении для нахождения искомой матрицы .

Предсказание с фиксированным упреждением является, очевидно, тем случаем, который обычно и описывается как собственно предсказание. В этой задаче требуется предсказать состояние на время вперед относительно текущего момента времени . При этом уравнение оценивания принимает вид

(8.74)

Так как оба аргумента переходной матрицы состояния являются в данном случае функциями текущего времени, то ни одно из стандартных ур-ний (8.63), (8.65) не описывает полностью эволюцию . Для получения необходимого уравнения определим производную по времени , как

(8.75)

Необычная форма записи этого уравнения выбрана для того, чтобы подчеркнуть истинную переменную для операции дифференцирования. После подстановки выражений (8.63) и (8.65) для соответствующих производных получаем уравнение , которое после ряда преобразований имеет вид

(8.76)

Необходимое граничное условие может быть получено путем решения ур-ния (8.63) в направлении от к . Предсказанная оценка состояния может оказаться очень неточной, если интервал предсказания и (или) коэффициент дисперсии шума объекта не являются достаточно малыми, а модели сообщения и наблюдения построены недостаточно точно. Для того чтобы быть уверенным в правильности полученных результатов при необходимости использования предсказанных оценок, крайне важно контролировать дисперсию ошибки предсказания. Даже если алгоритм гарантирует получение несмещенной оценки и, следовательно, математическое ожидание оценки совпадает с истинным состоянием, дисперсия может быть значительной. Уравнение для дисперсии ошибки может быть получено следующим образом.

Ошибка предсказания записывается в виде

(8.77)

Используя ур-ния (8.62) и (8.69), находим

для (8.78)

так что дисперсия ошибки равна

(8.79)

При выводе ур-ния (8.79) использовалось то обстоятельство, что и некоррелированны при , Выполняя интегрирование по переменной в ур-нии (8.79), получаем

(8.80)

Так как подынтегральное выражение в ур-нии (8.80) является неотрицательно определенным, дисперсия может в общем случае безгранично растн по мере увеличения разности между и . Кроме того, если система неустойчива, первое слагаемое в правой части ур-ния (8.80) также будет увеличиваться по мере увеличения .

Пример 8.1. Рассмотрим три приведенных выше вида предсказания для моделей сообщения и наблюдения:

которые имеют переходную матрицу состояния

Тогда алгоритм предсказания записывается в виде

или же как система уравнений

Алгоритм предсказания с фиксированным интервалом записывается в виде

Алгоритм предсказания с фиксированной точкой имеет вид

Наконец, алгоритм с фиксированным упреждением записывается как

При постоянной алгоритм вычисления дисперсии ошибки предсказания согласно ур-нию (8.80) принимает вид

Как и следовало ожидать, дисперсия ошибки предсказания с фиксированным интервалом неограниченно возрастает, так как фиксировано, a неограниченно возрастает. Дисперсия ошибки в случае предсказания с фиксированным упреждением зависит от величины времени прогнозирования . Дисперсия ошибки предсказания с фиксированной точкой равна дисперсии ошибки фильтрации, так как фиксировано, , a в конечном счете равно .

Сглаживание. В задаче сглаживания необходимо получить оценку состояния при заданном наблюдении , где . Иными словами, оценивается состояние в момент времени, который предшествовал текущему моменту времени в последовательности наблюдений. Так же, как и в случае предсказания, задача сглаживания может быть разделена на три вида:

— сглаживание с фиксированным интервалом: интервал наблюдения фиксирован, так что — постоянная величина, a изменяется от до ;

— сглаживание с фиксированной точкой: фиксирован момент времени когда должна быть получена оценка, и — текущее время;

— сглаживание с фиксированной задержкой: в этом случае ни , ни не фиксируются, но их разность остается постоянной. В этом случае и , где — постоянное время задержки.

К сожалению, в отличие от задачи предсказания, три вида сглаживания требуют для своего осуществления трех различных алгоритмов, хотя, как будет показано ниже, некоторые алгоритмы следуют непосредственно из других. Брайсон и Фрэзер опубликовали одну из первых работ по последовательным алгоритмам сглаживания [33]. Они показали, что сглаживание (так же, как и фильтрация) может рассматриваться как задача оптимизации и решаться с использованием обычных методов вариационного исчисления.

Аналогичные алгоритмы сглаживания, а также некоторые их обобщения были предложены в работах [192], [195], в которых были получены алгоритмы для дискретного времени с помощью оценивания по максимуму апостериорной вероятности и алгоритмы для непрерывного времени путем использования предельного перехода (см. § 7.3).

Медич, опубликовавший ряд фундаментальных статей по сглаживанию [151]—[156], первый четко определил три вида задач сглаживания. Он распространил предельный переход, примененный в работе [195], на сглаживание с фиксированной точкой и сглаживание с фиксированной задержкой, а также дал для непрерывного случая непосредственный вывод уравнения сглаживания с фиксированной точкой из уравнения Винера — Хопфа. При выводе алгоритмов дискретного сглаживания Медичем был развит 1уетод ортогонального проецирования, впервые использованный Калманом [109].

В недавних работах [70], [158] обсуждалась новая форма алгоритмов сглаживания, которые используют комбинацию двух оценок, полученных при фильтрации с помощью прямого и обратного фильтров Калмана. Как было указано выше, Мера и Брайсон [160] и Брайсон и Хенриксон [34] распространили алгоритмы сглаживания на случай небелого шума соответственно для непрерывных и дискретных процессов. Один из подходов к задаче сглаживания и фильтрации, предложенный Кайлатцом [101] и Кайлатцом и Фростом [103, 104], основан на теории «обновляющих» процессов. Этот подход позволяет существенно упростить вывод алгоритмов фильтрации и сглаживания и будет использован в настоящем разделе при выводе алгоритмов сглаживания для случая непрерывного времени. В первую очередь будет рассмотрен случай непрерывного времени, а затем будут получены алгоритмы для дискретного времени.

Подход, основанный на теории «обновляющих» процессов и впервые использованный Волдом и Колмогоровым в задаче линейного оценивания по критерию наименьших квадратов, заключается в «обелении» последовательности наблюдений и переходе к более простой задаче для белого шума. Боде и Шеннон [29] успешно применили этот подход к выводу уравнения классического стационарного фильтра Винера. Другим преимуществом такого подхода являются более общая постановка задачи оценивания и его возможное применение к некоторым нелинейным задачам. Для простоты изложения ограничимся рассмотрением линейных систем с сосредоточенными параметрами; интересующиеся могут познакомиться с другими применениями этого подхода в статьях [101], [103], [104].

Основной задачей при использовании подхода, основанного на теории «обновляющих» процессов, является получение при помощи физически реализуемой и обратимой линейной операции из наблюдаемого процесса процесса типа белого шума, который называется обновляющим и обозначается как . В общей постановке задачи определение подходящего преобразования может оказаться настолько сложным, что лишит возможности использовать данный подход. Однако для линейных систем с сосредоточенными параметрами нетрудно показать, что для некоррелированных процессов и с нулевыми средними процесс

(8.81)

является белым шумом. Так как может быть получено из как

(8.82)

то очевидно, и связаны физически реализуемым, обратимым линейным преобразованием, и поэтому является «обновляющим» процессом. Иными словами, оценка, основанная на , может быть выражена также через , так что и «эквивалентны» в том смысле, что они содержат одинаковую статистическую информацию. Таким образом, если необходимо, алгоритм фильтрации может быть выражен через , а не через . Такой алгоритм может оказаться значительно проще, чем вывод при непосредственном использовании наблюдения .

Как указывалось в § 7.2 и 7.3, «обновляющий» процесс можно рассматривать как новую информацию, содержащуюся в наблюдении . Кроме того, можно показать, что

. (8.83)

Интересным и очень полезным дополнительным свойством является то, что он является нормальным процессом, если — нормальный процесс. Таким образом, можно рассматривать и как две различные формы представления одного и того же случайного процесса [103].

Как отмечалось (см. § 6.6), ошибка оценивания и последовательность наблюдений ортогональны при . Так как и эквивалентны, то очевидно, что и при также должны быть ортогональны. Запишем оценку в виде линейной функции от :

(8.84)

Так как

(8.85)

то из ур-ния (8.84) следует уравнение Винера—Хопфа

так что

(8.86)

Это обычная форма записи уравнения Винера—Хопфа. Однако вследствие того, что «обновляющий» процесс является белым шумом [см. (8.83)],

(8.87)

Благодаря фильтрующему свойству дельта-функции это уравнение преобразуется в

(8.88)

Следовательно, интегральное уравнение Винера—Хопфа для превращается в простое алгебраическое выражение, из которого

(8.89)

Поэтому

(8.90)

Этот результат имеет принципиально важное значение и представляет собой решение задач сглаживания , фильтрации и предсказания . Остается только определить .

Хотя основным предметом нашего рассмотрения является не фильтрация, а сглаживание, оказывается, что решение задачи фильтрации играет большую роль при выводе алгоритмов сглаживания. Поэтому необходимо кратко остановиться на решении задачи фильтрации в терминах «обновляющего» процесса, прежде чем перейти к выводу алгоритмов сглаживания.

Для задачи фильтрации из ур-ния (8.90) при следует

(8.91)

Если продифференцировать обе части ур-ния (8.91) по , то получим

(8.92)

Используя уравнение модели сообщения, можно записать

но и при некоррелированны, так что

(8.93)

Поэтому ур-ние (8.92) принимает вид

(8.94)

Интеграл просто равен , поэтому получаем

(8.95)

Далее . Так как и ортогональны, то . Но зависит только от и , причем каждая из этих величин независима от Поэтому

(8.96)

Подставляя этот результат в ур-ние (8.95), получим

или

(8.97)

Это уравнение может быть приведено к стандартной форме, если использовать соотношение

(8.98)

Теперь обратимся к алгоритму сглаживания. Уравнение (8.90) может быть записано в виде

Так как первый интеграл в этом выражении равен

(8.99)

Аналогично можно показать, что

(8.100)

Ковариационная матрица может быть записана в виде

(8.101)

где переходная матрица состояния [см. (7.88)]

(8.102)

Иными словами, удовлетворяет дифференциальному уравнению

(8.103)

с . Уравнение (8.101) может быть легко получено, если записать в виде

(8.104)

Так как и независимы для , ур-ние (8.104) упрощается и получаем

(8.105)

Если подставить ур-ния (8.101) и (8.100) в (8.99), то для получаем

(8.106)

или

, (8.107)

где

. (8.108)

Оценка состояния как результат сглаживания при заданном состоит из оценки, полученной в результате фильтрации , и сигнала коррекции, который зависит от информации, полученной на временном интервале .

Дисперсия оценки, как результат сглаживания, может быть найдена из ур-ния (8.106) как функция дисперсии оценки, полученной в результате фильтрации .

В соответствии с определением ошибки имеем

(8.109)

Поэтому дисперсия ошибки сглаживания

(8.110)

Ковариация и записывается в виде , но так как и при некоррелированны, то . Если теперь подставить выражение для из ур-ния (8.105), то получим

(8.111)

При подстановке (8.111) в ур-ние (8.110) после очевидных алгебраических преобразований имеем

(8.112)

Это очень интересный результат, так как из него ясно видно, насколько уменьшается дисперсия ошибки оценки состояния , полученной в результате фильтрации, за счет сглаживания данных, которые поступят в будущем.

Рассмотрим каждый из трех видов сглаживания отдельно. В первую очередь рассмотрим сглаживание с фиксированным интервалом, для которого и , где — постоянная величина. При этом ур-ния (8.107) и (8.108) принимают вид

(8.113)

(8.114)

Если продифференцировать последнее выражение по текущему времени , то получим

(8.115)

Так как удовлетворяет ур-нию (8.103), частная производная по

(8.116)

Используя этот результат и то, что запишем (8.115) в виде

Интеграл в правой части уравнения равен , поэтому

(8.117)

Теперь вернемся к началу и продифференцируем ур-ние (8.113) по :

(8.118)

В результате подстановки ур-ний (7.82) и (7.85) для и , а также (8.117) для и выполнения ряда алгебраических преобразований получаем

(8.119)

Выражение для может быть получено из (8.113):

(8.120)

так что ур-ние (8.119) принимает вид

. (8.121)

Для компактной записи этого выражения введем матрицу коэффициентов усиления при сглаживании

(8.122)

и запишем ур-ние (8.121) в виде

(8.123)

Форма записи ур-ния (8.123) очень сходна с формой записи уравнения исходного фильтра Калмана, за исключением того, что ошибка здесь представляет собой разность между оценкой как результатом сглаживания и оценкой как результатом фильтрации, а не между действительным и ожидаемым наблюдениями.

Начальное условие для ур-ния (8.123) определяется при как и получается при применении алгоритма фильтрации. Уравнение сглаживания с фиксированным интервалом (8.123) решается по времени в обратном направлении до момента . Полная процедура вычислений для получения решения задачи сглаживания включает в себя применение алгоритма фильтрации в прямом по времени направлении с и до с последующим интегрированием ур-ния (8.123) в обратном направлении, начиная с . Так как оценка как результат фильтрации используется в

ур-нии (8.123), то должна храниться в памяти в течение всего времени фильтрации. Алгоритм сглаживания с фиксированным интервалом является процедурой, выполняемой не в реальном масштабе времени, так как обратный ход должен производиться после получения решения задачи фильтрации, которая выполняется в реальном масштабе времени.

Используя обычные определения и обозначения, запишем ошибку сглаживания в виде

, (8.124)

так что . После подстановки модели сообщения и ур-ния (8.123) в последнее выражение получаем

или

(8.125)

Следует обратить внимание на сходство полученного выражения с ур-нием сглаживания (8.123). Данное выражение может быть получено из (8.109), если воспользоваться теми же рассуждениями, что и при выводе алгоритма сглаживания (8.123). Уравнение (8.125) решается в обратном направлении по времени при начальном условии .

Дисперсия ошибки сглаживания с фиксированным интервалом может быть получена из ур-ния (8.112) при и в виде

(8.126)

В такой форме это выражение неудобно с той точки зрения, что сначала необходимо вычислить , а затем выполнить интегрирование. Для получения более удобного с вычислительной точки зрения решения возьмем частную производную по от обеих частей ур-ния (8.126). В результате получим

(8.127)

Используя ур-ния (7.85) и (8.116), после несложных алгебраических преобразований получим

(8.128)

Это уравнение также решается в обратном направлении по времени с граничным условием , которое получается из решения задачи фильтрации. Полный алгоритм сглаживания с фиксированным интервалом для непрерывного времени приведен в табл. 8.3

Таблица 8.3.Непрерывные алгоритмы сглаживания с фиксированным интервалом

Алгоритмы сглаживания с фиксированным интервалом

(8.123)

(8.122)

Вычисление дисперсии ошибки сглажнвання с фиксированным интервалом

(8.128)

Начальные условия

Примечание. Предварительно должны быть выполнены вычисления согласно алгоритмам фильтрации, приведенным в табл. 7.4.

При сглаживании с фиксированной точкой фиксируется момент времени, в который необходимо получить оценку, а далее увеличивается время наблюдения. Следовательно, в ур-нии (8.106) константа и , поэтому получаем

(8.129)

Если взять производные по от обеих частей ур-ния (8.129), то получаем

(8.130)

Используя (8.105), этот результат можно записать в виде

(8.131)

Начальное условие получается из алгоритма фильтрации.

Желательно выразить как решение дифференциального уравнения с тем, чтобы избежать . Конечно, для нахождения можно было бы просто решить ур-ние (8.116). Однако если продифференцировать уравнение (8.105), то получим

или

(8.132)

Решая ур-ние (8.132) с граничным условием , которое получается из алгоритма фильтрации, получаем . Итак, алгоритм сглаживания с фиксированной точкой полностью определен.

Следует заметить что для получения фильтрация должна выполняться одновременно со сглаживанием. Если момент начала наблюдений меньше , то можно использовать предсказание с фиксированной точкой при затем, когда станет больше перейти к сглаживанию.

Дифференцируя выражение , получаем уравнение ошибки для сглаживания с фиксированной точкой

Так как то

(8.133)

Уравнение дисперсии ошибки для сглаживания с фиксированной точкой легко получается из (8.112):

(8.134)

Вычисляя производные по , получаем . Используя ур-ние (8 105), находим

(8.135)

с начальным условие . Правая часть ур-ния (8.135) отрицательна и, следовательно, монотонно убывает. Сводка уравнений алгоритма сглаживания для непрерывных процессов с фиксированной точкой приведена в табл. 8.4.

Таблица 8.4. Непрерывные алгоритмы сглаживания с фиксированной точкой

Алгоритм сглаживания с фиксированной точкой

(8.131)

Вычисление второго момента

(8.132)

Вычисление дисперсии ошибки сглаживания

(8.135)

Начальные условия

Примечание. Для получения решения задачи сглаживания с фиксированной точкой необходимо предварительно выполнить вычисления согласно алгоритмам фильтрации, приведенным в табл. 7.4.

Медич [157] предложил непрерывный алгоритм сглаживания с фиксированной точкой несколько в ином виде:

(8.136)

где — коэффициент усиления обычного фильтра Калмана и , причем . Доказательство эквивалентности этих двух алгоритмов предлагается читателю в качестве самостоятельного упражнения.

Непрерывный алгоритм сглаживания с фиксированной задержкой был получен Медичем из дискретного алгоритма Рауха [192] путем довольно сложного предельного перехода.

Для сглаживания с фиксированной задержкой ( где — положительная константа) вывод алгоритма сходен с выводом алгоритма сглаживания с фиксированным интервалом.

Сначала запишем ур-ние (8.107), которое в этом случае принимает вид

(8.137)

и ур-ние (8.108)

(8.138)

Так же, как и при выводе ур-ния (8.117), вычисляем производную в виде

(8.139)

Это уравнение имеет такой же вид, что и (8.117), за исключением первого члена, который обусловлен наличием переменной в верхнем пределе интегрирования.

Вычисляя, как и в предыдущем случае, производную от (8.137), получим

Подставляя в это выражение ур-ние (7.102) и (7.105) для и ,а также (8.139) для , после некоторых алгебраических преобразований получаем

(8.140)

Из ур-ния (8.137) следует, что выражается следующим образом: , так что (8.140) принимает вид

(8.141)

Граничное условие получается из алгоритма сглаживания с фиксированной точкой от до .

Чтобы завершить вывод данного алгоритма, обратим внимание на то, что дифференциальное уравнение

(8.142)

получается тем же способом, который использовался при выводе уравнения предсказания с фиксированным упреждением (3.76). Граничное условие , необходимое для решения ур-ния (8.142), получается при решении ур-ния (8.103) в прямом направлении от до .Можно было бы также заметить, что и вывести уравнение для точно так же, как это было сделано в случае сглаживания с фиксированной точкой.

Уравнение ошибки сглаживания с фиксированной задержкой определяется путем дифференцирования выражения . В результате получаем . После подстановки уравнения модели сообщения и (8.141) имеем

(8.143)

Начальное условие получается из ур-ния (8.133) ошибки для сглаживания с фиксированной точкой.

Дисперсия ошибки сглаживания с фиксированной задержкой, как и в предыдущем случае, получается из ур-ния (8.112). После несложных алгебраических преобразований получаем

(8.144)

Здесь граничное условие , как и раньше, получается согласно алгоритму сглаживания с фиксированной точкой. Уравнения непрерывного алгоритма сглаживания с фиксированной задержкой сведены в табл. 8.5.

Таблица 8.5. Непрерывные алгоритмы сглаживания с фиксированной задержкой

Алгоритм сглаживания с фиксированной задержкой

(8.141)

Вычисление переходной матрицы ошибок

(8.142)

Вычисление дисперсии ошибки сглаживания

(8.144)

Начальные условия

- получается из ур-иия (8.103);

- получаются из решения задачи сглаживания с фиксированной точкой

Подход, основанный на теории «обновляющих» процессов, может быть также использован для вывода алгоритмов сглаживания для дискретных процессов. В дискретном случае «обновляющий» процесс хотя и является белым шумом, но уже не имеет ту же самую дисперсию, что и . Поэтому получать необходимые результаты несколько сложнее.

Для того чтобы подчеркнуть многообразие подходов, которые могут использоваться при решении задач оценивания, при выводе дискретных алгоритмов сглаживания используем подход, основанный на критерии максимальной апостериорной вероятности. Как уже было отмечено ранее, такой подход первоначально был предложен в работе [195].

Модели сообщения и наблюдения записываются, как обычно, в виде

(8.145)

(8.146)

где и — нормальные белые шумы с нулевыми средними и с . Дополнительно предполагается, что начальное условие имеет нормальный закон распределения со средним и дисперсией . Поэтому все плотности вероятности, рассматриваемые при решении этой задачи, нормальные, полностью определяемые средними и дисперсиями.

В качестве оценки состояния по методу максимальной апостериорной вероятности при заданном множестве наблюдений принимается значение , которое максимизирует условную плотность вероятности . Аналогичным образом определяются и как величины, одновременно удовлетворяющие двум уравнениям:

(8.147)

(8.148)

Как будет показано ниже, необходимо, чтобы удовлетворялось только ур-ние (8.147).

Согласно формуле Байеса условная плотность вероятности может быть записана в виде

Воспользовавшись теоремой умножения, получим

или

Еще раз применяя теорему умножения, находим

Если известно ,то множество наблюдений не содержит новой информации, следовательно, аргумент, фиксирующий условие в первом множителе числителя, может быть просто заменен на .Поэтому

Еще раз применим теорему умножения, и исключая аргумент , получим

(8.149)

Уравнение (8.149) представляет собой удобную форму записи условной вероятности, так как только две плотности вероятности в данном выражении включают в себя , а именно, и , а эти плотности могут быть легко найдены. Так как оба распределения нормальные, то требуется найти только соответствующие средние и дисперсии.

Для распределения находим:

Поэтому

(8.150)

где предполагается, что существует.

Для плотности оказывается, что среднее представляет собой оценку, полученную в результате фильтрации , а дисперсия равна дисперсии ошибки фильтрации . Обе эти величины могут быть получены в результате фильтрации. Функция плотности вероятности записывается в виде

, (8.151)

где — нормирующая константа.

Если подставить ур-ния (8.150) и (8.151) в (8.149), то получим

(8.152)

Чтобы упростить это выражение, прологарифмируем обе его части. В результате получим

(8.153)

Следовательно, оценки, как результат сглаживания, должны удовлетворять уравнению

(8.154)

Если решить это уравнение относительно , то получим

Используя лемму об обращении матрицы и выполняя некоторые алгебраические преобразования, получаем

, (8.155)

где коэффициент усиления

Используя соотношение для априорной дисперсии

выражение для можно переписать в виде

. (8.156)

Выражение (8.155) представляет собой уравнение для в конечных разностях с обращенным временем при данных и . Здесь значение получается в результате предварительных вычислений согласно алгоритму фильтрации, а получается из (8.156) с использованием граничного условия для конечного момента времени , которое также получается из алгоритма фильтрации. Поэтому для того,

чтобы получить , необходимо решить ур-ние (8.148).

Так как используется в ур-нии (8.155), то решение задачи фильтрации предварительно должно быть получено и сохранено в памяти для использования при сглаживании. Возможно также получение алгоритма в такой форме, когда запоминаются данные наблюдений, а не оценка, полученная в процессе фильтрации [195]. Так как решение задачи фильтрации необходимо для получения граничных условий ур-ния (8.155), то ни один из этих алгоритмов не обладает существенным преимуществом с точки зрения простоты вычислений.

Уравнение в конечных разностях для ошибки сглаживания получается непосредственно из . Оно имеет следующий вид:

(8.157)

с начальным условием при , которое получается из решения задачи фильтрации.

Уравнение для дисперсии ошибки сглаживания с фиксированным интервалом может быть получено, если вычесть из обеих частей ур-ния (8.155)

(8.158)

Если определить ковариации обеих частей ур-ния (8.158), учитывая, что

то получается рекуррентное уравнение для :

(8.159)

Это уравнение также решается в обратном направлении по времени с граничным условием .

Вычисление дисперсии ошибки сглаживания с фиксированным интервалом также требует знания дисперсии ошибки фильтрации. Так как ур-ние (8.159) требуется решить в обратном направлении по времени, то обычно необходимо предварительно вычислить и запомнить дисперсии и . Однако можно показать (см. задачу 8.14), что дисперсии ошибок фильтрации могут быть вычислены в обратном направлении по времени с помощью уравнений:

(8.160)

Эти два уравнения должны использоваться с большой осторожностью, так как они являются матричными уравнениями и обычно нестабильны. Сводка уравнений дискретного алгоритма сглаживания с фиксированным интервалом приведена в табл. 8.6.

Таблица 8.6. Дискретный алгоритм сглаживания с фиксированным интервалом

Алгоритм сглаживания с фиксированным интервалом

(8.155)

(8.156)

Вычисление дисперсии ошибки сглаживания

(8.159)

Начальные условия

; .

Вывод алгоритма сглаживания с фиксированной точкой начнем с алгоритма сглаживания с фиксированным интервалом, описываемого ур-нием (8.155). Но теперь конечный момент времени является переменным, поэтому алгоритм следует записать в виде

Если заменить на и затем вычесть полученный результат из приведенного выше выражения, то получим

(8.161)

Можно получить алгоритм сглаживания с фиксированной точкой, полагая (где — константа),

(8.162)

Если теперь в ур-нии (8.161) считать и подставить полученный результат в (8.162), то получим

(8.163)

Продержан увеличивать в ур-нии (8.161) и подставляя результаты в сравнение сглаживания до тех пор, пока не станет равным , получим в итоге

Этот результат может быть записан в виде

(8.164)

где

(8.165)

и . Уравнения (8.164) и (8.165) представляют собой рекуррентный алгоритм сглаживания с фиксированной точкой.

Так как , то ур-ние (8.164) можно записать в виде

(8.166)

Используя простые преобразования матриц получим

(8.167)

где удовлетворяет рекуррентному соотношению

(8.168)

Преимуществом такой формы записи является то, что теперь не надо вычислять матрицу, обратную , хотя и необходимо знать . Следует учитывать, что в большинстве случаев размерность больше, чем , и это приводит к значительному сокращению вычислительных операций.

Начальное условие для ур-ния (8.164) получается из решения задачи фильтрации. Уравнение ошибки сглаживания с фиксированной точкой получается непосредственно из . Если подставить ур-ние (8.164) в это выражение, то получаем

Для вычисления дисперсии ошибки применяется тот же ход рассуждений, что и для случая сглаживания с фиксированным интервалом, что приводит к выражению

(8.169)

Сводка уравнений алгоритма сглаживания с фиксированной точкой для дискретных процессов приведена в табл. 8.7.

Таблица 8.7. Дискретный алгоритм сглаживания с фиксированной задержкой

Алгоритм сглаживания

(8.164)

Вычисление коэффициентов усиления при сглаживании

(8.165)

(8.156)

Вычисление дисперсии ошибки сглаживания

(8.169)

Начальные условия

Альтернативный вариант алгоритма сглаживания

(8.167)

Вычисление коэффициента усиления при альтернативном варианте сглаживания

(8.168)

Алгоритм сглаживания с фиксированной задержкой для дискретных процессов получается в виде комбинации алгоритмов с фиксированным интервалом и фиксированной точкой. Начнем с решения ур-ния (8.155) для сглаживания с фиксированным интервалом Добавим и вычтем в правой части этого уравнения. Тогда

(8.170)

Заменяя на где — время фиксированной задержки, получаем

(8.171)

Перепишем алгоритм сглаживания с фиксированной точкой, определяемый ур-нием (8.166) при и . В результате получаем

(8.172)

Подставляя теперь ур-ние (8.171) и (8.172) для того, чтобы заменить , получаем

(8.173)

Можно упростить выражение (8.173), учитывая, что

Если подставить это выражение в ур-ние (8.173), то получим

(8.174)

Для завершения вывода алгоритма необходимо получить рекуррентное соотношение для . Его легко вывести из ур-ния (8.165):

(8.175)

Начальные условия для и получаются из алгоритма сглаживания с фиксированной точкой.

Алгоритм вычисления ошибки сглаживания получается непосредственно из определения ошибки для сглаживания с фиксированной точкой и алгоритма сглаживания, описываемого ур-нием (8 174), как

(8.176)

Можно показать, что дисперсия ошибки сглаживания определяется уравнением

(8.177)

Начальное условие получается из алгоритма сглаживания с фиксированной точкой. Все уравнения алгоритма сглаживания с фиксированной задержкой приведены в табл. 8 8.

Таблица 8.8. Дискретный алгоритм сглаживания с фиксированной задержкой

Алгоритм сглаживания с фиксированной задержкой

(8.174)

. (8.175)

Вычисление дисперсии ошибки сглаживания

(8.177)

Начальные условия

- получаются из алгоритмов сглаживания с фиксированной точкой