9.5. Нелинейное сглаживаниеСглаживание в фиксированной точке. В тех случаях, когда требуется получать оценку только в конечном числе точек некоторого интервала наблюдения, для нахождения последовательного алгоритма сглаживания в заданной точке можно использовать метод инвариантного погружения с «фиксированным шагом» или с «фиксированным временем». Пусть имеется дискретная нелинейная задача второго порядка, определяемая уравнениями (9.78) и (9.79). Необходимо найти наилучшую оценку вектора состояний на некотором фиксированном шаге, скажем, шаге , где . В дальнейшем станет текущей переменной и поэтому целесообразно обозначить наилучшую оценку через |. Эту оценку определим так, что |, (9.136) где отражена зависимость оценки |от шага оценивания, от текущего времени и от значения добавочной переменной , которая на шаге определяется так, что . (9.137) Далее, разлагая (9.79) в ряд в окрестности точки, имеем . (9.138) Для того чтобы удовлетворяло (9.138), полагаем (9.139) Левая часть предыдущего уравнения может быть выражена в виде , (9.140) где и — первые частные производные. Подстановка (9.138) и (9.139) в (9.140) приводит к уравнению инвариантного погружения с фиксированным шагом: ; (9.141) где — решение этого уравнения. Решение на текущем шаге определяет оптимальную оценку |на шаге с использованием информации . Определив , (9.142) можно (воспользоваться уравнением инвариантного погружения для , полученным в § 9.3, которое удовлетворяет уравнению, аналогичному (9 83) Таким образом, необходимо, чтобы (9.144) Решение ур-ний (9 143) и (9 144) определяет начальные значения, которые должны быть получены к моменту . На шаге начальное условие (9.145) налагается ур-нием (9.141), а ур-ния (9.141) и (9.142) должны одновременно решаться на шаге . Нетрудно видеть, что представляет решение задачи фильтрации по критерию МАВ. При увеличении частоты дискретизации (9.141) и (9.145) переходят в уравнения инвариантного погружения в непрерывном времени. Легко показать, что при этом уравнение инвариантного погружения с фиксированным временем будет иметь вид , (9.146) где — решение задачи фильтрации, полученное из уравнения инвариантного погружения в текущем времени с граничным условием (9.147) причём . (9.148) Уравнения инвариантного погружения с фиксированным временем в непрерывном случае были получены также другим способом в работе [99]. Переходя к приближенным алгоритмам сглаживания в фиксированной точке, предположим, что решение ур-ний (9.141) и (9.142) можно представить в виде (9.149) (9.150) используя разложение в ряд Тейлора, получаем (9.151) (9.152) где (9.153) Эти соотношения представляют приближенные уравнения сглаживания в фиксированной точке. Для того чтобы их можно было использовать, необходимо одновременно решать приближенные уравнения фильтрации, приведенные в табл. 9.3. Пример 9.10. Рассмотрим линейное оценивание по методу наименьших квадратов для модели, определяемой следующими соотношениями: ; Для такой модели граничная задача второго порядка удовлетворяет ур-ниям (9.76) и (9.77): Используя алгоритм приближенного нелинейного сглаживания в точке, полученный выше, уравнения оценки в фиксированной точке можно записать в виде Последнее уравнение преобразуется следующим образом: Введя функцию , где можно алгоритм оценки в фиксированной точке записать в виде где Если и , то приведенные выше алгоритмы оценки идентичны алгоритмам для линейной модели оценивания, полученным в гл. 8. Таким образом, в линейном случае приближенные алгоритмы сглаживания переходят в точные алгоритмы сглаживания в фиксированной точке. В табл. 9.12 приведены алгоритмы для дискретного сглаживания в фиксированной точке. К ним необходимо присоединить алгоритмы фильтрации из табл. 9.3. До шага используются только алгоритмы фильтрации. Далее используются все вместе взятые алгоритмы. Заметим, что для решения задачи сглаживания не обязательно иметь уравнения для ковариационной матрицы ошибок, которые мы получим несколько позже. Отметим также, что путем преобразований уравнений для ковариационных матриц ошибок можно получить различные формы обращения матриц. Частным примером этого служит ур-ние (9.155). Таблица 9.12. Дискретные нелинейные алгоритмы сглаживания по критерию МАВ в фиксированной точке (модели сигнала и наблюдения и алгоритмы фильтрации те же, что и табл. 9.3)
Из дискретных уравнений инвариантного вложения можно получить несколько уравнений сглаживания в точке в непрерывном времени путем увеличения частоты дискретизации или использованием ур-ния (9.146) так, что ; (9.157) (9.158) где и ; (9.159) (9.160) причем (9.161) Для того чтобы получить непрерывные алгоритмы сглаживания в точке, мы используем определения и , которые следуют из граничной задачи второго порядка для сглаживания в непрерывном времени ; (9.162) ; (9.163) (9.164) (9.165) Если подставить эти соотношения в (9.156) и (9.161), то получим искомые уравнения. Из (9 160) и (9 161) следуют алгоритмы фильтрации в непрерывном времени (табл. 9.4), которые при решении задачи сглаживания должны быть присоединены к уравнениям табл. 9.13. Таблица 9.13. Непрерывные нелинейные алгоритмы сглаживания в точке по критерию МАВ (для решения к этим алгоритмам должны быть присоединены алгоритмы фильтрации из табл. 9.4)
Сглаживание на фиксированном интервале. При выводе уравнений фильтрации мы получили приближенное решение граничной задачи второго порядка, описываемое ур-ниями (9.76) и (9.77) только для фиксированного шага . Задача сглаживания на заданном интервале нами еще не решалась. При использовании наблюдений в заданном интервале дисперсия ошибки оценивания должна быть уменьшена или, по крайней мере, не увеличена при оценивании состояния на некотором шаге внутри интервала наблюдения. Это можно сделать, используя процедуру сглаживания в заданной точке, и получить набор последовательных алгоритмов оценки. Однако возможно и сглаживание только в одной точке (или более чем в одной, если фильтр используется для каждой точки ). Если обработка происходит не в реальном масштабе времени, то можно использовать процедуру сглаживания на заданном интервале. Ошибки при сглаживании в точке и на заданном интервале будут одинаковы, поскольку в каждый момент оценивания используется одно и то же количество наблюдаемой информации. Таким образом, если требуется сглаживание на интервале и имеется возможность обработки не в реальном времени, то для вычислений сглаживание на фиксированном интервале будет более предпочтительным. Рассмотрим граничную нелинейную задачу второго порядка в форме ур-ний (9.76) и (9.77) Если алгоритмы фильтрации используются для оценки вектора от начального шага до конечного шага , то оценка может быть получена обработкой по всей наблюдаемой выборке, заданной на интервале . В силу этого оценка фильтрации и оценка сглаживания на фиксированном интервале в точке одинаковы. При фиксированном шаге оценка фильтрации и дополнительный член составляют набор граничных условий на конечном шаге, превращая тем самым граничную задачу второго порядка в задачу на начальные значения, которая и дает в качестве своего решения сглаживание на фиксированном интервале. Для того чтобы избежать вопросов устойчивости, возникающих при решении канонических уравнений в обратном времени желательно применить линейное приближение для , которое связывает оценки сглаживания на фиксированном интервале с оценками последовательного сглаживания (фильтрации). В случае линейных систем это эквивалентно преобразованию Риккати для добавочной переменной. Из ур-ния (9.75) видно, что в этом случае , (9.169) где через и обозначены решения ур-ний (9.166) и (9.167), а и (что эквивалентно ) — оценка и соответствующая ковариационная матрица ошибок задачи фильтрации. Заметим, что (9.169) не является единственной аппроксимацией, которая может быть сделана, но именно это приближение переходит в точное решение в случае линейной модели оценивания. Используя указанное приближение, алгоритм сглаживания на заданном интервале можно записать в виде (9.170) Таким образом, до конечного шага используются алгоритмы фильтрации в прямом времени. Далее значения и используются для решения (9.170) в обратном времени в качестве начальных условий, что и приводит к оценкам сглаживания на фиксированном интервале. Алгоритмы в непрерывном времени можно получить либо предельным переходом, либо полагая, что . Имеем: ; (9.171) , (9.172) причем необходимо использовать данные табл. 9.4, чтобы получить алгоритмы фильтрации. Окончательные алгоритмы, которые получаются при использовании соотношений для и , даны в табл. 9.14 и 9.15. Таблица 9.14. Дискретные алгоритмы сглаживания на фиксированном интервале (предварительно должны быть использованы алгоритмы фильтрации из табл. 9.3)
Таблица 9.15. Непрерывные алгоритмы сглаживания на фиксированном интервале (предварительно должны быть использованы алгоритмы фильтрации из табл. 9.4)
Часто начальные условия для задачи сглаживания в дискретном времени вычислить затруднительно. Трудность состоит в том, что вычисляется по оценке . В свою очередь нелинейно входит в и поэтому, вообще говоря, на каждом шаге необходимо решать нелинейное алгебраическое (или матричное) уравнение. В некоторых частных случаях удобно выразить (9.173) приближенным уравнением. Когда нелинейность содержится только в наблюдаемой модели , ур-ние (9.173) может быть заменено на , (9.174) где определяется из (9.139) [см. табл. 9.14]. Конечно, это соотношение может быть использовано и для нелинейной модели сообщения со следующим приближением: . Сглаживание с фиксированной задержкой. Мы получили алгоритм сглаживания на заданном интервале в виде приближенного решения граничной задачи второго порядка, описываемой ур-ниями (9.76) и (9.77). С точки зрения вычислений этот алгоритм обладает двумя недостатками. Его необходимо реализовать не в реальном времени и, кроме того, нужно запомнить оценку фильтрации и ее ковариационную матрицу ошибок. Как альтернативный подход к решению задачи оценивания на фиксированном интервале можно рассмотреть сглаживание с фиксированной задержкой. При этом алгоритм реализуется в реальном масштабе времени и требования к памяти существенно меньше, чем при сглаживании на фиксированном интервале. При оценивании состояния на шаге используются наблюдения вплоть до шага, где и . Таким образом, вообще говоря, оценка состояния в заданном интервале будет хуже, чем оценка сглаживания на фиксированном интервале, но лучше оценок последовательной фильтрации из-за использования дополнительных наблюдений. Если алгоритмы оценки точные, то ковариационная матрица ошибок сглаживания с фиксированной задержкой будет лежать между матрицей ковариаций ошибок фильтрации и сглаживания на фиксированном интервале. Замена на и на в (9.151) и (9.152) приводит к следующим соотношениям: (9.179) (9.180) Заменяя в (9.170) на , находим . Подставляя это соотношение в (9.179), получаем приближенный алгоритм сглаживания с фиксированной задержкой: (9.181) Соотношение для дается ур-нием (9.180), а начальное условие задается оценкой , получаемой решением задачи сглаживания в фиксированной точке. Алгоритмы фильтрации и сглаживания в фиксированной точке используются от шага до шага , определяя тем самым начальное условие для рассматриваемого алгоритма сглаживания. Далее сглаживание с фиксированной задержкой и фильтрация происходят одновременно, что дает требуемую оценку вектора состояний. Поскольку вычисление требует вычисления , то эти вычисления разнесены на шагов. Уравнения сглаживания в непрерывном времени можно получить, если воспользоваться упомянутым выше предельным переходом (9.182) (9 183) Для того чтобы можно было находить рекуррентно, ур-ние (9.180) необходимо переписать с учетом соотношения , которое можно получить из (9.174) и (9.175) в случае сглаживания на фиксированном интервале. Здесь начальное условие задается оценкой , получаемой сглаживанием в фиксированной точке , а использующийся алгоритм фильтрации такой же, как и в табл. 9.4. Если в эти соотношения подставить соответствующие выражения для , то получим как дискретные, так и непрерывные алгоритмы сглаживания с фиксированной задержкой, которые сведены в табл. 9.16 и 9.17. Таблица 9.16. Дискретные алгоритмы сглаживания с фиксированной задержкой (к данным алгоритмам должны быть присоединены алгоритмы фильтрации из табл. 9.3 и алгоритмы сглаживания в фиксированной точке из табл. 9.2)
Таблица 9.17. Непрерывные алгоритмы сглаживания с фиксированным интервалом (к этим уравнениям должны быть присоединены уравнения фильтрации и сглаживания в точке из табл 9.4 ,и 9.18)
Приближенные выражения для ковариационных матриц ошибок. Часто необходимо оценить увеличение точности при применении различных алгоритмов «сглаживания в зависимости от времени, которое тратится «а решение при использовании алгоритмов фильтрации. Для одного класса нелинейных систем, рассматриваемых ниже, можно найти приближенные соотношения для ковариационных матриц ошибок. Эти соотношения переходят в точные в случае идентично определенных линейных систем. Как для дискретного, так и для непрерывного времени приближенные выражения для ковариационных матриц ошибок представлены в табл. 9.3 и 9.4. Выше было показано, что линеаризация граничной задачи второго порядка приводит к возможности использования расширенных уравнений для ковариационной матрицы ошибок для оценки ковариационной матрицы ошибок нелинейного сглаживания. Представленные ниже приближенные уравнения для вычисления ковариационной матрицы ошибок сглаживания используют этот результат. В случае сглаживания в фиксированной точке приближенный алгоритм определяется ур-нием (9.156) для в табл. 9.12. Аналогичные результаты представлены в табл 9.13-9.17 для других алгоритмов сглаживания. Приближенные алгоритмы нелинейного оценивания для случаев: фильтрации, сглаживания на интервале, в заданной точке с фиксированной задержкой и одношагового предсказания были получены на основе байесовской теории оценок, а выбранная функция риска соответствовала критерию максимума апостериорной вероятности. Был использован дискретный принцип максимума и получена граничная нелинейная задача второго порядка, которая была решена методом инвариантного погружения в «текущем и фиксированном времени», что позволило определить соответствующие уравнения фильтрации и сглаживания. Был получен также алгоритм одношагового предсказания. Линеаризацией нелинейной граничной задачи второго порядка были представлены соответствующие алгоритмы для ковариационных матриц ошибок. Полученные уравнения оценивания являются приближенными, но они важны в том смысле, что для аналогично определенной линейной модели они переходят в найденные ранее алгоритмы для линейной системы с линейной моделью наблюдений. В некоторых случаях члены высших порядков, отсутствующие в линейных уравнениях, часто улучшают качество оценивания вектора состояний системы. Пример 9.11. Продолжим исследование задачи 9.10. Все предположения и модель сообщения остаются неизменными. Алгоритмы сглаживания в точке: ; ; ; ; . Алгоритм сглаживания на фиксированном интервале ; где , , , Алгоритм сглаживания с фиксированной задержкой принимает вид ; где определены выше. Алгоритмы одношагового предсказания даются соотношениями: , . Неявно мы использовали алгоритмы одношагового предсказания для нахождения алгоритмов фильтрации Кроме того, использовалось выражение для , полученное из (9.185). Рис. 9.14. Приближенная дисперсия ошибки сглаживания в фиксированной точке на шаге Рис 9.15. Дисперсии ошибок сглаживания с фиксированной задержкой и фильтрации Рисунок 9.14 иллюстрирует поведение дисперсии ошибки сглаживания в точке на 1001-м шаге для . Начальные условия для дисперсий ошибок на этом шаге одинаковы. При наличии дополнительных наблюдений дисперсия ошибки сглаживания уменьшается в точке . На рис 9.15 представлены графики дисперсий ошибок для . Для сравнения на этом же рисунке приведена дисперсия ошибки фильтрации.
|