7.3. Оптимальный линейный непрерывный фильтрВ этом параграфе алгоритм фильтрации Калмана дискретных процессов обобщается применительно к обработке непрерывных процессов. Основные результаты получены с помощью трех различных, но взаимно дополняющих друг друга методов. Сначала рассматривается предельный случай дискретной задачи, когда интервал между выборками стремится к нулю. Во втором случае для минимизации дисперсии ошибки оценивания непосредственно используется матричный принцип минимума. В третьем случае показывается, как интегральное уравнение Винера—Хопфа может быть преобразовано в дифференциальное уравнение фильтра Калмана в рекуррентной форме. Модель сообщения записывается в форме векторного дифференциального уравнения первого порядка (7.82) где — белый шум с нулевым средним ,и дисперсией (7.83) Известны также начальные среднее значение и дисперсия состояния : (7.84) Предположим также, что для всех . Модель наблюдений аналогична модели, используемой при решении дискретной задачи, т. е. (7.85) Однако здесь измерения выполняются непрерывно. Шум измерений также предполагается белым с нулевым средним и ковариацией . (7.86) Предполагается, что шум измерений и входной шум не коррелированы, так что (7.87) Найдем линейный последовательный алгоритм оценивания состояния с минимальной дисперсией ошибки при заданных на интервале измерениях , т. е. . Предельный случай. Один из первых выводов алгоритма фильтрации Калмана для непрерывных процессов был основан на предельном переходе от алгоритма, полученного для дискретных процессов, при уменьшении интервала дискретизации. Рассмотрим следующую дискретную модель сообщения (7.88) где — дискретный белый шум с нулевым средним значением и дисперсией (7.89) При получаем: . (7.90) . (7.91) В справедливости этих выражений легко убедиться, если учесть, что и . Используя приведенные выражения, можно показать, что дискретная модель сообщения переходит в непрерывную, задаваемую ур-нием (7.82), при : . Модель наблюдений для дискретного случая при переходе к пределу также совпадает с непрерывной моделью наблюдений, задаваемой ур-нием (7.85). Диоперсия шума измерений . (7.92) Уравнения (7.85), (7.88), (7.89) и (7.92) полностью определяют дискретный аналог сформулированной непрерывной задачи оценивания. Если дискретный фильтр Калмана, уравнения которого приведены в табл. 7.2, применить для решения представленной выше дискретной задачи фильтрации, то получим , (7.93) где коэффициент усиления . (7.94) Уравнение для априорной дисперсии (7.34) имеет вид , (7.95) а уравнение для апостериорной дисперсии (7.33) теперь записывается как . (7.96) Здесь для простоты введено обозначение . Для того чтобы получить алгоритм фильтрации для 'непрерывного случая, перепишем (7.94) в виде . (7.97) где множитель просто вынесен из-под знака обратной операции. Это выражение может быть записано в компактной форме . (7.98) где . (7.99) Здесь использован индекс для того, чтобы подчеркнуть, что рассматривается интервал между выборками. Если теперь перейти к пределу при , то получим . (7.100) Заметим, что априорная дисперсия ошибки стремится к , т. е. к фактической дисперсии, когда . Этот результат можно доказать, если воспользоваться другой формой записи уравнения для коэффициента усиления (7.55), из которого получаем . Если подставить ур-ние (7.98) в (7.93), то получим . (7.101) откуда следует После несложных алгебраических преобразований это выражение приводится к следующему: Предел может быть легко вычислен, если использовать ур-ния (7.90) и (7.100). В результате получаем (7.102) Следовательно, уравнение фильтрации есть дифференциальное уравнение (с начальным условием , решение которого может быть получено, если известен коэффициент усиления . Для того чтобы определить , необходимо найти выражение для дисперсии ошибки . Можно было бы ввести выражение для дисперсии ошибки непосредственно из ур-ний (7.82) и (7.102) точно таким же способом, как это было сделано в гл. 3 при рассмотрении непрерывного случая. Однако воспользуемся иным подходом и получим уравнение перехода для из результатов, справедливых для дискретного случая, путем вычисления предела. Мы не можем использовать отдельно как ур-ние (7.95), так и ур-ние (7.96) для отыскания выражения для дисперсии в непрерывном случае, поскольку, вычисляя предел в любом уравнении, получаем совершенно очевидный результат . Кроме того, невозможно составить выражение типа производной, используя лишь одно из этих уравнений, так как . (7.103) Поэтому для получения выражения, определяющего истинный закон изменения дисперсии во времени , необходимо использовать эти уравнения совместно. Подставляя (7.96) в (7.95), получим Если воспользоваться ур-ниями (7.90) и (7.98) и выполнить ряд несложных алгебраических преобразований, то получим (7.104) где . Из ур-ния (7.104) можно получить дифференциальное уравнение для дисперсии ошибки: Переходя к пределу в правой части этого выражения и используя ур-ние (7.100), получаем . (7.105) Уравнение (7.105) представляет собой искомый результат, из которого следует, что закон изменения дисперсии ошибки во времени описывается матричным уравнением Риккати. Заметим также, что в данное выражение входят только вторые моменты процессов и и не входят наблюдения . Следовательно, ур-ние (7.105) может быть решено предварительно до получения каких-либо результатов наблюдений, хотя это и не совсем обычный прием. Начальным значением для служит . Можно было бы также получить ур-ние (7.105), определив , как и затем использовать ур-ния (7.96), (7.98) и (7.100). Если известна, то может быть вычислен коэффициент усиления, а из ур-ния (7.102) может быть определена оценка состояния . Для удобства все результаты решения задачи фильтрации с помощью непрерывного фильтра Калмана сведены в табл. 7.4. Таблица 7.4 . Уравнение непрерывного фильтра Калмана
Структурные схемы модели сообщения и фильтра приведены на рис. 7.6. Следует отметить, что фильтр включает в себя, как составную часть, модель сообщения, на вход которой поступает Рис. 7.6. Структурные схемы непрерывного фильтра Калманна: а) модель сообщения; б) фильтр сигнал ошибки, пропорциональный разности между наблюдением и ожидаемым условным наблюдением при заданном , с коэффициентом веса, равным коэффициенту усиления . Следует запомнить, что на самом деле есть , a . Выражение определяет «обновляющий» процесс. Пример 7.3. В качестве иллюстрации применения непрерывного фильтра Калмана рассмотрим простую скалярную задачу. Пусть модель сообщения задается уравнением где и приняты равными нулю. Модель наблюдений определяется как , где — белый шум с нулевым средним и единичной дисперсией Начальное состояние имеет среднее значение, равное нулю, и дисперсию, равную 10. Если уравнения для моделей сообщения и наблюдений, а также значения параметров подставить в ур-ние (7.105) то получается следующий результат: . Решение этого уравнения имеет вид . Так как и равны единице, то коэффициент усиления просто совпадает с . Поэтому алгоритм оценивания состояния определяется следующим образом: , где начальное значение равно нулю. Перед тем как приступить к выводу алгоритма непрерывного фильтра Калмана путем непосредственного применения матричного принципа минимума, получим дифференциальное уравнение для . По определению, . Подставляя ур-ния (7.82) и (7.102) соответственно для и , получаем (7.106) Если использовать ур-ние (7.85), то получим два эквивалентных представления «обновляющего» процесса:
. (7.107) Используя последнее уравнение, получим дифференциальное уравнение , (7.108) которое аналогично ур-нию (7.36), полученному для дискретного случая. Уравнение для дисперсии ошибки теперь может быть легко получено одним из разобранных выше способов. Вывод уравнений фильтра методами вариационного исчисления. Существуют два подхода, опирающиеся на методы вариационного исчисления, которыми можно воспользоваться при решении задачи оценивания с минимальной дисперсией ошибки. Один из них состоит в использовании метода, аналогичного методу ортогонального проецирования, изложенному в § 6.6. Этим методом получено уравнение Винера—Хопфа [202]. Методы вариационного исчисления могут быть использованы также непосредственно в задаче минимизации дисперсии ошибки, решение которой приводит к алгоритму фильтрации Калмана. Здесь будем следовать второму методу, впервые опубликованному в работе [21]. Предположим, что алгоритм фильтрации задается обобщенным линейным дифференциальным уравнением . (7.109) Здесь, как раньше, будем обозначать оценку состояния как , хотя этим и не подчеркиваем какую-либо связь (по крайней мере, первоначально) этой оценки с результатами, полученными в предедыдущих разделах. Конечно, в конце концов, будет показана эквивалентность этих двух оценок и, следовательно, введенное обозначение окажется вполне логичным. Задача состоит в том, чтобы найти такие матрицы и , чтобы оценка была несмещенной и имела минимальную дисперсию ошибки. Сначала рассмотрим задачу построения условно и безусловно несмещенной оценки. Производная по времени уравнения ошибки оценивания определяется следующим образом: . Если подставить модель наблюдений из ур-ния (7.85), то получим . (7.110) Учитывая, что , можно записать ур-ние (7.110) как . (7.111) Если является условно несмещенной оценкой состояния для всех , то условное среднее как , так и при фиксированном должно быть равно нулю. Если бы среднее для некоторого не было равно нулю, то из этого следовало бы, что среднее также должно быть не равным нулю. Следовательно, если вычислить условное среднее обеих частей ур-ния (7.111) при фиксированном , то имеем . (7.112) так как и также равны нулю. Так как мы не можем предположить, что равно нулю для всех , то условие (7.112), вообще говоря, может соблюдаться только, если для всех . (7.113) Поэтому ур-ние (7.109) принимает вид Этот результат может быть представлен в форме, очень сходной с уравнением фильтра Калмана: . (7.114) Следовательно, удовлетворение требования условной несмещенности оценки приводит к струкгуре фильтра, аналогичного фильтру Калмана, за исключением пока еще неизвестных коэффициентов усиления в у р-н и и (7.114) и в ур-ния (7.102). Haчальное состояние может быть также определено, исходя из требования условной несмещенности оценки. Так как должно быть равно для всех , то тем более это должно соблюдаться при . Поэтому . (7.115) Теперь задача состоит в отыскании такой матрицы переменных коэффициентов усиления, при которой дисперсия ошибки оценивания была бы минимальна. Очевидно, достаточно было бы просто сопоставить ур-ния (7.114) и (7.102), чтобы убедиться, что при , равной , где определяется ф-лой (7.100), получается линейный алгоритм оценивания с минимальной дисперсией. Поступим иначе и покажем, что независимо от полученных ранеё результатов уравнение фильтра Калмана может быть выведено непосредственно с привлечением методов вариационного исчисления. Еще раз напоминаем читателю, что наша задача заключается не в получении новых результатов, а в изложении и иллюстрации возможных точек зрения и нескольких различных способов вывода уравнений фильтра Калмана. Необходимо выбрать матрицу на интервале наблюдения , которая минимизировала бы скалярную функцию риска . Как было показано в предыдущей главе, решение не зависит от и, следовательно, для простоты предположим, что . Рассмотрим функцию риска . Ее можно представить в более удобной форме, учитывая соотношение . Так как операторы следа матрицы и усреднения линейны, то можно изменить порядок выполнения операторов и записать . (7.116) Матричное дифференциальное уравнение для может быть получено из (7.111) с помощью методов, представленных в § 3.5, в виде (7.117) с начальным условием (7.118) Здесь, как и в предыдущих выкладках, использован тот же самый символ для обозначения ковариации ошибки оценивания. Однако и здесь этим мы не хотим подчеркивать какую-либо связь между двумя ковариациями. Ниже, когда будет показано, что совпадает с — коэффициентом усиления фильтра Калмана, использованное обозначение окажется вполне логичным. Задача оценивания теперь сводится к задаче оптимального управления, в которой необходимо найти матрицу на интервале наблюдения , которая минимизировала бы функцию риска при ограничении, заданном дифференциальным ур-нием (7.117) и при начальном условии (7.118). Отметим, что здесь мы сталкиваемся с задачей, которая совершенно не зависит от фактической оценки и наблюдения, и имеем дело исключительно с вероятностными характеристиками задачи оценивания. В частности, с дисперсиями. Согласно терминологии, принятой в теории управления, элементы матрицы являются «переменными состояния», а элементы матрицы — «переменными управления». Сформулированная задача представляет собой простую линейную задачу управления с заданным начальным значением, произвольным конечным значением и фиксированным временем управления и относится к типу вариационных задач Мейера. Оптимальная матрица , может быть найдена при помощи принципа максимума Л. С. Понтрягяна. Поскольку является матрицей, то необходимо использовать принцип максимума в матричной форме [8]. Чтобы применить принцип максимума к решению этой задачи, введем присоединенную матрицу или матрицу множителей Лагранжа размера и скалярную функцию , определяемую как . (7.119) Используя (7.117), получим . (7.120) Здесь для сокращения записи временной аргумент опущен. Если ввести понятие матрицы градиентов [10], то необходимые условия, которым должна удовлетворять оптимальная матрица коэффициентов усиления , записываются в виде ; (7.121) (7.122) с граничными условиями: . (7.123) Если теперь подставить из ур-ния (7.120) и использовать принцип максимума, то можно убедиться, что ур-ние (7.121) переходит в (7.117): , (7.124) а (7.122) переходит в . (7.125) и, наконец, граничные условия (7.123) становятся . (7.126) Из (7.124) следует, что если — симметричная матрица для некоторого значения , , то она является симметричной для всех значений , . Так как согласно ур-нию (7.126) — матрица симметричная при , можно заключить, что — симметричная матрица. Кроме того, из линейности ур-ния (7.124) и граничного условия (7.126) следует, что является несингулярной матрицей для всех , . Следовательно, — симметричная несингулярная матрица для всех , . Так как — симметричная несингулярная матрица, то ур-ние (7.125) можно умножить слева на и, воспользовавшись тем, что также симметрична, получить . (7.127) Если теперь сравнить ур-ния (7.127) и (7.100), то можно заметить, что совпадает с , если в (7.127) удовлетворяет ур-нию (7.105). Чтобы убедиться в справедливости этого утверждения, подставим (7.127) для в (7.117). В результате получим Можно заметить, что уравнение для совершенно не зависит от и конечного момента . Следовательно, можно считать , и полученный результат, который совпадает с алгоритмом непрерывного фильтра Калмана, справедлив для всех . Вывод уравнений фильтра Калмана с помощью уравнения Винера—Хопфа. Вывод уравнений непрерывного фильтра Калмана начнем с анализа уравнения Винера — Хопфа, которое было получено в § 6.6. Было показано, что если оценка состояния определяется интегралом свертки , (7.128) то удовлетворяет уравнению Винера—Хопфа при . (7.129) В § 6.6 упоминалось, что решение уравнения Винера—Хопфа в общем случае получить трудно. Здесь будет показано, как интегральное уравнение Винера—Хопфа может быть преобразовано в эквивалентное дифференциальное уравнение, которое, как мы убедимся, аналогично алгоритму фильтрации Калмана. Начнем с того, что вычислим частную производную по левой части ур-ния (7.129). В результате получим . Если использовать подстановку , то это выражение можно записать в виде . (7.130) Однако и независимы при поскольку зависит от только при , а — белый шум. Поэтому равна нулю и ур-ние (7.130) принимает более простой вид: при . Используя уравнение Винера—Хопфа, это уравнение можно записать как при . (7.131) Теперь вычислим частную производную по правой части уравнения Винера—Хопфа (7.129). Согласно правилу дифференцирования (см. §3.5) получаем . (7.132) По определению, представляет собой и, если использовать уравнение модели наблюдений , то получим . (7.133) Так как — белый шум, a и не коррелированы, причем , то и ур-ние (7.133) записывается как . (7.134) Используя уравнение Винера—Хопфа для замены , имеем . (7.135) Воспользовавшись этим уравнением при замене во втором слагаемом ур-ния (7.132), получаем . (7.136) Так как (7.131) и (7.136) представляют собой соответственно частные производные обеих частей уравнения Винера—Хопфа, то, приравнивая друг другу эти два выражения, получаем . (7.137) Очевидно, это интегральное уравнение будет удовлетворяться, если . (7.138) Калман и Бьюси [111] также показали, что если — положительно определенная матрица, что и предполагалось, то ур-ние (7.138) является необходимым условием справедливости ур-ния (7.137). Если учесть, что задается ур-нием (7.128), то нетрудно выяснить, как следует использовать (7.138), чтобы получить искомый алгоритм фильтрации. Запишем в виде . (7.139) Из ур-ния (7.138) следует, что . Следовательно, (7.139) можно записать как . Замечая, что интеграл в этом выражении представляет собой просто , находим . (7.140) Это выражение по форме совпадает с уравнением фильтра Калмана , если определить . (7.141) Теперь остается только найти выражение для . Запишем в виде . Так как — белый шум, который не зависит от , то. Поэтому . (7.142) Если подставить этот результат в уравнение Винера—Хопфа, то получим
или . (7.143) Используя определение величины , это выражение можно записать в виде . Меняя порядок выполнения операций интегрирования и вычисления ковариации, получаем . Интеграл в фигурных скобках представляет собой просто , поэтому . (7.144) Согласно определению левая часть (7.144) есть Предположим, что , так что это выражение упрощается и принимает вид . (7.145) Подставляя этот результат в ур-ние (7.144), находим . Сгруппировав два оператора вычисления ковариации, получаем . Из этого выражения можно найти , умножив справа обе части равенства на . В результате получим . (7.146) Так как это выражение является непрерывной функцией относительно аргумента , то можно найти, вычислив предел, к которому стремятся обе части уравнения (7.146) при : или . (7.147) Это выражение для отличается от полученного выражения для , поскольку здесь мы рассматривали вместо ранее использованной . Чтобы убедиться, что эти выражения эквивалентны, достаточно только записать . Согласно лемме об ортогональном проецировании , поэтому . Уравнение (7.147) для теперь имеет вид . (7.148) Этот результат, как и следовало ожидать, совпадает с (7.100). И, наконец, чтобы завершить вывод, необходимо получить дифференциальное уравнение для . Так как оно уже было выведено дважды: в § 3.5 и в самом начале данного параграфа [см. (7.105)], то вывод этого уравнения повторять не будем. Пример 7.4. [7]. Предположим, что в задаче фильтрации заданы следующие модели сообщения и наблюдений: ; (1) . (2) Матрицы , , , вообще говоря, состоят из переменных во времени элементов, но для удобства обозначения временные аргументы здесь опущены. Если произвести линейное преобразование переменных в виде (3) или (4) где — несингулярная матрица, составленная из переменных во времени элементов для всех , то модели сообщения и наблюдений могут быть выражены через : (5) (6) Хорошо известно, что эти два представления моделей связаны между собой следующими выражениями ; (7) ; (8) . (9) Заметим, что как в одном, так и в другом представлениях моделей входной и выходной шумы и , а также наблюдение идентичны. Наша задача — показать, как связаны между собой линейные по критерию минимума среднеквадратической ошибки оценки состояний и . В частности, будет показано, что ; (10) . (11) Очевидно, эти соотношения справедливы и при , так как — случайная величина, a — матрица, составленная из постоянных величин. Сначала рассмотрим соотношение между дисперсиями ошибки, определяемое ур-нием (11). Если под подразумевать , то необходимо показать, что . Производная по времени равна . При подстановке ур-ния дисперсии (7.105) в получаем Теперь, если воспользоваться ур-ниями (7) — (9) для замены , и , то после ряда алгебраических преобразований имеем Так как , то это выражение записывается в виде , причем оно совпадает с уравнением дисперсии . Начальные условия для и также совпадают, поскольку . Аналогичным способом можно доказать справедливость соотношения (10). Пусть определяется как , так что . Теперь воспользуемся ур-ниями (7), (9) и запишем . Согласно определению состояния и ранее доказанному соотношению (11) получаем . Таким образом, уравнение для совпадает с уравнением для , причем начальные условия также равны. Следовательно, для всех . Этот пример показывает, что любое эквивалентное множество переменных состояния может быть использовано при описании моделей сообщения и наблюдений, поскольку оценки любого множества состояний могут быть получены из оценок некоторого другого множества. Это, в свою очередь, означает, что выбором переменных состояния можио сократить объем вычислений, связанных с реализацией фильтра. Однако до сих пор еще не найдена методика определения наилучшего представления переменных состояния. Пример 7.5. [167]. Рассмотрим применение фильтра Калмана для получения производной линейной функции состояния, определяемого моделью сообщения. Иначе говоря, задана функция , где определяется уравнением модели сообщения (7.82), а модель наблюдений — ур-нием (7.85). Необходимо определить линейную по критерию минимума среднеквадратической ошибки оценку состояния . Если предположить, что существует, то определяется как. Воспользовавшись уравнением модели сообщения, это выражение можно записать в виде . Определим наилучшую оценку случайной величины, как условное среднее этой величины при заданных наблюдениях. Таким образом, имеем . Так как , то . Пример 7.6. Теперь покажем, как идея фильтра Калмана может быть легко применена в задаче определения структуры оптимального AM демодулятора в системах передачи непрерывных сообщений. Рассмотрим модели сообщения и наблюдения, представленные на рис. 7.7 и описываемые уравнениями: , , в которых и независимые случайные процессы с нулевым средним и коэффициентами дисперсии и . Рис. 7.7. Модель сигнала с амплитудной модуляцией и модель наблюдений. Матрицы и соответственно имеют вид ; . Уравнения фильтра Калмана (7.102) и (7.105) записываются в виде ,
Теперь заметим, что компоненты меняются во времени медленно, особен, но по сравнению с несущей частотой Поэтому можно исключить составляющие двойной частоты в уравнениях фильтрации и дисперсии, полагая . Это приближение упрощает уравнение фильтрации и уравнение дисперсии и, кроме того, позволяет, если это необходимо, заранее получить решение уравнения дисперсии. Если для реализации фильтра воспользоваться стационарным решением уравнения дисперсии ошибки, то в результате получим фильтр, структурная схема которого изображена на рис 7.8.
Рис. 7.8. Квазиоптимальный приемник сигналов с амплитудной модуляцией и модель наблюдений. Интересно вычислить стационарную дисперсию ошибки для случая, когда представляет скалярную величину. Установившееся значение дисперсии ошибки в этом случае равно . Дисперсия сигнала легко может быть вычислена, она равна . Если величину рассматривать как отношение сигнал/шум , то дисперсию ошибки можно выразить в виде . Как и следовало ожидать, дисперсия ошибки уменьшается с увеличением отношения сигнал/шум. В заключение рассмотрим задачу непрерывной линейной фильтрации в общем виде, когда шумовые процессы и коррелированы и имеют ненулевые средние значения, а модели сообщения и наблюдений также включают в себя известные функции времени. В этом случае модели сообщения и наблюдения имеют вид ; (7.149) , (7.150) где и — известные функции времени, a и — взаимно коррелированные процессы. Алгоритм фильтрации для этого случая приведен в табл. 7.5. Таблица 7.5. Обобщенный непрерывный фильтр Калмана
|