9.3. Оценивание по максимуму апостериорной вероятностиВ предыдущем параграфе рассмотрены оптимальные и подоптимальные алгоритмы фильтрации с минимумом ковариационной матрицы дисперсий ошибок. Здесь мы изучим методы оценивания по критерию максимума апостериорной вероятности. Основное внимание в этом параграфе уделено дискретной модели оценки. Для непрерывного времени результаты получены в терминах переопределенной модели оценки. Дискретные модели сообщения и наблюдения определяются следующими соотношениями (9.55) (9.56) где —-мерный вектор состояний; —-мерная векторнозначная функция: — матрица размером ,—-мерный вектор шума, входящий в модель сообщения; — -мерный вектор наблюдения; - -мерная векторнозначная функция; - -мерный вектор шума наблюдения. В случае дискретного времени и являются независимыми нормальными (марковскими) случайными последовательностями типа белого шума с параметрами: (9.57) , (9.58) где — дельта-функция, а и — положительно определенные матрицы ковариаций размерами и соответственно. Соотношения для непрерывного времени часто определяют с помощью нестрогого предельного перехода в дискретной модели, устремляя шаг дискретизации к нулю и . Тогда непрерывная модель определится следующим образом: (9.59) (9.60) Здесь и — статистически независимые белые нормальные шумы с нулевыми средними и (9.61) (9.62) Коэффициенты в этих уравнениях можно получить с помощью следующего нестрогого предельного перехода: (9.63) (9.64) (9.65) (9.66) (9.67) Дифференциальное ур-ние (9.59) можно записать в виде стохастического дифференциального уравнения где — винеровский процесс. Соотношения (9.63) — (9.67) можно получить строго с помощью соответствующих вероятностных операций, подобно тому, как это сделано в гл. 4 и в предыдущем параграфе. Обозначим последовательности и через и соответственно. Аналогично множество непрерывных значений и в интервале обозначим через и . Соответствующие условные плотности вероятностей при условии обозначим через и . Далее предположим, что известны плотности вероятностей и , а именно, и обладают нормальными распределениями со средними и . Наилучшая оценка внутри интервала наблюдения, вообще говоря, будет зависеть от выбранного критерия качества. Здесь термин «наилучшая» оценка определяет оценку по максимуму условной плотности вероятностей по функции , заданной на интервале наблюдения. Такая оценка называется оценкой максимума апостериорной плотности вероятностей. По формуле Байеса (9.68) Из ур-ния (9.55) следует, что если известно, то — нормальная плотность вероятностей, так как — нормальный случайный процесс. Если задано, то (9.69) По-правилу умножения вероятностей получим, что . Так как — последовательность независимых нормальных, марковских случайных величин, то — марковский процесс и . Таким образом, , (9.70) где — нормальная условная плотность вероятностей с параметрами: средним и ковариационной матрицей . Поскольку от не зависит, то ее можно рассматривать просто как нормировочный множитель при максимизации условной плотности. После некоторых преобразований выражение (9.68) (Может быть записано с учетом (9.69) и (9.70): (9.71) где от не зависит и . Ясно, что нахождение максимума (9.71) по эквивалентно минимизации (9.72) с учетом (9.55) и соответствующего начального условия для решения задачи фильтрации (9.73) Аналогично максимизация эквивалентна минимизации (9.74) при условии (9.59) и начальном условии из (9.73). Уравнение (9.72) записано в такой форме, что можно применить дискретный принцип максимума [202]. Гамильтониан определяется в виде где . Канонические уравнения и граничные условия задаются соотношениями: (9.75)
Эти канонические уравнения ih соответствующие граничные условия определяют специфическую граничную нелинейную задачу второго порядка, решением которой является оценка сглаживания на заданном интервале. Заметим, что (9.73) не является граничным условием для задачи сглаживания. В результате алгебраических преобразований получаем окончательно следующие канонические уравнения: (9.76) (9.77) где Решение канонических уравнений для может быть получено различными способами. Точное решение задачи в нереальном «времени может быть получено способом градиента или квазилинеаризации [156, 202, 213]. Для того чтобы получить несколько уравнений, которые можно решать в текущем реальном времени, рассмотрим метод инвариантного погружения в текущем дискретном времени [202] и используем его для нахождения приближенных рекуррентных уравнений фильтрации. Будем предполагать, что нелинейная граничная задача второго порядка может быть определена в следующем виде: (9.78) (9.79) с граничными условиями . Процесс начинается в точке и кончается в точке . Оценка вектора состояний определяется так, что и отражает зависимость от конечного шага и от конечного добавочного вектора. Граничные условия выбираются такими, что где теперь обозначают граничное условие, наложенное на оценку для процесса, развивающегося от точки и заканчивающегося в точке и удовлетворяющего условиям может быть выражена как (9.80) где интерпретируется как матрица первых частных производных с компонентами, определяемыми следующими соотношениями: где . Аналогично , есть первая частная производная Из (9.79) следует (9.81) а из (9 78) имеем (9.82) Подстановка (9 81) и (9 82) в (9 80) и заканчивает процедуру дискретного инвариантного погружения в дискретном времени (9.83) Эквивалентное уравнение инвариантного погружения в непрерывном текущем времени, использованное в [53] и полученное в более ранней работе [25], определяется в виде где соответствующая непрерывная нелинейная граничная задача второго порядка задается в виде с граничными условиями Процедура погружения определяется так, что и . Этот результат можно получить прямо из (9.78) и (9.79), уменьшая шаг дискретизации на интервале и определяя где — квадратичная форма в и поэтому в окончательных уравнениях может быть опущена. Подробное исследование уравнений инвариантного погружения в непрерывном времени в различных его формах дано в [202]. Если предположить, что решение ур-ния (9 83) должно быть получено в виде , (9.84) где заменено на , чтобы подчеркнуть тот факт, что есть текущее время, уравнение инвариантного погружения определится следующим образом (9.85) Поскольку на конечном шаге добавочная переменная равна нулю, то целесообразно разложить и в ряд Тейлора около точки для того, чтобы получить следующие соотношения ; Если предыдущие два соотношения подставить в (9.85) и вычислить , то получим приближенные рекуррентные уравнения фильтрации, вытекающие из решения соответствующей граничной задали второго порядка ; (9.86) . (9.87) Теперь мы можем решать совместно ур-ния (9.86) и (9.87) при начальных условиях, определяемых соотношениями (9 73), (9 75) и (9 84) . (9.88) и таким образом, получать приближенное решение задачи фильтрации. Итак, выражения (9.55) и (9.56) определяют нашу дискретную модель, а ур-ния (9.76), (9.77) и (9.86) — (9.88) определяют приближенно оптимальный фильтр. Хотя основное внимание в этой главе уделяется исследованию различных дискретных алгоритмов решения задачи нелинейной фильтрации, оптимальных по критерию максимума апостериорной вероятности (МАВ), целесообразно рассмотреть сейчас приближенный нелинейный алгоритм одношагового предсказания, что в дальнейшем упростит рассмотрение алгоритмов фильтрации. Рассмотрим задачу максимизации апостериорной плотности вероятности . Мы уже отмечали, что эта задача эквивалентна задаче минимизации или , где из ур-ния (9.55) следует, что , a определяется соотношением (9.72) Если последовательность , минимизирующая , задана, то является минимумом в предположении, что остаточный член равен нулю. В результате имеем уравнение , (9.89) где означает оценку фильтрации на шаге . Если положить теперь, что —текущая переменная, то получим приближенный алгоритм предсказания на один шаг . (9.90) Для того чтобы получить алгоритмы фильтрации, необходимо вычислить и в (9.86) и (9.87). Из (9.76) и (9.77) после алгебраических преобразований следует, что ; Это позволяет нам найти уравнение фильтрации , (9.91) где , (9.92) а уравнение для одношагового предсказания дается соотношением (9.90) Чтобы получить выражение для , заметим, что (9.93) причем мы определим несколько позже. Имеем также Определим симметричную матрицу в виде (9.94) Тогда Применяя лемму об обращении матрицы, из этого уравнения получим (9.95) В подобном виде это выражение предпочтительнее, поскольку обращенная матрица имеет невысокий порядок, вообще говоря, ниже того порядка, которым обладала матрица в ранее полученном выражении для . В общем случае —функция от , поэтому операции с этой матрицей не тривиальны. Мы сразу замечаем по аналогии с линейным фильтром Калмана и по виду функции риска, что есть (приближенное) выражение для ковариационной матрицы ошибок . Легко видеть также, что есть (приближенное) соотношение для ковариационной матрицы ошибок предсказания . Дискретный алгоритм фильтрации, оптимальный по критерию максимума апостериорной вероятности, приведен в табл 9.3. Таблица 9.3. Дискретные алгоритмы фильтрации по критерию МАВ
Интерпретация этих алгоритмов аналогична калмановским дискретным алгоритмам фильтрации (см. табл 72). Алгоритмы фильтрации в непрерывном времени, оптимальные по критерию МАВ, даны в табл. 9.4. Они получаются из дискретных соотношений путем устремления шага дискретизации к нулю или же с помощью непрерывного принципа максимума с использованием (9.74), (9.59) и (9.60) [53, 202]. Оба алгоритма фильтрации как дискретный, так и непрерывный являются точными только в том случае, если модели сигналов и наблюдений линейны. Таблица 9.4. Непрерывные алгоритмы фильтрации по критерию МАВ
Пример 9.6. Рассмотрим простую для целей численного расчета дискретную модель оценки второго порядка. Положим, что модель описывается следующими соотношениями ; , где . Применяя дискретный принцип максимума, получим следующий? вариант нелинейной граничной задачи второго порядка ; ; ; . Уравнения фильтрации определятся соотношениями ; ; ; ; , где ; . Для белого шума дисперсия состояния становится «бесконечно» большой. Это легко понять, поскольку непрерывным аналогом для модели сигнала является двойной интегратор. Таким образом, величина может безгранично расти в случае больших , (ее знак зависит от частных значений последовательности ), а скорость роста зависит от относительной величины и . Для шума модели с небольшой дисперсией и действие входной нелинейности (арктангенса) проявляется незначительно внутри интересующего нас интервала наблюдения. Поэтому целесообразно рассматривать модель как линейную. Для шума модели с большой дисперсией модель наблюдения даже внутри интервала наблюдения становится существенно нелинейной, и вся система становится практически необозримой. На рис 9.4 приведены кривые приближенных дисперсий ошибок для различных значений и . Для сравнения приведены дисперсии, полученные при замене на при и . Значения дисперсии ошибки при линейной фильтрации достаточно близки к десятикратным значениям дисперсий ошибок для нелинейной модели, в которой шумы модели сигнала и наблюдения в десять раз меньше, чем в линейной. При больших значениях и ошибки фильтрации в нелинейной модели становятся больше ошибок в линейной системе, полученной заменой на . В нелинейной системе дисперсия ошибки не достигает какого-то постоянного установившегося уровня. По мере увеличения амплитуды способность модели отражать изменения падает и, следовательно, возрастает ошибка фильтрации. Рис. 9.4. Приближенные дисперсии ошибок фильтрации. а) ; ; ; ; б) ;; ; Пример 9.7. Теперь рассмотрим задачу оценки постоянного параметра в модели . При этом наблюдение . Модель сообщения можно переопределить, полагая . Это соотношение описывает эволюцию постоянного параметра и определяет дополнительный вектор состояний параметра, который должен быть оценен. Таким образом, имеем ; ; ; . Тогда ; ;. Используя табл. 9.3, найдем следующие алгоритмы фильтрации ; ; ; ; ; ; ; ; ; , где . Решением этих уравнений служит оценка параметра и вектора состояний. На рис 9.5 представлены типичные экспериментальные зависимости, полученные в результате использования этих уравнений. Для того чтобы подчеркнуть, что нормальное распределение не необходимо для того, чтобы можно было пользоваться методом наименьших квадратов, в качестве шума в эксперименте были взяты «неизвестные» по форме функции, которые на самом деле представлялись треугольными по форме колебаниями с нулевой постоянной составляющей. Напомним, что для любых и можно воспользоваться методом наименьших квадратов для вычисления в (9.72). Однако только в том случае, когда и имеют нормальное распределение, мы получим оценку по критерию максимума апостериорной вероятности. Рис. 9.5. Совместная оценка состояния и параметра системы первого порядка в шуме: 1 - ; 2 - ; 3 - ; 4 - ; , , , .
|