Глава 7. ОПТИМАЛЬНЫЙ ЛИНЕЙНЫЙ ФИЛЬТР7.1. ВведениеВ этой главе будут рассмотрены решения некоторого класса задач оценивания, впервые сформулированных и развитых Калманом и Бьюси [105, 111] как обобщения классической работы Винера [275]. Нас будет интересовать класс линейных последовательных алгоритмов оценивания состояния, обеспечивающих минимальную среднеквадратическую ошибку. Эти алгоритмы получили название «фильтров Винера—Калмана», «фильтров Калмана» по имени авторов, чьи работы послужили началом теоретических исследований в этой бурно развивающейся области. Алгоритмы фильтра Калмана или одного из многочисленных его обобщений и модификаций уже применяются при решении многих практических задач, включающих в себя управление движением в космическом пространстве и определение параметров орбиты. Рассмотрение фильтра Калмана разделено на две части: в первой дан вывод основных результатов, во второй приведены обобщения. В этой главе будет дан вывод алгоритма фильтрации Калмана и исследованы его асимптотические характеристики. Рассмотрение фильтра Калмана начнем с дискретного варианта задачи, т. е. со случая дискретных по времени наблюдений дискретной динамической системы. Дискретная задача выбрана для первоначального рассмотрения до некоторой степени произвольно. Но такова историческая последовательность, и, кроме того, дискретный вариант имеет некоторые методические и теоретические преимущества. Для простых задач дискретные алгоритмы могут быть реализованы и вручную проверены и могут быть проще объяснены. Последовательная обработка информации приводит к более простым выкладкам. Кроме того, некоторые теоретические особенности задачи легче объяснить для дискретного варианта, чем для непрерывного. Как мы убедимся в дальнейшем, это, однако, справедливо не для всех аспектов задачи. Введение такого важного понятия, как «обновляющий» процесс, оказывается особенно полезным лишь для непрерывного случая. При выводе дискретного алгоритма будут использованы два различных подхода. Сначала будут получены линейные, оптимальные в смысле минимума среднеквадратической ошибки алгоритмы с помощью метода ортогонального проецирования. Затем будет рассмотрен подход, связанный с оцениванием по максимуму апостериорной вероятности (см. § 6.2). Непрерывный алгоритм сначала выводится из дискретного путем увеличения частоты отсчетов и предельного перехода. Затем результаты, соответствующие непрерывному случаю, непосредственно выводятся из интегрального уравнения Винера—Хопфа [см. ур-ние (6.151)], а также путем прямого использования вариационного метода решения задачи оптимизации. Подобные подходы к выводу алгоритма фильтрации Калмана служат не только иллюстрацией различных возможностей; некоторые вспомогательные результаты могут быть использованы при решении задач нелинейной (и линейной) фильтрации, рассмотренных в гл. 9. Стремление показать, что данную задачу оценивания можно рассматривать с различных точек зрения, служит оправданием для изложения нескольких различных cпособов решения, хотя одного было бы вполне достаточно, поскольку основные результаты аналогичны. Можно надеяться, что рассмотрение задачи с различных точек зрения будет способствовать более глубокому пониманию физических и статистических особенностей полученных результатов. Если время наблюдения неограниченно увеличивается или, по крайней мере, становится достаточно большим по сравнению с длительностью переходных процессов в системе и если параметры системы инвариантны во времени и априорное распределение стационарно, по крайней мере, в широком смысле, тогда получается стационарная асимптотическая форма фильтра Калмана. Этот стационарный фильтр Калмана аналогичен фильтру Колмогорова—Винера, хотя для большинства задач подход Калмана дает значительные вычислительные преимущества. Соотношение подходов Калмана и Винера обсуждается в § 7.4. Устойчивость асимптотических характеристик фильтра Калмана исследуется в § 7.5. Устойчивость алгоритма особенно важна, так как она обеспечивает стабильность ошибки оценивания при увеличении интервала наблюдения. Показано, что при слабых ограничениях алгоритм является асимптотически стабильным в большом, что позволяет применять этот алгоритм с малой вероятностью нежелательного режима, даже несмотря на незнание априорного распределения.
|