Читать в оригинале

<< Предыдущая Оглавление Следующая >>


8.2. Небелый шум

В этом параграфе будет исследована задача оценивания состояния в линейных системах с небелым шумом. Под «небелым шумом» мы понимаем случайный процесс, ковариационная функция которого не равняется нулю для несовпадающих моментов времени. Другими словами, рассматривается случайный процесс , такой, что  для .  В частности, небелый шум будет рассматриваться как процесс на выходе линейной динамической системы, на вход которой воздействует белый шум. Кроме того, может также присутствовать или отсутствовать белый шум. Хотя такое представление небелого шума и не является наиболее общим, но во всяком случае оно таково с практической точки зрения. Даже при определении параметров этой простой модели встречаются значительные трудности, так что использовать более общую форму представления небелого шума еще более трудно.

Небелый шум на входе, или шум объекта, не создает никаких трудностей, так как динамическая система, формирующая такой шум, может быть просто включена в модель сообщения точно так, как это было сделано в § 3.5. Поэтому основной задачей, представляющей интерес, является исследование небелого шума измерений. Одним из первых и во многих отношениях наиболее полным исследованием небелого шума в непрерывных системах является работа [36]. Исследование небелого шума в дискретных системах было проведено в работе [34] и распространено на задачу сглаживания, [159]. Оценивание в непрерывных системах, в которых каждое наблюдение содержало только небелый шум, рассматривалось в работах [253, 259].

В наиболее общей постановке задачи каждое наблюдение может содержать белый шум, небелый шум марковского типа, не содержать шума вообще или быть некоторой комбинацией трех рассмотренных возможностей. Поэтому в дальнейшем под термином «небелый шум» понимается наличие шума марковского типа или отсутствие шума вообще в одном или нескольких измерениях. Прежде чем непосредственно заняться рассмотрением такой общей задачи, исследуем сначала более простые задачи, а затем покажем, как методы, использованные при решении этих задач, могут быть применены к исследованию общей задачи. В первую очередь рассмотрим случай, когда каждое наблюдение содержит только шум марковского типа, а затем задачи оценивания при отсутствии шума.

Применительно к случаю чисто марковского шума, когда каждая составляющая является только небелым шумом, подробно будут выведены алгоритмы для непрерывных систем, а распространение этих алгоритмов на дискретные системы будет рассмотрено очень кратко. Модели сообщения и наблюдения записываются в обычной форме

,                              (8.1)

где  — белый шум с нулевым средним и ,

и

.                                          (8.2)

Однако в данном случае мы предполагаем, что, в свою очередь,  образуется на выходе линейной динамической системы вида

,                                           (8.3)

на которую воздействует также белый шум с нулевым средним и ; . Предположим, что среднее  и дисперсия  начального состояния  известны и дополнительно к этому начальное значение переменной состояния , т. е. , является случайной величиной с нулевым средним значением и известной дисперсией . Может показаться, что предположение о том, что  известна, является чрезмерно ограничивающим по сравнению с предыдущими предположениями относительно шума, однако, как будет показано ниже, это не так. Начальная дисперсия необходима для определения дисперсии  по уравнению модели шума (8.3) и .

Ставится задачу оценивания состояния  на основании наблюдения , которое содержит небелый шум. Наш подход будет строиться на преобразовании данной задачи в связанную с ней задачу оценивания, которую можно решить с помощью стандартного алгоритма фильтрации Калмана для случая белого шума измерений. Для осуществления такого преобразования рассмотрим наблюдение , которое получается из исходного в результате преобразования

.                         (8.4)

и после подстановки  из ур-ния (8.2) принимает вид

.                     (8.5)

Подставляя в приведенное выше выражение  из ур-ния (8.1) и  из (8.3), получаем для

или, иначе,

Этот результат может быть представлен в виде обычной модели наблюдения для случая белого шума измерений

,                                    (8.6)

где введены следующие очевидные обозначения:

;       (8.7)

.                           (8.8)

Очевидно, что преобразованный шум измерений  — белый, с ковариационной функцией

.    (8.9)

Шум измерений уже не является независимым от , так как

.                                (8.10)

Поэтому следует использовать алгоритм фильтрации Калмана из табл. 7.5, в котором  не предполагается равной нулю.

Исходное наблюдение  может быть полностью восстановлено по  и  с помощью ур-ния (8.4), решение которого можно записать в виде   

,                               (8.11)

где  рассматривается как известный процесс на входе. Здесь  является переходной матрицей состояния, связанной с , так что  . Поэтому оценка состояния , основанная на , должна быть идентична оценке состояния , основанной на  и , т.е.

,                            (8.12)

где, как и раньше, .

Если бы  и  были ортогональны, то оценку  можно было бы записать в виде

.                                        (8.13)

Однако, как нетрудно показать,  и  не являются ортогональными. Поэтому такое решение не может быть использовано и, прежде чем получить оценку, необходимо ортогонализировать информацию, связанную с наблюдением. Если обозначить  как компоненту  которая ортогональна , т. е. , то оценка состояния  может быть записана в виде

,                                        (8.14)

где .

Рассмотрим в первую очередь оценку, основанную на . Эта задача была решена ранее в примере 6.14, где было получено:

. (8.15)

Для простоты обозначений определим  как

.                                               (8.16)

Так как не зависит от  и имеет нулевое среднее значение, то

,                     (8.17)

где  — переходная матрица состояния, связанная с , следовательно,

,                             (8.18)

где  определяется на ур-ния (8.15).

Введем величину

,                     (8.19)

которая, как легко показать, ортогональна . Теперь можно получить алгоритм фильтрации для  непосредственным применением обобщенного алгоритма фильтрации Калмана, приведенного в табл. 7.5. Находим, что

,                               (8.20)

где , и после подстановок соответствующих выражений из ур-ний (8.9) и (8.10) получаем

.   (8.21)

Алгоритм вычисления дисперсии ошибки определяется как

  (8.22)

После определения  и  можно, используя ур-ние (8.14), записать  в виде

,                         (8.23)

так что

.                         (8.24)

Используя (8.18) и (8.20), получаем

.      (8.25)

или .

Если воспользоваться определением  приведенным в ф-ле (8.19), то . Подставляя  выраженное в виде (8.4), получаем окончательную форму алгоритма

.                     (8.26)

Начальное условие для  получается из ф-лы (8.15):

.       (8.27)

Начальное значение  необходимое для решения ур-ния (8.22), представляет собой дисперсию ошибки после приема . Эта дисперсия также была определена в примере 6.14 как

.                           (8.28)

Уравнения (8.26), (8.21) и (8.22) совместно с начальными условиями (8.27) и (8.28) представляет собой полный алгоритм оценки состояния в ситуации, где каждое измерение содержит только небелый шум. Для того чтобы ими было легко воспользоваться, все уравнения сведены в табл. 8.1.

Таблица 8.1. Алгоритм фильтрации в случае небелого шума измерений в непрерывных системах

Модель сообщения

.                               (8.1)

Модель наблюдения

,                           (8.2)

.                            (8.3)

Априорные данные

Алгоритм фильтрации

.                     (8.26)

Вычисление коэффициента усиления

,  (8.21)

где

.                       (8.7)

Вычисление дисперсии ошибки

              (8.22)

Начальные условия

;           (8.27)

.                           (8.28)

Можно избежать использования  в уравнении, но в этом случае необходимо определить  следующим образом.

Предположим, что  кусочно-непрерывна и рассмотрим —  так, что . Тогда из ур-ния (8.26) получим

или

.

Добавлением величины  из этого дифференциального уравнения может быть получено уравнение для . Данный подход при решении аналогичной задачи применительно к дискретным системам использовался в работе [34]. Общая сводка уравнений алгоритма представлена в табл. 8.2; вывод алгоритма фильтрации для дискретного случая предоставляется читателю в качестве упражнения. В этом случае

                                        (8.29)

оценка состояния , основанная на , фактически является оценкой одношагового сглаживания, так как   зависит от . Поэтому, как показано в табл. 8.2, алгоритм фильтрации включает в себя одношаговое предсказание оценки, полученной как результат сглаживания.

 Таблица 8.2. Алгоритм фильтрации в случае небелого шума измерений в дискретных системах

Модель сообщения

.

Модель наблюдения

.

Априорные данные

Алгоритм фильтрации

,

где

.

Алгоритм одношагового сглаживания

.

Вычисление коэффициента усиления при сглаживании

Вычисление коэффициента усиления при фильтрации

Вычисление дисперсии ошибки фильтрации

 

Вычисление дисперсии ошибки сглаживания

 

Начальные условия

 

Таблицы 8.1 и 8.2 представляют собой полную сводку алгоритмов оценивания состояния в том случае, когда каждое измерение содержит только небелый шум. Рассмотрим теперь задачу в условиях, когда шум измерений отсутствует. Может показаться, что подобная задача достаточно проста и для дискретного случая это действительно так. Напротив, для непрерывного случая эта задача оказывается настолько сложной, что некоторые ее аспекты полностью  не разрешены до сих пор. Сначала обсудим дискретный случай, а  затем кратко рассмотрим возможный способ решения задачи для непрерывного случая.

Модель сообщения, как и раньше, задается в виде

,                             (8.30)                                

модель наблюдения не содержит шума измерений и задается в виде

,                                                                       (8.31)

где шум объекта  - белый с нулевым средним и .

Необходимо найти оценку  по заданной последовательности наблюдений . Будем предполагать, что соответствующие распределения нормальные, и определим МАВ-оценку состояния . Запишем апостериорную плотность вероятности, используя' формулу Байеса (см. § 7.2) в виде

                      (8.32)

Необходимо найти значение , которое максимизирует . Может показаться, что результаты § 7.2 непосредственно применимы к этой задаче, и это действительно так. Однако» читатель должен иметь в виду, что некоторые из выражений § 7.2  справедливы только при условии, что  существует. В частности, выражение  из табл. 7.2 использовать уже нельзя. Вывод алгоритма оценивания по критерию максимума апостериорной вероятности из   § 7.2 также неправомерен, если не существует . Рассмотрим вывод алгоритма МАВ-оценивание для случая, когда  не существует.

Задача подобного типа рассматривалась ранее в § 6.2 и 7.2 и поэтому можно записать условные плотности вероятности  и  непосредственно как

      (8.33)

                   

    (8.34)

Здесь    и  -  нормировочные константы, конкретные значения которых не так важны.

Однако получить обычное решение для  невозможно, так как отсутствует шум измерений. Действительно, при данном   полностью известно, так что  в данном случае является неслучайной величиной. Следовательно,  становится просто дельта-функцией при  или

                                 (8.35)

Теперь, объединяя ур-ния (8.33), (8 34) и (8.35), получим: следующее выражение для апостериорной плотности вероятности:

      (8.36)

Для максимизации   по  необходимо решить уравнение

.                                                                              (8.37)                                                    

В остальных случаях  будет равняться нулю. Физически это условие означает, что оценку состояния  следует просто выбирать такой, чтобы оценка наблюдения была равной самому наблюдению, которое в данном случае свободно от шумов.

Однако ур-ние (8.37) не определяет  однозначно, кроме того случая, когда является неособенной и задача становится тривиальной. Если  - особенная матрица, что обычно и имеет место, то  не только должно быть решением ур-ния (8.37), но также и максимизировать оставшуюся часть плотности , а именно, . Может показаться, что бессмысленно говорить о максимизации если решение ур-ния (8.37) обращает плотность вероятности в бесконечность. Однако, если внимательно проследить вывод процедуры байесовской оценки (см. § 6.2), то можно заметить, что находится под знаком интеграла и поэтому необходимо максимизировать «вес» или «площадь» дельта-функции для того, чтобы получить точную МАВ-оценку.

Можно рассматривать задачу как выбор такого , которое максимизирует  при условии (8.31). Такой подход обычен в задаче оптимизации при ограничениях, которая может быть решена методом неопределенных множителей Лагранжа. Рассмотрим задачу максимизации выражения

которое может быть записано в виде

   (8.38)

Здесь множитель Лагранжа введен в достаточно необычной форме для того, чтобы упростить алгебраические преобразования в процессе решения задачи.

До максимизации  удобно прологарифмировать это выражение. В результате имеем

       (8.39)

Оценка  может быть получена как

.

При решении этого уравнения   получается в виде

.                                          (8.40)

Множитель определяется путем подстановки               ур-ния (8.40) в (8.37). В результате получаем

                                  (8.41)

откуда

              (8.42)

Если этот результат подставить в ур-ние (8.40), то МАВ-оценка состояния приобретает вид

     (8.43)

Легко проверить, что оценка , полученная из (8.43), удовлетворяет также ур-нию (8.37). Если определить матрицу коэффициентов усиления как

                (8.44)

то этот алгоритм принимает стандартную форму

               (8.45)

Выполняя обычные преобразования, сходные с теми, которые применялись в § 7.2, получаем разностное уравнение для дисперсии ошибки в виде

                          (8.46)

где

                                                    (8.47)

Начальные условия определяются как

                                                   (8.48)

Исходя из ур-ний (8.44) и (8.47), легко показать, что . Это соотношение непосредственно следует из того факта, что  полностью известно, так как шум измерений отсутствует. Алгоритмы фильтрации при отсутствии шума измерений совпадают с алгоритмами, приведенными в табл. 7.2. Хотя и может показаться, что при отсутствии шумов измерений возможно идеальное оценивание, результаты приведенного анализа достаточно ясно показывают, что это далеко не всегда так. К сожалению, приведенная выше методика не может быть применена к непрерывным системам вследствие трудностей выполнения ограничения, задаваемого ур-нием (8.31) в случае непрерывного времени.

Брайсон и Йохансен [36] развили иной подход к задаче оценивания для непрерывных систем в случае наблюдений без шума. Этот подход основывается на последовательном дифференцировании наблюдений без шума до тех пор, пока не получатся измерения, которые содержат белый шум. Свободные от шума измерения (как исходные, так и производные) используются для сокращения размерности пространства состояний, и наблюдения на фоне белого шума используются для оценивания оставшейся части вектора состояния. Основываясь на приведенном описании идеи метода, рассмотрим данную задачу более подробно.

Модель сообщения в непрерывном случае имеет вид ; наблюдение не содержит шума измерений и определяется соотношением

                                                       (8.49)

Предположим, что — матрица полного ранга, так что измерения линейно независимы. Если это не так, то любые линейно зависимые строки могут быть устранены, так как они не несут никакой новой информации, и может быть найдено наблюдение эквивалентное , но меньшей мерности.

Продифференцируем ; это всегда можно сделать, так как  не содержит белого шума. Поскольку требуется, чтобы  была только неотрицательно определенной, то вполне возможно, что некоторые элементы  не содержат белого шума. Продолжим дифференцирование этих элементов до тех  пор, пока каждый из них или не будет содержать белый шум, или измерение не станет линейно зависимым от других измерений. Иначе говоря, производные от каждого элемента  берутся до получения белого шума или до того момента, когда элемент становится линейно зависимым, после чего дифференцирование прекращается.

Сигналы, полученные из , и производные разбиваются на два множества. Первое из них содержит свободные от шума исходные измерения и часть линейно независимых, свободных от шума производных в виде

                                        (8.50)

Второе множество включает в себя все производные измерения, которые содержат белый шум в виде

,                                       (8.51)

где  — белый шум, коррелированный с , так как он образуется из . Величина  содержит  измерений, где  — ранг матрицы , если дифференцирование прекращается (как это было отмечено выше), когда все измерения становятся линейно зависимыми. Таким образом, матрица дисперсий будет неособенной, что и требуется для алгоритма фильтрации Калмана. Дисперсии  и  равны:

Используем -мерный, свободный от шума, вектор измерений  для уменьшения размерности пространства состояний путем линейного преобразования переменных состояния в новый вектор состояния в виде

                                                         (8.52)

где  — новый вектор состояния. Матрица  размера  предполагается неособенной и имеет вид

                                         (8.53)

Следовательно, последние  элементов  соответствуют измерениям без шума, а первые  элементов линейно независимы. Матрица размера  может быть выбрана произвольно, лишь бы матрица  была неособенной. Исходный вектор состояния  может быть восстановлен по  следующим образом:

           (8.54)

где  — -мерный вектор, содержащий первые  элементов . Поэтому, как только получена оценка состояния , оценка состояния  известна, поскольку известно .

Если исходную модель сообщения выразить через , то из ур-ния (8.1) находим

        (8.55)

Так как  уже известно, то необходимо рассмотреть только первые  уравнений, которые могут быть записаны в виде

                            (8.56)

Эта модель сообщения выражена уже почти в стандартной форме, за исключением добавочного члена, содержащего известную входную величину, поэтому алгоритмы табл. 7.5 могут быть использованы непосредственно

Если выразить уравнение наблюдения с шумом (8.51) через , то получим

                                           (8.57)

Чтобы подчеркнуть, что в это наблюдение включена известная функция , перепишем (8.57) в виде

                                                          (8.58)

Теперь для нахождения оценки состояния  и, следовательно,  можно применить алгоритм фильтрации Калмана (см. табл. 7 5).

После того как была разработана методика решения задачи для наблюдений без шума, можно рассмотреть еще один подход к решению задачи в случае, когда каждое измерение содержит только небелый шум.  Для того чтобы пояснить этот подход, рассмотрим снова модели сообщения, шума и наблюдения для случая небелого шума (для непрерывных систем), которые описываются ур-ниями (8.1) — (8 3). Определим расширенный вектор состояния  как

                                                                          (8.59)

так что

         (8.60)

Модель наблюдения определяется в этом случае как

                                                           (8.61)

и такие наблюдения оказываются свободными от шумов. Следовательно, для решения этой задачи можно применить полученный выше алгоритм. Основная трудность использования такого подхода заключается в увеличении порядка системы и, следовательно, объема вычислений, который растет приблизительно как квадрат числа переменных и может оказаться чрезмерно большим при условии, что число наблюдений велико. Однако возможно осуществить алгоритм, описанный в начале данного параграфа, используя подход, основанный на расширении вектора состояния, и в этом смысле оба подхода эквивалентны. Дополнительно следует отметить, что расширение вектора состояния можно использовать и тогда, когда измерения содержат небелый и белый шум, так как наблюдения с белым шумом дифференцировать нельзя.

 



<< Предыдущая Оглавление Следующая >>