5.7. Последовательное обнаружение марковских сигналов в нормальном шумеПроблема обнаружения нормальных сигналов в нормальном шуме уже обсуждалась в § 5.3. Там же были отмечены трудности решения этой проблемы. В данном параграфе будет описан метод вычисления отношения правдоподобия или, что эквивалентно, достаточной статистики для бинарной задачи обнаружения нормальных сигналов в нормальном шуме. Здесь будут использоваться некоторые понятия теории марковских процессов и аппарат разностных и дифференциальных уравнений. Изложение начнем с решения задачи обнаружения для процессов с дискретным временем. Аналогичные результаты для процессов с непрерывным временем будут получены с помощью предельного перехода, когда число отсчетов на конечном интервале времени неограниченно возрастает. В заключение укажем некоторые возможные обобщения рассматриваемых методов, которые позволят охватить задачи с сигналами, отличными от нормальных. Итак, будем рассматривать гипотезы: (5.134) Здесь нормальный шум является белым, имеет среднее значение, равное нулю, и статистически не связан с сигналом или вектором переменных состояния . Будем предполагать, что для сигнала справедлива линейная марковская модель, т. е. сигнал является решением разностного уравнения (5.135) где - нормальный белый шум, среднее значение равно нулю. Таким образом, имеем: (5.136) Отношение правдоподобия для рассматриваемых гипотез имеет вид . (5.137) Воспользовавшись правилом умножения вероятностей, запишем (5.138) Отношение правдоподобия (5.137) представляет собой отношение двух нормальных плотностей .вероятностей. Следовательно, оно полностью определяется первыми двумя моментами соответствующих плотностей. Пусть (5.139) Заметим, что при гипотезе : (5.140) При гипотезе требуемые моменты вычисляются совсем просто. Так, (5.141) Для и можно получить рекуррентные записи. Для этого достаточно воспользоваться представлением (5.135) и обозначениями (5.139) и ; . (5.142) а также учесть соотношения (5.140). В результате приходим к уравнениям фильтрации Калмана (см. табл. 7.2): ; ; ; (5.143) с начальными условиями, задаваемыми при формулировке задачи. Такими условиями могут быть, например, следующие: ; . (5.144) Ковариационная матрица ошибок оценивания определяется с помощью соотношения . (5.145) Отношение правдоподобия (5.137) теперь можно записать следующим образом: (5.146) где достаточная статистика (5.147) Следовательно, правило выбора решения, основанное на отношении правдоподобия, при фиксированном объеме выборки принимает вид . (5.148) Чтобы воспользоваться полученным правилом, необходимо предварительно вычислить значение правой части неравенства (5.148). В выражении для достаточной статистики (5.147) почти все слагаемые, за исключением и , также можно вычислить заранее. Однако значение этой статистики может быть вычислено лишь после того, как решены уравнения фильтрации Калмана для оценки . Эта оценка является наилучшей и вычисляется по результатам наблюдений при всех значениях от до . Из ф-л (5.147) и (5.148) следует, что значения достаточной статистики можно вычислять последовательно по мере поступления результатов наблюдений. Это означает, что на основе этой статистики можно построить последовательное правило, введя два порога и и модифицировав правило (5.148). Полезно рассмотреть другой способ получения этих же результатов. В предыдущем разделе уже было показано, что если сигнал является известной функцией времени, зависящей возможно от случайного или неизвестного неслучайного векторного параметра , а шум измерений является белым, то отношение правдоподобия может достаточно просто вычисляться последовательно по мере поступления наблюдений. Из ф-лы (5.111) для случая известного сигнала имеем . Это равенство можно рассматривать как простое скалярное разностное уравнение. Введем новое обозначение и перепишем предыдущее соотношение следующим образом: . (5.149) К сожалению, ур-ние (5.149) нельзя использовать в случае, который рассматривается в данном параграфе, когда сигнал или вектор состояния является случайным процессом. Объясняется это тем, что теперь используется представление (5.138), т. е. равенство , которое было использовано в предыдущем разделе, теперь несправедливо, поскольку ковариационная матрица сигнала не является диагональной. Однако на основании (5.138) отношение правдоподобия (5.137) можно записать следующим образом: . Следовательно, , (5.150) Равенство (5.150) представляет собой требуемое рекуррентное выражение для отношения правдоподобия в задаче обнаружения случайного сигнала. Его следует использовать с начальным значением . Ранее уже были получены выражения (5.140) и (5.141) для моментов плотностей вероятностей, входящих в (5.150). Воспользовавшись этими выражениями, для отношения правдоподобия можно записать рекуррентную формулу (5.151) По этой формуле отношение правдоподобия может вычисляться после получения каждого очередного наблюдения. В случае непоследовательного правила вычисленное на -м шаге значение отношения сравнивается с порогом . Значение можно также сравнивать с двумя порогами и на каждом шаге, если необходимо использовать последовательное правило Вальда для проверки гипотез и . Таким образом, теперь становится очевидным, что только что рассмотренный подход (который был предложен в работе [230]), полностью эквивалентен традиционному методу решения задачи обнаружения, приведшему к правилу (5.148). Получим аналогичные результаты для случая непрерывного времени при следующих моделях полезного сигнала и наблюдаемого процесса: ; (5.152) ; . (5.153) Здесь и — нормальные случайные процессы, математические ожидания которых равны нулю, а ковариационные матрицы ; . (5.154) Соответствующие модели при дискретном времени имеют вид (5.155) где ; ; ; . (5.156) Воспользуемся теперь результатами, полученными ранее для процессов с дискретным временем, и найдем соответствующие предельные соотношения, приняв, что и так, что и . Уравнения фильтрации Калмана (5.143) при этом переходят в уравнения фильтрации при непрерывном времени (см. также табл. 7.4): ; ; , (5.157) где , ; , . (5.158) Вместо достаточной статистики (5.147) при непрерывном времени получаем (5.159) Правило выбора решения, основывающееся на отношении правдоподобия, в соответствии с (5.148) принимает вид . (5.160) Последовательность «вычислений значения используемой здесь достаточной статистики такая же, как и при дискретном времени. Сначала полученная реализация наблюдаемого процесса используется при решении уравнения фильтрации. Затем эта же реализация и полученное решение используются при вычислении значения достаточной статистики. Финальный момент времени может быть задан заранее; в этом случае получаем непоследовательное правило выбора решения. Для последовательного правила является текущим временем. Тот же результат можно получить, если воспользоваться представлением (5.151). В обоих случаях функция правдоподобия или достаточная статистика рассматривается как вектор состояния, и задача состоит в том, чтобы получить разностное или дифференциальное уравнения, описывающие эволюцию этого вектора во времени. Именно процессу получения подобных уравнений будет постоянно уделяться основное внимание в этой книге. Пример 5.7. Выпишем явное выражение для отношения правдоподобия при гипотезах: ; и скалярной модели источника сигнала , где ; ; . Уравнения фильтрации Калмана (5157) и (5 158) принимают вид , ; , , а для достаточной статистики (5.159) получаем , Непоследовательное правило в соответствии с ф-лой (5.160) для рассматриваемого случая записывается следующим образом. . Для последовательного правила в выражении для достаточной статистики параметр следует заменить на переменную . Последовательное правило при этом можно записать следующим образом: если , то принимается гипотеза ; если , то проверку следует продолжать. если то принимается гипотеза . Функция может быть вычислена заранее или вычисляться в реальном времени. Структурная схема последовательного обнаружителя, осуществляющего вычисление значения достаточной статистики, изображена на рис 5.11.
Рис. 5.11. Структурная схема последовательного обнаружителя (пример 5.7) Во многих примерах длительность проверки гипотез настолько велика, что фактически имеется стационарный режим. В этих случаях можно положить и постоянную найти как положительный корень получившегося квадратного уравнения. Передаточная функция, определяемая как отношение значения оценки к значению наблюдаемого процесса , при этом имеет вид . Перейдем теперь к изучению более сложной проблемы обнаружения случайного сигнала, не являющегося нормальным процессом, на фоне аддитивного нормального шума. Для этого случая получим алгоритмы последовательного вычисления отношения правдоподобия. Как будет показано, такие алгоритмы оказываются нелинейными. Рассмотрим гипотезы: ; . (5.161) где — нормальный шум, имеющий нулевое среднее значение и положительно определенную ковариационную матрицу , (5.162) а — случайный процесс, не обязательно нормальный, для которого справедлива следующая марковская модель: . (5.163) Здесь — нормальный белый шум с нулевым средним значением и положительно полуопределенной ковариационной матрицей . (5.164) Будем предполагать, что случайные величины и взаимно некоррелированны друг с другом и со случайной величиной при всех , . Для вычисления отношения правдоподобия воспользуемся соотношением (5.106). На основании правила умножения вероятностей, которое применимо также и для плотностей вероятностей, функцию запишем в виде (5.165) Нижние индексы здесь опущены. Так как при гипотезе справедливо представление , то . (5.166) Первые два момента этой плотности вероятности запишем следующим образом: ; (5.167) , (5.168) где (5.169) В общем случае плотность вероятности (5.165) не является нормальной. Тем не менее обычно полезно ввести «псевдобайесовскую» плотность вероятности, которую можно получить, предположив, что плотности вероятности (5.166) являются нормальными, т. е. (5.170) Введя это предположение и учитывая, что , (5.171) отношение правдоподобия (5.106) запишем в виде . (5.172) Здесь использовано представление (5.165), а достаточная статистика (5.173) Таким образом, правило выбора решения, основанное на отношении правдоподобия, принимает вид . (5.174) С другой стороны, можно вычислить логарифм отношения правдоподобия и воспользоваться рекуррентной ф-лой (5.150). В рассматриваемом здесь случае (5.175) Эта формула может быть использована для вычисления отношения правдоподобия на каждом шаге по мере поступления результатов новых наблюдений. Для получения последовательного правила Вальда теперь достаточно сравнивать значения этого отношения c двумя порогами и . К сожалению, полученное правило не так просто использовать практически. Это объясняется тем, что необходимо знать значения и , которые в общем случае невозможно вычислить точно. В гл. 9 будет показано, что для функции часто оказывается допустимой аппроксимация рядом Тейлора относительно точки , которая является апостериорным средним, т. е. . (5.176) Если при этом в разложении функции ограничиться слагаемыми, порядок которых не выше первого, то получим . Тогда, согласно соотношениям (5.167) — (5.169) и (5.176), можно записать: ; (5.177) , (5.178) где (5.179) Если бы алгоритмы для вычисления и были найдены, то можно было бы воспользоваться последовательным правилом (5.174) или использовать при вынесении решений рекуррентную ф-лу (5.175). Приближенные алгоритмы вычисления условного среднего значения будут приведены в § 9.4, где решается задача фильтрации при дискретном времени. Отметим также, что при исследовании проблемы фильтрации будет получено довольно большое число алгоритмов, полезных при решении задач нелинейного последовательного обнаружения. Чтобы воспользоваться полученной формой правила, уже сейчас можно обратиться к таблице алгоритмов 9.7, описывающих дискретный обобщенный фильтр Калмана (или дискретный фильтр первого порядка для вычисления условного среднего). Для этих же целей можно использовать также алгоритмы табл. 9.9, которые описывают дискретный итерационный фильтр первого порядка для вычисления условного среднего. Эти алгоритмы следует применять совместно со скалярным разностным уравнением для логарифма отношения правдоподобия, записываемым в форме (5.180) с начальным условием . (5.181) Можно использовать также аппроксимацию второго порядка функции с помощью ряда Тейлора. В этом случае (5.182) где введено обозначение (:), чтобы избежать тензорных выражений, которое было приведено в гл 4. При аппроксимации второго порядка имеем: ; (5.183) . (5.184) Выражение для слагаемого можно найти в табл. 9.8. Полученные соотношения позволяют ввести аппроксимацию второго порядка для отношения правдоподобия, а также записать дискретные алгоритмы фильтрации, приведенные в табл. 9.8. Такие алгоритмы применяются для вычисления апостериорного среднего значения сигнальной составляющей наблюдаемого процесса, которое затем используется в приведенном ранее правиле выбора решения. Заметим также, что для вычисления отношения правдоподобия на -м шаге необходимо знать значение оценки , с помощью которой осуществляется экстраполяция сигнальной составляющей на один шаг. Аналогичные результаты для непрерывного времени нестрого можно получить с помощью следующих предельных переходов: ; (5.185) ; (5.186) ; (5.187) ; (5.188) . (5.189) Нетрудно показать, что ; (5.190) . (5.191) Таким образом, отношение правдоподобия оказывается зависящим только от достаточной статистики. Согласно представлениям (5.172) и (5.173) получаем [102, 147, 209]: , (5.192) (5.193) где . Один из интегралов в последнем выражении является стохастическим. Полезно заметить, что даже, несмотря на то, что плотность вероятности (5.165) отлична от нормальной при дискретном времени, она оказывается таковой в непрерывном случае; в результате полученные выше приближенные выражения будут точными при непрерывном времени [102]. Подробное обсуждение проблем нелинейной фильтрации будет проведено в § 9.2. Полученные там результаты и приведенные здесь последние два соотношения позволяют достаточно просто решать многие важные в теоретическом отношении задачи построения правил выбора решений при непрерывном времени. Однако с точки зрения практических приложений эти результаты оказываются мало пригодными, поскольку часто невозможно вычислить точно не только значение функции , но даже и оценки , являющейся условным средним . Для получения приближенного решения задачи последовательного обнаружения при непрерывном времени можно воспользоваться линеаризацией соотношений (5.182) и (5.183) с последующим применением приближенных алгоритмов, приведенных в табл. 9.1 и 9.2. Полезно указать другой способ получения уже найденных для непрерывного времени соотношений, не опирающийся на псевдобайесовское предположение. Это предположение было необходимо для введения аппроксимации (5.170). Можно показать [48], что точное выражение для условной плотности вероятности , где - скалярная переменная, записывается в виде ряда Грама — Шарлье (5.194) где — полином Эрмита -гo порядка и коэффициенты являются функциями условных центральных моментов случайной величины . Первые пять коэффициентов определяются с помощью соотношений: ; ; ; ; , где . Представление (5.194) является точным. Однако его трудно применять из-за того, что оно содержит бесконечный ряд. Используя (5.194) и представление (5.171) для плотности из (5.106) и (5.165), получаем следующее точное выражение для отношения правдоподобия в случае последовательности скалярных наблюдений: (5.195) Учитывая соотношения (5.168) и (5.189) и переходя к пределу при , можно показать, что при конечном , , . Определим теперь случайную величину с помощью винеровского процесса, положив , где для процесса справедливы равенства: ; Дж. Дуб [56] показал, что при этих предположениях допустим предельный переход при в выражениях, подобных (5.195), причем соответствующие пределы существуют в среднеквадратическом смысле. Таким образом, получаем (5.196) Если теперь в это выражение ввести обозначение стохастического интеграла, то придем к скалярному варианту статистики (5.193). Тем самым более строго доказана справедливость равенства (5.193). Тот факт, что это равенство справедливо, в то время как (5.132) является лишь приближением, может привести к заключению, что последовательное обнаружение случайного сигнала, не являющегося нормальным, на фоне нормального шума при непрерывном времени в каком-то смысле «лучше», чем при дискретном. Это действительно было бы возможно, если бы удалось точно реализовать требуемые алгоритмы и вычислить стохастические интегралы. Однако это невозможно, так что приближенные алгоритмы должны использоваться как при непрерывном, так и при дискретном времени.
|