Читать в оригинале

<< ПредыдущаяОглавлениеСледующая >>


5.9. Моделирование и применения

Моделируемые сигналы. Генерировались моделируемые сигналы с различными характеристиками и фиксировался отклик алгоритмов решетчатого оценивания. Эти сигналы включали белый шум, возбуждаемый авторегрессивными  процессами. Рассматривались следующие типы процессов: 1) стационарные; 2) с коэффициентами фильтра, линейно изменяющимися во времени; 3) с коэффициентами фильтра со ступенчатыми изменениями; 4) с импульсным возбуждением при ступенчатых изменениях коэффициентов.

На рис. 5.10 показана сходимость решетчатого метода наименьших квадратов для стационарного авторегрессивного процесса. Решетчатый фильтр восьмого порядка с фиксированными коэффициентами, возбуждаемый белым шумом, вырабатывал моделируемые сигналы. РНК – алгоритм с  применялся для вычисления коэффициентов отражения. Первый коэффициент отражения сходился менее чем за 50 выборок, а первые четыре коэффициента отражения приближались к своим истинным значениям после 150 выборок. Коэффициенты отражения высших порядков приближались к своим истинным значениям после 250 выборок.

Когда моделируемый сигнал вырабатывался с помощью возбуждаемого белым шумом решетчатого фильтра второго порядка с линейно изменяющимися во времени коэффициентами, характер адаптации был таким, как показано на рис. 5.11. Оценки двух коэффициентов отражения соответствовали истинным значениям параметров. Однако здесь имело место увеличение дисперсии оценки по мере приближения коэффициентов отражения к нулю или по мере увеличения порядка коэффициента. Для получения моделируемого сигнала предыдущий эксперимент повторялся для фильтра с кусочно-постоянными коэффициентами. На рис. 5.12 дана траектория оцененного коэффициента отражения, из которой не видно, что фильтр имеет ступенчатые изменения коэффициентов.

Влияние оптимальной весовой функции наблюдалось когда моделируемый сигнал вырабатывался тем же самым решетчатым фильтром со ступенчатыми изменениями коэффициентов, но у которого в момент изменения коэффициента к белому шуму, возбуждающему процесс, добавлялся периодический импульс. Наличие импульсов привело к быстрому изменению оценок, в соответствии с новыми кусочно-постоянными значениями коэффициентов (рис. 5.13). Импульс вызвал резкое увеличение , а это позволило сосредоточить оценки на новых характеристиках сигнала. Как только влияние импульса проходило, функция  уменьшалась и могла иметь место сходимость.

а.

б.

Рис. 5.10. Адаптация РНК - алгоритма для стационарного авторегрессивного процесса: а – коэффициент отражения от первого до четвертого; б – пятый и шестой коэффициенты отражения

Рис. 5.11. Адаптация РНК - алгоритма для нестационарного авторегрессивного процесса с линейно уменьшающимися коэффициентами.

 

Рис. 5.12. Адаптация РНК- алгоритма для нестационарного авторегрессивного процесса со ступенчатым изменением коэффициентов.

Применение для анализа речи. Решетчатый фильтр наиболее широко применяется для обработки речи, например в системах сжатия спектра речевого сигнала и в однокристальных устройствах синтеза речевых сигналов со встроенным словарем. Коэффициент отражения и решетчатый фильтр по многим причинам являются подходящими средствами для обработки речевых сигналов: моделирование голосового такта в виде акустической трубы, благоприятные свойства коэффициентов отражения, в смысле возможности квантования сигналов, свойства решетчатого фильтра, позволяющие использовать арифметику с конечной длиной слова, и медленное изменение во времени коэффициентов отражения для звуков речи (что делает возможной их интерполяцию).

Линейное предиктивное  кодирование (ЛПК) – метод, широко применявшийся при кодировании речевых сигналов с низкой скоростью передачи битов и синтезе речевых сигналов с фиксированным словарем. В методе ЛПК используются: модель голосового тракта, решетчатый фильтр, параметры которого определяются коэффициентами отражения, и модель возбуждения, обеспечиваемого периодическими звуковыми импульсами, производимыми колебанием голосовых связок (например, гласными звуками) и белым шумом от шипящих звуков. Короткие по времени отрезки речи (обычно 20 моделирование системы) характеризуются 8 – 10 коэффициентами отражения, периодом следования импульсов (нулевым для шума) и энергетическим членом. Все  параметры могут квантоваться так, чтобы полное число бит составляло 48 за 20 моделирование системы. Используя данное компактное описание звуков, можно разработать интегральные схемы синтеза речевых сигналов, которые могли бы с помощью параметров, накопленных в постоянном запоминающем устройстве, допускающем только считывание, воспроизводить понятную речь.   

Рис. 5.13 Адаптация РНК - алгоритма для нестационарного авторегрессивного процесса со ступенчатым изменением коэффициентов. Входной сигнал представляет собой сумму белого шума и импульсов, синхронизируемых со ступенчатыми изменениями.

Анализируя речевые гласные звуки с помощью РНК – алгоритма, обнаруживаем у них свойства коэффициента правдоподобия. Временная диаграмма сигнала (рис. 5.14, а) явно указывает на периодический характер этой гласной. При применении для данного звука          РНК - алгоритма возникает ошибка прямого предсказания, показанная на рис. 5.14, б. Этот относительно стационарный звук дал почти постоянные коэффициенты отражения (после сходимости) (рис. 5.14, в). Периодические всплески, наблюдаемые для всех пяти коэффициентов отражения, являются следствием влияния периодического открывания голосовых связок. Коэффициент правдоподобия  обычно мал, но он увеличивается, когда происходят эти открывания связок (рис. 5.14, г). Когда голосовые вязки открываются, резкий импульс от воздушной волны возбуждает голосовой тракт и коэффициент правдоподобия интерпретирует это как изменение структуры сигнала. Для ЛПК – модели речевого сигнала необходимо определить периодичность этих открываний, называемую периодом высоты тона. Местоположение импульсов высоты тона можно непосредственно определить из ошибок предсказания, но это не всегда дает точные результаты. Периодичность является очевидной, но ее нелегко выделить из диаграммы на рис. 5.14, б. Комбинируя производную коэффициента правдоподобия  с рядом для ошибки предсказаний, можно получить более легко различимый пик в начале колебаний голосовой связки (рис. 5.14, д). Данный способ был предложен в работе [189] в качестве метода оценки высоты тона.

Поскольку точные решетчатые алгоритмы рекурсивного метода наименьших квадратов могут быстро отслеживать изменения спектральных характеристик, их можно применять для различения природы промежуточных звуков [308] . Текущая оценка, полученная с помощью экспоненциального взвешивания прошлых данных, отражает кратковременные характеристики сигнала. На рис. 5.15, а и г  показано начало слов «bid» и «did», произносимых одним и тем же диктором-мужчиной. Анализируя эту ситуацию с помощью НККРНК – алгоритма при , можно заметить, что изменение коэффициентов отражения для начала каждого слова происходит по различным траекториям, в соответствии с различными согласными. Однако в течение следующего отрезка звучания гласной траектории становятся более похожими (рис. 5.15, б, в, д, е). Промежуточная часть звуков усиливается, но наблюдается также влияние импульсов высоты тона. Способность НККРНК – алгоритма различать типы звуков может быть полезной для систем распознавания речевых сигналов, основанных на фонемах.

а.

б.

Рис. 5.14 Адаптация РНК - алгоритма для произносимой гласной: а – временная диаграмма сигнала для типичной гласной; б – ошибка предсказания после РНК – фильтра пятого порядка; в – адаптация первых пяти коэффициентов отражения; г – коэффициент правдоподобия ; д – произведение ошибки предсказания и производной коэффициента  правдоподобия (только положительная часть).

в.

г.

Рис. 5.14. (продолжение).

д.

Рис. 5.14. (продолжение).

Применение для коррекции канала. Адаптивный решетчатый фильтр  имеет значительные преимущества в случае коррекции канала, а именно его частотной характеристики, где важны ортогонализирующие свойства и характеристики быстрого отслеживания. Корректирующие адаптивные градиентные фильтры на линиях задержки с отводами, хотя и являются простыми для реализации, имеют скорость сходимости, зависящую от отношения наибольшего и наименьшего характеристических чисел корреляционной  матрицы канала [115]. Методы самоортогонализации были предложены в работе [116], а в решетчатой форме – в работах [134, 136]. Было показано, что градиентный решетчатый корректирующий фильтр [280] и РНК – корректирующий фильтр (см. разд. 5.6) [282] обеспечивают очень быструю сходимость, которая не зависела от величины отношения характеристических чисел канала (рис. 5.16; см. работу [282). Были исследованы две модели каналов передачи  данных с корреляционными матрицами; у этих каналов отношения характеристических чисел (т. е. отношения наибольшего характеристического числа к наименьшему) составляли 11 и 21, соответственно.

Корректирующий фильтр с 11 отводами был реализован с помощью МНК – градиентного алгоритма или адаптивного решетчатого фильтра для коррекции канала (АРКК) и алгоритма метода наименьших квадратов адаптивного решетчатого корректирующего фильтра (НКАРКФ). Градиентный корректирующий фильтр на линии задержки с отводами имеет значительно более медленную сходимость: она зависела от величины отношения характеристических чисел. РНК – корректирующий фильтр в обоих случаях сходился примерно за 40 итераций, тогда как для сходимости адаптивного решетчатого корректирующего фильтра требовалось примерно 120 итераций.

а.

б.

Рис. 5.15. Сравнение двух похожих слов, начинающихся с взрывных согласных звуков «b» и  «d» (НККРНК – алгоритм при ): а – первые 62,5 мс  слова «bid»; б – 1–й и 2–й  коэффициенты отражения для слова «bid»; в – 3-й и 4-й коэффициенты отражения для слова «bid»; г – первые 62,5 мс слова «did»; д – 1–й и 2–й коэффициенты отражения для слова did»; е – 3-й и 4-й коэффициенты отражения для слова «did».

в.

г.

Рис. 5.15 (продолжение)

д.

е.

Рис. 5.15 (продолжение)

Применение для электроэнцефалографических исследований.

 Электроэнцефалографические (ЭЭГ) данные, исследованные с помощью авторегрессивного моделирования, могут дать лучшую совокупность сведений об ЭЭГ – спектре, чем методы, основанные на преобразованиях в частотной области, например БПФ. Коэффициенты отражения для НККРНК – алгоритма исследовались с целью обнаружения ничтожно малых изменений состояния головного мозга, наблюдаемых по ЭЭГ – активности [268]. На рис. 5.17, а приведены ЭЭГ – данные, полученные для левого полушария головного мозга взрослого пациента, снятые в начале засыпания (частота отсчетов ).

Сильное изменение активности наблюдается вблизи начала необработанных ЭЭГ – данных и явно выражено в коэффициентах отражения (рис. 5.17, б – г). Второе изменение активности в конце записи едва различимо для необработанных данных, но его можно наблюдать по изменениям коэффициента отражения  высшего порядка. По изменениям коэффициентов отражения можно судить о физиологических переходах и по ним давать заключение об ЭЭГ – состояниях головного мозга в данный момент времени и в хронологической последовательности.

Рис. 5.16. Сходимость корректирующего фильтра для двух моделей каналов: МНК – градиентный алгоритм, или адаптивный решетчатый фильтр для корректировки канала (АРКК), и алгоритм адаптивного корректирующего фильтра на основе метода наименьших квадратов (НКАРКФ). а – сходимость корректирующего фильтра при отношении характеристических чисел, равном 11; б – сходимость корректирующего фильтра при отношении характеристических чисел, равном 21.

(Из работы [282].)

а

б

Рис. 5.17. Анализ электроэнцефалографических данных с помощью авторегрессивного моделирования: а – ЭЭГ – данные с центрального электрода ; б – первый и второй коэффициенты отражения; в – третий и четвертый коэффициенты отражения; г – пятый и шестой коэффициенты отражения.

в

г

Рис. 5.17. (продолжение)

 



<< ПредыдущаяОглавлениеСледующая >>