3.5.1. Временное сигнальное кодирование

Имеется несколько технологических приёмов кодирования источника, которые используют временные характеристики сигнала. Наиболее широко использующийся метод описывается в этом разделе.

Импульсно-кодовая модуляция (ИКМ). Пусть обозначает реализацию сигнала, выдаваемого источником, и пусть обозначает отсчёт, взятый со скоростью стробирования , где - наивысшая частота в спектре .

В ИКМ каждый отсчёт сигнала квантуется в один из уровней, где - число двоичных цифр, используемых для представления каждого отсчёта. Следовательно, скорость источника равна бит/с.

Процесс квантования можно представить математически как

, (3.5.1)

где представляет квантованное значение , a - ошибку квантования, которую мы трактуем как аддитивный шум. Предположим, что используется равномерное квантование, имеющее характеристику вход-выход, показанную на рис. 3.5.1, тогда шум квантования хорошо характеризуется статистически равномерной ФПВ

, , (3.5.2)

где размер шага квантования .

Рис. 3.5.1. Характеристика вход-выход для равномерного квантователя

Средний квадрат ошибки квантования

. (3.5.3)

Средний квадрат ошибки в децибелах равен

дБ. (3.5.4)

Заметим, что шум квантования уменьшается на 6 дБ на каждый используемый в квантователе бит. Например, 7-битовый квантователь вызывает мощность шума квантования в -52,8 дБ.

Для многих сигналов источника, таких как речевые сигналы, характерно то, что маленькие уровни сигнала появляются более часто, чем большие. Однако, равномерный квантователь обеспечивает одинаковые расстояния между последовательными уровнями во всём динамическом диапазоне сигнала. Лучший подход – это использовать неравномерный квантователь. Характеристики неравномерного квантователя обычно получают пропусканием сигнала через нелинейное устройство, которое сжимает уровни сигнала, поступающие затем на равномерный квантователь.

Например, логарифмический сжиматель (компрессор) имеет амплитудную характеристику вход-выход в виде

, (3.5.5)

где - амплитуда входа, - амплитуда выхода, - параметр, который выбирается так, чтобы получить требуемую характеристику компрессии. Рисунок 3.5.2 иллюстрирует характеристики компрессии для некоторых значений . Величина соответствует случаю отсутствия компрессии.

Рис. 3.5.2. Амплитудная характеристика вход-выход для логарифмического компрессора

Величина принята в качестве стандарта в США и Канаде при кодировании сигналов речи. Эта величина ведёт к уменьшению мощности шума квантования относительно равномерного квантования приблизительно на 24 дБ, как показано Джайантом (1974). Следовательно, 7-битовый квантователь, используемый совместно с логарифмическим компрессором с параметром , даёт мощность шума квантования примерно -77 дБ по сравнению с -53 дБ при равномерном квантовании.

При восстановлении сигнала по квантованным значениям используется преобразование (экспандирование), обратное логарифмическому, для декомпрессии амплитуды сигнала. Комбинированную пару компрессор-экспандер называют компандером.

Дифференциальная импульсно-кодовая модуляция (ДИКМ). В ИКМ каждый отсчёт кодируется независимо от других. Однако у многих источников сигнала при стробировании со скоростью Найквиста или быстрее проявляется значительная корреляция между последовательными отсчётами. Другими словами, изменения амплитуды между последовательными отсчётами в среднем относительно малы. Следовательно, схема кодирования, которая учитывает избыточность отсчётов, будет требовать более низкой битовой скорости кодирования для выхода источника.

Относительно простые решения получаются при кодировании разности между последовательными отсчётами, а не самих отсчётов. Поскольку можно ожидать, что разность между отсчётами сигнала меньше, чем действительные значения отсчётов, то потребуется меньшее число бит для представления разностного сигнала. Суть этого общего подхода - в предсказании текущего значения отсчёта на основе предыдущих отсчётов. Для конкретности предположим, что означает текущий отсчёт источника, и пусть обозначает предсказанное значение (оценку) для , определяемое как

. (3.5.6)

Таким образом, является взвешенной линейной комбинацией отсчётов, а являются коэффициентами предсказания. Величины выбираются так, чтобы минимизировать некоторую функцию ошибки между и .

Математически и практически подходящей функцией ошибок является среднеквадратическая ошибка (СКО). В этом случае мы выберем так, чтобы минимизировать

. (3.5.7)

В предположении, что выход источника стационарен (в широком смысле), мы можем выразить (3.5.7) в виде

, (3.5.8)

где - автокорреляционная функция последовательности отсчётов сигнала . Минимизация по коэффициентам предсказания приводит к системе линейных уравнений

, , (3.5.9)

Таким образом, коэффициенты предсказания определены. Если автокорреляционная функция априори не известна, она может быть определена по реализации отсчётов посредством соотношения

, , (3.5.10)

и оценки используются в (3.5.9) для нахождения коэффициентов . Заметим, что нормирующий множитель в (3.5.10) сокращается, когда подставляются в (3.5.9).

Линейные уравнения (3.5.9) для коэффициентов предсказателя называют нормальными уравнениями или уравнениями Юли-Волкера. Имеется алгоритм, разработанный Левинсоном (1974) и Дурбиным (1959) для эффективного решения этих уравнений. Он описывается в приложении А. Мы будем иметь дело с этими уравнениями более детально при последующем обсуждении линейного кодирования с предсказанием.

Имея метод определения коэффициентов предсказания, теперь рассмотрим блок-схему практической системы ДИКМ, показанную на рис. 3.5.3, а. В этой схеме предсказатель встроен в цепь обратной связи, охватывающей квантователь. Вход предсказателя обозначен . Он представляет сигнальный отсчёт , видоизменённый процессом квантования, а выход предсказателя равен

. (3.5.11)

Разность

(3.5.12)

является входом квантователя, а обозначает его выход. Величина квантованной ошибки предсказания кодируется последовательностью двоичных символов и передаётся через канал в пункт приёма. Квантованная ошибка также суммируется с предсказанной величиной , чтобы получить .

В месте приёма создаётся такой же предсказатель, как на передаче, а его выход суммируется с , чтобы получить . Сигнал является входным воздействием для предсказателя и в то же время образует выходную последовательность, по которой с помощью фильтра НЧ, как показано на рис. 3.5.3, b, восстанавливается сигнал . Использование обратной связи вокруг квантователя обеспечивает то, что ошибка в - это просто ошибка квантования и что здесь нет накопления предыдущих ошибок квантования при декодировании. Имеем

. (3.5.13)

Рис. 3.5.3. (а) Блок-схема кодера ДИКМ; (b) Декодер ДИКМ в приёмнике

Следовательно, . Это означает, что квантованный отсчёт отличается от входа ошибкой квантования независимо от использования предсказателя. Значит, ошибки квантования не накапливаются.

В системе ДИКМ, иллюстрированной рис. 3.5.3, оценка или предсказанная величина отсчёта сигнала получается посредством линейной комбинации предыдущих значений , , как показано в (3.5.11). Улучшение качества оценки можно получить включением в оценку линейно отфильтрованных последних значений квантованной ошибки.

Конкретно, оценку можно выразить так:

, (3.5.14)

где - коэффициенты фильтра для квантованной последовательности ошибок . Блок-схемы кодера на передаче и декодера на приёме даны на рис. 3.5.4. Два ряда коэффициентов и выбираются так, чтобы минимизировать некоторую функцию ошибки , например среднеквадратическую ошибку.

Рис. 3.5.4. Модифицированная ДИКМ посредством прибавления линейно отфильтрованной последовательности ошибок

Адаптивные ИКМ и ДИКМ. Многие реальные источники являются квазистационарными по своей природе. Одно из свойств квазистационарности характеристик случайного выхода источника заключается в том, что его дисперсия и автокорреляционная функция медленно меняются со временем. Кодеры ИКМ и ДИКМ, однако, проектируются в предположении, что выход источника стационарен. Эффективность и рабочие характеристики таких кодеров могут быть улучшены, если они будут адаптироваться к медленно меняющейся во времени статистике источника. Как в ИКМ, так и в ДИКМ ошибка квантования , возникающая в равномерном квантователе, работающем с квазистационарным входным сигналом, будет иметь меняющуюся во времени дисперсию (мощность шума квантования). Одно улучшение, которое уменьшает динамический диапазон шума квантования, - это использование адаптивного квантователя. Хотя квантователь можно сделать адаптивным различными путями, относительно простой метод сводится к использованию равномерного квантователя, который меняет величину шага квантования в соответствии с дисперсией последних сигнальных отсчётов. Например, краткосрочная текущая оценка дисперсии может быть рассчитана для входной последовательности , и на основе такой оценки может быть установлен размер шага. В своём простейшем виде алгоритм для установки размера шага использует только предыдущий отсчёт сигнала. Такой алгоритм был успешно использован Джайантом (1974) при кодировании сигналов речи. Рисунок 3.5.5 иллюстрирует такой (3-битовый) квантователь, в котором размер шага устанавливается рекуррентно согласно соотношению

, (3.5.15)

где - множитель, величина которого зависит от уровня квантования отсчёта , а -

размер шага квантования для обработки . Величины множителей, оптимизированные для кодирования речи, были даны Джайантом (1974). Эти значения даны в табл. 3.5.1 для 2-, 3- и 4-битового адаптивного квантователя.

Рис. 3.5.5. Пример квантователя с адаптивным размером шага (Джайант, 1974)

Таблица 3.5.1. Коэффициенты умножения для адаптивной установки размера шага (Джайант, 1974).

	ИКМ			ДИКМ
	2	3	4	2	3	4
(1)	0,60	0,85	0,80	0,80	0,90	0,90
(2)	2,20	1,00	0,80	1,60	0,90	0,90
(3)		1,00	0,80		1,25	0,90
(4)		1,50	0,80		1,70	0,90
(5)			1,20			1,20
(6)			1,60			1,60
(7)			2,00			2,00
(8)			2,40			2,40

Если выход источника квазистационарный, предсказатель в ДИКМ также можно сделать адаптивным. Коэффициенты предсказателя могут время от времени меняться, чтобы отразить меняющуюся статистику сигнала источника. Линейные уравнения (3.5.9) остаются справедливыми и с краткосрочной оценкой автокорреляционной функцией , поставленной вместо оценки функции корреляции по ансамблю. Определённые таким образом коэффициенты предсказателя могут быть вместе с ошибкой квантования переданы приёмнику, который использует такой же предсказатель. К сожалению, передача коэффициентов предсказателя приводит к увеличению необходимой битовой скорости, частично компенсируя снижение скорости, достигнутое посредством квантователя с немногими битами (немногими уровнями) для уменьшения динамического диапазона ошибки , получаемой при адаптивном предсказании.

В качестве альтернативы предсказатель приёмника может вычислить свои собственные коэффициенты предсказания через и где

. (3.5.16)

Если пренебречь шумом квантования, эквивалентно . Следовательно, можно использовать для оценки автокорреляционной функции в приёмнике, и результирующие оценки могут быть использованы в (3.5.9) вместо при нахождении коэффициентов предсказателя. Для достаточно качественного квантования разность между и очень мала. Следовательно, оценка , полученная через , практически адекватна для определения коэффициентов предсказателя. Выполненный таким образом адаптивный предсказатель приводит к низкой скорости кодирования данных источника.

Вместо использования блоковой обработки для нахождения коэффициентов предсказателя , как описано выше, мы можем адаптировать коэффициенты предсказателя поотсчётно, используя алгоритм градиентного типа, подобный адаптивному градиентному алгоритму выравнивания, который рассматривается в гл. 11. Похожий алгоритм градиентного типа также разработан для адаптации фильтровых коэффициентов и для системы ДИКМ, показанной на рис. 3.5.4. За подробностями такого алгоритма читатель может обратиться к книге Джайанта и Нолля (1984).

Дельта-модуляция (ДМ). Дельта-модуляцию можно рассматривать как простейшую форму ДИКМ, в которой используется двухуровневый (1-битовый) квантователь в соединении с фиксированным предсказателем первого порядка. Блок-схема кодера и декодера для ДМ показана на рис. 3.5.6, а. Заметим, что

. (3.5.17)

Поскольку

то следует

Таким образом, оцененное (предсказанное) значение в действительности является предыдущим отсчётом , изменённым шумом квантования . Также заметим, что разностное уравнение (3.5.17) определяет интегратор со входом . Следовательно, эквивалентной реализацией предсказателя первого порядка является интегратор со входом, равным квантованному сигналу ошибки . В общем случае квантованный сигнал ошибки масштабируется некоторой величиной, скажем , которая называется размером шага. Эквивалентная реализация показана на рис. 3.5.6, b. В результате кодер, показанный на рис. 3.5.6, аппроксимирует сигнал посредством линейной ступенчатой функции. Для относительно хорошей аппроксимации сигнал должен меняться медленно относительно скорости стробирования. Это требование подразумевает, что скорость стробирования должна быть в несколько раз (не меньше 5) больше скорости Найквиста.

Рис. 3.5.6. (a) Блок-схема системы -модуляции, (b) Эквивалентная реализация системы-модуляции

При заданной скорости стробирования характеристика качества кодера ДМ ограничена двумя видами искажений, как показано на рис. 3.5.7. Одно называется перегрузкой по наклону. Оно вызывается размером шага , который слишком мал, чтобы следить за сигналом, который имеет крутой наклон. Второй тип искажений, названный шумом дробления, возникает от использования размера шага, который слишком велик для сигнала, имеющего малый наклон. Необходимость минимизации обоих видов искажения приводит к противоречивым требованиям для выбора размера шага . Решение сводится к выбору который минимизирует сумму средних квадратов от двух видов искажений.

Даже если , оптимизирован для минимизации общего среднего квадрата ошибки по наклону и шуму дробления, рабочая характеристика кодера с ДМ может всё ещё остаться неудовлетворительной. Альтернативное решение заключается в выборе переменного размера шага квантования, который адаптируется к кратковременным характеристикам сигнала источника, т.е. размер шага увеличивается, когда сигнал имеет крутой наклон, и уменьшается, когда сигнал имеет относительно малый наклон. Эта адаптивная характеристика иллюстрируется рис. 3.5.8.

Рис. 3.5.7. Пример искажений перегрузкой по наклону и шума дробления в кодере дельта-модуляции

Рис. 3.5.8. Пример кодирования при дельта-модуляции с переменным размером шага

Для адаптивной установки размера шага на любой итерации могут быть использованы различные методы. Квантованная последовательность ошибок создаёт хороший критерий характеристик наклона кодируемого сигнала. Если у квантованной ошибки меняется знак между последовательными итерациями, это указывает на то, что наклон сигнала в этой области относительно мал. С другой стороны, когда сигнал имеет крутой наклон, последовательные значения ошибки имеет одинаковый знак. На основе этих наблюдений возможно создать алгоритм, который уменьшает или увеличивает размер шага в зависимости от последовательных значений . Относительно простое правило, предложенное Джайантом (1970), сводится к адаптивному изменению размера шага согласно соотношению

, ,

где - константа, которая выбирается так, чтобы минимизировать суммарное искажение. Блок-схема кодера-декодера ДМ, которая включает этот адаптивный алгоритм, показана на рис. 3.5.9.

В технической литературе были исследованы и описаны насколько других вариантов адаптивного кодирования ДМ. Особенно эффективную и популярную технику, впервые предложенную Грифкесом (1970), называют дельта-модуляцией с непрерывно меняющимся наклоном (ДМ НМН). В ДМ НМН адаптивный параметр размера шага можно выразить так:

если , и имеют одинаковые знаки; в противном случае

Параметры ,, выбираются так, что и . Для более полного обсуждения этого и других вариантов адаптивный ДМ интересующемуся читателю следует обратиться к статьям Джайанта (1974) и Фланагана и др. (1979). Они содержат обширную библиографию. ИКМ, ДИКМ, адаптивные ИКМ, адаптивные ДИКМ и ДМ используют технику кодирования источника, которая пытается достоверно представить временную форму выходного сигнала источника. Следующий класс методов кодирования сигналов основывается на спектральных представлениях сигнала источника.

Рис. 3.5.9. Пример системы дельта-модуляции с адаптивным размером шага