11.4. Методы сжатия на основе предсказания
Сжатие
на основе предсказания использует информационную избыточность (корреляцию
данных) для формирования оценки
уровня яркости элемента
изображения
по значениям яркости его непосредственных соседей
(лежащих в окрестности
).
В той части изображения, где данные некоррелированы, оценка
, в
общем-то, не будет совпадать с исходным значением яркости
. Разность между оценкой и
действительным значением, которую можно ожидать относительно небольшой (но
абсолютной величине), далее квантуется, кодируется и передается (или
запоминается) совместно с Ваметрами модели прогноза — они и будут представлять
итоговый результат сжатия данных. Яркость в положении
восстанавливается по значениям вычисленной оценки
и разности
. Этот метод называется дифференциальной
импульсно-кодовой модуляцией (ДИКМ) [11.5, гл.22.5]. Эксперименты показали,
что линейный предсказатель третьего порядка (использующий три соседа — левый,
верхний и диагональный) для широкого диапазона изображений достаточен для прогноза.
Если изображение обрабатывается строка за строкой, то оценка
представляется в виде
,
где
—
Ваметры принятой модели прогноза. Эти Ваметры выбираются так, чтобы
минимизировать средний квадрат ошибки оценивания
. Решение, предполагающее
сигнал стационарным случайным процессом с нулевым средним, использующее
предсказатель третьего порядка, находится из системы уравнений
где
является автокорреляционной функцией случайного
процесса
.
Для подавляющего большинства изображений автокорреляционная функция островершинная,
имеет экспоненциальный вид и дисперсия разности
обычно существенно меньше дисперсии исходной
переменной
. Это делает возможным сжатие
данных.
Рис. 11.4.
Сжатие на основе предсказания [11.4]: а - восстановленное изображение,
коэффициент сжатия 3.8, б - разностное изображение - разности между яркостями
исходного и восстановленного изображений
; максимальная разность - 6 уровней
квантования; гистограмма изображения перед визуализацией эквализована; в -
восстановленное изображение, коэффициент сжатия 6.2, г - разностное изображение
между исходным и восстановленным изображениями
; максимальная разность - 140 уровней
квантования
Очевидно,
что данный алгоритм сжатия адаптивен к изображению в среднем. Он не реагирует
на локальные особенности изображения, к которым в первую очередь необходимо
отнести слитные участки массива, состоящие из одинаковых по яркости отсчетов.
Для кодирования таких участков, как правило, применяют предсказатель нулевого
порядка, в котором используется кодирование длин серий отсчетов с одинаковыми
значениями [11.5, гл. 22.3]. Отметим, что
достаточно эффективны алгоритмы сжатия, в которых кодирование длин серий
совмещается с алгоритмом линейного прогноза. Здесь необходимо дополнительно
передавать также информацию о распределении длин серий. Если изображение
состоит из резко отличающихся по динамике областей, то может оказаться
целесообразным разбиение изображения на блоки (фрагменты).
Метод
предсказания второго порядка с переменной длиной кода при кодировании разностей
был применен для сжатия уже известного изображения
и представлен на рис. 11.4; были получены коэффициенты сжатия данных
и
.
Отметим
горизонтальные линии и ложные контуры, обусловленные методом сжатия, а также
уменьшение качества восстановления при большем коэффициенте сжатия.