11.3. Дискретные преобразования изображений в сжатии данных

Основная идея излагаемого подхода состоит в представлении данных изображения коэффициентами их дискретного преобразования (трансформантами). Коэффициенты преобразования упорядочиваются в соответствии с их важностью, например в соответствии с вкладом в информационное содержание, так что трансформанты с небольшим информационным содержанием можно опустить (отбросить). Оставшиеся трансформанты квантуются, кодируются и передаются или запоминаются. Важность коэффициентов можно сопоставлять, например, визуально (субъективно), в соответствии с их вкладом в яркостную картину восстанавливаемого изображения на дисплее; тем самым можно обойти вопрос корреляции элементов изображения и оценить результат сжатия. Отличной считается архивация, при которой невозможно на глаз различить первоначальное и разархивированное (восстановленное) изображения, хорошей - когда различие видно лишь для рядом находящихся отмеченных изображений. При дальнейшем увеличении степени сжатия, как правило, становятся заметны побочные эффекты, характерные для применяемого алгоритма сжатия.

Наиболее известным преобразованием, устраняющим корреляцию, является преобразование Карунена-Лоэва, привлекающее собственные векторы ковариационной матрицы наблюдаемых данных (элементов изображения). Представим -матрицу изображения в виде вектора , путем «лексикографического» упорядочения (по столбцам) элементов изображения .

Пусть - ковариационная матрица исходных данных , а — матрица, составленная из собственных векторов .

Преобразование , где — центрированный вектор (изображение), переводит исходные данные в множество некоррелированных переменных. При восстановлении изображения исходят из частичного разложения Карунена-Лоэва путем идентификации собственных векторов, соответствующих наибольшим собственным значениям (выделение «главных компонент» ). Пусть — подматрица, составленная из собственных векторов, соответствующих максимальным собственным числам. Преобразование к главным компонентам имеет вид линейного преобразования . Это преобразование выделяет малоразмерное подпространство, соответствующее в базисе Карунена-Лоэва максимальным собственным значениям. Стратегия сжатия основывается здесь на привлечении трансформированных переменных с большой дисперсией (высоким информационным содержанием) и представлении изображения только этими трансформантами [11.5, гл.23.2].

Преобразование Карунена-Лоэва - единственное преобразование, гарантирующее некоррелированность сжимаемых данных, и поэтому результат их сжатия является оптимальным в статистическом смысле. Однако базисные векторы зависят от ковариационной матрицы ансамбля исходных изображений (в общем-то, неизвестной), что существенно затрудняет практическую (программную) реализацию. Поэтому преобразование Карунена-Лоэва используется лишь как ориентир при осуществлении других преобразований. Здесь можно отметить широко известные дискретные преобразования Фурье, Адамара, Уолша, косинус- и синус-преобразования, имеющие к тому же быстрые схемы реализации с вычислительной сложностью порядка . Если изображение сжимается применением дискретного преобразования, то оно обычно разбивается на блоки размером 8x8 или 16x16 пикселов для ускорения вычислений, поскольку тогда каждый блок преобразуется и обрабатывается отдельно. Понятно, что здесь не учитывается корреляция между блоками изображения, хотя эта корреляция может оказаться серьезным источником информационной избыточности итогового сжатия. Новым подходом, позволяющим снизить межблочную избыточность и фрагментарность преобразования, является рекурсивное блочное кодирование [11.4]. Приобретают популярность также различные виды дискретного вейвлет-преобразования (ДВП) [11.6].

Большая (чем у других) сравнительная близость косинус-преобразования к преобразованию Карунена-Лоэва, является одной из причин его популярности. Возможности сжатия с применением дискретного косинус-преобразования (ДКП) показаны па рис. 11.2.

Рис. 11.2. Сжатие изображения с применением ДКП (источник – [11.4]): а - восстановленное изображение, коэффициент сжатия 4.2, б - разностное изображение - разности между яркостями исходного и восстановленного изображений; в - восстановленное изображение, коэффициент сжатия 5.6, г - разностное изображение между исходным и восстановленным изображениями

ДКП в данном случае обеспечивает неплохое сжатие с небольшими вычислительными затратами, коэффициенты сжатия в представленных двух вариантах обработки равны и . (В двумерном случае прямое дискретное косинус преобразование имеет вид

Данное преобразование используется в JPEG — кодировке изображений.)

Отметим здесь, что разбиение на блоки с последующим ДКП-сжатием приводит к снижению качества восстановленного изображения при больших коэффициентах сжатия. Следовательно, сжатие изображений посредством дискретного вейвлет-преобразования заслуживает определенного внимания, поскольку оно может быть эффективно применено к целому изображению и при нем не будут присутствовать артефакты блочного разбиения [11.4].

Вейвлет-сжатие сводится к тем же этапам обработки, что и ДКП: преобразование, квантование и кодирование ДВП-трансформант. Рис. 11.3 демонстрирует восстановленные изображения с привлечением ДВП-сжатия при двух различных коэффициентах сжатия: и . Первый уровень сжатия (рис. 11.3 а, б) был достигнут обнулением 82.0 % коэффициентов ДВП, второй (больший) уровень сжатия (рис. 11.3, в, г) достигнут обнулением 87.6 % коэффициентов ДВП. Отметим отсутствие артефакта разбиения на блоки.

Вейвлеты основываются на какой-либо базисной функции , называемой материнской функцией или анализирующим вейвлетом. Из нее выстраивается вейвлет-базис в виде

Здесь масштабный множитель (степень 2) характеризует «ширину» соответствующего вейвлета, а целочисленная переменная — его «местоположение» на оси координат. Очевидно, что ключевым моментом в применениях является выбор материнской функции; простейшим примером является функция Хаара:

Вследствие локализованности базисных функций и по пространству и по частоте вейвлет-преобразование лучше приспособлено к анализу данных на разных масштабах (или при различном разрешении) и дает более компактное представление сигнала, нежели Фурье- или косинус-преобразования.

Рис. 11.3. Сжатие изображения с применением ДВП [12.4]: а - восстановленное изображение, коэффициент сжатия 4.2; в - разностное изображение - разности между яркостями исходного и восстановленного изображений; в - восстановленное изображение, коэффициент сжатия 5.6; г - разностное изображение между исходным и восстановленным изображениями