7.4.3. Соотношение скорость/искажениеОдновременное измерение битовой скорости и меры PSNR в допустимом диапазоне установок квантователя позволяет сделать более аккуратный численный анализ (который, однако, не имеет прямой связи с живым визуальным восприятием), чем субъективное сравнение кодеков. В этом параграфе будет сделано такое исследование для стандартов MPEG-4 и Н.264. На рис. 7.32 и 7.33 сравнивается производительность стандартов MPEG-4 (простой профиль) и Н.264 (базовый профиль, один ссылочный кадр) для видеопоследовательностей «офис» и «травы». Отметим, что видеофрагмент «офис» лучше поддается сжатию, чем «травы» (см. предыдущий параграф), мера PSNR, вычисленная для видеоряда «офис», выше, чем для последовательности «травы». Стандарт Н.264 превосходит по производительности стандарт MPEG-4 на всех протестированных битовых скоростях, но различие графиков скорость/искажение более заметно только на последовательности «офис». Рис. 7.32. Сравнение по соотношению скорость/искажение: «офис», CIF. Рис. 7.33. Сравнение по соотношению скорость/искажение: "травы», CIF.
Рис. 7.34. Сравнение по соотношению скорость/искажение: «травы», CIF. Графики соотношения скорость/искажение для популярного тестового видеоклипа Carphone построены на рис. 7.34. На этом видеофрагменте снято умеренное перемещение объектов, и источник представлен в формате QCIF со скоростью 30 кадров/с. Сравниваются четыре серии кодирования: две — по алгоритму MPEG-4 и две — по Н.264. В первых двух сериях фрагменты кодировались простым профилем (первый кадр закодирован в виде I-объекта, а остальные — в виде Р-объектов) и расширенным простым профилем (с использованием двух В-объектов между последовательными Р-объектами, без использования других инструментов ASP) стандарта MPEG-4. А в третьей и четвертой сериях фрагменты были закодированы соответственно базовым профилем (первый кадр закодирован I-слоем, а последующие кадры — в виде Р-слоев, применялся один ссылочный кадр в моде inter и энтропийное кодирование UVLC/CAVLC) и основным профилем (первый кадр закодирован I-слоем, а последующие кадры — в виде Р-слоев с использованием пяти ссылочных кадров в прогнозе inter и энтропийного кодирования САВАС). Расширенный простой профиль MPEG-4 демонстрирует лучшие результаты, чем простой профиль MPEG-4 на высоких скоростях, а на низких скоростях это преимущество почти не заметно. Интересно, что другие инструменты расширенного простого профиля (компенсация движения с шагом в четверть пиксела и альтернативный квантователь) дают еще более слабую производительность в этих тестах. Базовый профиль Н.264 превосходит оба профиля MPEG-4 на всех протестированных скоростях, а использование кодирования САВАС вместе с несколькими ссылочными кадрами еще больше увеличивает это превосходство. Например, при PSNR в 35 дБ простой профиль MPEG-4 дает скорость порядка 125 кбит/с, простой расширенный профиль MPEG-4 — 120 кбит/с, базовый профиль Н.264 (с одним ссылочным кадром) — 80 кбит/с, а в сочетании с САВАС и пятью ссылочными кадрами он же обеспечивает меньше 70 кбит/с. Результаты тестирования видеоряда Carphone еще более убедительно свидетельствуют в пользу стандарта Н.264. Возможно, это связано с тем, что клип Carphone был снят профессиональной видеокамерой с высокой точностью воспроизведения изображений, в то время как два других видеофрагмента отсняты высококачественными любительскими видеокамерами и в них присутствовал большой посторонний шум. Другие опыты сравнения производительности. Результаты сравнения производительности простого и расширенного простого профилей MPEG-4 приведены в [35]. В этой работе показано, что инструменты расширенного простого профиля существенно улучшают степень сжатия, давая выигрыш в 30 - 40% при том же качестве видео, но с большей сложностью кодирования. Основной вклад в улучшение производительности делается за счет использования В-снимков (для этого требуется дополнительная память и задержка кодирования), применения компенсации движения с шагом в четверть пиксела и выбора оптимальной модели скорость/искажение (т.е. нахождение для каждого макроблока такой моды кодирования, которая максимизирует степень сжатия). В работе [36] вычислялась производительность Н.264 (и более старой тестовой версии стандарта), которая сравнивалась с производительностью Н.263++ (это вариант Н.263 с оптимизированными модами по производительности). В соответствии с представленными результатами стандарт Н.264 (H.26L) повсеместно превосходит Н.263++. Авторы также изучали вклад некоторых дополнительных (опционных) функций Н.264 в общую производительность. Они обнаружили, что модуль САВАС дает значительное повышение степени сжатия по сравнению с кодами VLC. уменьшая скорость в среднем на 7,7% при том же качестве изображения (хотя использованная версия тестовой модели не включала более эеффективные контекстно-адаптивные коды VLC при кодировании коэффициентов). Применение нескольких ссылочных кадров при компенсации движения обеспечивает лучшую производительность, чем использование только одного кадра (среднее улучшение составляет примерно 5,7%). Малые размеры блоков компенсации движения (до 4x4) также улучшают сжатие по сравнению с одним вектором движения на макроблок (при этом сберегается в среднем 16,4% битовой скорости), хотя большая часть этого улучшения достигается уже при размере блоков 8x8. В работе [37] сделано сравнение стандарта Н.264 с Н.263++ и с расширенным простым профилем MPEG-4 Visual. Авторы сравнивали PSNR яркости (см. гл. 2) каждого из кодеков при одних и тех же условиях тестирования. По три кодека было выбрано для представления самых высокооптимизированных версий каждого из стандартов, доступных на тот момент времени. Тестовая модель 8 стандарта H.26L (ранняя версия Н.264) превзошла Н.263++ и расширенный простой профиль MPEG-4 в среднем на 3,0 и на 2,0 дБ соответственно. Кодек H.26L достиг (огрубленно) ту же производительность на скорости 32 кбит/с, что и два других кодека на скорости 64 кбит/с (при кодировании видеоформата QCIF на скорости 10 кадров/с), т.е. в этих тестах стандарт H.26L обеспечивал такое же качестве) изображения, но при скорости передачи вдвое меньшей, чем у MPEG-4 и Н.263++. На большей битовой скорости (512 кбит/с и выше) преимущество тоже было значительным, но не столь подавляющим. Обзор кодеров с контролем ограниченной скорости и сравнение производительности Н.264 со стандартами Н.263, MPEG-2 Video) и MPEG-4 Visual приведены в [38].
|