ГЛАВА 1. ВВЕДЕНИЕ1.1. СценаСцена первая: ваше цифровое воплощение (реалистичная трехмерная модель, похожая на вас и с вашим голосом) гуляет по изощренным виртуальным мирам, населенным такими же цифровыми воплощениями. Эти миры наполнены рекламой различных продуктов. На стенах домов демонстрируется видео. На одном виртуальном экране вы видите передачу новостей по вашему любимому телеканалу. Вам захотелось узнать подробнее о текущей финансовой ситуации, и вы запрашиваете дополнительные анимированные графики и таблицы, отражающие состояние рынка акций. На другом экране вы вызываете на видеоконференцию трех своих друзей. Видеоизображения участников конференции четко вырисовываются на фоне других виртуальных видеообразов. Сцена вторая: зазвонил ваш новый ЗG-видеофон; вы легко откидываете защитную крышку и отвечаете на звонок. На экране видеофона появляется лицо вашего знакомого, и вы приветствуете друг друга. Каждый из вас видит маленький четкий образ собеседника вместо надоевшей черно-белой заставки, присущей старым моделям мобильных телефонов. После телефонного звонка вы принимаете видеокадры с футбольного матча в реальном времени. Качество передачи при стандартной битовой скорости не очень высокое, поэтому вы переключаетесь на более высокую (и более дорогую) скорость передачи канала «премиум». Неожиданно начинает вмешиваться посторонний радиосигнал, но вы замечаете лишь временные слабые помехи на вашем видеоэкране. Эти два воображаемых сценария иллюстрируют различные точки зрения на мультимедийные приложения следующего поколения. Первый взгляд относится к стандарту MPEG-4 Visual: богатый интерактивный онлайновый мир, в котором сливаются реальные видеосцены и искусственные, сымитированные двухмерные и трехмерные образы и объекты. Второй взгляд относится к стандарту H.264/AVC, обеспечивающему высокоэффективную и надежную видеосвязь, поддерживающую двухсторонние, потоковые и широковещательные приложения и устойчивую к широкому спектру помех и искажений, свойственных многим реальным каналам передачи данных. Перед вами два стандарта, обладающих своими преимуществами и недостатками. Каждый имеет сторонников и критиков. Между ними объявлено состязание на роль стандарта видеосжатия в коммуникационных приложениях следующего поколения. Включите телевизор и пройдитесь по десяткам и сотням цифровых каналов. Посмотрите ваши любимые видеофильмы по DVD- видеоплееру и погрустите о старомодных VHS-кассетах, которые вы теперь можете выбросить. Настройтесь на иностранную телепередачу в Интернете (которая все еще демонстрируется в окне, имеющем формат почтовой марки, но выбор и надежность потокового видео растет с каждым днем). Войдите в чат с вашими друзьями, близкими и родственниками с помощью РС-видеофона. Все эти действия стали привычными и рутинными для вас. которые, однако, означают, что цифровое видео находится на правильном пути, чтобы стать повсеместным и существенным компонентом в индустрии развлечения, а также в широковещательных и коммуникационных сферах нашего общества. Всеобъемлющее, цельное и высококачественное видео было целью компаний, исследователей и разработчиков видеостандартов в течение последних двух десятилетий. В некоторых сферах (например, в широковещательном телевидении и в хранении видеоданных) цифровое видео полностью захватило рынок, а в некоторых областях (например, видеоконференции, видеопочта, мобильное видео) еще рано судить о возможном рыночном успехе. Тем не менее всем ясно, что цифровое видео является очень важной отраслью информационной индустрии, которая продолжит свое распространение в бизнесе, в сетевых областях и в наших домах. Непрерывное развитие видеоиндустрии вызвано мощными коммерческими и технологическими силами. Коммерческое воздействие приходит от осознания потенциально громадного дохода, которое побуждает потребителей и бизнесменов заменять аналоговые и старые цифровые технологии на более новые, эффективные и высококачественные цифровые видеопродукты и осваивать новые развлекательные и коммуникационные технологии, которые рождаются с приходом новых цифровых видеопродуктов. Техническое воздействие основано на непрерывном росте производительности вычислительной и процессорной техники, на увеличении емкости систем хранения данных, на возрастании скоростей передачи данных, а также на прогрессе технологии обработки изображений и видео. Передача цифрового видео от источника (видеокамера или записанный видеоролик) к получателю (видеодисплей) вовлекает в работу целую цепь различных компонентов и процессов. Ключевыми звеньями этой цепи являются процессы компрессии (кодирования) и декомпрессии (декодирования), при которых «сырой» частотоемкий цифровой видеосигнал сокращается до размеров, подходящих для его дальнейшей передачи или хранения, а затем восстанавливается для отображения на видеоэкране. «Правильная» разработка процессов компрессии и декомпрессии может дать существенное коммерческое и техническое преимущество продукта, обеспечив лучшее качество видеоизображения, большую надежность и/или гибкую приспособляемость по сравнению с конкурирующими решениями. Таким образом, имеется живая заинтересованность в развитии и улучшении методов и систем компрессии и декомпрессии видео. Заинтересованные стороны включают развлекательные, вещательные и коммуникационные компании, многочисленных разработчиков компьютерного хардвера и софтвера, исследователей и держателей потенциально прибыльных патентов на новые алгоритмы сжатия. Недавние успехи цифровой видеоиндустрии (прежде всего широковещательного цифрового телевидения и DVD-видео) базировались на международном стандарте ISO/IEC 13818 [1], широко известном под аббревиатурой MPEG-2 (назван так по имени рабочей группы экспертов по движущимся изображениям, разработавшей этот стандарт Moving Picture Experts Group). Предвосхищение насущной необходимости лучшего сжатия породило разработку дальнейших стандартов видеосжатия, известных под наименованиями ISO/IEC 14496 Part 2 («MPEG-4 Visual» ) [2] и Рекомендация организации ITU-E H.264/ISO/IEC 144496 Part 10 (сокращенно Н.264). Стандарты MPEG-4 Visual и Н.264 имеют общее происхождение и многие схожие черты (оба были разработаны на основе более ранних стандартов сжатия). Однако они развивают старые стандарты в существенно различных направлениях. Стандарт MPEG-4 Visual удаляется от прямоугольного видеокадра, предлагает открытый и гибкий взгляд на визуальные коммуникации и использует высоко эффективное видеосжатие и объектно-ориентированную обработку данных. Стандарт Н.264 имеет более прагматический взгляд. Он стремится выполнять те же действия, что и предыдущие стандарты (обеспечивая механизм для сжатия прямоугольных видеокадров), но с большей эффективностью и устойчивостью, обеспечивая совместимость со всеми широко распространенными типами приложений (такими как широкое телевещание, хранение визуальной информации и передача потокового видео). В настоящее время ведутся оживленные дебаты о том, какой из этих двух стандартов (а может, какой-нибудь другой) будет доминировать на видеорынке. Стандарт MPEG-4 Visual является более зрелым продуктом. Его первая редакция была опубликована в 1999 году, а Н.264 был объявлен международным стандартом/рекомендацией только в 2003 году. Нет сомнения в том, что стандарт Н.264 превосходит MPEG-4 Visual по части эффективности сжатия, но в нем нет такой гибкости. Ситуация с лицензированием MPEG-4 Visual ясна (и не очень популярна в некоторых индустриальных кругах), но цена лицензирования Н.264 остается договорной. Эта книга посвящена этим двум новым стандартам. В ней освещаются методы, лежащие в основе этих систем, излагаются ключевые аспекты алгоритмов, а также описываются технические детали этих стандартов, т.е. все те факторы, которые, я надеюсь, позволят ответить на вопрос: MPEG-4 Visual или Н.264?
|