Читать в оригинале

<< ПредыдущаяОглавлениеСледующая >>


5.2.3. Видеообъекты

Одной из ключевых новаций стандарта MPEG-4 Visual стал отход от традиционного представления о видеоданных как о последовательности прямоугольных видеокадров. Вместо этого MPEG-4 Visual трактует видеопоследовательность как семейство, состоящее из одного или нескольких видеообъектов. MPEG-4 Visual определяет видеообъект как «пластичную сущность, доступную пользователю, к которой он может обращаться, наблюдать и манипулировать (вырезать и вставлять)» [1]. Видеообъект (VO, video object) - это некоторая область видеосцены, которая может заполнять район произвольной формы и которая может существовать вполне определенное время. Реализация или значение VO в некоторый момент времени называется плоскостью видеообъекта (VOP, video object plane).

Это определение расширяет традиционный подход к кодированию полного кадра, в котором VOP — это единичный кадр видеоряда, а последовательность кадров образует VO (например, на рис. 5.2 показан VO, состоящий из трех прямоугольных VOP). Однако введение концепции VO позволяет рассматривать более общие объекты для видеокодирования. На рис. 5.3 показан VO, состоящий из трех VOP нерегулярной формы. Каждый ил них существует в данном кадре и каждый закодировал независимо от других (с помощью объектно-ориентированного кодирования).

Рис. 5.2. Видеообъект (VO) и плоскости видеообъектов (VOP) (прямоугольная форма).

Рис. 5.3. Видеообъект (VO) и плоскости видеообъектов (VOP) (произвольная форма).

Видеосцена (см., например, рис. 5.4) может быть составлена из заднего плана (объект V03 в этом примере) и из нескольких выделенных объектов на переднем плане (V01 и V02). Такой подход является более гибким по сравнению с жестко фиксированными структурами прямоугольных кадров ранних стандартов. Разделенные объекты можно кодировать с различным визуальным качеством и временным разрешением, отражающим их «важность" для конечной сцены. Объекты из разных источников (включая «синтетические» и «природные» объекты) можно помещать в одну видеосцену, причем композиция и поведение объектов этой сцены могут контролироваться конечным пользователем в интерактивных приложениях. На рис. 5.5 показана новая видеосцена, сформированная с помощью объекта VO1 из рис. 5.4, нового объекта VO2 и нового заднего плана VO. Каждый объект можно кодировать независимо в стандарте MPEG-4 Visual (композиция визуальных и аудиообъектов делается отдельно, например с помощью MPEG-4 Systems [2]).

Рис. 5.4. Видеосцена из трех VO.

Рис. 5.5. Видеосцена, составленная из VO разных источников.

 



<< ПредыдущаяОглавлениеСледующая >>