Макеты страниц
ГЛАВА 1. СИНТЕЗ АЛГОРИТМОВ ОЦЕНИВАНИЯ ПАРАМЕТРОВ ПРОСТРАНСТВЕННЫХ ДЕФОРМАЦИЙ МНОГОМЕРНЫХ ИЗОБРАЖЕНИЙ, НАБЛЮДАЕМЫХ НА ФОНЕ ПОМЕХАнализируются модели и методы оценивания пространственно-временных деформаций последовательностей изображений. В рамках метода максимального правдоподобия проводится синтез оптимальных алгоритмов оценивания параметров межкадровых пространственных деформаций гауссовских изображений в условиях полной априорной определенности. Находится нижняя граница дисперсии погрешностей, возникающих при решении задачи оценивания параметров деформаций. Обосновывается корректность использования компенсационного подхода при оценивании межкадровых пространственных деформаций. Рассматриваются тензорные процедуры рекуррентного оценивания марковских сдвигов изображений последовательности кадров. Проводится анализ подходов к преодолению априорной неопределенности при синтезе алгоритмов оценивания пространственных деформаций последовательностей многомерных изображений и обосновывается целесообразность применения адаптивных псевдоградиентных алгоритмов. 1.1. Модели и методы оценивания параметров пространственно- временных деформаций изображенийПри оценивании параметров пространственно-временных деформаций последовательностей изображений объектом исследования является система формирования изображений, включающая в себя в общем случае исходное изображение, среду, мешающие факторы, датчик и устройство предварительной обработки изображения. Исходное изображение обычно является динамическим, то есть изменяющимся во времени. Датчик часто находится на подвижном объекте. Это приводит к тому, что получаемые с его помощью изображения различных кадров имеют взаимные сдвиги, повороты, изменения масштаба и т.п. Вклад в ПД последовательностей изображений вносят также искажения оптических трактов, нестабильность разверток считывающих устройств датчиков, дефекты их изготовления. Можно отметить также искажения, вызванные изменением оптической плотности среды, турбулентностью атмосферы и т.д. Таким образом, практически все составляющие системы формирования изображений могут вносить ПД в получаемые изображения. В некоторых случаях ПД - мешающий фактор и должны учитываться при синтезе алгоритмов обработки последовательностей изображений, например, при обнаружении сигналов. В других ситуациях ПД содержат полезную информацию, например, при оценке перемещений датчика. Модели пространственно-временных деформацийВ результате ПД изображений, одни и те же элементы сцены на разных кадрах имеют различные координаты. Геометрически эту ситуацию можно описать деформацией и движением сетки отсчетов в пространстве при неподвижной сцене или движением элементов сцены. На рис. 1.1, а изображены два положения Смещение каждого узла сетки (или, что то же самое, смещение элемента сцены в узле относительно его положения на Рис. 1.1. Примеры возможных ПД изображений двух кадров. векторное СП Другой подход к описанию межкадровых ПД состоит в следующем. Каждое положение сетки рассматривается как система координат. Тогда межкадровые деформации могут быть представлены как случайное преобразование системы координат что значительно облегчает описание. Параметризация может быть и частичной, например, когда имеется сдвиг и поворот, а также относительно небольшие составляющие ПД вызванные неизвестными факторами. В дальнейшем для простоты будем считать, что объектом исследования является последовательность кадров изображений, полученных посредством некоторого датчика и заданных на регулярной прямоугольной сетке с единичным шагом. При этом наблюдателю доступны только кадры изображений уже искаженные помехами. То есть отсчет с координатами соответствующими значению Будем также считать, что изображение Рис. 1.2. Структурная схема формирования последовательности изображений.
Методы оценивания пространственно-временных деформацийПри оценивании пространственно-временных деформаций последовательности изображений применяется, в основном, четыре подхода: сопоставление изображений (или их локальных участков), пространственно-временная фильтрация изображений, анализ оптического потока и морфологический анализ изображений. В первом подходе используется сопоставление изображений или их отдельных локальных областей. При этом многие методы [1,2,18,20,49,65,95] основаны на выделении небольшого множества признаков (яркие и темные точки или их группы, контуры, углы, перекрестья и т. д.). При переходе от кадра к кадру устанавливается соответствие между этими признаками. Например, находятся межкадровые сдвиги в нескольких точках изображения. Далее учетом физических свойств наблюдаемых объектов (например, предположения об их твердости) значения межкадровых сдвигов интерполируются на остальную часть изображения. Для применения таких методов необходимы существование и стабильность выбранных признаков, которые могут быть весьма слабо выражены или отсутствовать. Среди методов, основанных на сопоставлении изображений, отметим метод разложения на множители применяемый при восстановлении формы трехмерных объектов и характеристик движения камеры по последовательности кадров изображений. Такая задача возникает, например, в навигации и робототехнике. Нерекуррентный алгоритм, реализующий этот метод предложен в работе [108]. В [97] он обобщен для случая использования в качестве модели изображения конической проекции, учитывающей пространственные искажения за счет перспективы. На изображении выбирается характерных точек или локальных областей и оцениваются их координаты на кадрах изображений. По полученной совокупности данных восстанавливается форма объекта и траектория движения камеры. При этом форма объекта считается неизменной. Величина Другой распространенной разновидностью методов, основанных на сопоставлении изображений, являются корреляционно-экстремальные, исходной посылкой которых является предположение о высокой коррелиро- ванности характеристик изображений на последовательности кадров [69,78,83,86]. К недостаткам этих методов можно отнести большие вычислительные затраты в случае оценивания многокомпонентного вектора параметров ПД. Оценка ПД при пространственно-временной фильтрации изображений [67,80,84] достигается за счет фильтрации изображений в пространственной и временной областях. Для этого параметры фильтра подстраиваются по пространственным частотам. Этот подход требует использования информации о ПД изображений, содержащейся во всем изображении, поэтому применим, в основном, для оценки глобальных параметров деформаций, характерных для всего изображения (параллельный сдвиг, поворот и т.д.). В подходе, основанном на использовании оптического потока, рассматриваются изменения яркости в узлах сетки отсчетов, то есть векторное поле скоростей движения точек яркостей сцены или их характеристик, например, контрастности, градиента, энтропии и т.д. [1,2,4,9,19,32,34,39,44,48,53,55,75,101]. Эти изменения обычно и называют оптическим потоком. Отметим, что в ряде работ такой подход называется также градиентным [77,81,109,110]. При конической проекции трехмерного изображения на плоскость ПД, вообще говоря, неоднозначно связаны с изменением яркости в узлах сетки отсчетов. Тем не менее, как показывают исследования различных авторов [79,92,111], в большинстве приложений оптический поток достаточно полно характеризует ПД изображений последовательности кадров. При описании оптического потока обычно используются дифференциальные уравнения с частными производными. Причем яркость изображения, как правило, считается неизменной во времени. Для вычисления оптического потока применяются методы регуляризации и методы, основанные на ограничениях. При использовании методов регуляризации оценка оптического потока рассматривается как некорректная задача [62], решение которой получается за счет минимизации некоторого функционала. Ограничения на гладкость этого функционала обычно усложняют нахождение решения. Реализация этих методов часто приводит к итеративным процедурам. При этом для смежных кадров оценивается сдвиг каждой точки изображения, соответствующей узлам сетки отсчетов [77,81,94]. Например, для движущегося объекта оценивается сдвиг всех его точек, а не только контуров. Однако известен подход [78] к оцениванию оптического потока только в контурах движущихся объектов. Недостатком методов регуляризации является возможность возникновения нарушений непрерывности оцениваемых параметров ПД. Это приводит к тому, что при восстановлении изображений по оцененным параметрам на границах объектов могут возникать разрывы или "распространение" одного объекта внутрь другого. При этом величина этих дефектов зависит от числа итераций и использованных весовых коэффициентов. Кроме того, методы регуляризации во многих случаях ведут к потери части важной информации о форме объектов [72]. Методы, основанные на ограничениях, базируются на предположении, что условие неизменности яркости изображения справедливо и для некоторой другой функции В методах, основанных на ограничениях, для улучшения оценок ПД применяют предварительную фильтрацию изображений [74,110,112], увеличение локальной области исследования [76], а также фильтрацию полученных оценок [110]. Однако указанные операции приводят также к некоторым неточностям в оценке границ движущегося объекта. Компромисс между точностью оценок и вычислительными затратами достигается за счет выбора размера локальной области, в которой осуществляется фильтрация. Как правило, эта область имеет размеры от В работе [79] предложены и исследованы уравнения оптического потока, использующие характеристику его энергетической плотности и включающие слагаемые, характеризующие его рассеяние. Эти уравнения получили название уравнений расхождения области оптического потока. При этом, если рассеяние равно нулю (как, например, при параллельном сдвиге изображений), то выражения становятся идентичны уравнениям для постоянной яркости. В работе [72] показано, что если размер локальной области в многоточечных методах равен размеру области гауссовской фильтрации в методах, основанных на ограничениях, то при оценивании параллельного сдвига изображений эти методы дают примерно равную точность оценок. При наличии поворота и изменения масштаба лучшие результаты достигаются при использовании методов, основанных на ограничениях. Разновидностью метода, основанного на исследовании оптического потока, является использование локальных базисных функций [81,109] применение которых приводит к существенному уменьшению вычислительных затрат. Выбор базисных функций определяется требованиями к точности оценок сдвига и к вычислительным затратам. При наличии в изображениях высоких пространственных частот главным источником погрешностей оценок сдвига являются неточности формирования производных изображения, которые также определяются выбором базисных функций. Предложены различные базисные функции. Так, в работе [99] в качестве базисных функций исследованы линейная (с областью определения оптимальной. Меньшие вычислительные затраты достигаются при использовании частоты дискретизации вдвое превышающей частоту Найквиста. К недостатку методов, основанных на исследовании оптического потока, можно отнести большие вычислительные затраты, что делает проблематичной их реализации в системах реального времени. При сжатии видеоинформации часто используется то обстоятельство, что параметры межкадровых афинных преобразований в любой точке трехугольной или четырехугольной области могут быть определены по сдвигам соответственно трех (при билинейной интерполяции) или четырех (при перспективной интерполяции) точек изображения [68,70,89], расположенных в узлах соответствующей сетки. Использование методов, основанных на исследовании оптического потока, как уже отмечалось, может приводить к нарушениям связности сетки. Например, международные стандарты сжатия видеоинформации информация о содержании изображения доступна, то может быть использована интеллектуальная сетка, которая использует прогноз трехмерного изображения на плоскость [70]. В подходе, базирующемся на морфологическом анализе изображений [40,41], используется понятие формы изображения [40] как его максимального инварианта. Такой подход позволяет решать задачу оценивания пространственных деформаций, когда другие подходы оказываются неприменимыми, например, для случая произвольного функционального преобразования яркостей. Однако указанный подход также требует большого объема вычислений. В настоящей книге при построении алгоритмов оценивания ПД последовательностей изображений используется, в основном, подход, основанный на исследовании оптического потока. При этом особое внимание уделяется исследованию возможностей уменьшения вычислительных затрат.
|
Оглавление
|