6.2. РАСПОЗНАВАНИЕ ВИДЕООБРАЗОВ

Распознавание видеообразов уже долгое время остается популярной областью [120], привлекающей возможности самых разных областей математики, средств вычислительной техники и методов программирования. Наиболее распространенными методами распознавания изображений являются экстремально-корреляционные, статистические, структурно-лингвистические, геометрических инвариантов [2]. Прежде чем показать связь этих подходов с машинной графикой, дадим их общую краткую характеристику, определим те причины, которые задерживают методы распознавания в рамках лабораторий и оставляют проблему далекой от широкого практического применения.

Идея экстремально-корреляционного решения сводится к вычислению корреляционной функции исходного изображения и изображения эталона . Вычислительные аспекты этого процесса изучены в [42,45]. Если в исходном изображении найдется фрагмент, идентичный , то в этом месте возникнет локальный экстремум. Все поле корреляционной функции подвергают высокочастотной фильтрации для подавления шумов, размытых пиков и пороговым методом селектируют положение эталонного объекта. Недостатками экстремально-корреляционного метода являются высокая чувствительность к несовпадению масштаба, ориентации, яркости и значительный объем вычислений. Последний недостаток преодолевают путем параллельных вычислений на множестве специализированных микропроцессоров, достигая высокой скорости из-за потери универсальности вычислителя. Метод может давать "ложные тревоги" в случае отсутствия поискового объекта в исходном изображении, и, кроме того, имеется субъективизм в выборе порога, вида высокочастотного фильтра и некоторых других параметров. Положительной чертой метода является то, что он работает непосредственно с изображением, а не с производными признаками.

Статистические методы [55] основываются на идее сходства некоторых статистических характеристик (математического ожидания, дисперсии, моментов высшего порядка, гистограмм ...) изображения эталона и их проявлений на анализируемом изображении. Такой подход пригоден для решения задачи распознавания после того, как объект обнаружен, что само по себе остается проблемой. Кроме того, метод анализирует лишь часть содержащейся на изображении информации, игнорируя такие важные характеристики, как форма и структура. Метод оперирует небольшим числом сравнительно просто вычисляемых признаков, что делает его пригодным в частных случаях.

Сущность структурных методов заключается в выделении на распознаваемом и эталонном изображениях некоторых признаков и их связей, кодировании признаков и связей на формальном языке и решении задачи идентичности семантических образов эталона и анализируемого изображения. В качестве признаков, например, могут использоваться фрагменты контурной линии изображения объекта, такие как прямые и дуги определенных направлений. Описываемый подход инвариантен к масштабу, повороту, яркости, однако сам процесс извлечения признаков из изображения остается проблемным и обычно решается субъективным вмешательством.

Метод геометрических инвариантов оперирует такими признаками изображения, как площадь фигуры и площадь выпуклой оболочки, длина периметра, величины углов смежных контурных линий, и их соотношениями в различных сочетаниях. Для выделения этих признаков эталон и анализируемое изображение подвергают бинаризации. Метод может быть применен только в частных случаях.

Все перечисленные методы объединяет общая идея сравнения эталонного и анализируемого изображений непосредственно или через вторичные признаки. Вне зависимости от метода качество сравнения в сильной степени зависит от идентичности условий освещения и наблюдения анализируемого и эталонного изображений.