Читать в оригинале

<< Предыдущая Оглавление Следующая >>


18.5. СЕГМЕНТАЦИЯ ПО ЯРКОСТИ

Сегментация изображения представляет собой разделение или разбиение изображения на области по сходству свойств их точек. Наиболее часто сегментацию проводят по яркости для одноцветного изображения и цветовым координатам для цветного изображения. В разд. 18.6 рассматривается сегментация, основанная на контурах; в разд. 18.7 описывается сегментация, при которой в качестве разделительного признака используется текстура, а разд. 18.8 посвящен сегментации по форме. Принятое здесь определение сегментации сильно ограничено: при сегментации не учитывается информация, характеризующая объекты в целом. Кроме того, в процессе сегментации производится лишь подразделение изображения, не делается попытки распознать отдельные сегменты, установить взаимные соотношения между ними и пометить их соответствующими символами. Этим важным этапам работы системы распознавания изображений посвящена гл. 20.

18.5.1. ПОРОГОВОЕ ОГРАНИЧЕНИЕ ПО ЯРКОСТИ

Многие изображения можно охарактеризовать тем, что они содержат некоторый интересующий нас объект достаточно однородной яркости на фоне другой яркости. Типичными примерами могут служить машинописные и рукописные тексты, медицинские пробы под микроскопом, самолеты на взлетной полосе. Для таких изображений яркость служит отличительным признаком, который можно использовать для локализации объекта. Если интересующий нас объект имеет белый цвет и расположен на черном фоне или наоборот, то определение точек объекта представляет собой тривиальную задачу установления порога по средней яркости. На практике, однако, встречаются определенные трудности, например когда наблюдаемое изображение подвержено воздействию шума и причем как на объекте, так и на фоне допускается некоторый разброс значений яркости. Другая часто встречающаяся трудность состоит в том, что фон может быть неоднородным.

Рис. 18.5.1. Примеры сегментации машинописного текста методом порогового ограничения по яркости: а - многоградационное изображение: б - гистограмма распределения яркости; в - гистограмма распределения яркости пограничных точек, выделенных оператором Лапласа; г - ограничение высоким порогом, ; д - ограничение средним порогом. ; е – ограничение низким порогом, .

На рис. 18.5.1, а приведена фотография представленного в цифровой форме машинописного текста, состоящего из темных букв па светлом фоне. На рис. 18.5.1, б показана гистограмма распределения яркости этого текста. Ожидаемая бимодальность гистограммы скрыта из-за относительно большого процента элементов фона. На рис. 18.5.1, г, е показан текст, выведенный на дисплей при разных порогах, причем всем точкам с яркостью выше порога соответствует уровень яркости, равный 255, а остальным точкам с яркостью ниже порога поставлен в соответствие нулевой уровень яркости. Эти фотографии иллюстрируют общую проблему, связанную с пороговым ограничением изображения. Если порог установить слишком низким, то отдельные части букв исчезнут (разорвана ножка буквы «р»). Наоборот, если порог установить слишком высоким, то в результате на объектах возникнут побочные детали (заполняется петелька буквы «е»). Наилучший компромисс обычно определяется экспериментальным путем. На рис. 18.5.2 приведен пример порогового ограничения по яркости многоградационного изображения, содержащего единственный значительный объект на нейтральном фоне.

Известно несколько аналитических подходов к пороговому ограничению по яркости. Один из методов состоит в установлении порога на таком уровне, при котором общая сумма элементов с подпороговой яркостью согласована с априорными вероятностями этих значений яркости [38]. Например, может быть известно, что черные знаки занимают 25% общей площади машинописной страницы. Тогда пороговый уровень для такого изображения необходимо установить таким, чтобы яркость четверти элементов была ниже порога. Другой подход к пороговому ограничению по яркости состоит в выборе порога, соответствующего минимуму бимодальной гистограммы, находящемуся между двумя ее пиками [39]. Определение этого минимального значения часто затруднено вследствие ступенчатости гистограммы. Поэтому участок гистограммы между пиками аппроксимируется некоторой аналитической функцией и находится ее минимум путем вычисления производных.

Например, пусть  и  - соответственно оси абсцисс и ординат на гистограмме. Тогда кривая второго порядка

,                                          (18.5.1)

где ,  и  - константы, обеспечивает простую аппроксимацию гистограммы в районе ее «долины». Минимум гистограммы наблюдается при .

Рис. 18.5.2. Пример сегментации изображения «Танк» методом порогового ограничения по яркости.

Для определения порога яркости Уэшка, Нэгел и Розенфельд [40] предложили использовать оператор Лапласа. Для непрерывного изображения  оператор Лапласа

            (18.5.2)

дает значения вторых частных производных этой функции по направлениям координатных осей. Рассмотрим область изображения в районе объекта, где яркость увеличивается с уровня низкого «плато» до уровня более высокого «плато», соединенных наклонной поверхностью. На плоских участках лапласиан равен нулю, а вдоль наклонной поверхности - почти нулю. В области перехода от низкого «плато» лапласиан будет иметь большое положительное значение, а при переходе к высокому «плато» - большое отрицательное значение. Гистограмма, построенная с использованием лишь точек исходного изображения, которые соответствуют очень высоким или очень низким значениям лапласиана, оказывается бимодальной с отчетливой «долиной» между пиками. Определению порога яркости могут помочь и другие процедуры выделения перепадов, которые были рассмотрены в гл. 17.

Рис. 18.5.3. Пример сегментации изображения «Танк» методом поперечных сечений профиля яркости: а - гистограмма по строкам; б - исходное изображение; в - сегментация; г - гистограмма по столбцам.

Если фон на изображении неоднороден, то необходимо сделать так, чтобы порог по яркости адаптировался к ее среднему уровню [41, 42]. Это можно выполнить, разбивая изображения на маленькие фрагменты и устанавливая свои пороги для каждого фрагмента. Пороги для каждого элемента изображения можно затем определить путем интерполяции между центрами фрагментов.

Области изображения иногда можно выделить путем усреднения поперечных сечений профиля яркости изображения [43,44]. Горизонтальные и вертикальные поперечные сечения определяются следующим образом:

,                      (18.5.3)

.                       (18.5.4)

Рис. 18.5.3 иллюстрирует применение метода сегментации по поперечным сечениям профиля яркости для определения размеров объекта на поле с достаточно однородным фоном.

Эффективную сегментацию можно выполнить для некоторых классов изображений с помощью рекуррентного метода порогового ограничения по яркости, который предложили Томита, Ясида и Цудзи [45]. На первом этапе выполняется пороговое ограничение изображения путем нахождения минимального значения между модами гистограммы яркости для того, чтобы отделить более яркие области от более темных. Затем формируются гистограммы для каждой сегментированной части. Если эти гистограммы неунимодальны, то полученные сегменты можно снова подвергнуть пороговому ограничению. Процесс продолжается до тех пор, пока гистограммы для всех сегментов не станут унимодальными или же не будет достигнут некоторый желаемый уровень сегментации.

 



<< Предыдущая Оглавление Следующая >>