КЛАССИФИКАЦИЯ АЭРОКОСМИЧЕСКИХ ИЗОБРАЖЕНИЙ ПРИ РАЗЛИЧНОМ УРОВНЕ АПРИОРНОЙ ИНФОРМАЦИИ

УДК 621.391.2
В.В.Балабанов

КЛАССИФИКАЦИЯ АЭРОКОСМИЧЕСКИХ ИЗОБРАЖЕНИЙ ПРИ РАЗЛИЧНОМ УРОВНЕ АПРИОРНОЙ ИНФОРМАЦИИ

При обработке многозональных аэрокосмических изображений, полученных от разных датчиков при дистанционном зондировании Земли, одной из важнейших процедур является классификация (выделение типов земных покровов). В силу различных факторов (форма рельефа, изменчивость волнения и поля приводного ветра в районе акваторий, возраст льдов, наличие облачности» характер почв и растительности) регистрируемые приборами значения отраженной и собственной радиации носят случайный характер [1-3].

Цель работы - рассмотреть особенности статистической методики классификации аэрокосмических изображений, описываемых многомерной смесью гауссовских распределений, при различном уровне априорной информации о классификации аэрокосмических изображений, описываемых многомерной смесью гауссовских распределений, при различном уровне априорной информации о классифицируемых объектах.

Полученное в результате дистанционного зондирования изображение является совокупностью массивов данных , , , которые образованы в результате пространственной дискретизации изображений, поступивших от различных датчиков. Будем полагать, что массивы данных, отображающие одну и ту же область , пространственно совмещены и элемент с номером каждого кадра относится к одному и тому же участку поверхности Земли. При этом элемент многозонального изображения представлен M-мерным вектором признаков , а совокупность из N элементов, входящих в область , обозначим .

При отсутствии априорных сведений об изображении должен быть использован режим автоматической классификации. В прикладной статистике этот режим соответствует параметрическому самообучению и расщеплению смеси вероятностных распределений [4,5]:

, (1)

где - плотность вероятности, принадлежащая к параметрическому семейству функций заданного вида; – априорные вероятности (веса) компонентов-распределений; - набор параметров класса ; - число классов (однородных фрагментов на изображении).

При этом, как параметры , , так и число классов , должны быть оценены по самому изображению . Известно [4,5], что в режиме автоматической классификации плотность должна быть одномодальной, а условию различимости конечной смеси (1) подчиняется ограниченное число распределений, в частности, многомерное нормальное:

. (2)

Вычислительные аспекты оценивания параметров (2): математических ожиданий обратных, ковариационных матриц весовых коэффициентов , а также количества классов рассмотрены в [6]. Особенность процедур оценивания состоит в рациональном выборе начальных приближений оцениваемых методом максимального правдоподобия параметров , благодаря чему обеспечивается сравнительно быстрая сходимость итерационного процесса, а также в использовании аппарата информационной матрицы Фишера при выборе числа гауссовских компонентов в (2). Компонент считается незначимым, если вычисляемая ошибка оценивания весового множителя превышает саму : , где - значение порога. Число классов, на которые может быть разбито многозональное изображение, определяется как наибольшее число значимых компонентов в (2), полученных при последовательном увеличении .

Полученные оценки используются в качестве параметров в выражении (2), при этом каждому классу на изображении соответствует один из компонентов смеси. Оценка вероятности принадлежности элемента s-му классу определяется по формуле Байеса:

, (3)

где , а . После подсчета для всех принимается решение об отнесении элемента к тому классу, для которого обеспечивается и это значение , где - значение порога (например 0,7). При невыполнении последнего условия элемент относился к -му классу, что означает отказ от классификации.

В режиме классификации с обучением предполагается наличие обучающих выборок , по каждому из классов, составляющих изображение . В отличие от режима автоматической классификации каждый класс может быть представлен многокомпонентной плотностью распределения, причём число компонентов может быть оценено не только из условия их значимости, но и как результат максимизации функционала качества, вычисляемого по обучающим выбор кам.

Формула Байеса для оценки прогнозной вероятности принимает вид:

(4)

где , - априорные вероятности классов, которые пропорциональны объемам обучающих выборок; - число компонентов смеси для представления класса .

Для повышения достоверности классификации элементов изображения предложено использовать нижнюю доверительную границу прогнозной вероятности [б]:

, (5)

где - среднеквадратическая ошибка вычисления прогнозной вероятности, полученная с помощью аппарата матрицы Фишера; - коэффициент учета ошибки вычисления .

Привлечение для классификации оценок (5) вместо (4) результаты классификации для всех участков изображения независимо от использования отдельных фрагментов изображения в качестве обучающих участков, «этим исключается эффект приспособления к обучающей выборке имеются только для заданных классов. На первом этапе оцениваются две группы параметров ; для заданных классов по обучающим выборкам и для всего изображения по . Оценки прогнозных вероятностей находятся в предположении непротиворечивости гипотез о принадлежности элемента изображения заданным классам и всему изображению:

, (6)

где - априорная вероятность заданного класса, пропорциональна объемам обучающих выборок: р. По существу режим с частичным обучением соответствует выделению на изображении элементов, принадлежащих заданным классам.

Поскольку чаще всего невозможно сопоставить результаты дистанционного зондирования и параллельных контактных наблюдений из-за отсутствия последних, важно получить количественные оценки достоверности проведенной классификации. При полном и частичном обучении функционал качества предложено [6] определять как средне взвешенное значение оценок нижней доверительной границы (5) по всем элементам обучающих фрагментов , :

где - цена ошибки классификации элемента класса ; - количество элементов в обучающем фрагменте класса .

При автоматической классификации в качестве целевой функции используется четкость разбиения изображения на классы:

(8)

По функционалу качества может быть проведен выбор числа компонентов для представления заданных классов при классификации с обучением и выбор количества классов при автоматической классификации. При этом максимальные значения функционалов (7) И (8) соответствуют оптимальному числу компонентов при описании заданных классов и наилучшему выбору числа классов.

Актуальным представляется формализация процедуры отбора информативного набора признаков из числа кадров многозонального изображения и сформированных текстурных изображений. Осуществление перебора и сопоставление каждый раз значений функционалов (7) или (8) является трудоемким в вычислительном отношении. Удобно для отбора признаков использовать межклассовое расстояние Бхатачария [7], которое может быть вычислено между k и n компонентами распределения (2) на основе оценок параметров распределений, полученных в режиме автоматической классификации:

, (9)

где - определитель матрицы. Последовательно добавляя текстурные признаки можно оценить, насколько добавление того или иного признака увеличивает , .

Поскольку определяет верхнюю границу ошибки классификации между классами и : , то по совокупности всех расстояний Бхатачария можно оценить и верхнюю границу общей ошибки классификации в режиме автоматической классификации:

. (10)

Наиболее информативные признаки обеспечивают минимальное значение .

На рис. 1,а приведено радиоизображение размером 471x297 элементов, полученное с помощью самолетного радиолокатора бокового обзора. Применение описанной методики позволяет успешно решить задачу классификаций, используя разные режимы.

При малом числе кадров многозонального изображения желательно формирование текстурных признаков. Особенно это целесообразно для изображений, полученных от радиолокатора с синтезированной апертурой. Из числа сформированных текстурных изображений должны быть отобраны наиболее информативные. Для этого к исходному поочередно добавляются текстурные изображения и каждый раз в режиме самообучения производится оценивание параметров компонентов-распределений смеси (2), Число классов, на которое проводится расщепление смеси, задается минимальным, исходя из предполагаемой структуры ландшафта. По оценкам параметров вычисляются расстояния Бхатачария (9), а по ним отбираются изображения, обеспечивающие наименьшее значение (10).

Для рассматриваемого изображения при (предполагаемые типы поверхности: вода, лед, суша) информативность текстур упорядочилась в порядке убывания следующим Образом: среднеквадратичное отклонение (скользящее окно 9x9), медианная фильтрация (5x5), среднее (5x5), экспоненциальный показатель корреляции (9x9). Причем учет последнего текстурного изображения приводил к заметному ухудшению результатов классификации и потому был исключен из рассмотрения.

При глобальной классификации изображения общее число признаков целесообразно ограничить до . Важнейшая функция режима автоматической классификации - определение числа классов. Для этого, последовательно увеличивая число компонентов , каждый раз осуществляют проверку их значимости. Наибольшее число значимых компонентов соответствует максимальному числу классов на изображении. Оценивание числа классов можно проводить и на основе функционала (8). Появление незначимого компонента приводит к его уменьшению.

На рис. 1,6 приведен результат автоматической классификации для (исходное изображение и скользящее среднее) и . Видно, что к предполагаемым трем классам добавился еще один. Класс, соответствующий льду, был разбит на 2 компонента. Максимальное число классов, на которые может Раз6ит° Сражение рис. 1,а равно 5, причем вес составляет менее 0,01. При добавлении третьего признака результаты классификации практически сохраняются, но суда на поверхности воды относятся к -му классу (аномалия). Для сходимости итерационного процесса при оценивании параметров методом максимального правдоподобия потребовалось 25 итераций. Установлено, что при сопоставлении результатов классификации после 10-й и 25-й итерации изменения коснулись не более 5% элементов изображения.

Режим классификации с обучением целесообразно применить после режима автоматической классификации. Каждый класс при этом может объединять любое число компонентов, выявленных в режиме автоматической классификации. Достоверность классификации, оцениваемая функционалом (7), в этом режиме повышается. После этапа оценивания параметров заданных классов, оценки, соответствующие, рассматриваемому изображению, могут использоваться на этапе классификации изображений, полученных для других участков поверхности Земли. Отличительное свойство методики состоит в том, что фрагменты изображения, по которым обучение не проводилось, будут отнесены к новым классам, объединенным в -й класс. Для этого классификация проводится с учетом не только оценок прогнозных вероятностей (4), но и нижних доверительных границ (5). Причем вклад оценок (5) в принятие решения об отнесении элементов изображения к -му классу является основным.

В режиме с частичным обучением необходимо задать число компонентов смеси (2) для описания областей как заданных классов , так и области всего изображения , куда входят и . В этом режиме новые фрагменты изображения относятся к -му классу достовернее, чем в режиме с полным обучением. Это объясняется видом выражения для оценки прогнозной вероятности (6), где в знаменателе присутствует оценка плотности для . Однако при этом достоверность классификации элементов заданных классов несколько хуже по сравнению с полным обучением.

Интересная особенность режима с частичным обучением состоит в том, что независимо от структурной сложности заданных классов удовлетворительные результаты могут быть получены при небольшом числе компонентов. На рис. 1,в представлены результаты выделения объединенной области вода-лед когда для описания и заданного класса, и всего изображения используется по одному компоненту. Результаты классификации улучшаются (исчезают точки в области вода-лед) при увеличении числа компонентов до двух.

а.

б.

в.

Рис. 1

Проведенные эксперименты по классификации аэрокосмических изображений подтвердили эффективность модели смеси гауссовских распределений (2) для статистического описания реальных многозональных изображений и конструктивность представленной методики для автоматизации процедуры классификации при разных уровнях априорной информации о классах.