Читать в оригинале

<< Предыдущая Оглавление Следующая >>


7.3.1. Распределение Гиббса и его применение к описанию случайных дискретных сигналов и изображений

Сразу отметим, что распределение Гиббса на самом деле представляет собой широкий класс распределений, объединяемых некоторыми общими фундаментальными чертами. По своей сути РГ может быть применено для описания дискретных сигналов и изображений. При решении статистических задач обработки сигналов или изображений одно из центральных мест принадлежит проблеме представления многомерного (совместного) распределения вероятностей всех отсчетов полезного сигнала и наблюдаемых  данных.   Особая трудность связана с заданием взаимозависимости элементов в этом многомерном распределении. Распределение Гиббса при решении этой проблемы опирается на геометрическое понятие клик и понятие потенциалов взаимодействия значений сигнала на этих кликах. Поясним их на примере случайного поля.

Элемент двумерного сигнала (изображения)  в точке кадра с координатами  связан (взаимодействует) с другими элементами, что обусловливает их вероятностную взаимозависимость. Взаимодействия могут включать два и более элемента изображения, в первом случае взаимодействия называются парными. Вокруг каждой точки изображения формируется несколько групп точек, в каждую из которых входит и данная точка. Каждая из этих групп есть клика. На рис. 7.5 показан пример множества клик, включающих точку  изображения.

Рис.7.5. К понятию клик и потенциалов взаимодействия

Множество содержит восемь клик, объединяемых овалами. Каждая состоит из двух точек: кроме самой точки  в них входит по одной из точек ближайшего окружения. Клики, показанные на рис. 7.5, относятся к одному из четырех типов - горизонтальному, вертикальному или одному из наклонных. Точка  входит в две клики каждого типа. Для более компактной записи последующих соотношений половину из показанных на рис. 7.5 клик (выведены непрерывными линиями) закрепляют за точкой . Аналогичное правило закрепленияклик применяется и для всех других точек. В результате все парные клики, существующие на двумерной решетке, оказываются однозначно распределенными между точками изображения.

Таким образом, вся решетка, на которой определено изображение, оказывается связанной множеством парных клик. Геометрическая структура клик может быть самой разнообразной. В них могут входить не только ближайшие по решетке, но и удаленные соседи, клики могут различаться числом входящих в них точек, одновременно в модели могут присутствовать более простые и более сложные клики и т.д. Многообразие геометрических вариантов представляет собой один из источников разнообразия математических моделей изображений, основанных на РГ.

На каждой клике задается потенциал взаимодействия (ПВ)-функция значенийв точках, составляющих клику. На рис. 7.5  - множество потенциалов. Для однородного изображения, т.е. такого, у которого порождающий его механизм одинаков на всем кадре, очевидно справедливы равенства функций:

                      (7.18)

Пусть  - бинарное поле, т.е. его значения в разных точках равны 0 или 1. В этом случае каждый из потенциалов представляет собой функцию, которая может быть задана при помощи табл. 7.1. Здесь я качестве примера приведена функция ПВ  (рис. 7.5), аргументами которой являются отсчеты изображения  и . В этом случае ПВ описывается всего четырьмя числами, составляющими данную таблицу.

Таблица 7.1. Потенциал  парного взаимодействия бинарного поля

0

1

0

1

Поскольку модель однородного поля в соответствии с (7.18) задается четырьмя потенциалами , то ее полное задание требует нахождения 16 чисел. Если изображение обладает некоторой симметрией, то количество независимых потенциалов, входящих в соответствующие таблицы, будет меньшим. Так, если свойства изображения вдоль строк и вдоль столбцов одинаковы, то , а при совпадении свойств по диагональным направлениям . При этих условиях математическая модель полностью определяется 8параметрами.

С учетом введенных обозначений распределение Гиббса для данного примера имеет вид

       (7.19)

где - совокупность всех отсчетов изображения,  - множество узлов решетки, на котором задано изображение, а  - константа, которую находят из условия нормировки распределения вероятностей:

                                   (7.20)

в котором суммирование выполняется по множеству реализаций случайного поля. Обычно РГ записывают в более компактной форме

        (7.21)

где вводят понятие потенциальной функции

            (7.22)

а отдельные (частные) потенциалы  представляют в общей записи как функции всего изображения  (хотя в действительности каждый из них, как мы видели выше, зависит лишь от определенной пары отсчетов).

Во втором примере, который мы рассмотрим, случайное поле , принимает значения из непрерывного множества . Оно подчиняется распределению Гиббса, для которого клики имеют такой же вид, что и в примере бинарного поля (рис, 7.5), а потенциалы взаимодействия (на примере потенциала  — квадратичные функции вида

                                                 (7.23)

с параметрами ,  и . Обозначим  - элемент поля, соответствующий -й клике для центрального элемента с координатами . Например, ,  и т.д. Тогда вразвернутом виде РГ будет иметь вид:

     (7.24)

В компактной же форме остается справедливой запись вида (7.21), но с потенциалами (7.23). Константа также определяется выражением типа (7.20), однако вместо многомерного суммирования в нем использовано интегрирование. Аргумент экспоненты в (7.24) - квадратичная форма, следовательно, данное РГ гауссовское.

Используя рассмотренные примеры однородных полей  и , можно образовать математическую модель неоднородного изображения. Полагаем, что наблюдаемым является поле , которое описывается РГ (7.24), но его параметры ,  и  могут принимать одно из двух значений ,  и  или ,  и . Выбор того или иного варианта в точке  определяется значением ненаблюдаемого бинарного поля , которое оно принимает в данной точке. Таким образом, поле  является управляющим, скрытым в наблюдаемом изображении , поскольку оно скачкообразно переводит это наблюдаемое изображение из одного состояния в другое. При этом сегментация заключается в получении оценки  ненаблюдаемого бинарного поля путем анализа наблюдаемого .

Использование статистического подхода к сегментации требует, как будет видно из дальнейшего, использования совместного распределения  двух полей, для которого справедливо соотношение

Здесь  - распределение множества всех значений управляющего поля , а  - условное по отношению к его значению  распределение наблюдаемого изображения . Первое описывается соотношением (7.19) или (7.21) - (7,22), а для второго можно использовать (7.24), введя в него зависимость параметров ,  и  от . В результата имеем:

  (7.25)

где  - множество узлов решетки, общее для обоих случайных полей, а  - нормировочная константа, обеспечивающая равенство единице суммарной вероятности для дискретного поля  и непрерывного .

 



<< Предыдущая Оглавление Следующая >>