3. Оценки параметров модели и маргинальных вероятностей.
Для реализации составных байесовских правил необходимо задать или оценить неизвестные значения параметров
и найти маргинальные вероятности
или математические ожидания значений сигналов. Ограничимся здесь только задачей обучения распознаванию или статистического оценивания параметров
при заданном выходном изображении
и соответствующем входном изображении
. Нетрудно показать [13, 14], что гиббсовское PB представляет одноэкстремальную функцию параметров
так что максимально правдоподобная оценка этих параметров
может быть, в принципе, получена методами стохастической аппроксимации. Такая оценка является байесовской при простой функции потерь от ошибок и равновероятных значениях параметров и достаточно естественно выводится в схеме вычислительного зрения на основе МАВ-решення. При использовании составного MMAB-решения аналогичная схема вывода дает оценку параметров
, которая минимизирует составной риск BR
:
. (3)
Здесь
- величина, полученная усреднением маргинальных вероятностей заданных значений выходных сигналов
по всему растру при заданном входном изображении
и параметрах
. Так как
может быть многоэкстремальной функцией параметров
, то простейший способ получить приближенную оценку (3) состоит в поиске локального минимума этой функции, ближайшего к начальному приближению
. Максимально правдоподобная оценка может использоваться как такое начальное приближение. Аналогичная оценка типа (3), минимизирующая составной риск, может быть выведена и для АМО-решения.
Стохастическую релаксацию удобно рассматривать как последовательность макрошагов. На каждом макрошаге выполняется последовательный обход всех элементов растра
без повторения при случайном равновероятном выборе каждого очередного элемента. В каждом текущем элементе
случайным образом выбирается новое значение сигнала
при фиксированной остальной конфигурации сигналов изображения,
[6,]. Вероятности
, с которыми выбираются значения сигнала
в элементе
при фиксированном остальном порождаемом изображении
, входном изображении
и параметрах
, т.е. переходные вероятности одного шага вдоль порождаемой марковской цепи изображений, определяются так, чтобы цепь имела в равновесном состоянии заданное PB
. Мы ограничимся здесь так называемым "методом термостата", в котором переходные вероятности равны условным вероятностям значений сигналов в элементе в элементе растра
при фиксированной окрестности
, вычисленным по РВ (1) и зависящим от потенциалов
на кликах
;
, содержащих элемент растра
:
. (4)
Порождая с помощью стохастической релаксации марковскую цепь изображений, можно оценить маргинальные вероятности просто по частотам значений сигналов
в каждом элементе растра [11, 13, 14]. Нетрудно показать, что маргинальные и переходные вероятности связаны соотношением:
, (5)
в котором переходная вероятность рассматривается как скалярная случайная величина, функционально связанная с изображениями
, ,имеющими PB
. Это соотношение позволяет оценивать маргинальные вероятности также с помощью выборочных средних значений соответствующих переходных вероятностей на каждом макрошаге релаксации (эти оценки мало отличаются по своим статистическим показателям от частотных оценок, хотя и имеют в экспериментах несколько более высокую эффективность, т.е. меньшую дисперсию относительно искомых маргинальных вероятностей). Альтернативные подходы к оцениванию маргинальных вероятностей основаны на построении и приближенном решении системы нелинейных уравнений, которые связывают эти вероятности в элементе растра и его окрестности, исходя из соотношений типа (4), (5) при различных упрощающих предположениях [10].
Соотношение (5) позволяет также рассматривать функцию
как математическое ожидание определенных переходных вероятностей, усредненных по растру на макро шаге релаксации:
. (6)
Здесь
- значения сигналов для заданного выходного изображения
. Это позволяет использовать для получения искомой оценки (3) в случае ММАВ-решения методы стохастической аппроксимации, если функция (6) и ее первые и вторые частные производные удовлетворяют соответствующим условиям сходимости в достаточно широкой окрестности локального максимума этой функции, ближайшего к начальному приближению
.