3.4. Адаптивный байесов подход

Сущность этого подхода состоит в следующем. Пусть имеется существенная априорная неопределенность в описании параметров и/или наблюдений z. Эта неопределенность не позволяет применить обычный байесов формализм: найти для каждого правила u(z) величину среднего риска R(u(z)), величину апостериорного риска R(u,z) и определить положение минимума R(u,z) по u для каждого z, что и дает оптимальное байесово решение u = u0(z).

Отметим, что невозможность применения этого формализма связана именно с незнанием, а не с существованием: на самом деле в любых конкретных условиях существуют вполне определенные (хотя и неизвестные) истинные значения R(u(z))=Rист(u(z)) для всех u(z), а следовательно, существует и оптимальное решение u0(z), обращающее Rист(u(z)) в минимум.

Попытаемся применить этот байесов формализм в условиях априорной неопределенности, используя сведения, содержащиеся в наблюдениях z для оценки истинного значения апостериорного риска, чтобы получить его приближенное значение . После нахождения оценки остается воспользоваться стандартным байесовым подходом, используя вместо Rист(u,z).

Таким образом, адаптивный байесов подход в своей основе ничем не отличается от неадаптивного: главным остается минимизация среднего (апостериорного) риска. Различие только в способе достижения этой цели. При наличии априорной неопределенности приходится модифицировать обычный байесов формализм, вводя в него дополнительные процедуры. При этом повышается роль наблюдений z – они уже не просто аргументы известной функции R(u,z), но еще используются для ее восстановления.

Процесс восстановления функции R(u,z) называется адаптацией, а полученные таким способом правила называются адаптивными байесовыми решающими правилами.

Итак, адаптивный байесов подход основан на замене точной меры ожидаемых потерь ее оценкой на основе имеющихся данных. В этом аспекте различные способы адаптации есть различные способы оценки меры потерь.

Продолжение примера 3. Правило (3.11) нельзя применить, так как неизвестно значение a. Используем наблюдения z1,….,zn для нахождения оценки . Можно, в частности, взять оценку ММП a*, определяемую в нашем случае соотношением

Подставляя это значение a* в (3.11), получим адаптивное правило

. (3.12)

Если ошибка мала, то можно ожидать, что правило (3.12) будет для подавляющего большинства значений zn+1 давать то же решение, что и (3.11).

Для иллюстрации конкретизируем этот пример, взяв a>0 и нормальные распределения

Тогда (3.11) приводится к виду

(3.13)

а правило (3.12) – к виду

(3.14)

Оценкой ММП параметра a в нашем случае будет . При этом ошибка e=a*-a нормальна с нулевым средним и дисперсией s2/n. Таким образом, вместо области принятия решения u=1 в правиле (3.13) имеем область в правиле (3.14). Эти области различаются на интервал (a/2;a/2+e/2] или (a/2+e/2; a/2]. При этом e/2 имеет СКО , стремящееся к нулю при , поэтому разница между правилами тоже сходит на нет.

Найдем средний риск для правил (3.13) и (3.14). Средний риск для (3.13):

Средний риск для (3.14):

Величина нормальна. При =0 она имеет среднее значение a/2 и дисперсию (1+1/4n)s2, а при =1 имеет среднее -a/2 и ту же дисперсию. Поэтому

Естественно, что R*>R0, но разница стремится к нулю при и мала уже при относительно небольших n. Таким образом, адаптивное правило (3.14) асимптотически оптимально: при увеличении объема данных средний риск R*стремится к минимальному байесову риску R0 , который мы имели бы при отсутствии априорной неопределенности, т. е. при известном a.

Пример 4. Имеется И Z = {zij}. На нем, возможно, есть области, отличающиеся от своего окружения большей средней яркостью. Требуется обнаружить эти области. Такая задача возникает, в частности, при поиске акваторий, перспективных для рыбного промысла – таковыми являются участки моря с более высокой средней температурой, для такого поиска используются тепловизионные И моря.

Зададимся формой области W и ее окружением R, например, квадрат и рамка, показанные на рис. 3.4. Если mW и mR – математические ожидания отсчетов изображения по W и по R, то нам нужно выбрать одну из двух альтернатив или. При известных mW и mR решающее правило элементарно:

. (3.15)

Это правило нужно применить ко всевозможным положениям W на Z.

Однако mW и mR неизвестны. Построим адаптивное правило. Для этого применим в качестве оценок неизвестных mW и mR средние арифметические наблюдений:

, ,

Рис. 3.4.

где nW и nR – количество элементов в W и R. Эти оценки состоятельны. Но теперь не обязательно влечет за собой . Поэтому гипотезу следует принимать только при >m. Более того, порог m может быть различным для разных положений W, так как изображение Z может быть неоднородным. Поэтому отнормируем разность оценкой СКО в рамке R, т. е. величиной . В результате получим адаптивное правило

. (3.16)

Если все отсчеты изображения имеют ограниченные дисперсии и постоянные средние в W и R, то правило (3.16) сходится к правилу (3.15), когда nW и nR стремятся к бесконечности. При этом порог L0 стремится к нулю.