Читать в оригинале

<< ПредыдущаяОглавлениеСледующая >>


2.2. Потери и риск

Последствия от принятия решений следует оценивать по степени их соответствия поставленной цели. Это соответствие, в принципе, может быть определено с помощью количественной меры, определяющей выигрыш или потери от принятия решения. Эта мера называется функцией потерь (штрафа) или функцией выигрыша (целевой функцией). Для определенности будем использовать функцию потерь, которую, естественно, следует минимизировать, чтобы решение было оптимальным.

Потери могут зависеть не только от принятого решения , но и от реальной ситуации, описываемой параметрами . Возможно, что потери зависят и от наблюдений . В общем случае функция потерь имеет вид . В частных случаях может быть ,  и т. д.

Если бы значение  было известно, т. е. полностью определена реальная ситуация , то при получении наблюдения оптимальным решением была бы точка минимума   функции , т. е. оптимальным решающим правилом была бы просто минимизация известной функции по  при заданных значениях ее параметров  и . Полученное таким образом решение является каждый раз наилучшим.

В реальности же  являются скрытыми параметрами, т. е. действительная обстановка может быть, в лучшем случае,  известна только приближенно.                     В таком случае уже невозможно каждый раз находить наилучшее решение – неизбежны просчеты из-за ошибочной оценки ситуации.

Единственное, что можно сделать в сложившемся положении, это попытаться найти такое решающее правило, при котором минимальными будут средние потери, т. е. среднее значение функции потерь, называемое риском. Правило, минимизирующее риск, будем называть оптимальным.

Для нахождения среднего значения функции потерь  нужно задать распределение вероятностей на пространстве ее аргументов , что может быть сделано следующим образом.

Закон распределения вероятностей возможных ситуаций  описывается ПРВ  на .

Наблюдения z должны быть в той или иной мере связаны с , иначе в них нет никакой надобности. Эта связь может быть описана условной ПРВ  на пространстве наблюдений , которая называется функцией правдоподобия (ФП).

Решения  u принимаются в зависимости от z, это и есть решающее правило. В наиболее  общем случае это правило рандомизировано и определяется условной вероятностной мерой, для определенности заданной условной ПРВ  .

Таким образом, совместная ПРВ параметров ,, есть  функция , определенная на пространстве .

 

В зависимости от степени усреднения можно рассматривать различные типы рисков.  Средний риск. Если известно распределение  и  (заданы ПРВ и ), то для любого решающего правила  можно найти безусловное математическое ожидание функции потерь, зависящее только от этого правила и называемое средним риском:

 

.           (2.1)

Оптимизация принятия решений заключается в выборе такого правила (т. е. ПРВ ), при котором средний риск (2.1) минимален.

Для нерандомизированых правил  распределение  сосредоточено в точке , т. е.

                                                                         (2.2)

где  –  функция Дирака, и (2.1) принимает вид

 .                          (2.3)

Здесь и в дальнейшем, если не возникает недоразумений, будем опускать обозначения областей интегрирования. Выражение (2.3) определяет средний риск для любого правила , а оптимизация принятия решений заключается в выборе такого правила , при котором риск (2.3) минимален.

Априорным риском называется величина

  ,                                   (2.4)

где  не зависит от. Если, кроме того, , то

.                  (2.5)

Выражения (2.4) и (2.5) определяют априорную оценку потерь, связанных с решением , принимаемым при отсутствии наблюдений или при их игнорировании. Такое решение может быть спланировано заранее, еще до наступления момента, когда решение необходимо принимать. В такой постановке оптимальным решением является , минимизирующее (2.4) или (2.5), оно учитывает только априорную информацию.

Апостериорным риском называется условное математическое ожидание функции потерь для данного решения  при данном значении . Для этого найдем по формуле Байеса апостериорное условное распределение  при заданном значении :

.                             (2.6)                          

Апостериорный риск определится усреднением функции потерь по ПРВ (2.6):

.              (2.7)

Средний и апостериорный риски связаны очевидным соотношением

,                           (2.8)

где

                               (2.9)

безусловная ПРВ наблюдений . В случае нерандомизированных правил соотношение (2.8) принимает вид

.                            (2.10)

Условным риском называются средние потери при использовании правила  при заданном значении :

,                (2.11)

а в случае нерандомизированного правила :

.                         (2.12)

Этот риск определяет потери в среднем по всем возможным наблюдениям для конкретного решающего правила  и конкретной ситуации .

 



<< ПредыдущаяОглавлениеСледующая >>