§ 7. Построение решающих правил по конечной выборкеЕсли мы хотим воспользоваться техникой построения статистических решающих правил, то нам нужно построить модели распределений образов. А для этого нужно помимо гипотезы компактности принять еще несколько дополнительных предположений, которые давали бы ответы на следующие вопросы: какому закону подчиняются распределения образов, каков характер зависимости между признаками, какова априорная вероятность появления различных образов, как выглядит матрица стоимости ошибочного распознавания, какова степень представительности обучающей выборки? Так как обычно нет объективных способов ответить на эти вопросы, то в качестве ответов принимаются самые простые предположения. Чаще всего предполагается, что распределения подчиняются нормальному закону, что матрицы ковариаций диагональны (значит, признаки системы Задаче подбора вида распределения и его параметров по конечной выборке посвящено большое количество работ [8,17,43,48, 111]. Описаны программные системы, предназначенные для решения этой задачи при различных критериях согласия [3,47,112]. Самый простой, но часто применяемый прием состоит в следующем. Для каждого образа вычисляются координаты центра тяжести его точек, и эти координаты принимаются в качестве координат математического ожидания нормального распределения данного образа. Затем строится одно из решающих правил, описанных в § 2 данной главы. При опоре на гипотезу полимодальной компактности модель распределения аппроксимируется смесью простых (например, нормальных) распределений. Этот аппроксимационный подход развивается в работах [35,118] и ряде других. Если для заданного критерия согласия наилучшая аппроксимация достигается с помощью одного распределения, то ситуация сводится к той, что рассмотрена выше. Если для образа Метод попутного разделения (ПОРА) модифицируется для данной задачи так, чтобы из списка неразделенных образов с самого начала были удалены пары распределений с одинаковыми именами. В итоге фиксируются только границы, разделяющие образы с разными именами. Так, для разделения смесей образов с именами Рис. 16
|