§ 7. Построение решающих правил по конечной выборке

Если мы хотим воспользоваться техникой построения статистических решающих правил, то нам нужно построить модели распределений образов. А для этого нужно помимо гипотезы компактности принять еще несколько дополнительных предположений, которые давали бы ответы на следующие вопросы: какому закону подчиняются распределения образов, каков характер зависимости между признаками, какова априорная вероятность появления различных образов, как выглядит матрица стоимости ошибочного распознавания, какова степень представительности обучающей выборки? Так как обычно нет объективных способов ответить на эти вопросы, то в качестве ответов принимаются самые простые предположения. Чаще всего предполагается, что распределения подчиняются нормальному закону, что матрицы ковариаций диагональны (значит, признаки системы не зависимы), что априорные вероятности и стоимости взаимных ошибок всех образов одинаковы и что обучающая выборка представительна. После добавления к фактическим данным этого букета эвристических подпорок можно приступать к вычислению по обучающей выборке параметров распределений и построению по ним «оптимальных» решающих правил.

Задаче подбора вида распределения и его параметров по конечной выборке посвящено большое количество работ [8,17,43,48, 111]. Описаны программные системы, предназначенные для решения этой задачи при различных критериях согласия [3,47,112].

Самый простой, но часто применяемый прием состоит в следующем. Для каждого образа вычисляются координаты центра тяжести его точек, и эти координаты принимаются в качестве координат математического ожидания нормального распределения данного образа. Затем строится одно из решающих правил, описанных в § 2 данной главы. При опоре на гипотезу полимодальной компактности модель распределения аппроксимируется смесью простых (например, нормальных) распределений. Этот аппроксимационный подход развивается в работах [35,118] и ряде других. Если для заданного критерия согласия наилучшая аппроксимация достигается с помощью одного распределения, то ситуация сводится к той, что рассмотрена выше. Если для образа потребовалось использовать распределений , то общее число распределений, построенных в признаковом пространстве, окажется равным сумме этих чисел: . Все эти распределения рассматриваются в качестве описаний отдельных образов, среди которых имеется подмножеств из образов с одинаковыми именами. При построении решающих правил следует применять методы, предназначенные для распознавания большого числа образов (см. §3 данной главы). При использовании метода отбора сильнейшего конкурента необходимо следить за списком образов, оставшихся непроверенными. Если в этом списке остались образы с одним и тем же именем , то дальнейшая проверка прекращается. Так, на рис. 16 показан случай, в котором проверка первых трех образов выявит в качестве сильнейшего претендента образ 3 с именем В. После 5-го шага на первое место выйдет образ 5 с именем , и в списке оставшихся претендентов останутся только образы с тем же именем , так что дальнейшие сравнения окончательного результата распознавания не изменят.

Метод попутного разделения (ПОРА) модифицируется для данной задачи так, чтобы из списка неразделенных образов с самого начала были удалены пары распределений с одинаковыми именами. В итоге фиксируются только границы, разделяющие образы с разными именами. Так, для разделения смесей образов с именами и , представленных на рис. 16, достаточно использовать две границы из 21 возможных. Разделяющая граница, составленная из нескольких линейных границ (в -мерном пространстве гиперплоскостей), называется кусочно-линейной. Способам построения аппроксимаций нелинейных поверхностей кусочно-линейными поверхностями посвящены работы [105,141]. При использовании метода покоординатного вычеркивания (МПК) также нужно следить за составом невычеркнутых образов. Если на некотором шаге вычеркивания обнаружится, что все оставшиеся претенденты имеют одно и тоже имя, то процесс распознавания заканчивается. Так, на рис. 16 вычеркивание по признаку (пунктирные линии) оставляет невычеркнутыми только образы с именем и точка распознается в качестве реализации образа .

Рис. 16