§ 6. Гипотеза компактности в распознавании образовСформулированное в главе 3 условие компактности для решения задачи распознавания образов является необходимым, но не достаточным. Мало того, чтобы точки образа были близкими друг к другу, нужно еще, чтобы точки образа не оказались к ним такими же близкими, т. е. нужно, чтобы сгустки точек разных образов не налагались друг на друга, что обозначаем следующим образом: . С учетом этого гипотезу компактности для распознавания образов можно записать в следующем виде: Если предполагать, что реализации одного и того же образа образуют один компактный сгусток, то его можно аппроксимировать унимодальным распределением. Этот случай соответствует гипотезе унимодальной компактности . Ослабленный вариант обсуждаемой гипотезы (назовем его гипотезой полимодальной компактности ) утверждает, что точки одного образа могут образовывать не один, а несколько компактных сгустков. На этом основании можно представлять образ многосвязными областями или смесью нескольких простых распределений. Полимодальную компактность можно в пределе представить в виде локальной компактности. Гипотеза локальной компактности выражает осторожное утверждение о свойстве ближайшего соседства: «обо всем распределении судить не берусь, но в некоторой малой -окрестности каждой реализации обучающей выборки образа может появиться только представитель этого же образа». На указанном основании построить общую модель распределения образа нельзя, но можно построить правило распознавания с опорой на все или на часть объектов обучающей выборки (т. е. с опорой на прецеденты). Проекции компактных сгустков на координатные оси будут также компактными. Если, кроме того, эти проекции окажутся еще и не совпадающими друг с другом, то появляется возможность разделять образы не сразу в многомерном пространстве признаков, а поочередно, по каждому признаку в отдельности. На этом основании можно сформулировать гипотезы проективной унимодальной , проективной полимодальной и проективной локальной компактности. Из сказанного выше следует, что все алгоритмы распознавания, отправляющиеся от обучающей выборки, в своей основе отличаются друг от друга лишь вариантом принимаемой гипотезы компактности вне зависимости от того, формулируется ли она в явном виде или интуитивно подразумевается. А дальше пути разных школ распознавания расходятся. Как указывалось выше, часть из них строит модели унимодальных распределений генеральных совокупностей распознаваемых образов и потом для построения решающих правил применяет аппарат математической статистики. Другие ориентируются на гипотезу полимодальной компактности, строят модели распределений в виде смеси простых распределений, после чего применяют те же статистические методы, но как бы для большего числа образов. Те, кто ориентируется на гипотезу локальной компактности, строят решающие правила, опирающиеся на прецеденты. Наконец, те, кто предполагает, что компактность в многомерном пространстве проявляется в компактности проекций сгустков на координатные оси, используют последовательные покоординатные процедуры. Рассмотрим особенности этих направлений.
|