Читать в оригинале

<< ПредыдущаяОглавлениеСледующая >>


9.2. Разделяющие функции

Будем предполагать, что существует известное множество , состоящее из  взаимно исключающих классов (образов) объектов. Каждый объект представляем набором результатов измерений выбранных признаков , называемых его описанием. Таким образом, описание объекта — это точка (вектор)  в -мерном пространстве признаков . Евклидово расстояние между двумя точками  и  в

.                                 (9.1)

Процедурой распознавания образов объектов называется процедура определения областей  пространства  путем исследования описаний заданного множества   объектов, про которые известно, каким классам они на самом деле принадлежат. Иначе говоря,  будет обучающей выборкой, с которой работает процедура распознавания образов объектов.

Процедурой классификации объектов является процедура, относящая объект к классу   тогда и только тогда, когда его описание  попадает в область  пространства  соответствующую этому классу. Такая процедура классификации корректна, если объект и в самом деле относится к классу . Таким образом, процесс распознавания объектов включает процедуру распознавания образов (формирование классов объектов) и процедуру классификации объектов (правило отнесения объектов к тому или иному классу). Геометрические понятия, включенные в распознавание объектов, достаточно просты. Рассмотрим, например, двумерное пространство признаков (рис. 9.3). Здесь представлены два класса  и обучающая выборка объектов. Проблема состоит в классификации неизвестного объекта — отнесении его к одному из классов. Одним из множества возможных решений является определение разделяющей границы, такой, например, как указана на рис. 9.3. Наше решающее правило тогда сводится к отнесению неизвестного объекта к классу , если соответствующая ему точка (вектор признаков) лежит с одной стороны границы и к классу  — с другой. В данном случае неизвестный объект будет отнесен к классу .

Рис. 9.3. Двумерное пространство признаков с обучающей выборкой: темными точками помечены объекты класса , крестиками — объекты класса ; эллипс – неизвестный объект

Из представленного примера видно, что две совокупности объектов оказалось удобно разделить прямой. Пусть  - уравнение разделяющей прямой, где - параметры, а  - признаки объектов. Функцию можно использовать в качестве разделяющей (дискриминантной) функции, поскольку, рассматривая объект , принадлежность которого неизвестна, можно утверждать, что он принадлежит классу (образу) , если , и классу , если . Если вектор признаков  лежит на разделяющей границе, то имеет место неопределенность: . Очевидно, что данный метод можно распространить на большее число классов и на более общий случай нелинейных границ в любом конечномерном евклидовом пространстве признаков [9.7, гл.2].

В общем случае пространство признаков можно считать состоящим из  областей ,, каждая из которых содержит точки, соответствующие объектам из одного класса. При этом задача распознавания может рассматриваться как построение границ областей решений, разделяющих  классов, исходя из зарегистрированного (обучающего) множества векторов- признаков. Пусть эти границы определяются, например, разделяющими функциями . Если  для всех , то объект  принадлежит классу . Отсюда становится понятным, что основная проблема, возникающая после определения разделяющих функций, состоит в отыскании граничных поверхностей. Для их определения и нужна обучающая выборка объектов. Здесь процесс обучения считается законченным, когда проведены все разделительные границы между множествами образов (классов). Это удается обычно выполнить при условии так называемой компактности, когда каждая группа (кластер) векторов-признаков, принадлежащих одному классу, образует в пространстве описания компактную (локально ограниченную) в некотором смысле область. Если кластеры, соответствующие различным классам, разнесены достаточно далеко друг от друга, то с успехом можно воспользоваться простыми схемами распознавания, например такими, как классификация объекта по расстоянию от центра тяжести кластеров или по «среднему расстоянию» до всех элементов обучающей выборки соответствующих им образов и т.п. [9.7, гл. 3].

Следует отметить, что вариабельность изображений объектов в пределах классов такова, что кластеры (локальные сгущения точек в признаковом пространстве), порождаемые конкретными элементами обучающих подмножеств изображений, в определенной степени перекрываются и отношение принадлежности контролируемого фрагмента изображения (объекта) к тому или иному классу приобретает вероятностный характер. В этих условиях естественно добиваться как можно лучшего качества классификации, что сводится к проблеме синтеза алгоритмов, экстремальных по качеству распознавания. Эта сложная проблема требует комплексного использования теоретических и экспериментальных методов исследования [9.8, 9.9] и в общем случае предполагает знание информативных признаков объектов. Основное требование к таким признакам состоит в том, чтобы они адекватно отражали визуальные (уникальные либо статистические) свойства реальных изображений объектов. Уникальность определяется характерными чертами моделируемых объектов, которые, очевидно, являются признаками их яркостной структуры (оптической формы) по которым, собственно, и осуществляется их распознавание.

 



<< ПредыдущаяОглавлениеСледующая >>