Читать в оригинале

<< ПредыдущаяОглавлениеСледующая >>


§ 4.3. Формулировка задачи

Попытаемся теперь сформулировать задачу опознавания в более точных терминах. Геометрически задача обучения опознаванию образов (задача трех О) состоит в построении поверхности, которая в каком-либо смысле лучше всего разделяет многомерное пространство на области, соответствующие различным классам. Построение проводится на основе показа некоторого числа объектов (образов), принадлежащих этим классам. Опознавание, которое производится после окончания процесса обучения, состоит в испытании нового объекта, о котором заранее неизвестно, к какому классу он принадлежит. При этом объявляется название области пространства, к которой этот объект относится.

Первой части этой формулировки задачи опознавания (а именно обучению) можно поставить в соответствие, как это часто делается, другую «алгебраическую» формулировку. Обучение опознаванию состоит в «экстраполяции», т. е. в построении некоторой разделяющей функции по показам образов и указания, к какому классу эти образы принадлежат. Мы ограничимся двумя классами:  и , или 1 и 2, т. е. случаем, который обычно называют дихотомией. К дихотомии можно последовательно свести и общий случай, когда число классов превышает два.

Обозначим разделяющую функцию через

,                                    (4.1)

где  — -мерный вектор, характеризующий образ, а  — величина, определяющая класс, к которому этот образ принадлежит.

Можно условиться, что разделяющая функция должна обладать следующим свойством:

   (4.2)

т. е. знак  определяет принадлежность  к классу  или . Наряду с детерминистской возможна и статистическая постановка задачи. В этом случае ход  будем подразумевать степень достоверности принадлежности образа к классу , а  — степень достоверности принадлежности образа к классу . Из формулы (4.2) следует, что, вообще говоря, существует множество функций, определяющих разделяющую поверхность. Эти функции мы также будем называть разделяющими. Очевидно, что такое множество существует но крайней мере тогда, когда классы легко различимы. Однако если это не так, то обычно существует лишь одна наилучшая разделяющая функция.

Для постановки задачи экстраполяции или, если угодно, задачи аппроксимации, прежде всего надо выбрать класс аппроксимирующих функций и меру уклонения, характеризующую точность аппроксимации. Обозначим класс аппроксимирующих функций через , где  — неизвестный пока вектор коэффициентов, а меру уклонения определим как некоторую выпуклую функцию от и , например . Поскольку показы вектора  случайны, то и мера уклонения случайна. Поэтому в качестве меры аппроксимации целесообразно выбрать функционал, представляющий собой математическое ожидание меры уклонения:

.           (4.3)

Наилучшая аппроксимация соответствует такому выбору вектора , при котором  достигает минимума.

В большинстве случаев мера уклонения определяется как выпуклая функция разности , и тогда вместо функционала (4.3) получаем зависимость

.         (4.4)

В дальнейшем мы будем, как правило, рассматривать именно такой функционал.

Поскольку плотность вероятности , а значит, и математическое ожидание (4.4) нам неизвестны, то единственная возможность определения  состоит в том, чтобы воспользоваться отдельными реализациями, получаемыми при показе векторов, и соответствующими алгоритмами адаптации или обучения. К этому мы сейчас и перейдем.

 



<< ПредыдущаяОглавлениеСледующая >>