§ 4.2. Обсуждение задачи опознаванияПрежде чем формулировать задачу опознавания, целесообразно обсудить некоторые ее особенности, не стесняя себя слишком строгими формулировками и точными понятиями. Основная задача опознавания состоит в отнесении предъявляемого объекта к одному из классов, вообще говоря, заранее неизвестных. Классы характеризуются тем, что принадлежащие им объекты обладают некоей общностью, сходством. То общее, что объединяет объекты в класс, и называют образом. Для решения задачи опознавания необходимо прежде всего заняться обучением посредством показа образов, принадлежность которых к тому или иному классу известна. Если мы можем точно (в виде конкретных признаков) сформулировать то общее, что объединяет объекты в класс, то задача опознавания сводится к сравнению признаков предъявляемых объектов с заранее известными. Хотя этот случай и очень важен, например, для построения машин, читающих стандартный текст, мы его касаться здесь не будем. Отметим лишь, что в контрольно-сортирующих устройствах этот принцип издавна используется для опознавания бракованных деталей. Мы будем рассматривать только тот случай, когда общность свойств объектов каждого класса заранее установить невозможно или неудобно, хотя в объективном существовании этой общности сомнений нет. В этом случае, попросту говоря, мы хотим классифицировать объекты, но не знаем как. Попытки искать признаки ощупью, надеясь на удачу, иногда приводят к решению важных конкретных задач. Но возможен и иной путь — обучение показами,— который сводится к предварительному показу ряда объектов и указанию классов, к которым они принадлежат. Для более точной постановки задачи опознавания удобно использовать геометрические представления. Каждому объекту можно поставить в соответствие точку в некотором многомерном пространстве. Естественно думать, что сходным объектам соответствуют близкие точки, и классы легко различимы, если точки, принадлежащие им, располагаются кучно. Разумеется, этот интуитивно очевидный факт можно облечь в форму «гипотезы компактности». Но это, пожалуй, ничего не дает, поскольку мы заранее не можем рассчитывать на то, что эта гипотеза всегда оправдывается, а проверить гипотезу очень трудно. Поэтому речь может идти не о достижении абсолютной классификации, а о достижении наилучшей классификации при имеющихся условиях. И только в том случае, если классы легко различимы, мы получим абсолютную классификацию.
|