8.3. Таксономические решающие функции (алгоритм ТРФ) [24,54]Обычно на этапе обучения строится решающее правило, параметры которого определяются и жестко фиксируются по информации, содержащейся в обучающей выборке. Какие бы контрольные реализации не предъявлялись потом для распознавания, решающее правило не меняется. Но возможен и другой подход: решающее правило строить непосредственно в процессе распознавания, опираясь на информацию, содержащуюся как в обучающей, так и в контрольной выборке. На рис. 20 объекты обучающей выборки двух образов обозначены кружочками и крестиками, а реализации контрольной выборки обозначены точками. Если аппроксимировать сгустки точек обучающей выборки унимодальными распределениями, то решающая граница представляет линию . Такое решающее правило, построенное по непредставительной выборке, даст много ошибок при распознавании контрольной выборки. Рис. 20 Если же обучающую и контрольную выборку рассматривать совместно, то можно построить решающую границу в виде линии , которая обучающую выборку распознает так же хорошо, как и линия , но снижает количество ошибок на контрольной выборке. Такое решение получается, если применить критерии таксономии: большие расстояния между таксонами и малые расстояния внутри таксонов. Это и положено в основу принятия решений методом таксономических решающих функций. Смесь обучающих и контрольных объектов подвергается таксономии на таксонов с помощью алгоритмов типа FOREL или KRAB. Если в некотором таксоне есть точки обучающей выборки только одного -го образа, то все контрольные точки, попавшие в этот таксон, относятся также к образу . Если в таксоне есть точки из разных образов, то такой таксон разбивается на более мелких таксонов. Эта процедура продолжается до тех пор, пока в каждом таксоне не окажутся обучающие точки только одного образа. Контрольные точки, попавшие в таксон, не содержащий обучающих точек, считаются принадлежащими новому, -му образу. При желании их можно отнести к одному из образов, присоединение к которому даст наибольшее значение критерия качества таксономии. Описанный алгоритм позволяет использовать не только информацию из обучающей выборки, но и из контрольной. Этим обеспечивается более высокая устойчивость алгоритма ТРФ к такому часто встречающемуся неприятному явлению, как непредставительность обучающей выборки.
|