Глава XIV. ПОСТРОЕНИЕ РАЗДЕЛЯЮЩЕЙ ГИПЕРПЛОСКОСТИ (МЕТОД ОБОБЩЕННОГО ПОРТРЕТА)§ 1. Оптимальная разделяющая гиперплоскостьВыше было показано, что конкретные алгоритмы обучения машин распознаванию образов могут быть построены по следующей схеме: из класса решающих правил подходящей емкости выбирается правило, минимизирующее количество неправильных классификаций элементов обучающей последовательности. При этом чрезвычайно важным оказывается способ задания класса решающих правил. Во многих случаях этот класс задается параметрически, т. е. считается, что функции известны с точностью до значения конечного числа параметров. Более того, класс функций задается линейно по параметру, т. е. в виде
Выбрать функцию из этого класса – значит найти соответствующие
На практике такая задача решается путем построения гиперплоскости, разделяющей в соответствующем спрямляющем пространстве В этой главе будут рассмотрены методы построения разделяющих гиперплоскостей. Однако следует иметь в виду, что рассмотренные здесь методы немедленно могут быть использованы для выбора решающего правила из заданного множества линейных по параметру решающих правил. Два конечных множества векторов: множество
а для любого вектора
В случае, когда выполняются (14.1) и (14.2), говорят также, что множество
Определим для любого единичного вектора
Согласно определению величин
Ясно, что если
то пара
отделяющую множество Заметим, что функции Будем выделять из множества разделяющих гиперплоскостей оптимальную. Определение. Назовем оптимальной разделяющей гиперплоскостью такую разделяющую гиперплоскость, которая определяется следующей парой: единичным вектором
и числом
Справедлива теорема Теорема 14.1. Если два множества векторов разделимы гиперплоскостью, то существует единственная оптимальная разделяющая гиперплоскость. Доказательство. Очевидно, достаточно показать, что функция Существование максимума следует из того, что функция Допустим, что максимум достигается не на границе, а в некоторой точке
откуда следует противоречие:
Остается показать единственность. Пусть максимум Геометрически величина Рис. 23. Вектор обладает тем свойством, что в классе разделяющих гиперплоскостей oна максимально удалена от ближайшего из множеств В § 9 будут указаны алгоритмы построения оптимальной разделяющей гиперплоскости. А пока рассмотрим однопараметрическое семейство разделяющих гиперплоскостей, содержащее оптимальную разделяющую гиперплоскость.
|