§ 6. Теорема НовиковаЕстественно, что первый же вопрос, который возник при изучении персептрона,– насколько эффективен предложенный Розенблаттом алгоритм построения разделяющей гиперплоскости, т. е. всегда ли с помощью этого алгоритма может быть построена гиперплоскость, разделяющая два множества векторов и . Конечно, имеются в виду случаи, когда такая гиперплоскость в принципе существует. В 1960 году американский ученый А. Новиков показал, что если последовательность, составленную из всех элементов множеств и , предъявить персептрону достаточное число раз, то он, в конце концов, разделит ее (конечно, если разделение с помощью гиперплоскости в принципе возможно). Это утверждение оказалось чрезвычайно важным для развития теории обучающихся программ. Использованные для его доказательства понятия оказались полезными и при установлении более тонких свойств алгоритмов обучения. Рассмотрим их подробнее. Утверждение Новикова относится к случаю, когда в пространстве существует гиперплоскость, проходящая через начало координат и разделяющая два множества векторов и , т. е. когда существует такой вектор , что выполняются неравенства , , , . (1.5) Здесь использовано обозначение . Рассмотрим множество , состоящее из всех векторов и . Тогда система неравенств (1.5) примет вид для всех . Если обозначить , а , то условие разделимости векторов и может быть формально выражено так: . Величине может быть дана следующая геометрическая интерпретация. Пусть, как на рис. 3, множество векторов обозначено крестиками, а множество векторов кружками. Рис. 3. Утверждение о том, что два множества векторов разделимы гиперплоскостью, проходящей через начало координат, эквивалентно тому, что выпуклая оболочка векторов , не содержит нуля или, что то же самое, расстояние от начала координат до выпуклой оболочки множества отлично от нуля. Величина как раз и равна расстоянию от выпуклой оболочки множества до начала координат. Особенность алгоритма персептрона, состоящая в том, что разделяющая гиперплоскость проходит через начало координат, не является серьезным ограничением при построении произвольной разделяющей гиперплоскости (в том числе и не проходящей через начало координат). Если для разделения классов необходима гиперплоскость, не проходящая через начало координат, то достаточно расширить пространство , добавив к векторам , одну координату и положить ее равной 1. Тогда нетрудно видеть, что в новом пространстве множества разделимы гиперплоскостью, проходящей через начало координат. Итак, пусть расстояние от начала координат до выпуклой оболочки множества отлично от нуля и равно , а расстояние от начала координат до конца самого далекого вектора этого множества равно . Тогда, как показал Новиков, после многократного предъявления обучающей последовательности, составленной из элементов множеств и , будет проведено не более исправлений коэффициентов (символ означает целую часть числа ).
|