Читать в оригинале

<< ПредыдущаяОглавлениеСледующая >>


§ 6. Теорема Новикова

Естественно, что первый же вопрос, который возник при изучении персептрона,– насколько эффективен предложенный Розенблаттом алгоритм построения разделяющей гиперплоскости, т. е. всегда ли с помощью этого алгоритма может быть построена гиперплоскость, разделяющая два множества векторов  и . Конечно, имеются в виду случаи, когда такая гиперплоскость в принципе существует.

В 1960 году американский ученый А. Новиков показал, что если последовательность, составленную из всех элементов множеств  и , предъявить персептрону достаточное число раз, то он, в конце концов, разделит ее (конечно, если разделение с помощью гиперплоскости в принципе возможно). Это утверждение оказалось чрезвычайно важным для развития теории обучающихся программ. Использованные для его доказательства понятия оказались полезными и при установлении более тонких свойств алгоритмов обучения. Рассмотрим их подробнее.

Утверждение Новикова относится к случаю, когда в пространстве  существует гиперплоскость, проходящая через начало координат и разделяющая два множества векторов  и ,  т. е. когда существует такой вектор , что выполняются неравенства

, ,

, .     (1.5)

Здесь использовано обозначение

.

Рассмотрим множество , состоящее из всех векторов  и . Тогда система неравенств (1.5) примет вид

 для всех .

Если обозначить

,

а

,

то условие разделимости векторов  и  может быть формально выражено так: .

Величине  может быть дана следующая геометрическая интерпретация. Пусть, как на рис. 3, множество векторов  обозначено крестиками, а множество векторов  кружками.

019.jpg

Рис. 3.

Утверждение о том, что два множества векторов разделимы гиперплоскостью, проходящей через начало координат, эквивалентно тому, что выпуклая оболочка векторов ,  не содержит нуля или, что то же самое, расстояние от начала координат до выпуклой оболочки множества  отлично от нуля. Величина  как раз и равна расстоянию от выпуклой оболочки множества  до начала координат.

Особенность алгоритма персептрона, состоящая в том, что разделяющая гиперплоскость проходит через начало координат, не является серьезным ограничением при построении произвольной разделяющей гиперплоскости (в том числе и не проходящей через начало координат). Если для разделения классов необходима гиперплоскость, не проходящая через начало координат, то достаточно расширить пространство , добавив к векторам ,  одну координату и положить ее равной 1. Тогда нетрудно видеть, что в новом пространстве множества разделимы гиперплоскостью, проходящей через начало координат. Итак, пусть расстояние от начала координат до выпуклой оболочки множества  отлично от нуля и равно , а расстояние от начала координат до конца самого далекого вектора этого множества равно .

Тогда, как показал Новиков, после многократного предъявления обучающей последовательности, составленной из элементов множеств  и , будет проведено не более  исправлений коэффициентов (символ  означает целую часть числа ).

 



<< ПредыдущаяОглавлениеСледующая >>