Читать в оригинале

<< ПредыдущаяОглавлениеСледующая >>


§ 4. Теоремы об останове

Пусть одновременно с построением разделяющей гиперплоскости будет выясняться качество построенной к данному моменту гиперплоскости. Если оно высоко, то обучение прекращается; в противном случае обучение продолжается. Таким образом, кроме алгоритма построения разделяющей гиперплоскости имеется алгоритм проверки качества построенной гиперплоскости. Будем пользоваться следующим критерием: процесс обучения заканчивается, как только после некоторого (-го) исправления решающего правила очередные  элементов обучающей последовательности не приводят к изменению решающего правила. Теория останова, по существу, исследует два вопроса:

1) какими должны быть величина , чтобы в случае, если останов произойдет, можно было бы утверждать, что с заданной вероятностью качество построенного решающего правила будет не хуже требуемого;

2) на какой длине обучающей последовательности заведомо произойдет останов.

Ответ на эти два вопроса дают следующие теоремы.

Теорема 4.1. Если в соответствии с критерием останова процесс обучения закончится, то с вероятностью, большей , можно утверждать, что построенное решающее правило характеризуется качеством  при условии, что

,

где ;  – любая константа, большая 1; .

Доказательство. Пусть в процессе обучения сменяются решающие правила

Оценим вероятность того, что останов произойдет в тот момент, когда выбрано правило  с качеством .

Пусть, например, после -го исправления выбрано правило  с качеством ; при этом условии вероятность  того, что останов произойдет после -го (но до -го) исправления, равна вероятности того, что за этим исправлением последует  безошибочных опознаний, т. е.

.

Тогда вероятность  того, что останов произойдет после одного из исправлений, когда , оценивается так:

.

Таким образом, справедлива оценка:

.

Выберем теперь функцию  такую, что

.                   (4.5)

Из равенства (4.5) может быть найдено, что

.              (4.6)

Остается определить величину . Найдем ее из условия

,

т. е.

,

где

            .

Из этого соотношения находим, что

.              (4.7)

Таким образом, из (4.6) и (4.7) следует, что при

                       (4.8)

вероятность  меньше требуемой величины . Оценка (4.8) справедлива для любого . В частности, при  , откуда

.

Теорема доказана.

Теорема 4.2. Пусть конечно-сходящийся алгоритм таков, что число коррекций не превосходит величину , а в качестве  взята функция (4.8), описанная в условии теоремы 4.1; тогда можно утверждать, что останов заведомо произойдет на обучающей последовательности длины

                                                           .

Доказательство теоремы очевидно.

Для персептрона Розенблатта в силу теоремы Новикова , поэтому останов произойдет на обучающей последовательности длины

.

Существует некоторая тонкость в понимании приведенных теорем об останове. Эти теоремы никак не гарантируют, что после того, как будет сделано  шагов, построенная разделяющая гиперплоскость окажется требуемого качества. Теоремы гарантируют лишь то, что до -гo шага обязательно произойдет останов и что в момент останова построенная гиперплоскость окажется заданного качества.

Если же алгоритм не остановить, то, вообще говоря, может случиться, что последующие коррекции ухудшат качество решающего правила и к -му шагу это качество будет ниже требуемого.

 



<< ПредыдущаяОглавлениеСледующая >>