§ 8. Оценка уклонения эмпирически оптимального решающего правилаВ главе X будет получена оценка скорости равномерной сходимости. Оказывается, что . (5.9) Оценка имеет тот же вид, что и для конечной системы событий, но вместо числа событий в правой части неравенства стоит функция роста. Таким образом, функция роста служит мерой разнообразия класса событий. Если емкость класса бесконечна , оценка (5.9) тривиальна, так как правая часть неравенства больше единицы при всех . Если же емкость конечна, оценка приобретает вид . (5.10) Правая часть неравенства стремится к нулю при и притом тем быстрее, чем меньше . Можно потребовать, чтобы вероятность не превышала заданное значение . Это во всяком случае произойдет, если . Это равенство можно разрешить относительно . Таким образом, справедливо утверждение: с вероятностью, не превышающей , максимальное по классу уклонение частоты выпадения событий от вероятности не превосходит . (5.11) Отсюда, в силу сказанного в § 2, непосредственно следует, что с вероятностью, превышающей , качество эмпирически оптимального решающего правила отличается от качества истинно оптимального не более чем на , т. е. , где – длина обучающей выборки, а – емкость класса решающих правил, из которого осуществляется выбор. В частности, для линейных решающих правил в пространстве размерности . Таким образом, при заданной длине обучающей выборки качество решающего правила, выбранного алгоритмом, тем ближе к наилучшему в классе, чем меньше емкость класса . Но следует помнить, что качество наилучшего в классе решающего правила, вообще говоря, напротив, тем выше, чем шире класс . Разрешая равенство (5.11) относительно , можно оценить для фиксированной точности и надежности достаточную длину обучающей последовательности (см. главу XIII). Оказывается, что качество эмпирически оптимального решающего правила с вероятностью, превышающей , отличается от наилучшего в классе не более чем на , если только длина обучающей выборки достигает . (5.12) Следовательно, достаточная длина выборки пропорциональна емкости класса решающих функций. В частности, для линейных решающих функций в -мерном спрямляющем пространстве достаточная длина пропорциональна размерности .
|