§ 10. Замечание об оценке скорости равномерной сходимости частот появления событий к их вероятностямПочему же оценки, полученные для детерминистского и стохастического вариантов постановки задачи, так сильно различаются. Объяснение этому частично дано в предыдущем параграфе, где формулы (5.3), (5.10) и (5.13), (5.18) определяют скорости равномерной сходимости частот появления событий к их вероятностям по различным классам событий В детерминистском варианте постановки учитываются только те события исходного множества событий Формально этот факт находит свое отражение в структуре формул, задающих оценку равномерной сходимости, (5.10), (5.18). Правая часть неравенств (5.10), (5.18) состоит из двух сомножителей. Первый сомножитель характеризует емкость класса событий (он идентичен, как в случае (5.10), так и в (5.18)), второй сомножитель оценивает вероятность уложиться в заданное уклонение Оказывается, удается существенно по-разному оценить этот второй сомножитель. Так как при стохастическом варианте постановки априори не известны никакие характеристики вероятностей событий класса Для детерминистского варианта постановки наиболее неблагоприятное событие в классе Таким образом, оценки, полученные для детерминистского и стохастического вариантов постановки задачи, различаются так, как различаются оценки уклонения частот от вероятностей в двух событиях: в событии Это обстоятельство заставляет внимательно отнестись к тем требованиям, которые предъявляются к величинам уклонения частот от вероятностей. В задаче обучения распознаванию образов можно ослабить требования к характеру сходимости: разумно требовать не равномерного отклонения частот от вероятностей для всех событий, а разрешить большее уклонение для тех событий, которым соответствует вероятность, близкая к Рис. 12. Допустим, что оптимальным является правило Учтем далее, что сходимость частот к вероятностям для фиксированного значения Оценим требующуюся для этого длину выборки. В главе XII будет показано, что справедлива односторонняя оценка:
Положим
Тогда из условия
следует, что При
Таким образом, условия (5.21) достаточно для
В детерминистском случае Результаты главы XII позволяют получить и другую оценку качества решающего правила. Допустим, что выполняется (5.21). Тогда, разрешая (5.21) относительно
Потребуем теперь, чтобы (5.21) выполнялось для всех
Разрешая это уравнение относительно
При
Как и раньше, примем, что в точке
Заметим, что для эмпирически оптимального
Тогда с вероятностью
Используя (5.22), можно получить оценку длины обучающей последовательности, которая в одном предельном случае (при
В этой главе были приведены качественные оценки длины обучающей последовательности. Строгие оценки получены в главе XIII. Однако при использовании оценок важно не столько их конкретное выражение (ведь оценки получены в предположении наиболее неблагоприятных условий), сколько структура связи основных параметров
|