Читать в оригинале

<< Предыдущая Оглавление Следующая >>


§ 2. Равномерная сходимость средних к математическим ожиданиям

1. В общем случае вопрос о равномерной близости функций  и  сводится к равномерной по параметру  сходимости средних к математическим ожиданиям.

В самом деле, функция

есть математическое ожидание функции потерь , тогда как

есть среднее арифметическое этой случайной величины, вычисленное по выборке .

Сформулируем в точных терминах проблему равномерной сходимости средних к математическим ожиданиям.

Пусть  – элементарное событие из пространства ,  – вероятностная мера в нем,  – некоторый абстрактный параметр,  – некоторая функция, измеримая при всех  относительно меры  в пространстве .

Предположим, что существует математическое ожидание этой функции при всех

.

Пусть, далее, задана повторная выборка  из пространства , т. е. выборка, полученная в последовательности независимых испытаний при неизменном распределении. Тогда для каждого  по этой выборке можно вычислить среднее значение

.

Если бы  была постоянной величиной, то сходимость среднего к математическому ожиданию обеспечивалась бы законом больших чисел. Но если параметр  может изменяться в пределах некоторого множества , то возникает вопрос о равномерности по параметру  оценки математического ожидания средним значением. Точнее, обозначим через  вероятностную меру в пространстве выборок длины . Тогда равномерность близости средних к математическим ожиданиям может быть оценена величиной

,

т. е. вероятностью того, что максимальное по  уклонение средневыборочного значения от математического ожидания превзойдет .

Говорят, что имеет место равномерная по параметру сходимость средних к математическим ожиданиям, если случайная величина  стремится к нулю соответственно по вероятности или почти наверное при .

Приводимые ниже достаточные критерии такой сходимости (за исключением последнего) сводят при определенных условиях вопрос о равномерной сходимости средних к математическим ожиданиям к исследованной в предыдущих главах проблеме равномерной сходимости частот к вероятностям в некотором классе событий.

Теорема 13.1. Пусть   - семейство измеримых на  функций, причем выполнено условие  (число  не зависит от  и ). Рассмотрим систему  событий вида

для всевозможных  и .

Тогда равномерная сходимость частот к вероятностям по классу событий  является достаточным условием для равномерной сходимости средних к математическим ожиданиям. При этом выполняется соотношение

.

Доказательство. Действительно, согласно определению интеграла Лебега

.

Аналогично

.

Обозначим событие

через . Тогда

,

чем и доказывается наше утверждение.

Кроме того, получаем

.

Тем самым из оценок для равномерной сходимости частот к вероятностям по классу событий можно всегда получить оценки для равномерной сходимости средних к математическим ожиданиям для равномерно ограниченных функций .

Следствие. В силу полученных в главах X и XI условий равномерной сходимости частот к вероятностям в случае, когда

,

для равномерной сходимости средних к математическим ожиданиям (почти наверное) достаточно, чтобы  или (более слабое условие)

,

где  – определенная выше совокупность событий.

При этом справедлива оценка:

.                  (13.8)

Отметим, что необходимые и достаточные условия равномерной сходимости частот к вероятностям переходят здесь лишь в достаточные условия равномерной сходимости средних к математическим ожиданиям.

Замечание. Равномерная ограниченность функции  в этом рассуждении существенна, так как в противном случае можно построить примеры, где равномерная по классу  сходимость частот к вероятностям имеет место, тогда как равномерной сходимости средних к математическим ожиданиям нет.

Однако это требование может быть ослаблено. В ряде случаев существенно не абсолютное, а относительное уклонение средних от математических ожиданий. В этом случае из допущения, что

 и ,

где  не зависит от  и , аналогично доказанной теореме выводится неравенство

,

где система  определена как и раньше. Отсюда следуют аналогичные оценки и условия сходимости.

Применим полученный результат для оценки алгоритмов, основанных на минимизации эмпирического риска. Допустим, что функция потерь  неотрицательна и равномерно ограничена. Тогда из (13.8) следует, что

,

где  – система событий вида

при всевозможных  и .

Свойством равномерной ограниченности обладают функции потерь в задачах распознавания образов при произвольной функции штрафа за ошибку.

2. Пусть существует функция , не зависящая от  такая, что

, .

Тогда для равномерной сходимости средних к математическим ожиданиям (почти наверное) достаточна равномерная сходимость частот к вероятностям по классу  событий вида

.

Пусть . Выберем  таким, чтобы выполнялось

,

и положим

Тогда

,

,

где  и  – соответственно математическое ожидание и среднее функции , a

.

Поскольку  равномерно ограничена, в силу предыдущего результата с вероятностью 1 найдется  такое, что при

.

Кроме того, из усиленного закона больших чисел следует, что с вероятностью 1 найдется  такое, что при

.

Но тогда при

,

что и требуется.

3. Ле-Кам [84, 85], основываясь на идеях Вальда, получил следующий результат.

Пусть  – измеримая по  функция, непрерывная по  почти для всех ,  изменяется в пределах метрического компакта  и существует  такая, что

, .

Тогда, если математическое ожидание  существует для всех , то

,

т. е. имеет место равномерная по параметру сходимость средних к математическим ожиданиям.

Этот результат не перекрывает изложенные выше хотя бы потому, что здесь требуется непрерывность, тогда как предыдущие критерии включали также и разрывные функции, обычно используемые в распознавании. Кроме того, в рамках идей Вальда – Ле-Кама, видимо, трудно получить какие-либо оценки.

 



<< Предыдущая Оглавление Следующая >>