§ 2. Равномерная сходимость средних к математическим ожиданиям1. В общем случае вопрос о равномерной близости функций и сводится к равномерной по параметру сходимости средних к математическим ожиданиям. В самом деле, функция есть математическое ожидание функции потерь , тогда как есть среднее арифметическое этой случайной величины, вычисленное по выборке . Сформулируем в точных терминах проблему равномерной сходимости средних к математическим ожиданиям. Пусть – элементарное событие из пространства , – вероятностная мера в нем, – некоторый абстрактный параметр, – некоторая функция, измеримая при всех относительно меры в пространстве . Предположим, что существует математическое ожидание этой функции при всех . Пусть, далее, задана повторная выборка из пространства , т. е. выборка, полученная в последовательности независимых испытаний при неизменном распределении. Тогда для каждого по этой выборке можно вычислить среднее значение . Если бы была постоянной величиной, то сходимость среднего к математическому ожиданию обеспечивалась бы законом больших чисел. Но если параметр может изменяться в пределах некоторого множества , то возникает вопрос о равномерности по параметру оценки математического ожидания средним значением. Точнее, обозначим через вероятностную меру в пространстве выборок длины . Тогда равномерность близости средних к математическим ожиданиям может быть оценена величиной , т. е. вероятностью того, что максимальное по уклонение средневыборочного значения от математического ожидания превзойдет . Говорят, что имеет место равномерная по параметру сходимость средних к математическим ожиданиям, если случайная величина стремится к нулю соответственно по вероятности или почти наверное при . Приводимые ниже достаточные критерии такой сходимости (за исключением последнего) сводят при определенных условиях вопрос о равномерной сходимости средних к математическим ожиданиям к исследованной в предыдущих главах проблеме равномерной сходимости частот к вероятностям в некотором классе событий. Теорема 13.1. Пусть - семейство измеримых на функций, причем выполнено условие (число не зависит от и ). Рассмотрим систему событий вида для всевозможных и . Тогда равномерная сходимость частот к вероятностям по классу событий является достаточным условием для равномерной сходимости средних к математическим ожиданиям. При этом выполняется соотношение . Доказательство. Действительно, согласно определению интеграла Лебега . Аналогично . Обозначим событие через . Тогда , чем и доказывается наше утверждение. Кроме того, получаем . Тем самым из оценок для равномерной сходимости частот к вероятностям по классу событий можно всегда получить оценки для равномерной сходимости средних к математическим ожиданиям для равномерно ограниченных функций . Следствие. В силу полученных в главах X и XI условий равномерной сходимости частот к вероятностям в случае, когда , для равномерной сходимости средних к математическим ожиданиям (почти наверное) достаточно, чтобы или (более слабое условие) , где – определенная выше совокупность событий. При этом справедлива оценка: . (13.8) Отметим, что необходимые и достаточные условия равномерной сходимости частот к вероятностям переходят здесь лишь в достаточные условия равномерной сходимости средних к математическим ожиданиям. Замечание. Равномерная ограниченность функции в этом рассуждении существенна, так как в противном случае можно построить примеры, где равномерная по классу сходимость частот к вероятностям имеет место, тогда как равномерной сходимости средних к математическим ожиданиям нет. Однако это требование может быть ослаблено. В ряде случаев существенно не абсолютное, а относительное уклонение средних от математических ожиданий. В этом случае из допущения, что и , где не зависит от и , аналогично доказанной теореме выводится неравенство , где система определена как и раньше. Отсюда следуют аналогичные оценки и условия сходимости. Применим полученный результат для оценки алгоритмов, основанных на минимизации эмпирического риска. Допустим, что функция потерь неотрицательна и равномерно ограничена. Тогда из (13.8) следует, что , где – система событий вида при всевозможных и . Свойством равномерной ограниченности обладают функции потерь в задачах распознавания образов при произвольной функции штрафа за ошибку. 2. Пусть существует функция , не зависящая от такая, что , . Тогда для равномерной сходимости средних к математическим ожиданиям (почти наверное) достаточна равномерная сходимость частот к вероятностям по классу событий вида . Пусть . Выберем таким, чтобы выполнялось , и положим Тогда , , где и – соответственно математическое ожидание и среднее функции , a . Поскольку равномерно ограничена, в силу предыдущего результата с вероятностью 1 найдется такое, что при . Кроме того, из усиленного закона больших чисел следует, что с вероятностью 1 найдется такое, что при . Но тогда при , что и требуется. 3. Ле-Кам [84, 85], основываясь на идеях Вальда, получил следующий результат. Пусть – измеримая по функция, непрерывная по почти для всех , изменяется в пределах метрического компакта и существует такая, что , . Тогда, если математическое ожидание существует для всех , то , т. е. имеет место равномерная по параметру сходимость средних к математическим ожиданиям. Этот результат не перекрывает изложенные выше хотя бы потому, что здесь требуется непрерывность, тогда как предыдущие критерии включали также и разрывные функции, обычно используемые в распознавании. Кроме того, в рамках идей Вальда – Ле-Кама, видимо, трудно получить какие-либо оценки.
|