§ 5. Еще одно условие сходимости рекуррентных алгоритмов
В условиях теоремы 1 не предполагалось, что существует минимум функционала
. Достаточно было того, что функционал ограничен снизу и, следовательно, существует точная нижняя грань. Сходимость к точной нижней грани и утверждала теорема.
Сейчас будем предполагать, что минимум функционала существует. Это позволит ослабить требования к порядку роста модуля градиента функции потерь.
Теорема 9.2. (Б. М. Литваков [44]). Пусть выполнены следующие условия:
1) функционал
ограничен снизу и существует непустое множество
,
2)
,
3)
.
Тогда при любом
с вероятностью единица справедливо:
.
Доказательство. Выберем произвольную точку
. Оценим долю
тех последовательностей, которые хоть раз выйдут из гипершара
с центром в
и радиуса
. Для этого положим, что рекуррентные соотношения (9.13) выполняются лишь для
и вне гипершара
последовательность «залипает», т. е.
.
Таким образом, последовательность, выйдя из гипершара, не может войти обратно.
Аналогично теореме 9.1, учитывая условия выпуклости
и условия теоремы 9.2, можно показать, что справедливо неравенство
. (9.24)
Усилим неравенство (9.24), для чего оценим величину
.
Воспользовавшись неравенством
, получим
. (9.25)
Подставляя (9.25) в (9.24), получим
. (9.26)
Из неравенства (9.26) следует, что величина
ограничена числом
, не зависящим от номера
. Покажем это.
Обозначим
,
. Покажем, что справедливо неравенство
. (9.27)
Для
справедливость неравенства легко проверяется:
.
По индукции легко доказывается справедливость неравенства и для любого
, если оно справедливо для
:

Остается показать, что величина
ограничена, т. е.
. (9.28)
В самом деле, в произведении (9.28) сомножитель
ограничен, так как
.
Сомножитель

также ограничен, так как бесконечное произведение

ограничено тогда и только тогда, когда сумма

ограничена.
Таким образом,
.
Используя неравенство Чебышева, можно получить неравенство
.
На множестве
функция
ограничена. Рассмотрим процесс, отличающийся от (9.13) лишь тем, что при выходе за пределы
он «залипает». Очевидно, что все реализации исходного процесса, не покидающие
, при этом сохранятся и вероятность «залипания» меньше
. Применительно к новому процессу можно повторить все рассуждения теоремы (9.1) и показать, что с вероятностью, превышающей
, для этого процесса
.
Отличие лишь в том, что в лемме 2 величина
есть вероятность того, что процесс за первые
шагов ни разу не вышел из области
и не вошел в
. Получая, далее, что
, приходим к выводу, что с вероятностью, превышающей
, процесс входит в
. Остальные рассуждения повторяются, по существу, без изменения.
Далее, соответствующим выбором
величина
может быть сделана сколь угодно малой, откуда и следует утверждение теоремы.