§ 10.5. Алгоритмы обучения решению игрПредставим уравнения (10.15) в виде
и применим к ним вероятностные итеративные алгоритмы обычного типа. Тогда мы получим алгоритмы обучения решению игр
Здесь Подобным же образом, представляя уравнения (10.18) в виде
находим алгоритмы обучения решению игр при наличии погрешностей:
Алгоритмы (10.22) соответствуют процессу последовательного совершенствования игроками стратегий «опытным путем» при наличии мешающих факторов — погрешностей. Любопытно отметить, что наличие погрешностей с нулевым средним значением не является препятствием к выработке оптимальных стратегий, лишь удлиняя время обучения. По
которая при Полученные общие алгоритмы обучения (10.20), (10.22) в частных случаях приводят и к известным итерационным алгоритмам, приведенным в табл. 10.1. Алгоритмы обучения решению игр сходятся, вообще говоря, довольно медленно. Для ускорения сходимости алгоритмов можно использовать различные способы ускорения сходимости, о которых речь шла, например, в § 3.15. Все эти способы связаны в конечном итоге с изменением коэффициентов Рис. 10.1 Рис. 10.2 Так, например, сходимость алгоритмов может быть ускорена, если заменить те итерации, в которых повторяются одни и те же чистые стратегии, одной итерацией. Это соответствует такому выбору
где
|