§ 10.25. Игры автоматовОбучение автомата оптимальному поведению можно рассматривать как игру автомата с природой. Но автоматы могут играть и между собой, если погрузить их в одну и ту же среду (рис. 10.16). Стратегии игроков-автоматов представляют собой состояния. Число стратегий определяется памятью автоматов. Теперь штраф или поощрение соответствуют выигрышу или проигрышу автомата. Рис. 10.16. Игры автоматов определяют коллективное поведение обучающихся автоматов. Для игр автоматов с нулевой суммой остается справедливой основная теорема о минимаксе, и мы можем применить полученные выше алгоритмы обучения решению игр и алгоритмы обучения автоматов. Мы надеемся, что для прос1ейших задач, связанных с играми автоматов, читатель сам выпишет алгоритмы, определяющие стратегии играющих автоматов.
|