Читать в оригинале

<< ПредыдущаяОглавлениеСледующая >>


§ 10.25. Игры автоматов

Обучение автомата оптимальному поведению можно рассматривать как игру автомата с природой.

Но автоматы могут играть и между собой, если погрузить их в одну и ту же среду (рис. 10.16). Стратегии игроков-автоматов представляют собой состояния. Число стратегий определяется памятью автоматов. Теперь штраф или поощрение соответствуют выигрышу или проигрышу автомата.

Рис. 10.16.

Игры автоматов определяют коллективное поведение обучающихся автоматов. Для игр автоматов с нулевой суммой остается справедливой основная теорема о минимаксе, и мы можем применить полученные выше алгоритмы обучения решению игр и алгоритмы обучения автоматов. Мы надеемся, что для прос1ейших задач, связанных с играми автоматов, читатель сам выпишет алгоритмы, определяющие стратегии играющих автоматов.

 



<< ПредыдущаяОглавлениеСледующая >>