§ 10.26. Некоторые задачи

Среди задач, связанных с играми, мы выделим задачу построения алгоритмов обучения решению игр в тех случаях, когда элементы платежной матрицы не постоянны, а представляют собой случайные величины, либо неизвестны. Последний случай охватывает так называемые игры вслепую.

Важным во всех задачах обучения и адаптации является ускорение сходимости алгоритмов за счет использования более полных данных о среде, получаемых во время работы автомата. Обычно это сводится к надлежащему выбору характера изменения и . Существуют ли иные возможности учета предшествующего опыта для ускорения сходимости?

Было бы желательно оценить эффективность различных алгоритмов обучения порогового элемента, а также пороговых цепей, составленных из пороговых элементов. Задачи идентификации и управления, очевидно, переносятся и на конечные автоматы. Систематическое исследование этих возможностей представило бы определенный интерес.

Весьма интересные задачи возникают в связи с играми автоматов. К ним относятся поведение автоматов, получающих информацию не только об исходе партий, но и об использованных в этих партиях стратегиях, и игры автоматов вслепую, когда платежная матрица неизвестна. Представляет интерес рассмотреть игры автоматов с ненулевой суммой и, наконец, игры большого числа автоматов. Естественно, при адаптивном подходе предполагается достаточно малая априорная информация, которая не позволяет непосредственно применить довольно развитый аппарат марковских цепей.