§ 10.4. Уравнения оптимальных стратегий

Решение матричных игр сводится к отысканию седловой точки, т. е. нахождению оптимальных стратегий , для которых выполняются условия (10.12).

Существуют прямые методы отыскания оптимальных стратегий, основанные на теореме Шеппли-Сноу. Эти методы гарантируют нахождение точного решения игры за конечное число операций, однако практически они пригодны лишь для игр с малым числом стратегий. На основе связи, существующей между теорией игр и линейным программированием, для решения игр возможно применение различных конечных методов линейного программирования.

Наряду с прямыми методами известны разнообразные не прямые методы решения игр. Мы упоминаем об этих возможных методах решения игр с тем, чтобы без угрызения совести оставить их в дальнейшем без рассмотрения. Читатель, вероятно, догадывается, что нас интересуют методы решения игр, основанные на обучении игроков во время игр и совершенствовании ими своего мастерства. Существуют ли такие методы решения игр? Оказывается, да. Вот именно на них мы и остановим свое внимание.

Обозначим через и оптимальные ответы на соответствующие смешанные стратегии и .

Тогда для оптимальных смешанных стратегий и , определяемых теоремой фон Неймана (10.11), будут справедливы равенства

(10.13)

которые выражают тот очевидный факт, что оптимальные ответы на оптимальные смешанные стратегии, представляют собой оптимальные смешанные стратегии.

Из (10.13) следует, что оптимальные смешанные стратегии и представляют собой решения уравнений

(10.14)

Вспоминая, что смешанные стратегии можно представить как математическое ожидание применяемых соответствующих чистых стратегий (10.7), уравнения (10.14) можно представить в форме

(10.15)

где и — оптимальные ответы — чистые стратегии — на чистые стратегии, появляющиеся с распределением и соответственно.

Предположим теперь, что мы не имеем возможности точно находить оптимальные ответы и , а определяем их с какой-то погрешностью , т. е. вместо и мы в действительности определяем

(10.16)

Если среднее значение погрешностей и равно нулю, то

(10.17)

и вместо уравнения (10.12) мы получаем

(10.18)

Здесь математическое ожидание берется по распределению вероятностей помех.

Уравнения (10.15) и (10.18) и представляют собой уравнения оптимальных стратегий.