§ 10.21. О мере целесообразности поведенияПри погружении автомата в среду его действие вызывает реакцию среды, изменяющую входное воздействие. При благоприятном поведении автомата , а при неблагоприятном . Эти двоичные сигналы можно считать поощрением и штрафом. В качестве меры целесообразности поведения автомата удобно принять математическое ожидание величины штрафа, т. е. которое равно вероятности штрафования автомата. (10.87) Если бы автомат совершал свои действия равновероятно, независимо от реакции среды, то его выходная переменная представляла бы бернуллиеву решетчатую функцию . Такому безразличному поведению автомата соответствует условное математическое ожидание штрафа (10.88) Автомат обладает целесообразным поведением, если . (10.89) Неравенство (10.89) имеет важное значение для анализа поведения конечных автоматов при достаточно полной априорной информации. Мы не можем удержаться от того, чтобы не привести цетлиновский пример о стопке книг, который особенно наглядно иллюстрирует сказанное выше. Из стопки книг, лежащей на письменном столе, книгами можно пользоваться различными способами. Например, брать нужную книгу, а затем класть ее на место, либо класть просто на верх стопки. Второй способ обладает определенной целесообразностью. Чем чаще книга употребляется, тем выше она расположена в стопке книг. Отметим, что величины и могут быть найдены по обычным алгоритмам определения математических ожиданий (5.8) (5.9), если мы можем наблюдать за действиями автомата.
|