Читать в оригинале

<< Предыдущая Оглавление Следующая >>


§ 3.2. Понятия обучения, самообучения и адаптации

Известно большое число определений того, что следует понимать под обучением, самообучением и адаптацией. К сожалению, даже применительно к автоматическим системам эти определения весьма разноречивы. Мы не будем углубляться в сравнительный анализ и критику таких определений. Это слишком отвлекло бы нас от основной цели, и неизвестно, достигли бы мы на этом пути успеха. Вместо этого мы попытаемся привести удобные для нашей цели определения, которые, вероятно, также можно подвергнуть критике.

Под обучением мы будем подразумевать процесс выработки в некого рой системе той или иной реакции на внешние сигналы путем многократных воздействий на систему и внешней корректировки. Разумеется, при этом система предполагается потенциально «способной» к обучению.

Внешняя корректировка, или как ее еще называют, «поощрение» или «наказание», осуществляется «учителем», которому известна желаемая реакция на определенные внешние воздействия. Таким образом, при обучении «учитель» сообщает системе дополнительную информацию о том, верна или неверна реакция системы.

Самообучение отличается от обучения отсутствием внешней корректировки. Самообучение — это обучение без поощрения или наказания. Дополнительная информация о верности реакции системе не сообщается.

Адаптацией мы будем называть процесс изменения параметров и структуры системы, а возможно, и управляющих воздействий на основе текущей информация с целью достижения определенного, обычно оптимального, состояния системы при начальной неопределенности и изменяющихся условиях работы.

Иногда обучение отождествляют с адаптацией. Для этого есть много оснований, особенно если ввести какой-то показатель успехи обучения, улучшение которого характеризует степень обучения. Нам, однако, будет удобнее считать, что при адаптации обучение используется для получения информации о состоянии и характеристиках системы, необходимой для оптимального управления в условиях неопределенности. Это соглашение можно обосновать тем, что при наличии начальной неопределённости, пожалуй, единственный разумный подход состоит в устранении ее с помощью обучения или самообучения в процессе управления и в использовании накапливаемой информации для улучшения критерия оптимальности системы управления. Таким образом, наиболее характерная черта адаптации состоит в накоплении и немедленном использовании текущей информации для устранения неопределённости из-за недостаточной априорной информации с целью оптимизации избранного показателя качества.

Читатель заметит, вероятно, что адаптацию мы по существу отождествляем с оптимизацией в условиях недостаточной априорной  информации.

 



<< Предыдущая Оглавление Следующая >>