§ 6. Направленный таксономический поиск признаков (алгоритм НТПП) [59,82]
Если мы располагаем методом измерения близости (зависимости) между признаками, то можем сделать таксономию множества
признаков на
таксонов. И если при таксономии объектов в один таксон объединяются наиболее близкие, похожие друг на друга объекты, то в данном случае в таксоны объединяются признаки, одинаково проявляющие себя на объектах обучающей выборки. Так как в один таксон группируются признаки по принципу максимального сходства (зависимости), то между таксонами обеспечивается максимальное несходство (независимость). Выбрав затем по одному типичному признаку из каждого таксона, мы получим
-мерную подсистему, которая включает в свой состав признаки, отличающиеся максимальной независимостью друг от друга. Такая подсистема наилучшим образом соответствует решающему правилу, ориентированному на использование независимых признаков.
В реальных задачах может встретиться случай, когда в исходной системе имеются группы признаков, связанных между собой сильной зависимостью, но не несущих информации, полезной для распознавания заданных образов. Такие признаки объединятся в таксоны, их представители попадут в
-мерную подсистему, будут разрушать компактность образов и служить помехой при принятии решений. Чтобы избежать такой ловушки, в алгоритме НТПП предусмотрен следующий прием. Таксономия
признаков делается на
таксонов
. Выбирается
признаков и делается перебор
сочетаний из
по
признаков. Эти сочетания сравниваются между собой по качеству распознавания и выбирается такое сочетание, которое приводит к наименьшей величине ошибок. Оно и принимается за наиболее информативную
-мерную подсистему признаков.