§ 2. Алгоритмы таксономии класса FOREL
Самый известный критерий
состоит в том, что в один таксон должны собираться объекты, похожие, близкие по своим характеристикам. Но термины похожесть, близость можно понимать по-разному, и в зависимости от того, какой их вариант мы выберем, получится тот или иной вариант таксономии. Остановимся вначале на разновидности меры «похожести» в виде «похожести на центр».
Оговоримся, что здесь мы рассматриваем случай таксономии объектов, признаки которых измерены в сильных шкалах, что позволяет оценивать похожесть через евклидово расстояние между точками в многомерном пространстве. Как поступать в случае с разнотипными признаками, мы обсудим позже.
Если координаты центра
-го таксона обозначить символом
, то сумма расстояний
между центром и всеми
точками
этого таксона
, где
, а сумма таких внутренних расстояний для всех
таксонов
,
. Смысл критерия похожести на центр состоит в том, что нужно найти такое разбиение
объектов на
таксонов, чтобы приведенная выше величина
была минимальной. Выполнение этого условия можно достичь с помощью алгоритма FOREL [53,82]. Опишем базовую версию и некоторые модификации этого алгоритма.