Читать в оригинале

<< ПредыдущаяОглавлениеСледующая >>


2.2. Отбор компетентных штаммов

Элементы базового штамма , начинающегося с элементов -й строки, в массиве исходных данных помечены их порядковыми номерами  в штамме: . Набор адресов этих элементов описывает структуру (архитектуру) конкретного штамма, состоящего из  элементов. Если индекс  у всех элементов штамма увеличить на заданное число , то мы получим штамм той же структуры, что и исходный, но только сдвинутый во времени на  шагов назад. Назовем такой штамм изоморфным данному базовому штамму.

Выделим среди изоморфных штаммов группу, состоящую из  «потенциально компетентных» штаммов (ГПК). В нее будем включать изоморфные штаммы с наибольшей похожестью на базовый штамм . Меру похожести между штаммами можно оценивать разными способами.

Если ориентироваться на абсолютные значения характеристик их элементов, то можно использовать евклидово расстояние между штаммами:

В ГПК отбирается  штаммов с наименьшими расстояниями .

Если считать, что мы имеем дело с данными, измеренными в шкале отношений, то похожесть двух штаммов можно обнаружить через расстояние между соответствующими отношениями:

Инвариантами шкалы интервалов являются расстояния между отношениями интервалов:

Хорошими свойствами обладает мера Акаика [28], выражающая степень похожести  объектов через расстояние  между ними:

Для всех приведенных выше сильных шкал похожесть штаммов можно определять и по модулю коэффициента корреляции  между значениями соответствующих элементов этих штаммов. Если в таблице представлены данные, измеренные в более слабых шкалах (порядка и наименований), то для измерения расстояния между штаммами можно воспользоваться мерами, которые будут описаны в следующей главе.

Теперь проверим, является ли данная ГПК на самом деле компетентной. Чтобы обосновать процедуру такой проверки, вспомним смысл гипотезы компактности  (см. гл. 3). Из нее следует, что сначала нужно удостовериться, что объекты множества  компактны в пространстве описывающих характеристик . В нашем случае мы имеем дело с множеством  из  штаммов, входящих в ГПК. Пространство  имеет размерность, равную . Каждая -я характеристика этого пространства есть номер -го элемента базового штамма. Значение этого элемента  и есть значение -й характеристики объекта (в данном случае базового штамма). Для изоморфного штамма, сдвинутого относительно базового на  моментов времени назад, значение -й характеристики равно значению   элемента, находящегося в клеточке с координатами . Таким образом, мы имеем дело с множеством  объектов в -мерном пространстве . Эти объекты были отобраны по критерию похожести на базовый штамм . Если критерий похожести принять в качестве критерия компактности, то условие компактности  для множества штаммов из ГПК выполняется автоматически.

Добавим к  еще одну — целевую характеристику , т. е. еще один элемент таблицы. Пусть для базового штамма этим элементом будет тот, значение которого требуется предсказать, т. е. . Соответственно к каждому штамму из ГПК добавим по одному известному элементу . Теперь появляется возможность проверить, выполняется ли условие компактности для целевой характеристики  у объектов множества , входящих в ГПК. Условие компактности для значений одной характеристики может быть определено по-разному. Например, по величине дисперсии значений, по разности между  и  и т. д.

Если условие компактности для  на штаммах множества  не выполняется, то это означает, что по свойствам  они похожи друг на друга, а по свойству  не похожи. Следовательно, между свойствами  и  этих объектов закономерной связи нет, и нет оснований рассчитывать на успешное прогнозирование целевого свойства с опорой на штаммы из данной группы. Такая ГПК не включается в список компетентных групп, она и породивший ее базовый штамм из дальнейшего рассмотрения исключаются. Если же штаммы данной ГПК оказались компактными в пространстве свойств , то они совместно со своим базовым штаммом образуют группу компетентных штаммов.

Затем вся описанная последовательность процедур повторяется для другого штамма той же мощности , но другой архитектуры. Таким способом множество базовых штаммов порождает коллектив из  групп компетентных штаммов мощности .

 



<< ПредыдущаяОглавлениеСледующая >>