§ 6. Коллективно-групповые методы распознавания (класс алгоритмов КГМ)

§ 6. Коллективно-групповые методы распознавания (класс алгоритмов КГМ) [64]

Описанный выше подход к решению задачи прогнозирования применим и к задаче распознавания образов. Уже упоминались методы распознавания, использующие не одно, а несколько параллельно работающих решающих правил [116, 138]. Каждое правило выдает свой частный вариант решения. Окончательное решение принимается на основании учета этих вариантов с помощью той или иной процедуры обобщения. Этот подход целесообразно расширить на случай, когда используется не одна группа решающих правил, а несколько, т. е. «коллектив» групп. Иерархия групп или коллективов может быть сколь угодно большой. На каждом уровне вырабатываются частные решения, по ним — обобщенные решения данного уровня, которые играют роль частных для следующего уровня и т. д.

Компетентность группы решающих правил может оцениваться по величине, характеризующей разброс получаемых результатов. При прогнозировании величин, измеряемых в сильных шкалах, для этой цели используется дисперсионный критерий. В задачах распознавания прогнозируется характеристика, измеряемая в шкале наименований, и здесь в качестве меры неодинаковости решений можно использовать энтропию .

Если распознается образов, то при равномерном распределении решений в пользу всех образов энтропия решений максимальна и равна . Если в пользу образа высказалось решающих правил из , то энтропия предсказаний в группе выражается формулой

Компетентность решающих правил группы при распознавании образов можно принять равной . Если энтропия решений равна нулю, то компетентность максимальна и равна единице. Если энтропия решений , то компетентность такой группы предикторов естественно считать минимальной и равной нулю. По своему смыслу компетентность группы решающих правил эквивалентна их информативности. Но информативность оценивается не для всех возможных ситуаций, а каждый раз для данного распознаваемого объекта. Т. е. речь идет не о потенциальной информативности в среднем, как это обычно делается при оценке информативности признакового пространства, а об актуальной информативности системы «признаки-правила-объект» для каждого текущего случая.

Если соревнуются несколько групп решающих правил, то энтропийный критерий позволяет делать обоснованный выбор наиболее компетентной группы. Если же используется одна группа (один коллектив решающих правил), то по величине энтропии можно судить об ожидаемой ошибке (или надежности) распознавания данного объекта.

Так же, как и в случае прогнозирования, энтропийный критерий приводит к формулировке нового метода выбора компетентных групп решающих правил: если в распоряжении имеется несколько групп решающих правил, то нужно использовать все группы и затем выбирать ту из них, частные решения в которой отличаются наименьшей энтропией.

На основании изложенного можно предложить следующую общую схему класса эффективных алгоритмов для решения задач распознавания образов с помощью коллективно-групповых решающих правил (класс алгоритмов КГМ).

Алгоритмы этого класса состоят в выполнении четырех последовательных этапов:

1) генерации групп решающих правил;

2) получения частных решений и оценки компетентности групп;

3) формирования обобщенного решения;

4) оценки ожидаемой ошибки.

I. Этап генерации групп решающих правил. На этом этапе можно использовать любые способы порождения семейств решающих правил. Общая схема этого процесса предложена Ю. И. Журавлевым [62, 63].

Представим, что для распознавания используются линейные решающие правила в виде конечного набора из гиперплоскостей. Если вместо констант в уравнениях этих плоскостей использовать непрерывно изменяемые параметры, то на базе каждой гиперплоскости можно породить группу из бесконечного числа гиперплоскостей, отличающихся друг от друга сдвигами и наклонами к координатным осям. Если использовать конечное число дискретных значений изменяемых параметров, то каждая плоскость порождает группу из различных гиперплоскостей. Средствами этого коллектива групп решающих правил можно получать частных результатов распознавания.

Наряду с гиперплоскостями можно использовать и другие типы решающих правил, например наборы из квадратичных, таксономических или логических решающих правил. Каждый набор может породить свой коллектив решающих правил, и мы получим множество из коллективов по групп, состоящих из решающих правил. Это множество порождает частных результатов распознавания.

II. Этап получения частных решений и оценки компетентности групп. Техника получения частных решений правилами из группы определяется видом решающих функций, входящих в эту группу. Результат распознавания по каждому отдельному правилу может быть категоричным («объект принадлежит образу ») или вероятностным («объект принадлежит образу с вероятностью , образу с вероятностью ... »). В любом случае сумма вероятностей принадлежности объекта к тому или иному образу равна единице.

Если просуммировать «голоса», высказанные членами группы в пользу каждого из образов, и разделить полученные значения на количество членов этой группы , то будет получено групповое решение о принадлежности объекта к тому или иному образу:

Сумма этих величин равна единице, а энтропия такого решения есть

Отсюда компетентность группы равна .

Решение -го коллектива получается путем взвешенного усреднения групповых решений. Для каждого образа суммируются голоса групп за этот образ с весом, равным компетентности группы:

В результате будет получено коллективное решение в виде вероятностей принадлежности объекта одному из образов:

Теперь можно определить энтропию этого решения -го коллектива и его компетентность .

Аналогичные операции над всеми коллективами дают материал для получения окончательного решения путем взвешенного усреднения коллективных решений:

Если требуется получить одно категоричное решение, то выбирается образ , имеющий наибольшее значение вероятности .

По значению компетентности коллектива решающих правил можно судить о надежности полученного результата распознавания объекта .

Описанная схема выглядит и является на самом деле сложной для реализации. Ее можно упростить путем уменьшения величин , и . Кроме того, алгоритмы класса КЕМ очень хорошо распараллеливаются. На первом этапе параллельно могут работать процессоров, генерирующих группы решающих правил; на втором, самом трудоемком — процессоров, вырабатывающих частные решения для каждого из образов. На третьем этапе можно использовать вначале процессоров, каждый из которых получает групповое решение для каждого образа, затем процессоров, работающих над получением коллективных решений, и, наконец, процессоров, вырабатывающих окончательное решение.