Читать в оригинале

<< ПредыдущаяОглавлениеСледующая >>


Часть III Анализ знаний и структур

Глава 14 Метрика в пространстве знаний

§ 1. Меры близости между предикатами

Знания, которые используются в экспертных системах, часто бывают представлены в виде продукций типа «если  то ». При этом значения переменных могут задаваться разным способом, например:  и т. д. Такой специфичный вид представления знаний налагает большие ограничения на методы работы с ними. Методы логического вывода, опирающиеся на сравнение левых и правых частей двух продукций средствами языка PROLOG, рассматривают все переменные через призму шкалы наименований [146], и результат сравнения считается положительным, если имеет место точное совпадение значений сравниваемых предикатов. Величина отличия значений предикатов роли не играет, номинальная шкала не позволяет оперировать такими понятиями, как степень похожести, близости, аналогичности, т.е. понятиями, на которых основаны человеческие способы рассуждений по аналогии. Ясно, что для расширения логических возможностей экспертных систем нужно научиться измерять степень похожести знаний или ввести метрику для измерения расстояний в пространстве знаний.

Такая метрика была введена в [81]. Можно считать, что каждый предикат отражает знание эксперта о распределении возможных значений данной характеристики. Утверждение  равносильно утверждению, что предикат  с одинаковой вероятностью (1/3) может принимать одно из трех значений, а условие  означает, что  с вероятностью 0,25 может быть равен одному из четырех значений в диапазоне от 2 до 5. Следовательно, расстояние между одноименными предикатами можно определять через расстояние между двумя распределениями вероятностей.

Предложенная мера для измерения этого расстояния  учитывает расстояние  от всех элементов одного распределения до всех элементов другого, энтропийную меру , близкую по смыслу к дисперсии распределений, и степень  пересечения распределений (величину области «консенсуса»). Эти аргументы вычисляются следующим образом.

Если функции плотности вероятности  и  отражают суждения двух экспертов о значении предиката  на участке от , т. е. минимального из возможных значений, до  — максимально возможного значения этого предиката, тогда различия двух распределений измеряются величиной

В дискретном случае разделим ось , отображающую мнение эксперта о распределении предиката, на  частей (квантилей) так, чтобы в каждой части была заключена плотность вероятности, равная  (см. рис. 39, а). Правая граница первого квантиля находится в точке , второго — в точке , -го — в точке  и т. д. до . Аналогично границы квантилей распределения, указанного вторым экспертом, находятся в точках . Расстояние выражается величиной

Принимается, что чем больше область пересечения двух распределений (область консенсуса), тем меньше расстояние . Определим величину , связанную с областью консенсуса:

где  — число делений, равномерно распределенных вдоль оси , a  и  — указанные экспертами вероятности попадания оценок в -ю градацию (см. рис. 39, б).

Рис. 39

Расстояние между суждениями экспертов зависит и от категоричности  их оценок (см. рис. 39, в). При одних и тех же расстояниях  и  мера  считается тем большей, чем больше распределения, отражающие мнения экспертов, отличаются от равномерного распределения по всему диапазону значений от  до . Величина  находится следующим образом:

Общая мера расстояния  между предикатами, отражающими знания двух экспертов о характеристике , теперь принимается равной . Эта мера удовлетворяет таким естественным аксиомам, как непрерывность, симметричность и транзитивность. Имеются способы вычисления меры  для порядковых и номинальных шкал.

Проверка правомочности применения описанной меры делалась путем экспертного оценивания. Были предъявлены различные пары распределений, и эксперты упорядочивали эти пары по степени их похожести, близости. Мера близости, найденная по приведенной формуле, сохраняла установленный экспертами порядок.

 



<< ПредыдущаяОглавлениеСледующая >>