Читать в оригинале

<< ПредыдущаяОглавлениеСледующая >>


§ 4. Заполнение пробелов в базе знаний

Список знаний можно записать в виде таблицы той же формы, что и таблица «объект-свойство». Строку  в такой таблице занимает знание , a -й столбец отражает мнения экспертов о значениях предиката . Если информация о значении -го предиката в строке  отсутствует, то это значение  можно попытаться предсказать с помощью алгоритмов семейств ZET и WANGА.

В алгоритме ZET вначале отбирается компетентная подтаблица размером  строк и  столбцов. Строка  включается в число компетентных, если она содержит информацию о -m предикате  и входит в число  наиболее близких к строке  по расстоянию .

О компетентности столбца , содержащего предикат  в -й строке, по отношению к столбцу  можно судить по критериям зависимости между предикатами, которые были описаны в предыдущем параграфе.

В отобранной подтаблице определяются расстояния  от строки  до всех остальных  строк . Величину  считаем мерой компетентности строки  по отношению к строке . Затем синтезируется распределение  в виде некоторой функции от распределений -го предиката во всех строках подтаблицы. Это прогнозное распределение должно обеспечивать минимум суммы  взвешенных расстояний от него до всех распределений, участвовавших в синтезе:

Показателем степени  можно регулировать зависимость результата от компетентности : при  все распределения участвуют в синтезе прогноза с равными весами. При больших  доминируют распределения из самых близких строк.

Синтез прогнозного распределения будем делать почти так же, как делали эталонный предикат в распознавании образов (см. § 2) — путем механического усреднения взвешенных значений плотностей в каждой градации данного предиката. Если весь диапазон возможных значений предиката  разделен на  одинаковых участков и вероятность того, что предикат принимает значение -й градации, равна , то усредненное по всем строкам значение плотности в этой градации принимает значение

Еще одно прогнозное распределение  можно получить, используя зависимости  между -м и всеми  остальными -ми столбцами (предикатами) компетентной подтаблицы. Здесь суммировать с весами  нужно распределения всех предикатов  строки . В качестве окончательного прогноза распределения пропущенного предиката  можно принять усредненное по градациям значение двух полученных прогнозов:  и .

Для оценки величины ожидаемой ошибки можно, как и в алгоритме ZET, применить метод контрольного прогнозирования известных значений предикатов в компетентной подтаблице.

 



<< ПредыдущаяОглавлениеСледующая >>