§ 4. Заполнение пробелов в базе знаний
Список знаний можно записать в виде таблицы той же формы, что и таблица «объект-свойство». Строку
в такой таблице занимает знание
, a
-й столбец отражает мнения экспертов о значениях предиката
. Если информация о значении
-го предиката в строке
отсутствует, то это значение
можно попытаться предсказать с помощью алгоритмов семейств ZET и WANGА.
В алгоритме ZET вначале отбирается компетентная подтаблица размером
строк и
столбцов. Строка
включается в число компетентных, если она содержит информацию о
-m предикате
и входит в число
наиболее близких к строке
по расстоянию
.
О компетентности столбца
, содержащего предикат
в
-й строке, по отношению к столбцу
можно судить по критериям зависимости между предикатами, которые были описаны в предыдущем параграфе.
В отобранной подтаблице определяются расстояния
от строки
до всех остальных
строк
. Величину
считаем мерой компетентности строки
по отношению к строке
. Затем синтезируется распределение
в виде некоторой функции от распределений
-го предиката во всех строках подтаблицы. Это прогнозное распределение должно обеспечивать минимум суммы
взвешенных расстояний от него до всех распределений, участвовавших в синтезе:
![](/archive/arch.php?path=../htm/book_zg/files.book&file=zg_97.files/image018.gif)
Показателем степени
можно регулировать зависимость результата от компетентности
: при
все распределения участвуют в синтезе прогноза с равными весами. При больших
доминируют распределения из самых близких строк.
Синтез прогнозного распределения будем делать почти так же, как делали эталонный предикат в распознавании образов (см. § 2) — путем механического усреднения взвешенных значений плотностей в каждой градации данного предиката. Если весь диапазон возможных значений предиката
разделен на
одинаковых участков и вероятность того, что предикат принимает значение
-й градации, равна
, то усредненное по всем строкам значение плотности в этой градации принимает значение
![](/archive/arch.php?path=../htm/book_zg/files.book&file=zg_97.files/image025.gif)
Еще одно прогнозное распределение
можно получить, используя зависимости
между
-м и всеми
остальными
-ми столбцами (предикатами) компетентной подтаблицы. Здесь суммировать с весами
нужно распределения всех предикатов
строки
. В качестве окончательного прогноза распределения пропущенного предиката
можно принять усредненное по градациям значение двух полученных прогнозов:
и
.
Для оценки величины ожидаемой ошибки можно, как и в алгоритме ZET, применить метод контрольного прогнозирования известных значений предикатов в компетентной подтаблице.