§ 4. Заполнение пробелов в базе знаний

Список знаний можно записать в виде таблицы той же формы, что и таблица «объект-свойство». Строку в такой таблице занимает знание , a -й столбец отражает мнения экспертов о значениях предиката . Если информация о значении -го предиката в строке отсутствует, то это значение можно попытаться предсказать с помощью алгоритмов семейств ZET и WANGА.

В алгоритме ZET вначале отбирается компетентная подтаблица размером строк и столбцов. Строка включается в число компетентных, если она содержит информацию о -m предикате и входит в число наиболее близких к строке по расстоянию .

О компетентности столбца , содержащего предикат в -й строке, по отношению к столбцу можно судить по критериям зависимости между предикатами, которые были описаны в предыдущем параграфе.

В отобранной подтаблице определяются расстояния от строки до всех остальных строк . Величину считаем мерой компетентности строки по отношению к строке . Затем синтезируется распределение в виде некоторой функции от распределений -го предиката во всех строках подтаблицы. Это прогнозное распределение должно обеспечивать минимум суммы взвешенных расстояний от него до всех распределений, участвовавших в синтезе:

Показателем степени можно регулировать зависимость результата от компетентности : при все распределения участвуют в синтезе прогноза с равными весами. При больших доминируют распределения из самых близких строк.

Синтез прогнозного распределения будем делать почти так же, как делали эталонный предикат в распознавании образов (см. § 2) — путем механического усреднения взвешенных значений плотностей в каждой градации данного предиката. Если весь диапазон возможных значений предиката разделен на одинаковых участков и вероятность того, что предикат принимает значение -й градации, равна , то усредненное по всем строкам значение плотности в этой градации принимает значение

Еще одно прогнозное распределение можно получить, используя зависимости между -м и всеми остальными -ми столбцами (предикатами) компетентной подтаблицы. Здесь суммировать с весами нужно распределения всех предикатов строки . В качестве окончательного прогноза распределения пропущенного предиката можно принять усредненное по градациям значение двух полученных прогнозов: и .

Для оценки величины ожидаемой ошибки можно, как и в алгоритме ZET, применить метод контрольного прогнозирования известных значений предикатов в компетентной подтаблице.