§ 3. Состояние разработок в области партнерских систем

Основой для разработки ряда подсистем партнерской системы могут служить результаты, имеющиеся в области методов обнаружения закономерностей, распознавания образов, анализа данных и знаний, математической лингвистики, а также опыт в создании экспертных систем. Отметим некоторые из этих предпосылок, опираясь на один из возможных вариантов блок-схемы партнерской системы (см. рис. 46). На этой схеме заштрихованы блоки, имеющиеся в наиболее распространенных экспертных системах. При описании некоторых блоков мы подразумеваем их реализацию в нашей инструментальной системе ЭКСНА (экспертная система наполняемая) [22, 23, 57, 58].

3.1. Блок диалога. Этот блок включает в себя подсистему генерации диалога для новой предметной области, лингвистический процессор и подсистему речевой связи.

Основу подсистемы диалога может составлять программа, которая в диалоге с пользователем непрограммистом выясняет терминологию новой предметной области, формирует набор сообщений в «меню», определяет желательную форму выходных сообщений. С помощью этой же программы можно вносить изменения в сценарий уже существующего диалога.

Рис. 46

В качестве прообраза лингвистического процессора может быть использована, например, программа, построенная на базе языка ДЕКЛ [106]. Эта программа может анализировать фразы естественного языка и строить соответствующие их семантическому содержанию сетевые структуры. Система задает пользователю вопросы, касающиеся новых для нее слов и отношений. В итоге она становится способной понимать смысл сообщений, формулируемых в естественной форме и синтезировать осмысленные фразы, относящиеся к данной предметной области.

Для создания подсистемы речевой связи можно использовать результаты многочисленных исследований и разработок в области речевой технологии. Для очень многих прикладных областей достаточно иметь программно-аппаратный комплекс, ориентированный на распознавание 200-300 устных команд [77]. Условия применения ПС во многих случаях позволяют использовать подстройку под диктора, что существенно упрощает задачу и повышает надежность распознавания. Существуют сейчас и синтезаторы речевых сигналов (текст-речь), вполне приемлемые по разборчивости и натуральности звучания речевых сообщений.

3.2. Блок логического вывода. Если знания в БЗ представлены в форме продукций типа «если ... то ...», то при сравнении двух продукций, например средствами языка ПРОЛОГ, их левые части (условия) и правые части (следствия) проверяются на точное совпадение. Если точного совпадения нет, то степень несовпадения роли не играет. Очевидно, что возможности блока логического вывода были бы существенно большими, если бы можно было использовать информацию не только о совпадающих частях продукций, но и о близких, похожих, аналогичных частях. В главе 14 описан метод, позволяющий измерять степень похожести одной продукции на другую. Благодаря этому удалось построить механизм логического вывода, который имитирует человеческие способности рассуждений по аналогии [23].

Пусть, например, в БЗ имеется утверждение: «Если и , то . Достоверность ». Поступает запрос: «Условия и . Возможно ли следствие ?». Программа логического вывода обнаруживает, что условие в запросе не совпадает с условием базового знания: . Вычисление степени этого несовпадения показывает, что расстояние от до не превышают заданного порога: . Это позволяет опереться на гипотезу, аналогичную гипотезе локальной компактности, которая здесь выглядит так: «В непосредственной близости от известных продукций похожие условия влекут за собой похожие следствия». В результате можно сделать вывод, что «если и , то . Достоверность ». Здесь меньше на величину, зависящую от расстояния между условиями и .

Упомянутая мера близости между знаниями позволяет предварительно сделать таксономию знаний и тем самым структурировать базу знаний. Если для каждого таксона найти (или синтезировать) «эталонное» знание (см. гл. 14), то в процессе логического вывода отпадет необходимость проверять на совпадение или похожесть все знания БЗ. Достаточно найти таксон, эталон которого является самым близким к запросу, и дальше сравнивать запрос со всеми знаниями только этого таксона. Такой прием позволяет существенно ускорить процесс логического вывода, особенно в больших базах знаний.

3.3. Блок анализа данных. В блоке анализа данных должны быть программы обработки больших массивов разнотипных данных, представленных преимущественно в упоминаемой выше форме кубов данных типа «объект-свойство-время». В инструментальной системе ЭКСНА основу блока анализа данных составляют программы пакета ОТЭКС [57,58,82]. Напомним, что пакет содержит программы для решения задач четырех основных типов: таксономии, выбора информативных признаков, распознавание образов и заполнения пробелов.

Программы таксономии позволяют делать группировку (кластеризацию) наблюдаемых объектов по похожести их характеристик как в евклидовом, так и в -пространстве. Таксоны могут иметь как сферическую, так и произвольную форму. Признаки могут быть качественными, порядковыми и количественными. Имеются критерии для выбора наиболее предпочтительного числа таксонов.

Программы выбора признаков позволяют выделить наиболее информативное подмножество признаков из их исходного множества. Признаки могут быть разнотипными. Допускаются пробелы в таблицах данных.

Программы распознавания позволяют в процессе обучения обнаруживать закономерные связи между описывающими и целевыми характеристиками объектов. Эти закономерности используются затем в процессе распознавания новых объектов. Среди этих программ следует особо отметить программы, реализующие алгоритмы таксономических и логических решающих функций. Первые позволяют повышать устойчивость решений в условиях малой обучающей выборки, а вторые обнаруживают закономерности в виде высказываний типа «если ... то ...». В партнерской системе это дает возможность автоматически извлекать знания из данных и пополнять ими базу знаний.

Программы заполнения пробелов предназначены для предсказания наиболее правдоподобного значения пропущенных элементов в таблицах данных. При этом используются закономерности, обнаруживаемые на данных, содержащихся в таблицах. Исходные данные могут содержать разнотипные признаки. Можно использовать эти программы и для обнаружения грубых ошибок или противоречий в таблицах данных. Имеются также программы для решения задач продолжения динамических рядов.

3.4. Блок анализа моделей. Представим себе, что запрос (его часть «если ...») касается таких режимов объекта, о которых нет сведений ни в базе данных, ни в базе знаний. Если ПС содержит модель объекта в виде программ, позволяющих имитировать его функционирование, то процесс логического вывода прерывается, запускается имитационная модель и фиксируется поведение объекта в требуемом режиме. В результате в базу знаний вносится знание о том, что последует за этим «если ...». Этот же результат включается в цепочку логического вывода и вывод продолжается. Работа с имитационной моделью требует больших затрат машинных ресурсов, потому к услугам модели можно прибегать изредка, только в том случае, когда встречаются запросы, не предусмотренные экспертами.

В системе ЭКСНА по такой схеме реализован выход из процесса логического вывода на блок вычислений по формулам или доопределения недостающих данных и знаний с помощью имитационных моделей [145].

3.5. Блок «Гомеостат». В свободное от обслуживания пользователя время партнерская система с помощью блока «Гомеостат» [22] анализирует вновь поступающие данные и знания, проверяет их на непротиворечивость, заполняет пробелы в данных, выявляет устаревшие и продублированные данные и знания и удаляет их в архив. При обнаружении новых закономерностей система вырабатывает сообщение пользователю, а при обнаружении противоречия или грубой ошибки формулирует ему соответствующие вопросы. Это может делаться с помощью программ пакета ОТЭКС с использованием описанной выше метрики в пространстве знаний.

Помимо этого «Гомеостат» должен анализировать содержание сеансов работы с пользователем, выявляя часто повторяющиеся вопросы и строя на этой основе упрощенную модель пользователя. Такова функция программы «Частые вопросы» (ЧАВО) в инструментальной системе ЭКСНА.

3.6. Особенности системы ЭКСНА. Система ЭКСНА разработана Международной лабораторией интеллектуальных систем «СИНТЕЛ» и Институтом математики Сибирского отделения Российской академии наук (г. Новосибирск). Она реализована на IBM-совместимых компьютерах. Система хорошо документирована.

ЭКСНА представляет собой оболочку с набором разнообразных программных средств универсального назначения. Она предназначена для создания прикладных экспертных систем партнерского типа. Разработчику требуется организовать сбор и ввод в оболочку имеющейся у него содержательной информации — данных, знаний и моделей. Кроме того, с помощью подсистемы генерации диалога нужно сформировать удобную среду для общения с системой. Как показывает опыт, с помощью средств партнерской системы ЭКСНА пользователь генерирует свою прикладную версию ПС с базой знаний в 500 правил в течение одного месяца. В результате создается экспертная система партнерского типа, которая еще не реализует всех функций партнерских систем, но от экспертных систем первого поколения отличается следующими особенностями.

- ВСЕ экспертные системы используют знания экспертов.

- МНОГИЕ помогают пользователю сконструировать свой диалог.

- НЕКОТОРЫЕ системы включают в свой состав блок анализа данных.

- ОЧЕНЬ НЕМНОГИГ системы умеют извлекать знания из данных.

- ТОЛЬКО ЭСПТ на базе ЭКСНА делает все это и, КРОМЕ ТОГО, умеет:

а) рассуждать по аналогии;

б) обнаруживать частичные и полные противоречия между знаниями;

в) структурировать базу знаний;

г) обрабатывать разнотипные данные в таблицах с пробелами;

д) обнаруживать ошибки в базе данных;

е) заполнять пробелы в таблицах данных;

ж) адаптироваться к особенностям пользователя;

з) улучшать свои характеристики в процессе эксплуатации.