ЗаключениеВ заключение остановимся на нерешенных проблемах анализа данных и знаний. А таковых больше, чем решенных. Действительно, достаточно сказать, что из 28 типов задач анализа данных, упомянутых в классификационной таблице 1 главы 2, в той или иной степени проработаны чуть больше десятка. Часть из них широко известны, алгоритмы их решения реализованы в виде программ, которые часто используются для решения практических задач. Для других же сформулированы лишь общие идеи методов их решения. Так что фронт работ по освоению задач новых типов и по совершенствованию методов и алгоритмов решения известных задач анализа данных очень большой. Исследования в этой области должны быть направлены на преодоление трудностей решения реальных прикладных задач, проявляющихся в: - многомерности признакового пространства; - разнотипности измерительных шкал; - большом числе образов; - очень малых и очень больших объемах обучающих выборок; - наличии ошибок и пробелов в таблицах данных; - наличии неинформативных признаков; - наличии структурированных объектов. Для расширения областей применения методов распознавания в экономике, социологии, психологии и т. п. необходимо развитие методов теории измерений, ориентированных на измерение не физических, а «гуманитарных» характеристик. Актуальной проблемой является разработка методов анализа данных, основанных на гипотезах, отличающихся от используемой до настоящего времени гипотезы компактности. Необходимо дальнейшее углубление связи между методами и системами искусственного интеллекта и системами распознавания образов и анализа изображений. В частности, актуальной является задача распространения методов анализа данных на решение аналогичных задач анализа знаний, что позволило бы поднять уровень развития искусственного интеллекта. В данной книге отмечены лишь некоторые первые шаги в этом перспективном направлении. Погружение сферы анализа информации в мир многоагентских компьютерных сетей требует больших научно-организационных усилий для продвижения методов анализа данных и знаний в эту новую операционную среду. При этом могут оказаться полезными методы системного анализа [133]. Многие прикладники не знают, что из протекающего через их руки потока информации с помощью современных методов анализа данных можно было бы получить «сухой осадок» в виде в простых, «прозрачных» закономерностей или знаний. Эти знания могут помочь разобраться в структуре информации, выявить относительную важность ее различных частей, своевременно обнаружить факты, отклоняющиеся от общей закономерности, получить сигнал о первых предвестниках изменений в поведении наблюдаемого процесса. Поэтому распространение знаний о возможностях обсуждаемых здесь методов, включение такого рода материалов в учебные программы для студентов самого разного профиля также было бы своевременным и полезным.
|