Исследование применения онтологических моделей для семантического поиска Цель: определение основных способов и средств построения онтологических моделей и выбор специализированного языка для их описания Актуальность Современные средства поиска, каталогизации, описания текстов не удовлетворяют нарастающим потребностям пользователей. Требуется их развитие в направлении повышения эффективности поиска информации и упрощения взаимодействия с пользователем. Существующие поисковые системы имеют ряд недостатков: избыточность - в пословном индексе используются слова-синонимы, выражающие одни и те же понятия; слова текста считаются независимыми друг от друга, что не соответствует свойствам связного текста; многозначность слов - поскольку многозначные слова могут рассматриваться как дизъюнкция двух или более понятий, то маловероятно, что все элементы этой дизъюнкции интересуют пользователя. Семантическая модель информации • все синонимы сведены к одному и тому же понятию • многозначные слова отнесены к разным понятиям • связи между понятиями и соответствующим и словами описаны и могут быть использованы при анализе текста Диаграмма потоков данных при поиске Под онтологией можно понимать: • надежный семантический базис в определении содержания; • общую логическую теорию, которая состоит из словаря и набора утверждений на некотором языке логики; • основу для коммуникации между людьми и компьютерными агентами. Основные компоненты онтологической модели: Концепт 1 Свойство 1 … Свойство т Концепт 2 Связь 1 Связь k Свойство 1 … Свойство n ограничения Концепты – понятия, классы, сущности, категории Свойства – слоты, атрибуты, роли Отношения – связи, зависимости, функции Ограничения - аксиомы Анализ средств разработки онтологических моделей OilEd OntoE dit Ontolin gua OntoSa urus Protégé WebODE WebOnto 3–х уровневая 3–х уровнева я Клиент/ сервер Клиент/ сервер 3–х уровневая nуровневая Клиент/ сервер Хранение онтологий файлы файлы файлы файлы файлы, CУБД СУБД Язык ПО Java Java Lisp Lisp Java Java Название параметра Архитектура приложения Файлы Java+ Lisp Осн. язык представления знания DAML+OIL OXML Ontolingu a LOOM OKBC - OCML Интерфейс пользователя Локк-ое приложение Локк-ое приложе ние HTML HTML Локк-ое приложен ие HTML и апплеты Апплеты - + - - + + + + - - - + + - Графич. редакт. таксономии концептов Редактор формальных аксиом Анализ форматов представления данных Языки построения онтологий Традиционные языки Ontolingu a CycL LOOM OKBC OCML Flogic Более поздние языкии, основанные на web-стандартах Специальные языки для обмена данными через web XOL SHOE UPML RDF(S) DAML,OIL OWL График применения различных форматов при построении онтологии Заключение Исходя из анализа основных параметров различных редакторов онтологий, наиболее приемлемым является редактор Protégé, именно он будет взят за основу в дальнейшей работе. Среди форматов представления данных, лидирующие позиции занял RDF(S), который будет использован для построения онтологии предметной области электронной библиотеки кафедры АСУ Спасибо за внимание