базы знаний

' Т. А. Гаври11ова В. Ф. Хорошевский ( nnTEP "' �· 1'.,,! &13Ь1311НИI ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМ • студентам вузов, изучающим вопросы искусственного интеллекта в рамках соответствующих дисциплин • разработчикам интеллектуальных систем • всем интересующимся вопросами инженерии знаний Т. А. Гаврилова В. Ф. Хорошевский & 3Ь1311111 ИНТЕЛЛЕКТУАЛЬНЬ/Х СИСТЕМ Допущено Министерством образования Российской Федерации в качестве учебного пособия для студентов вузов, обучающихся по направлениям «Прикладная математика и информатика», «Информатика и вычислительная техника» и специальностям «Прикладная информатика» (по областям), «Прикладная математика и информатика» Санкт-Петербурr Москва• Харьков• Минск 2000 /),dЛпJ• �J Ф ББК 32.973.23-018я7 УДК 681.3.016(075) Г12 Рецензенты: Колосов О. С., доктор технических наук. профессор, декан факультета «Автоматика и вычислительная техни ка» Московского энергетического института (технического университета) Кутепов В. П., доктор технических наук, профессор, заведующий кафедрой «Прикладная математика» Московского энергетического института (технического университета) Кумунжиев К. В., доктор технических наук, профессор, заведующий кафедрой «Информационные системы» Ульяновского государственного университета Сулейманов Д. Ш., кандидат технических наук, заведующий совместной научно-исследовательской лабораторией «Проблемы искусственного интеллекта» Академии наук Татарстана и Казанского государственного университета Г12 Базы знаний интеллектуальных систем/ Т. А. Гаврилова, В. Ф. Хорошевский - СПб: Питер, 2000. - 384 с.: ил. ISBN 5-272-00071-4 Учебник для технических вузов по входящим в различные дисциплины вопросам разработки интеллектуальных систем - развивающейся области информатики. Актуальность предмета определяется растущим применением инженерии знаний и системного анализа в различных областях деятельности. Особенностью изложения является его практическая направленность: освоения имеющегося материала достаточно для начала самостоятельной работы над созданием интеллектуальной системы, основанной на знаниях. В учебнике учтена все возрастающая роль Интернета, и потому подробно рассматривается применение инженерии знаний в Сети. ББК 32.973.23-018я7 УДК 681.3.016(075) \SBN 5-272-00071-4 ©Т. А. Гаврилова, В. Ф. Хорошевский, 2000 © Серия, оформление. Издательский дом «Питер», 2000 Содержание Предисловие .................................................................. 6 Об авторах .......................................................................................................... 8 От издательства ................................................................................................. 8 1 . Введение в интеллектуальные системы ........................... 9 1.1. Краткая истор ия искусственного интеллекта .............................................. 9 1.2. Основные направления исследований в области искусст венного интеллекта ...........................................···················:······.. 15 1.3. Представление зн аний и вы вод на знаниях ................................................................................................. 19 1.4. Нечеткие знания ........................................................................................ 31 2. Разработка систем, основанных на знаниях ................... 39 2.1. Введение в экспертные системы. Определение и структура .................... 39 2.2. Классификация систем, основанных на знаниях ....................................... 41 2.3. Коллектив разработчиков .......................................................................... 45 2.4. Технология проектирования и разработки ................................................ 49 З. Теоретические аспекты инженерии знаний ..................... 59 3.1. Поле знаний ................................ J............................................................. 59 3.2. Стратегии получения знаний ..................................................................... 67 3.3. Теоретические аспекты извлечения знаний .............................................. 71 3.4. Теоретические аспекты структурирования знаний .................................... 90 4. Технологии инженерии знаний ........ � ............................. 99 4.1. Классификация методов практического извлечения знаний ..................... 99 4.2. Коммуникативные методы ....................................................................... 102 4.3. Текстологические методы ....................................................................... 124 4.4. Простейшие методы структурирования .................................................. 131 4.5. Состояние и перспективы автоматизированного приобретения знан ий ..................................................................................................... 137 4.6. Примеры методов и систем приобретения знаний ................................. 145 / 4 Содержани е 5. Нов1а1е тенденции и прикладные аспекты инженерии знаний .................................................... 181 5.1. Латентные структуры знаний и психосемантика ..................................... 161 5.2. Метод репертуарных решеток·········································:··················--··· 176 5.3. Управление знаниями ............................................................................. 183 5.4. Визуальное проектирование баз знаний как инструмент познания ........ 190 5.5. Проектирование гипермедиа БД и адаптивн ых обучающих систем ........ 195 6. Проrраммный инструментарий разработки систем, основанн1:а1х на знаниях • • • . . • • . . • • • . • • . • . • • • • • • • • • • . • • • • • • • • • . • • • • • • • 203 6.1. Технологии разработки программн ого обеспечения - цели, принципы, парадигмы ..............................•.............................................. 203 6.2. Методологии создания и модели :жизненн ого цикла интеллектуальных систем ....................................................................... 214 6.3. Языки программирования для ИИ и языки представления знаний .......... 218 6.4. Инструментальные пакеты для ИИ .......................................................... 224 6.5. WorkBench-cиcтeмы ....................... ,........................................................ 231 7. Пример разработки системы, основанной на знаниях •..• 237 7. 1. Проду кционно-фреймовый ЯПЗ PILOT/2 ................................................. 237 7 .2. Психодиагн остика - приме р пред метной области для построения экспертных систем ................................................................................. 252 7.3. Разработка и реал изация психодиагностической ЭС «Cattell• ................ 256 8. Представление данных и знаний в Интернете .......•.....•. 27 1 8.1. Язык HTML и представлен ие знаний ....................................................... 271 8.2. Онтологии и он тологические системы ..................................................... 284 8.3. Системы и средства представления онтологических знаний .................. 301 9. Интеллектуальные Интернет-технолоrии ....•.....•.......... 3 1 7 9.1. Программные аген ты и мультиагентные системы ..........................._. ....... 3 17 9.2. Проектирование и реализация аген тов и мультиагентных систем .......... 323 9.3. Информационный поиск в среде Ин тернет ............................................. 335 Заключение ................................................................ 356 Литература ................................................................. 358 С любовью, учителю Д. А. Поспелову, друЗЫ1.М и близким,, всем, кто помог созданию этой версии учебника, и, надеемся, будет сотрудничать с нами дальше ... / Предисловие Вы открываете необычный учебник - учебник, предназначенный для студентов технических университетов и их преподавателей, для аспирантов, магистров, ба калавров и практиков-разработчиков. Этот учебник написан для тех, кто хочет вступить в мир науки с интригующим названием - ИСКУССТВЕННЫЙ ИН ТЕЛЛЕКТ. Несмотря на обилие книг с аналогичным названием ( см. список основной лите ратуры), на сегодняшний день нет вузовского учебника по предметам �интеллек туальные системы�, �экспертные системы�, �Базы знаний� и т. д. Тем не менее практически все технические университеты совершенно справедливо включили такого рода дисциплины в свои программы. Поскольку бум в этой науке при шелся на конец 70-х и 80-е, большинство книг на русском языке издано в эти годы. И авторы приносят благодарность создателям первых отечественных мо нографий и справочников, а также переводчикам классических книг в этой обла сти - Д. А. Поспелову, Э. В. Попову, В. Л. Стефанюку, Г. С. Осипову и другим пионерам, без работ которых создание этого учебника было бы невозможно. Необычность этого учебника связана также с подчеркнутой междисциплинарно стью выбранного подхода, отказом от �клановости� отдельных научных школ и направлений. Этот учебник могут читать инженеры и математики, экономисты и биологи, программисты и медики. Он практически не требует предварительной подготовки в данной области знаний и рассчитан на широкий круг читателей, заинтересованных разработкой интеллектуальных систем, основанных на зна ниях. Мы отказались от излишней специализации в пользу широты изложения, нам хотелось представить горизонты этой науки, а не прокопать в ней глубокий, но узкий туннель. Другой особенностью учебника является его практическая направленность. Ос воив изложенны11 материал, студент или другой заинтересованный читатель смо жет самостоятельно приступить к разработке интеллектуальной системы в роли инженера по знаниям. Акцент в учебнике сделан именно на работу со знаниями. Фактически он ориентирован на подготовку уникальных специалистов, спрос на которых на современном рынке высоких информационных технологий много кратно превышает спрос на программистов. Этих специалистов называют по-раз ному - системные аналитики, постановщики задач, инженеры по знаниям, инже неры-когнитолоrи. По англu.йски это - knowledge engineers. Предисловие 7 Рассмотренные в учебнике вопросы представляют лишь вершину айсберга срав нительно молодой науки- ИНЖЕНЕРИИ ЗНАНИЙ. И, надеемся, показывают ее новые горизонты в мире информационных технологий. Учитывая значительное число достижений и публикаций в этой области за рубе жом, авторь1 сознательно будут приводить терминологию, используемую в ориги налах, что существенно облегчит изучение проблемь1 желающим повысить свою квалификацию через Интернет и другие источники англоязычной информации. Материал учебника основан на курсах лекций, прочитанных авторами для сту дентов Санкт-Петербургского государственного технического университета (быв ший Политех) и Московского физико-технического института (Технического университета). Объем кур.са от 32 до 64 лекционных часов плюс столько же практических занятий. По сути дела здесь в одном учебнике собрано несколько курсов лекций, ориентированных на разные специализации и разную базовую подготовку.. В целом же данный учебник, по опыту авторов, содержит материал для двухгодовых курсов с общим названием •Искусственный интеллект•. Разные категории читателей могут читать учебник по различным •сценариям•. • Сценарий 1 - для студентов-�сачков» технических вузов перед сессией. По метить в оглавлении параграфы, вошедшие в список вопросов для экзамена, и читать на максимальной скорости. • Сценарий 2 - для студентов-отличников. Внимательно прочесть весь учебник последовательно, затем перейти к сценарию 1. • Сценарий 3 - для студентов-непрограммистов и всех, кто просто интересует ся проблемой для расширения кругозора. Главы 1, 2, 4, 9. • Сценарий 4 - для преподавателей вузов и тех, кто хочет овладеть инженерией знаний. Использовать учебник как готовый конспект, расширив или сократив материал по своему усмотрению. Варианты: • минимальный курс: параграфы 1.1-1.4, 2.1-2.4, 3.2, 3.4, 4.1-4.3, 4.4, 6.3, 8.2, 9.1; • главы 1-2 могут составить основу вводного курса в проблематику искус ственного интеллекта и систем, основанных на знаниях; • аналогичный вводный курс по тематике программных средств искусствен ного интеллекта может дать материал главы 6, параграфа 7.1 и, при нали чии времени, 9.1, 9.2; • семестровый курс по базам знаний экспертных систем может быть прочи тан на основе глав 2-4, 7; • базовый курс по инженерии знаний составляют главы 3, 4; • наконец, главы 8, 9 дают основу для курса по тематике интеллектуальных Интернет-технологий. • Сценарий 5 - для системных аналитиков. Главы 3-6. • Сценарий 6- для программистов и разработчиков. Главы 2-4, 6-9. Материал, набранный более мелким шрифтом, носи:r иллюстративный характер. 8 Предисловие В заключение авторы благодарят заведующую редакцией технической литера, туры издательства -.Питер• Екатерину Строганову за энергию и энтузиазм при убеждении авторов принять решение о начале работы над учебником и поддерж ку в ее завершении. В параграфе 4.6. четвертой главы использованы материалы монографии •При обретение знаний интеллектуальными системами•, любезно предоставленные ее автором Г. С. Осиповым. На подготовку материалов, представленных в параграфах 8.2 и 8.3 восьмой гла вы, а также в параграфах 9.1 и 9.3 девятой главы, в значительной мере повлияла работа по мультиагентным системам и интеллектуальным Интернет-ориентиро ванным: системам поиска информации, проведенная Н. В. Майкевич при подго товке кандидатской диссертации на тему -.Исследование методов анализа Ин тернет-ресурсов и реализация на этой основе мультиагенtной системы поиска информации• (ИПС РАН, Переславль-Залесский, 1999). По сути дела именно ей один из авторов данной книги обязан своей -.миграцией• в эту новую, чрез вычайно интересную и перспективную область интеллектуальных информаци онных технологий из проблематики экспертных систем и программного обеспе чения систем искусственного интеллекта. Отдельная благодарность должна быть высказана Е. Васильевой, Н. Нумеровой и Н. Сташ, сотрудницам Института высокопроизводительных вычислений и баз данных Миь:науки РФ, за техническую помощь при работе над рукописью, без которой книга могла бы так и не дойти до читателей. Главы 1-5 написаны д. т. н., проф. Гавриловой Т. А., главы 6-9- д. т. н., проф. Хорошевским В. Ф. Предисловие и заключение- результат совместной работы авторов, которые с надеждой на дµьнейшее сотрудничество выражают глубо кую признательность всем, кто помог выходу этой книги. Об авторах Т. А. Гаврилова - д. т. н., профессор кафедры компьютерных интеллектуальных технологий Санкт-Петербургского государственного технического университета, председатель Петербургского отделения Ассоциации искусственного интеллекта. В. Ф. Хорошевский - д. т. н., профессор МФТИ, ведущий научный сотрудник вы числительного центра РАН, член Научного Совета Российской Ассоциации ис кусственного интеллекта. От издательства Ваши замечания, предложения, вопросы отправляйте по адресу электронной по чты comp@piter-press.ru (издательство -.Питер•, компьютерная редакция). Мы будем рады узнать ваше мнение! Подробную информацию о наших книгах вы найдете на WеЬ-сайте издательства http://www.piter-press.ru. Введение в интеллектуальные системы о Краткая история искусственного интеллекта о Основные направления исследований в области искусственного интеллекта о Представление знаний и вывод на знаниях о Нечеткие знания о Прикладные интеллектуальные системы 1 . 1 . Краткая история искусственного интеллекта 1 . 1 . 1 . Предыстория Идея создания искусственного подобия человека для решения сложных задач и моделирования человеческого разума витала в воздухе еще в древнейшие време на. Так, в древнем Египте была создана �оживающая� механическая статуя бога Амона. У Гомера в �илиаде• бог Гефест ковал человекоподобные существа-авто маты. В литературе эта идея обыгрывалась многократно: от Галатеи Пигмалиона до Буратино папы Карло. Однако родоначальником искусственного интеллекта считается средневековый испанский философ, математик и поэт Раймонд ЛуЛJlиЙ, который еще в XIII веке попытался создать механическую машину для решения различных задач, на основе разработанной им всеобщей классификации понятий. В XYIII веке Лейбниц и Декарт независимо друг от друга продолжили эту идею, предложив универсальные языки классификации всех наук. Эти работы можно считать первыми теоретическими работами в области искусственного интеллекта. Окончательное рождение искусственного интеллекта как научного направления произошло только после создания ЭВМ в 40-х годах ХХ века. В это же время Нор берт Винер создал свои основополагающие работы по новой науке - киберне тике. 10 Глав а 1 • Введение в интеллектуальные системы Термин •искусственный интеллект• - ИИ- (AI - artificial intelligence) был предложен в 1956 г. на семинаре с аналогичным названием в Дартсмутском колледже (США). Семинар был посвящен разработке методов решения логи ческих, а не вычислительных задач. В английском языке данное словосочетание не имеет той слегка фантастической антропоморфной окраски, которую оно при обрело в довольно неудачном русском переводе. Слово intelligence означает •уме ние рассуждать разумно•, а вовсе не •интеллект•, для которого есть термин intel lect. Вскоре после признания искусственного интеллекта .отдельной областью науки произошло разделение его на два направления: нейрокибернетика и •кибернети ка черного ящика•. Эти направления развиваются практически независимо, су щественно различаясь как в методологии, так и в технологии. И только в настоя щее время стали заметны тенденции к объединению этих частей вновь в единое целое. 1 . 1 .2. Зарождение нейрокибернетики Основную идею этого направления можно сформулировать следующим образом: Единственный объект, способный мыслить, - это человеческий мозг. Поэтому лю бое �мыслящее• устройство должно каким-то образом воспроизводить его струк туру. Таким образом, нейрокибернетика ориентирована на программно-аппаратное моделирование структур, подобных структуре мозга. Физиологами давно уста новлено, что основой человеческого мозга является большое количество (до 1021) связанных между собой и взаимодействующих нервных клеток - нейронов. По этому 'усилия нейрокибернетики были сосредоточены на создании элементов, аналогичных нейронам, и их объединении в функционирующие системы. Эти си стемы принято называть нейроннь,ми сетями, или нейросетями. Первые нейросети были созданы Розенблаттом и Мак-КШlllоком в 1956-1965 rr. Это были попытки создать системы, моделирующие человеческий глаз и его взаи модействие с мозгом. Устройство, созданное ими тогда, получило название пер септрона (perceptron). Оно умело различать буквы алфавита, но было чувстви тельно к их написанию. Например, буквы А, А и А для этого устройства были тремя разными знаками. Постепенно в 70-80 годах количество работ по этому направлению искусственного интеллекта стало снижаться. Слишком неутеши тельны были первые результаты. Авторы объясняли неудачи малой памятью и низким быстродействием существующих в то время компьютеров. Однако в 1980-х в Японии в рамках проекта •ЭВМ V поколения• был создан первый нейрокомпьютер, или комiiьютер VI поколения. К этому времени ограни чения по памяти и быстродействию были практически сняты. Появились транс пьютеры - параллельные компьютеры с большим количеством процессоров. Транспьютерная технология- это только один из десятка новых подходов к ап паратной реализации нейросетей, которые моделируют иерархическую структу ру мозга человека. Основная область применения нейрокомпьютеров сегодня - 1.1. Краткая история искусственного интеллекта 11 это задачи распоэнавания образов, например идентификация объектов по резуль татам аэрофотосъемки из космоса. Можно выделить 3 подхода к созданию нейросетей: 1. Аппаратный - создание специальных компьютеров, нейрочипов, плат рас ширения, наборов микросхем, реализующих все необх одимые алгоритмы. 2. Программный - создание программ и инструментариев, рассчитанных на высокопроизводительные компьютеры. Сети создаются в памяти компьюте ра, всю работу выполняют его собственные процессоры. 3. Гибридный - комбинация первых двух. Часть вычислений выполняют спе� циальные платы расширения (сопроцессоры), часть '- программнf?Iе сред ства. Более глубокое рассмщрение этого чрезвычайно перспективного и интересного направления исследований искусственного интеллекта выходит за рамки данной книги. Подробнее см. работы [Соколов, Вейткявичус, 1989; Амамия, Танака, 1 993] . 1 . 1 . 3 . От кибернетики «черного ящи ка)) к И И В основу этого подхода был положен принцип, противоположный нейрокиберне тике. Не имеет значения, как устроено �мыслящее» устройство. Главное, чтобы на за данные входные воздействия оно реагировало так же, как человеческий мозг. Сто . ронники этого направления мотивировали свой подход тем, что человек не дол жен слепо следовать природе в своих научных и технологических поисках. Так, например, очевиден успех колеса, которого не существует в природе, или самоле та, не машущего крыльями, подражая птице. К тому же пограничные науки о че ловеке не смогли внести существенного теоретического вклада, объясняю щего хо тя бы приблизительно, как протекают интеллектуальные процессы у человека, как устроена память и как человек познает окружающий мир. Это направление искусственного интеллекта было ориентировано на поиски ал горитмов решения интеллектуальных задач на существующих моделях компью теров. Существенный вклад в становление новой науки внесли ее «пионеры»: Маккарти (автор первого языка программирования для задач И И - ЛИСПа) , Минский (автор идеи фрейма и фреймовой модели представления знаний), Нью элл, Саймон, Шоу, Хант и другие. В 1 956- 1 963 rr. велись интенсивные поиски моделей и алгоритмов человеческо го мышления и разработка первых программ на их основе. Представители сущес твующих гуманитарных наук - философы, психологи, лингвисты - ни тогда, ни сейчас не в состоянии были предложить таких алгоритмов. Тогда кибернетики начали создавать собственные модели. Так последовательно были созданы и оп робованы различные подходы. 1 . В конце 50-х годов родилась модель лабиринтного поиска. Этот подход представ ляет задачу как некоторое пространство состояний в форме графа, и в этом графе проводится поиск оптимального пути от входных данных к результиру- 12 Глава 1 • Введение в интеллектуальные системы ющим. Была проделана большая работа по разработке этой модели, но для ре шения практических задач эта идея не нашла широкого применения. В первых учебниках по искуссrвенному интеллекту [Хант, 1 986; Эндрю, 1 985] описаны эти программы - они играют в игру • 15•, собирают •Ханойскую башню•, иг рают в шашки и шахматы. 2. Начало 60-х - это эпоха эвристического программирования. Эвристика - пра вило, теоретически не обоснованное, которое позволяет сократить количество переборов в п ространстве поиска. Эвристическое программирование - разра ботка стратегии действий на основе известных, заранее заданных эвристик [Александров, 1 975] . 3. В 1 963- 1 970 rr. к решению задач стали подключать методы математической логики. Робинсон разработал метод резолюций, который позволяет автомати чески доказывать теоремы при наличии набора исходных аксиом. Примерно в это же время выдающийся отечественный математик Ю. С. Маслов предложил так называемый обратный вывод, впоследствии названный его именем, реша ющий аналогичную задачу другим способом [ Мас.лов, 1 983]. На основе метода резолюций француз Ал,ьбер Кольмероэ в 1 973 г. создает язык логического про- . граммирования Пролог. Большой резонанс имела программа •Логик -теоре тик•, созданная Ньюэлом, Саймоном и Шоу, которая доказывала школьные теоремы. О днако большинство реальных задач не сводится к набору аксиом , и человек, решая производственн�е задачи; не использует классическую логику, поэтому логические модели при всех своих преимуществах имеют существен ные ограничения по классам решаемых задач. 4. История искусственного интеллекта полна драматических событий, одним из которых стал в 1 973 r. так называемый •доклад Лайтхилла•, котррый был под готовлен в Великобритании по заказу Британского совета научных исследова ний. Известный математик Д. Лайmхuлл, никак с ИИ профессионально не свя занный, подготовил обзор состояния дел в области ИИ. В докладе были признаны определенные достижения в области ИИ, однако уровень их опре делялся как разочаровывающий, и общая оценка·была отрицательная с пози ций практической значимости. Этот отчет отбросил европейских исследова телей примерно на 5 лет назад, так как финансирование ИИ существенно сократилось. 5. Примерно в это же время существенный прорыв в развитии практических при ложений искусственного интеллекта произошел в США, когда к середИJtе 1 970-х на смену поискам универсального алгоритма мышления пришла идея моделировать конкретные знания специалистов-экспертов. В США появились первые коммерческие системы, основанные на знанияr, или экспертные систе мы (ЭС). Стал применяться новый подход к решению задач искусственного интеллекта - представление знаний. Созданы MYCIN и DENDRAL [Shortliffe, 1 976; Buchanan, Feigenbaum, 1 978], ставшие уже классическими, две первые экспертные системы для медицины и химии. Существенный финансовый вклад вносит Пентагон, предлагая базировать новую программу министерства обо роны США (Strategic Computer Initiative - SCI) на принципах ИИ. Уже вдо- . 1 . 1 . Крат кая и стори я и скусств енного и нтеллекта 13 гонку упущенных возможностей в начале 80-х объявлена глобальная програм ма развития новых технологий ESPRIT (Европейский Союз), в которую вклю чена проблематика искусственного интеллекта. 6. В ответ на успехи США в конце 70-х в гонку включается Япония, объявив о начале проекта машин V поколения, основанных на знаниях. Проект был рас считан на 10 лет и объединял лучших молодых специалистов (в возрасте до 35 лет) крупнейших японских компьютерных корпораций. Для этих специ алистов был создан специально новый институт !СОТ, и они получили пол ную свободу действий, правда, без права публикации предварительных резуль татов. В резу льтате они создали достаточно громоздкий и дорогой символьный процессор, программно реализующий ПРОЛОГо-подобный язык, не получив ший широкого признания. Однако положительный эффект этого проекта был очевиден. В Японии появилась значительная группа высококвалифицирован ных специалистов в области И И, которая добилась существенных результатов в различных прикладных задачах. К середине 90-х японская ассоциация ИИ насчитывает 40 тыс. человек. Начиная с середины • 1980-х годов, повсеместно происходит коммерциал�зация искусственного интеллекта. Растут ежегодные капиталовложения, создаются промышлеЙные экспертные системы. Растет интерес к самообучающимся систе мам. Издаются десятки научных журналов, ежегодно собираются между.народ ные и национальные конференции по различным направлениям ИИ. Искусственный интеллект становится одной из наиболее перспективных и пре стижных областей информатики (computer science). 1 . 1 . 4 . История искусственного интеллекта в России В 1954 r. в МГУ начал свою работу семинар «Автоматы и мышление>> под руковод ством академика Ляпунова А. А. ( 1911- 1 973), одного из основателей российской ки бернетики. В этом семинаре принимали участие физиологи , лингвисты, психологи, математики. Принято считать, что именно в это время родился искусственный ин теллект в России. Как и за рубежом, вьщелились два основных направления - ней рокибернетики и кибернетики «черного ящика». В 1954-1964 rr. создаются отдельные программы и проводятся исследования в области поиска решения логических задач. В Ленинграде (ЛОМИ - Ленинград ское отделение математического института им. Стеклова) создается программа АЛПЕВ ЛОМИ, автоматически доказывающая теоремы. Она основана на ориги нальном обратном выводе Маслова, аналогичном методу резолюций Робинсона. Среди наиболее значимых результатов, полученных отечественными учеными в 60-е годы, следует отметить алгоритм « Кора» М. М. Бонrарда, моделирующий деятельность человеческого мозга при распознавании образов. Большой вклад в становление российской школы ИИ внесли выдающиеся ученые Цетлuн М. Л., Пушкин В. Н., Гавршов М. А, чьи ученики и явились пионерами этой науки в Рос сии (например, знаменитая Гаврuловская школа). 14 Глава 1 • Введение в интеллектуальн ые системы В 1965-1980 rr. происходит рождение нового направления - ситуационного уп равления (соответствует представлению знаний, в западной терминологии). Ос нователем этой научной школы стал проф. Поспелов Д. А. Б ыли разработаны специальные модели представления ситуаций - представления знаний [ Поспе лов, 1986]. При том что отношение к новым наукам в советской России всегда было насторо женное, наука с таким <,вызывающим� названием тоже не избежала этой участи и была встречена в Академии наук в штыки [Поспелов, 1997]. К счастью, даже среди членов Академии наук СССР нашлись люди, не испугавшиеся столь необычного словосочетания в качестве названия научного направления. Двое из них сыграли огромную роль в борьбе за признание ИИ в нашей стране. Это были академики А. И. Берг и Г. С. Поспелов. Только в 197 4 году при Комитете по системному анализу при президиуме АН СССР был создан Научный совет по проблеме << Искусственный интеллект�, его возглавил Г. С. Поспелов, его заместителями были избраны Д. А. Поспелов и Л. И. Микулич. В состав совета входили на разных этапах М. Г. Гаазе-Рапопорт, Ю. И. Журавлев, Л. Т. Кузин, А. С. Нариньяни, Д. Е. Охоцимский, А. И. Поло винкин, О. К. Тихомиров, В. В. Чавчанидзе. По инициативе Совета было организовано пять комплексных научных проектов, которые были возглавлены ведущими специалистами в данной области. Проек ты объединяли исследования в различных коллективах страны: <,Диалог� (рабо ты по пониманию естественного языка, руководители А. П. Ершов, А. С. Наринь яни ), <,Ситуация� (ситуационное управление, Д. А. Поспелов), <,Банк� (банки данных, Л. Т. Кузин), <,Конструктор� (поисковое конструирование, А. И. Поло винкин), <,Интеллект робота� (Д. Е. Охоцимский). В 1980-1990 rr. проводятся активные исследования в области представления зна ний, разрабатываются языки представления знаний, экспертные системы (более 300). В Московском университете создается язык РЕФАЛ. В 1988 r. создается АИИ - Ассоциация искусственного интеллекта. Ее членами являются более 300 исследователей. Президентом Ассоциации единогласно из бирается Д. А. Поспелов, вьiдающийся ученый, чей вклад в развитие ИИ в России трудно переоценить. Крупнейшие центры - в Москве, Петербурге, Пе реславле-Залесском, Новосибирске. В научный совет Ассоциации входят веду щие исследователи в области И И - В. П. Гладун, В. И. Городецкий, Г. С. Оси пов, Э. В. Попов, В. Л. Стефанюк, В. Ф. Хорошевский, В. К. Финн, Г. С. Цейтин, А. С. Эрлих и другие ученые. В рамках Ассоциации проводится большое количе ство исследований, организуются школы для молодых специалистов, семинары, симпозиумы, раз в два года собираются объединенные конференции, издается на учный журнал. Уровень теоретических исследований по искусственному интеллекту в России ничуть не ниже мирового. К сожалению, начиная с 80-х rr. на прикладных рабо тах начинает сказьiваться постепенное отставание в технологии. На данный мо мент отставание в области разработки промышленных интеллектуальных систем составляет поряд�а 3-5 лет. 1 .2. Основные и сследования в области искусственного интеллекта 15 1 . 2 . Основн ые н аправления исследова н ий в области искусственного интеллекта Синтезируя десятки определений ИИ из различных источников, в �анной книге в качестве рабочего определения можно предложить следующее. ИскусственныR ин теллект - это одно из направлений информатики , целью которого яв ляется разработка аппаратно-программных средств, позволяющих пользователю-не программисту ставить и решать свои, традиционно считающиеся интеллектуальными за дачи , общаясь с ЭВМ на ограниченном подмножестве естественного языка. Среди множества направлений искусственного интеллекта есть несколько веду щих, которые в настоящее время вызывают наибольший интерес у исследовате лей и практиков. Опишем их чуть подробнее. 1 .2. 1 . Представление знаний и разработка систем , основанных на знаниях (knowledge-based systems) Это основное Itаправление в области изучения искусственного интеллекта. Оно связано с разработкой моделей представления знаний, созданием баз знаний, об разующих ядро экспертных систем. В последнее время включает в себя модели и методы извлечения и структурирования знаний и сливается с инженерией зна ний. Именно исследованиям в этой области посвящена данная книrа. Подробнее см. главы 2 -5. 1 .2.2. Программное обеспечение систем И И (software engineering for AI) В рамках этого направления разрабатываются специальные языки д,1lЯ решения интеллектуальных задач, в которых традиционно упор делается на преобладание логической и символьной обработки над вычислительными процедурами. . Эти языки ориентированы на символьную обработку информации - LISP, P R OLOG, SMALLTALK, РЕФАЛ и др. Помимо этого создаются пакеты прикладных про грамм, ориентированные на промышленную разработку интеллектуальных сис тем, или программные инструментарии искусственного интеллекта, например КЕЕ, ARTS, G2 [ Хейес-Рот и др., 1987; Попов, Фоминых, Кисель, Шапот, 1996]. Достаточно популярно также создание так называемых пустых экспертных сис тем или •оболочек• - КАРРА, EXSYS, М 1 , ЭКО и др., базы знаний которых мож но наполнять конкретными знаниями, создавая различные прикладные системы. Подробно эти технологии рассмотрены в главе 6. 16 Глава 1 • Введение в и нтелле ктуальные системы 1 . 2 . З . Разработка естественно-языковых интерфейсов и машинный перевод ( natural language processing) Начиная с 50-х годов одной из популярных тем исследований в области ИИ я в ляетс я компьютерная лингвистика, и, в частности, машинный перевод (МП ). Идея машинного перевода оказалась совсем не так проста, как казалось первым исследователям и ' разработчикам. Уже первая программа в области естественно-языковых ( ЕЯ) интерфейсов - пе реводчик с английского на русский язык - продемонстрировала неэффективность первоначального подхода, основанного на пословном переводе. Однако еще долго разработчики пытались создать программы на основе морфологического анали за. Неплодотворность такого подхода связана с очевидным фактом: человек мо жет перевести текст только на основе понимания его смысла и в контексте пред шествующей информации, или контекста. Иначе поя вля ются переводы в стиле � мо я дорогая Маша - my expensive Masha• . В дальнейшем системы МП услож нялись и в настоящее врем я используется несколько более сложных моделей: • применение так называемых �язь�ков-посредников• или языков смысла, в ре зультате п ро исходит дополнительная трансляция � исходный язык оригина ла - язык смысла - язык перевода•; • ассоциативный поиск аналогичных фрагментов текста и их переводов в специ альных текстовых репозиторJ!ЯХ или базах данных; • структурный подход, включающий последовательный анализ и синтез есте ственно-языковых сообщений. Традиционно такой подход предполагает на личие нескольких фаз анализа: 1. Морфологический анализ - анализ слов в тексте. 2 . Синтаксический анализ - разбор состава предложений и грамматических связей между словами. 3. Семантический анализ - анализ смысла составных частей каждого предло жения на основе некоторой предметно-ориентированной базы знаний. 4. Прагматический анализ - анализ смысла предложений в реальном контексте на основе собственной базы знаний. Синтез ЕЯ -сообщений включает аналогичные этапы, но несколько в другом по рядке. Подробнее см. работы [ Попов, 1 982; Мал ьковский, 1 985] . 1 . 2 . 4 . Интеллектуальные роботы ( robotics) Идея создания роботов далеко не нова. Само слово <,робот• по я вилось в 20-х годах, как производное от чешского <<робота• - тяжелой грязной работы. Его автор - чешский писатель Карел Чапек, описавший роботов в своем рассказе � Р.У.Р•. 1 . 2 . Основные направления в области искусственно го интемекта 17 Роботы - это эл ектротехничес кие устройства , предназначе нные для авто м ати зации че ло веч еско го труда . Можно условно выделить несколько поколений в истории создания и развития робототехники: 1 поколение . Роботы с жесткой схемой управления. Практически все современ ные промышленные роботы принадлежат к первому поколению. Фактически это программируемые манипуляторы. 11 поколение. Адаптивные роботы с сенсорными устройствами. Есть образцы та ких роботов, но в промышленности они пока используются мало. 111 поколение. Самоорганизующиеся или интеллектуальные роботы. Это - ко. печная цель развития робототехники. Основные нерешенные проблемы при со здании интеллектуальных роботов - проблема машинного зрения и адекватного хранения и обработки трехмерной визуальной информации. В настоящее время в мире изготавливается более 60 ООО роботов в год. Фактиче ски робототехника сегодня - это инженерная наука, не отвергающая технологий ИИ, но не готовая пока к их внедрению в силу различных причин. 1 .2.5. Обучение и самообучение (machine learning) Активно развивающаяся область искусственного интеллекта. Включает модели, методы и алгоритмы , ориентированные на автоматическое накопление и фор мирование знаний на основе анализа и обобщения данных [Гаек, Гавранек, 1983; Гладун, 1994; Финн, 1991]. Включает обучение по примерам (или индуктивное), а также традиционные подходы из теории распознавания образов. В последние годы к этому направлению тесно примыкают стремительно разви вающиеся системы data mini ng - анализа данных и knowledge discovery - поис ка закономерностей в базах данных. 1 .2 . 6. Распознавание образов (pattern recognition) Традиционно - одно из направлений искусственного интеллекта, берущее нача ло у самых его истоков, но в настоящее время практически выделившееся в са мостоятельную науку. Ее основной подход - описание классов обьеюпов через опре деленные значения · эначимых признаков. Каждому объекту ставится в соот- 1 ветствие матрица признаков, по которой происходит его распознавание. Процедура распознавания использует чаще всего специальные математические процедуры и функции, разделяющие объекты на классы. Это направление близ ко к машинному обучению и тесно связано с нейрокибернетикой [Справочник по 1990]. ии, 18 Глава 1 • В ведение в интеллектуальные системы 1 .2. 7. Новые архитектуры компьютеров (new hardware platforms and architectures) Самые современные процессоры сегодня основаны на традиционной последова� тельной архитектуре фон Н еймана, используемой еще в компьютерах первых поколений. Эта архитектура крайне неэффективна для символьной обработки. Поэтому усилия многих научных коллективов и фирм уже десятки лет нацелены на разработку аппаратных архитектур, предназначенных для обработки сим вольных u логических данных. Создаются Пролог- и Лисп-машины, компью теры V и VI поколений. Последние разработки посвящены компьютерам баз данных, параллельным и векторным компьютерам [Амамия, Танака, 1 993] . И хотя удачные промышленные решения существуют, высокая стоимость, недо статочное программное оснащение и аппаратная несовместимость с традицион ными компьютерами существенно тормозят широкое использование новых архи тектур. 1 .2.8. Игры и машинное творчество Это, ставшее скорее историческим, направление связано с тем, что на заре иссле дований ИИ традиционно включал в себя игровые интеллектуальные задачи шахматы, шашки, го. В основе первых программ лежит один из ранних подхо дов - лабиринтная модель мышления плюс эвристики. Сейчас это скорее ком мерческое направление, так как в научном плане эти идеи считаются тупико выми. Кроме того, это направление охватывает сочинение компьютером музыки [Зари пов, 1 983] , стихов, сказок [ Справочник по ИИ, 1 986] и даже афоризмов [Любич, 1 998] . Основным методом подобного �творчества� является метод пермутаций (перестановок) плюс использование некоторых баз знаний и данных, содержа щих результаты исследований по структурам текстов, рифм, сценариям и т. п. 1 .2.9. Другие направлени я ИИ - междисциплинарная наука, которая, как мощная река по дороге к морю, вбирает в себя ручейки и речки смежных наук. Выше перечислены лишь те на правления, которые прямо или косвенно связаны с основной тематикой учебни ка - инженерией знаний. Стоит лишь взглянуть на основные рубрикаторы кон ференций п о ИИ, чтобы понять, насколько широко простирается область ис следований по ИИ: • генетические алгоритмы; • когнитивное моделирование; • интеллектуальные интерфейсы; • распознавание и синтез речи; • дедуктивные модели; 1 .3. Представл е н ие з наний и в ы вод на з н ани ях 19 • мноrоаrеmные системы; • онтологии; . • менеджмент знаний; • логический вывод; • формальные модели; ,, • мягкие вычисления и многое другое. Конечно, невозможно в рамках одного учебника рассмотреть все многообразие подходов и идей в области ИИ. Однако некоторые новые направления будут под робнее описаны главах 5, 8, 9. в 1 . 3 . Представление зна ний и вывод на знаниях 1 .3 . 1 . Данные и знания При изучении интеллектуальных систем традиционно возникает вопрос - что же такое знания и чем они отличаются от обычных данных, десятилетиями обраба тываемых ЭВМ. Можно предложить несколько рабочих определений, в рамках которых это становится очевидным. Данные - это отдельные факты , характеризующие объекты, пр оцессы и я вления пред метной области, а также их свойства . При обработке на ЭВМ данные трансформируются, условно проходя следующие этапы: 1. D1 - данные как результат измерений и наблюдений; 2. D2 - данные на материальных носителях информации (таблицы, протоколы, справочники); 3. DЗ - модели (структуры) данных в виде диаграмм, графиков, функций; в 4. D4 - данные компьютере на языке описания данных; 5. D5 - базы данных на машинных носителях информации. Знания основаны на данных, полученных эмпирическим путем. Они представля ют собой результат мыс.лительной деятельности человека, направленной на обоб щение его опыта, полученноrо в результате практической деятельности. Знання - это закономерности предметной области (принципы , связи , законы) , получен ные в результате практической деятельности и профессионального о пыта, п озволяющие специалистам ставить и решать задачи а этой области. 20 Глава 1 • Введение в интеллектуальные системы При обработке на ЭВМ знания трансформируются аналогично данным. 1 . Z 1 - знания в памяти человека как результат мышления; 2. Z2 - материальные носители знаний (учебники, методические пособия); 3. ZЗ - поле знаний - условное описание основных объектов предметной облас ти, их атрибутов и закономерностей, их связывающих; 4. Z4 - знания, описанные на языках представления знаний (продукционные язы ки, семантические сети, фреймы - см. далее); 5. ZS - база знаний на машинных носителях информации. Часто используется такое определение знаний. Знания - это хорошо структурированные данные, или данные о данных , или метаданн ые. Существует множество способов определять понятия. Один из широко приме няемых !.:Пособов оqнован на идее интенсионала. Интенсионал понятия - это опредешние его через соотнесение с понятием более высокого уровня абстрак ции с указанием специфических свойств. Интенсионалы формулируют знания об объектах. Другой способ определяет понятие через соотнесение с понятиями более низкого уровня абстракции или перечисление фактов, относящихся к оп ределяемому объекту. Это есть определение через данные, или экстенсионал по ня тия. Пр и мер 1 . 1 Понятие сперсональный компьютер• . Его интенсионал: сПерсональный компьютер это дружественная ЭВМ, которую можно постаsить на стол и купить менее чем за $2000-ЗООО•. Экстенсионал этого понятия: сПерсональный компьютер - это Мае, IBM РС, Sinkler... • Для хранения данных используются базы данных (для них характерны большой объем и относительно небольшая удельная стоимость информации), для хра нения знаний - базы знаний (небольшого объема, но исключительно дорогие информационные массивы). База знаний - основа любой интеллектуальной си'· стемы. Знания могут быть классифицированы по следующим категориям: • Поверхностные - знания о видимых взаимосвязях между отдельными собы- . тиями и фактами в предметной области. • Глубинные - абстракции, аналогии, схемы, отображающие структуру и приро ду процессов, протекающих в предметной области. Эти знания объясняют яв ления и могут использоваться для прогнозирования поведения объектов. Пр и ме р 1 .2 I;Iоверхностные знания: сЕсли нажать на кнопку звонка, раздастся звук. Если болит голова, то следует принять аспирин•. 1 .3. Представлен ие з наний и в ы вод на з наниях 21 Глубинные знания: •Принципиальная элеюприческая схема зввонка и проводки. Знания физиологов и врачей высокой квалификации о причинах, видах головных болей и методах их лечения •. Современные экспертные систем ы работают в основном с поверхностными зна ниями. Это связано с тем, что на данный момент нет универсальных методик, по зволяющих выявлять глубинные структуры знаний и работать с ними. Кроме того, в учебниках по И И знания традиционно делят на процедурные и дек ларативные. Исторически первичными были процедурные знания, то есть зна ния, срастворенные• в алгоритмах. Они управляли данными . Для их изменения требовалос ь изменять программы. Однако с развитием искусственного интел лекта приоритет данных постепенно изменялся, и все большая часть знаний со средоточивалась в структурах данных (таблицы, списки, абстрактные типы дан ных), то есть увеличивалась роль декларативных знаний. Сегодня знания приобрели чисто декларативную форму, то есть знаниями счита ются предложения, записанные на языках представления знаний, приближенных к естественному и ПОJ;И,ТНЫХ неспециалистам. 1 . 3 . 2 . М одели представления знаний Существуют десятки моделей (или языков) представления знаний для различ ных предметных областей. Большинство из них может быть сведено к следую щим классам: • продукционные модели; • семантические сети; • фреймы; • формальные логические модели. Пр одукци он н ая модепь Продукц ионная модель или модель , основанная н а правилах, позаоляет представить зна . ни я в виде предложени й типа «Если ( усл о вие ) , то (дейст вие ) » Под «условием• (антецедентом) понимается некоторое предложение-образец, по которому осуществляется поиск в базе знаний, а под «действием• (консеквен том) - действия, выполняемые при успешном исходе поиска (они могут быть промежуточными, выступающими далее как условия и терминальными или целевыми, завершающими работу системы). Чаще всего вывод на такой базе знаний бывает прямой (от данных к поиску цели) или обратный (от цели для ее подтверждения - к данным). Данные - это исход ные факты, хранящиеся в базе фактов, на основании которых запускается маши на вывода или интерпретатор правил, перебирающий правила из продукцион ной ба:,,1 знан_ий (см:. далее). 22 Глава 1 • В ведение в и нтем ектуальн ые системы Продукционная модель чаще всего применяется в промышленных экспертных системах. Она привлекает разработчиков своей наглядностью, высокой модуль ностью, легкостью внесения дополнений и изменений и простотой механизма ло гического вывода. Имеется большое число программных средств, реализующих продукционный подход (язык OPS 5; •оболочки• или •пустые• ЭС - EXSYS Professional, Карра, ЭКСП ЕРТ; ЭКО, инструментальные системы П И Э С [ Хорошевский, 1993] и СПЭИ С [Ковригин, Перфильев, 1988] и др.), а также промышленных ЭС на его основе (например, ЭС, созданных средствами G2 [ Попов, 1996] ) и др. Семантические сети Термин семантическа.я означает •смысловая• , а сама семантика - это наука, ус танавливающая отношения между символами и объектами, которые они обозна чают, то есть наука, определяющая смысл знаков. Семантическая сеть - это о риентированный граф , вер ш ины которого - по нятия , а ду ги - отношения между ними . В качестве понятий обычно выступают абстрактные или конкретные объекты, а,. отношения - это связи типа: •это• ( •АКО - A-Kind-Of•, •is• }, •имеет частью• ( •has part• ), •принадлежит• , «любит•. Характерной особенностью семантичес ких сетей является обязательное наличие трех типов отношений: • класс - элемент класса (цветок - роза); • свойство - значение (цвет - желтый); • пример элемента класса (роза - чайная). Можно предложить несколько классификаций семантических сетей, связанных с типами отношений между понятиями. По количеству типов отношений: • Однородные (с единственным типом отношений) . • Неоднородные (с различными типами отношений). По типам отношений: • Бинарные (в которых отношения связывают два объекта). • N-арные (в которых есть специальные отношения, связывающие более двух понятий). Наиболее часто в семантических сетях используются следующие отношения: • связи типа •часть - целое• ( «класс - подкласс•, .элемент -множество•, и т. п.) ; • функциональные связи ( определяемые обычно глаголами « производит•, «влияет • . . . ); • количественные (больше, меньше, равно... ); 23 1 .3. Предста вление знаний и вывод на з наниях • пространственные (далеко от , близко от, за, под, над ... ); • временные (раньше, позже, в течение... ); • атрибутивные связи (иметь свойство, иметь значение); • логические С!3ЯЗИ (И, ИЛИ, НЕ); • лингвистические связи и др. Проблема поиска решения в базе знаний типа семантической сети сводится к за даче поиска фрагмента сети, соответствующего некоторой подсети, отражающей поставленный запрос к базе. При мер 1 .3 На рис. 1 . 1 изображена семантическая сеть. В качестве вершин тут выступают понятия •человек•, •т. Иванов• , •Волга•, савтомобиль•, свид транспорта• и сдвигатель•. свойство Волrа это имеет частью ЭТО ид транспорта Рис. 1 . 1 . Семантическая сеть Данная модель представления знаний была предложена американским психоло гом Куиллианом. Основным ее преимуществом является то, что она более других соответствует современным представлениям об организации долговременной па мяти человека [Скрэгг, 1983]. Недостатком этой модели я вляется сложность организации процедуры поиска вывода на семантической сети. Для реализации семантических сетей существуют специальные сетевые языки, например NET [Цейтин, 1 985], язык реализацюi систем SIMER+MIR [ Осипов, 1 997] и др. Широко известны экспертные системы, использующие семантичес кие сети в качестве языка представления знаний - PROSPECTOR, CASNET, TORUS [Хейес-Рот и др. , 1 987; Durkin, 1 998] . Фреймы Термин фрейм (от английского frame, что означает •каркас� или •рамка� ) был предложен Марвином Минским [Минский, 1979], одним из пионеров ИИ, в 70-е годы для обозначения структуры знаний для восприятия пространственных сцен. Эта модель, как и семантическая сеть, имеет глубокое психологическое обо снование. 1 24 Глава 1 • В ведение в и н темектуальн ые системы Фрейм - это абстрактный образ дл я представления некоего стереотипа восприятия. В психологии и философии известно понятие абстрактного образа. Например, произнесение вслух слова •комната• порождает у слушающих образ комнаты: •жилое помещение с четырьмя стенами, полом, потолком, окнами и дверью, пло щадью 6 -:?О м2 • . Из этого описания ничего нельзя убрать (например, убрав окна, мы получим уже чулан, а не комнату}, но в нем есть •дырки• или •слоты• - это незаполненные значения некоторых атрибутов - например, количество окон, цвет стен, высота потолка, покрытие пола и др. В теории фреймов такой образ комнаты называется фреймом комнаты; Фреймом также называется и формализованная модель для отображения образа. Различают фреймы-образцы, или прототипы, хранящиеся в базе знаний, и фреймы ·э1'Земnляры, которые создаются для отображения реальных фактических си туаций на основе поступающих данных. Модель фрейма является достаточно универсальной, поскольку позволяет отобразить все многообразие знаний о мире через: • фреймы-структуры, использующиеся для обозначения объектов и понятий (заем, залог, вексель); • фреймы-роли (менеджер, кассир, клиент); • фреймы-сценарии (банкротство, собрание акционеров, празднование именин); • фреймы-ситуации (тревога, авария, рабочий режим устройства) и др. Традиционно структура фрейма может быть представлена как список свойств: (ИМЯ ФРЕЙМА: (имя 1-ro слота: значение 1-ro слота), (имя 2-ro слота: значение 2-ro слота), (имя N-ro слота: значение N-r-o слота)). Ту же запись можно представить в виде таблицы, дополнив ее двумя столбцами. Т■бпица 1 . 1 . Структура фрейма Имя слота Зн■чение спота Имя dlDейма Способ nоnуч■ния 3Н8Ч8НИЯ Присоединеннм п--··- -··-- 25 1 .3. Представлен ие з наний и вывод на з наниях В таблице дополнительные столбцы предназначены для описания способа полу чения слотом его значения и возможного присоединения к тому или иному слоту специальных процедур, что допускается в теории фреймов. В качестве значения слота может выступать имя другого фрейма, так образуются сети фреймов. Существует несколько способов получения слотом значений во фрейме-экзем пляре: • по умолчанию от фрейма-образца (Dеfаult-значение); • через наследование свойств от фрейма, указанного в слоте АКО; • по формуле, указанной в слоте; • через присоединенную процедуру; • явно из диалога с пользователем; • из базы данных. Важнейшим свойством теории фреймов является заимствование из теории се мантических сетей - так называемое наСJlедование свойств. И во фреймах, и в се мантических сетях наследование происходит по АКО-связя.м (A -Кind- O/ - это). Слот АКО указывает на фрейм более высокого уровня иерархии, откуда неявно наследуются, то есть переносятся, значения аналогичных слотов. Пр и мер 1 . 4 Например, в сети фреймов на рис . 1 .2 понятие •ученик• наследует свойства фреймов «ребенок• и «человек•, которые находятся на более высоком уровне иерархии. Так, на вопрос «любят ли ученики сладкое• следует ответ «да•, так как этим свойством облада ют все дети, что указано во фрейме «ребенок•. Наследование свойств может быть час тичным, так как возраст для учеников не наследуется из фрейма •ребенок•, поскольку указан явно в своем собствещюм фрейме. Человек АКО Млекопитающее Умеет Мыслить �-----, АКО Возраст Рост Любит Человек О-1 6 лвr 50-180 см Сладкое Ученик АКО Ребенок Учится В школе Возра ст Носит 7-1 7 лет Форму Рис. 1 .2. Сеть фреймов Основным преимуществом фреймов как модели представления знаний является то, что она отражает концептуальную основу организации памяти человека [Шенк, Хантер, 1987], а также ее гибкость и наглядность. 26 Глава 1 • Введение в интеллектуальные системы Специальные языки представления знаний в сетях фреймов FRL (Frame Repre sentation Language) [Байдун, Бунин, 1 990), KRL (Knowledge Representation Lan guage) ·[Уотермен, 1 989] , фреймовая 4оболочка• Карра [ Стрельников, Бори сов, 1 997] и другие программные средства позволяют эффективно строить про мышленные ЭС. Широко известны такие фрейм-ориентированные экспертные системы, как ANALYST, МОДИС, TRISTAN, ALTERID [Ковригин, Перфильев, 1988; Николов, 1 988; Sisodia, Warkentin, 1 992]. Фо р м альные лог ичес к ие модели Традиционно в представлении знаний выделяют формальные логические модели, основанные на классическом исчислении предикатов 1-ro порядка, когда предмет ная область или задача описывается в виде набора аксиом. Мы же опустим описа ние этих моделей по следующим причинам. Исчисление предикатов 1-ro порядка в промышленных экспертных системах практически не используется. Эта логи ческая модель применима в основном в исследовательских 4Игрушечных• систе мах, так как предъявляет очень высокие требования и ограничения к предметной области. В промышленных же экспертных системах используются различные ее модифи кации и расширения, изложение которых выходит за рамки этого учебника. 1 . 3 . З . Вывод н а зн аниях Несмотря на все недостатки, наибольшее распространение получила продукци онная модель представления знаний. При использовании продукционной модели база знаний состоит из набора правил. Программа, управляющая перебором пра вил, называется машиной вывода. Машина выв ода Машина вывода (интерпретатор правил) выполняет две функции: во-первых, просмотр существующих фактов из рабочей памяти ( базы данных) и правил из базы знаний и добавление (по мере возможности) в рабочую память новых фак тов и, во-вторых, определение порядка просмотра и применения правил. Этот механизм управляет процессом консультации, сохраняя для пользователя ин формацию о полученных заключениях, и запрашивает у него информацию, когда для срабатывания очередного правила в рабочей памяти оказывается недостаточ но данных [Осуга, Саэки, 1990] . В подавляющем большинстве с·истем, основанных н а знаниях, механизм вывода представляет собой небольшую по объему программу и включает два компонен та - один реализует собственно вывод, другой управляет этим процессом. Действие компонента вывода основано на применении правила, называемого modus ponens. Если известно, что исти нно утверждение А и существует nра,щло в ида «е·сли А , то В», тогда утве �ждение В tакже истинно. Правило modцs ponens. 27 1 . 3 . Представле н ие з нан и й и вывод на знаниях Правила срабатывают, когда находятся факты, удовлетворяюЩИf их левой части: если истинна посылка, то должно быть истинно и заключение. Компонент вывода должен функционировать даже при недостатке информации. Полученное р ешение может и не быть точным, однако система не должна останав ливаться из-за того, что отсутствует какая-либо часть входной информации. Управляющий компонент определяет порядок применения правил и выполняет четыре функции. 1. Сопоставление - образец правила сопоставляется с имеющимися фактами . 2. Выбор - если в конкретной ситуации может быть применено сразу несколько правил, то из них выбирается одно, наиболее подходящее по заданному крите рию (разрешение конфликта). 3. Срабатывание - если образец правила при сопоставлении совпал с какими либо фактами из рабочей памяти, то правило срабатывает. 4. Действие - рабочая память подвергается изменению путем добавления в нее заключения сработавшего. правила. Если в правой части правила содержится указание на какое-либо действие, то оно выполняется (как, например, в систе мах обеспечения безопасности информации). Интерпретатор п родукций работает циклически. В каждом цикле он просматри вает все правила, чтобы выявить те, посылки которых совпадают с известными на данный момент фактами из рабочей памяти. После выбора правило срабатывает, его заключение заносится в рабочую память, и затем цикл повторяется сначала. В одном цикле может сработать только одно правило. Если несколько правил ус пешно сопоставлены с фактами, то интерпретатор производит выбор по опреде ленному кр итерию единственного правила, которое срабатывает в данном цикле. Цикл работы интерпретатора схематически представлен на рис. 1 .3. Сопоставление Рабочая память (база да нных) База правил 1 1 ' Конфликтное м ножество Критерий выбора правил Разрешение конфликта правило Действие --- --- - -- - -- - -- -- --- - -- -- - - ____ l i - --- --- -- -- - · - -- ·1 1 1 1 Рис . 1 .3. Цикл работы и нтерпретатор а 1 Информация из рабочей памяти последовательно сопоставляется с посылками правил для выявления успешного сопоставления-. Совокупность отобранных пра- 28 Глава 1 • В ведение в интел лектуальн ы е системы вил составляет так_ называемое конфликтное множество. Для разрешения кон фликта интерпретатор имеет критерий, с помощью которого он выбирает единственное правило, после чего оно срабатывает. Это выражается в занесе нии фактов, образующих заключение правила, в рабочую память или в измене нии критерия выбора конфликтующих правил. Если же в заключение правила входит название какого-нибудь действия, то оно выполняется. Работа машины вывода зависит только от состояния рабочей памяти и от состава базы знаний. На практике обычно учитывается история работы, то есть поведе ние механизма вывода в предшествующих циклах. Информация о поведении ме ханизма вывода запоминается в памяти состояний (рис. 1.4). Обычно память со• стояний содержит протокол системы. И нтерпретатор (механизм вывода) Память СОСТОЯНИЙ 1 Данные □.,,,, ... □ Рабочая память (база да нных) Об�цы □ ....... □ 0-. . . . . . □ . Модули (база зна ний) Рис . 1 .4. С хема функци онирова ния и нтерпретато ра Ст рате г ии у правления в ы во до м От выбранного метода поиска, то есть стратегии вывода, будет зависеть порядок применения и срабатывания правил. Процедура выбора сводится к определению направления поиска и способа его осуществления. Процедуры, реализующие по иск, обычно сзашиты• в механизм вывода, поэтому в большинстве систем инже неры знаний не имеют к ним доступа и, следовательно, не могут в них ничего из менять по своему желанию. При разработке стратегии управления выводом важно определить два вопроса: 1. Какую точку в пространстве состояний принять в качестве исходной? От вы бора этой точки зависит и метод осуществления поиска - в прямом или об ратном направлении. 2. Какими методами можно повысить эффективность поиска решения? Эти ме тоды определяются выбранной стратегией перебора - глубину, в ширину, по подзадачам или иначе. Пря мо й и о б рат ный в ы вод При обратном порядке вывода вначале выдвигается некоторая гипотеза, а затем механизм вывода как бы возвращается назад, переходя к фактам, пытаясь найти 29 1 . 3 . Представление з нан ий и в ывод на з наниях те, которые подтверждают гипотезу (рис. 1.5, правая часть). Если она оказалась правильной, то выбирается следующая гипотеза, детализирующая первую и яв ляющаяся по отношению к ней . подцелью. Далее отыскиваются факты, под тверждающие истинность подчиненной гипотезы. Вывод такого типа называется уnравляемым целями, или управляемым консеквентами. Обратный поиск приме няется в тех случаях, когда цели известны и их сравнительно немного. Прямой вывод Обратный ВЫIК\Q Поиск в mубину Поиск в wирину Начало поиска Начало 11ОМС1С8 Начаnо ПОИС1С8 Рис. 1 .5. Стратегии вывода В системах с прямым выводом по известным фактам отысIЩвается заключение, которое из этих фактов следует (см. рис. 1.5, левая часть). Если такое заключение удается найти, то оно заносится в рабочую память. Прямой вывод часто называют выводом, управляемым данными, или выводом, управляемым антецедентами. Существуют систеМf!I, в которых вывод основывается на сочетании упомянутых выше методов - обратного и ограниченного прямого. Такой комбинированный метод получил название циклического. Пр и мер 1 .5 Имеется фрагмент базы знаний из двух правил: П 1 . Если сотдых - летом• и счеловек - активный•, то сехатъ в горы•. П2. Если слюбит солнце•, то сотдых летом•. Предположим, в систему поступили факты - •человек активный• и слюбит солнце•. ПРЯМОЙ ВЫВОД - исходя из фактических данных, получить рекомендацию. 30 Глава 1 • В ведение в интелл ектуальные сиСТ!ЭМЫ 1 -й проход. Шаг 1. Пробуем П1, не работает (не хватает данных •отдых - летом•). Шаг 2. Пробуем П2, работает, в базу поступает факт •отдых - летом•. 2-й проход. Шаz З. Пробуем П1, работает, активируется цель •ехать в горы•, которая и выступает как совет, который дает ЭС. ОБРАТНЫЙ ВЫВОД - подтверлить выбранную цель при помощи имеющихся правил и данных. 1 -й проход. Шаz 1. Цель - •ехать в горы•: пробуем П1 - данных •отдых - летом• нет, они стано вятся новой целью и ищется правило, где цель в левой части. Шаz 2. Цель •отдых - летом•: правило П2 подтверждает цель и активирует ее. 2-й првход. Шаг З. Пробуем П 1 , подтверждается искомая цель. М етоды п ои ска в глуб и ну и ши рину В системах, база знаний которых насчитывает сотни правил, желательным явля ется использование стратегии управления выводом, позволяющей минимизиро вать время поиска решения и тем самым повысить эффективность вывода. К чис лу таких стратегий относятся: поиск в глубину, поиск в ширину, разбиение на подзадачи и альфа-бета алгоритм [Таунсенд, Фохт, 199 1 ; Уэно, Исидзука, 1989; Справочник по ИИ, 1990]. При поиске в глубину в качестве очередной подцели выбирается та, которая со ответствует следующему, более детальному уровню описания задачи. Например, диагностирующая система, сделав на основе известных симптомов предположе ние о наличии определенного заболевания, будет продолжать запрашивать уточ няющие признаки и симптомы этой болезни до тех пор, пока полностью не опро вергнет выдвинутую гипотезу. При поиске в ширину, напротив, система вначале проанализирует все симптомы, находящиеся на одном уровне пространства состояний, даже если они относятся I< разным заболеваниям, и лишь затем перейдет к симптомам следующего уровня детальности. Разбиение на подзадачи - подразумевает выделение подзадач, решение которых рассматривается как достижение промежуточных целей на пути к конечной цели. Примером, подтверждающим эффективность разбиения на подзадачи, является поиск неисправностей в компьютере - сначала выявляется отказащпая подсисте ма (питание, память и т. д.), что значительно сужает пространство -п оиска. Если удается правильно понять сущность задачи и оптимально разбить ее на систему иерархически связанных целей-подцелей, то можно добиться того, что путь к ее решению в пространстве поиска будет- минимален. Альфа-бета алгоритм позволяет уменьшить пространство состояний путем уда ления ветвей, неперспективных для успешного поиска. Поэтому просматривают ся только те вершины, в которые можно попасть в результате следующего шага, 31 1. 4. Нечеткие знания после чего неперспективные направления исключаются. Альфа-бета алгоритм нашел широкое применение в основном в системах, ориентированных на различ ные игры, например в шахматных программах. 1 . 4. Нечеткие знания При попытке формализовать человеческие знания исследователи вскоре столк нулись с проблемой, затруднявшей использование традиционного математиче ского аппарата для их описания. Существует целый класс описаний, оперирую щих качественными характеристиками объектов (много, мало, сильный, очень сильный и т. п.). Эти характеристики обычно размыты и не могут быть однознач но интерпретированы, однако содержат важную информацию (например, -«Од ним из возможных признаков гриппа является высокая температура�). Кроме того, в задачах, решаемых интеллектуальными системами, чаtто прихо дится пользоваться неточными знаниями, которые не могут быть интерпретиро ваны как полностью истинные или ложные (логические true/false или 0/1). Су ществуют знания, достоверность которых выражается некоторой промежуточной цифрой, например 0.7. Как, не разрушая свойства размытости и неточности, представлять подобные зна ния формально? Для разрешения таких проблем в начале 70-х американский ма тематик Лотфu Заде предложил формальный аппарат нечеткой (fuzzy) алгебры и нечеткой логики [Заде, 1972] . Позднее это направление получило широкое рас пространение [Орловский, 1981; Аверкин и др., 1986; Яшин, 199,0 ] и положило на чало одной из ветвей ИИ под названием - мяг1СUе вычисления (soft computing). Л. Заде ввел одно из главных понятий в нечеткой логике - понятие лингвисти ческой переменной. Лингвистическая переменная (ЛП) - это пе ременна я, значение которой оп ределяется на боро м вер бальных ( то есть сло весных) ха ра ктеристик некоторого свойства . Например, ЛП <рост» определяется высокий, очень высо1СUй}. через набор {карликовый, низкий, средний, 1 . 4 . 1 . О сновы теории нечетких множеств Значения лингвистической переменной (ЛП) определяются через так называе мые нечеткие множества (НМ), которые в свою очередь определены на некото ром базовом наборе значений или базовой числовой шкале, имеющей размер ность. Каждое значение ЛП определяется как нечеткое множество (например, нм -«НИЗКИЙ росн ). Нечеткое множество определяется через некоторую базовую шкалу В и функцию принадлежности НМ - µ(х), хе В, принимающую значения на интервале [0 ... 1]. Таким образом, нечеткое множество В - это совокупность пар вида (х, µ(х)), где хе В. Часто встречается и такая запись: 32 Глава 1 • Введение в интелл ектуальные системы где х. - i-e значение базовой шкалы. Функция принадлежности определяет субъективную степень уверенности экс перта в том, что данное конкретное значение базовой шкалы соответствует опре деляемому НМ. Эту функцию не стоит путать с вероятностью, носящей объек-_ тивный характер и подчиняющейся другим математическим зависимостям. Например, для двух экспертов определение НМ •высокая))> для ЛП «цена автомо биля,> в условных единицах может существенно отличаться в зависимости от их социального и финансового положения. •Высокая_цена_автомобиля_1 ,> = {50000/1 + 25000/0.8 + 10000/0.6 + 5000/0.4}. «Высокая_цена_автомоб�ля_2,> = {25000/1 + 10000/0.8 + 5000/0.7 + 3000/0.4} 1 , П ример 1 .6 Пусть перед нами стоит задача интерпретации значений ЛП «возраст», таких как «мо лодой» возраст, «преклонный• возраст или «переходный» возраст. Определим «воз расн как ЛП (рис. 1 .6). Тогда «молодой», «преклонный», «переходный» будут значе ниями этой лингвистической переменной. Более полно, базовый набор значений ЛП ( «возраст» следующий: В = {младенческий, детский, юный, молодой, зрелый, преклонный, старческий}. Рис . 1 .6. Лингви сти ческая п е ре м енная « возраст» и неч етки е м нож е ст ва, о пределяю щи е ее з наче н и я Для ЛП <<Возраст» базовая шкала - это числовая шкала от О до 1 20, обозначающая ко· личество прожитых лет, а функция принадлежности определяет, насколько мы увере нь1 в том, что данное количество лет можно отнести к данной категории возраста. На рис. 1 .7 отражено, как одни и те же значения базовой шкалы могут участвовать в опре делении различных НМ. о 2 з 4 5 6 7 8 Рис. 1 . 7. Ф ормирован ие н еч етких м ноже ств 9 10 33 1 .4. Н ече тк ие знания Например, определить значение НМ «младенческий возр ас т• можно та к: 4:младенческий» = 0.5 1 2 3 4 5 10 {- + - + - + - + - + - + - } · 1 0.9 0.8 0.7 0.6 0.3 0.1 Рисун ок 1 .8 илл юстрирует оценку НМ неким усредненным э ксперто м, который ребе н ка до полу года с высокой степе1!1,ю уверенн ости отн осит к младенца м (ш = 1). Дети до четырех лет причисля ются к мл аденцам тоже, н о с меньшей степенью уверенности (0.5< ш <0.9), а в десять лет ребенка назьiвают так только в очень редких случаях - к примеру, для девяностолетней бабушки и 15 лет м ожет считаться младенчеств ом. Та ки м образом , нечеткие мн ожества п озволяют при определении по ня т ия учитывать субъективные мнения отдельных индивидуумо в. µ(х) НМ = мл аденческий возраст 0,5 0,4 0,3 0,2 0,1 0,0 О 2 3 4 5 6 7 8 9 10 11 Возраст Рис. 1 .8 . График функции п ринадлежности н ечеткому множеству «м л аде нческий возраст• 1 . 4.2. Операции с нечеткими знаниями Для операций с нечеткими знаниями, выраженными при помощи лингвистичес I<ИХ переменных, существует много различных способов. Эти способы являются в основном эвристиками. Мы не будем останавливаться на этом вопросе подробно, укажем лишь для примера определение нескольких операций. К примеру, опера ция «ИЛИ� часто задается так [ Аверкин и др., 1 986; Яшин, 1990]: µ(х) = max(µ1(x),µ2(x)) (так называемая логика Заде) или так: µ(х) = µ1(х) + µ2(х) - µ1(х) * µ2(х) (вероятностный подход). Усиление или ослабление лингвистических понятий достигается введением спе циальных квантификаторов. Например, если понятие «старческий возраст>> определяется как 60 70 80 90 {- + - + - + - } ' 0.6 · 0.8 0.9 . l 34 Гл ава 1 • Введение в и нтеллещальн ые систе мы то понятие <!очень старческий возраст� определится как · con( A ) = A 2 = L то есть <<Очень старческий возраст� равен \, ; µ/ 90 {_оо_ + � + .!О.. + } · 0.36 0.64 0.8 1 . 1 Для вывода на нечетких множествах используются специальные отношения и операции над ними (подробнее см. работу (O]:)ловский, i 981 ]). Одним из первых применений теории НМ стало использование коэффициентов уверенности для вывода ре1юмендаций медицинской системы MYCIN [Shortliffe, 1976]. Этот метод использует несколько эвристических приемов. Он стал приме.ром обработки нечетких знаний, повлиявших на последующие системы. В настоящее время в большинство инструментальных средств разработ1си систем, основанных на знаниях, включены элеr,._1енты работы с НМ, кроме того, разработа ны специальные программные средства реализации так называемого нечеткого вывода, например <!Оболочка,> FuzzyCLIPS. 1 . 5 . Прикладные интеллектуальные системы Центральная парадигма интеллектуальных технологий сегодня - это обрабоп<а знаний. Системы, ядром которых является база знаний или модель предметной области, описанная на язьп<е сверхвысокого уровня, приближенном к естествен ному, называют интеллектуальными. Будем называть такой язык сверхвысшю го уровня - языком представления знаний (ЯПЗ). Чаще всего интеллектуальные системы (ИС) применяются для решения сложных задач, где основная сложность решения связана с использованием слабо-формализованных знаний специалис тов-практиков и где логическая (или смысловая) обработка информации пре валирует над вычислительной. Например, понимание естественного языка, под держка принятия решения в сложных ситуациях, постановка диагноза и реко мендации по методам лечения, анализ визуальной информации, управление дис петчерскими пультами и др. Фактически сейчас прикладные интеллектуальные системы используются в де сятках тысяч приложений. А годовой доход от продаж программных и аппарат ных средств искусственного интеллекта еще в 1989 r. в США составлял 870 млн долларов, а в 1990 г. - 1,1 млрд долларов [ Попов, 1996]. В дальнейшем почти тридцатипроцентный прирост дохода сменилсJ1 более плавным наращиванием темпов (по материалам [Поспелов, 1997; Хорошевский, 1997; Попов, 1996; Walker, Miller, 1987; Tuthill, 1 994, Durkin, 1998]}. На рис:. 1.9 отражеirьt различные аспекты состояния рынка искусственного интел лекта: инвест:иции в разработку в области ИИ (США, Европа, Япония) (рис. 1.9, а); ДОЛЯ систем ии в информатике (программном обеспечении) (рис. 1.9, б); доходы от продаж традиционных языков программирования (рис. 1.9, в); инвестиции 1 .5. Прикладны е 14 нтелл ектуальные системы 35 только в программное обеспечение (СЩА ) (рис. 1.9, .z); инвестиции в аппаратное обеспечение ( США) (рис. 1 .9, д); структура рынка ЭС ( США, 1993) (рис. 1.9, е). П рирост % год % от рынка информатики 220 1 00 80 Eaporra Япони,� США 87 · 89 , 1 984 млн $ 420 '' 230 20 1 984 а 92 а млн $ 270 96 Anna� �не 1 570 1 986 зс ЕЯ-интерфеi\с ' - · - - :- Расnоэнавание ------t-----t 1 986 90 г 94 ► Проrреммныi\ ментариi\ н .....-.--и-.стру депо системное п о ·· Д11!t ann apantolO 620 ПО дnя ИИ 840 650 \:<.�·:... . . 88 2000 90 млн $ Языки ии ' 1 985 9;3 91 г J 2: 0, 16 ,, ' ' _ , - - - - � • обесnеченм 90 94 Меди� ' и обраэоввние Информатика д е Рис:1 .�. �осто.яние и перспекти вы рынка ИИ Наиболее распространенным видом ИС являются экспертные системы. Экспертные системы (ЭС) -:- это наиболее расnроqтраненный кnасс ИС, ориентирован ный н а тиражирование оп ыта в ысококвалифицированных сп ециал истов в о бластях , где качество nринятия ·реш ен и й традици онно зав исит от уровня эксперти зы , напри мер; ме дицина, юриспруденци я, геоло�:ия, э кономика, военное дело и др. ·. ЭС эффективны лищь в специфических •экспертных• областях, где важен эмпи рический опыт специ11ЛисТQв•. . Только в США ежегодный доход от продаж инструментальных. средств разработ ки ЭС состав{IЯЛ в Н!!,Чале. .9,�-х �;с:>,цов, зрО-400 млн доллаРQв., а . от прр:менен�я ЭС - 80-90 млн долларов {По\1.о�,, Щ96]. Ежегодно крупные фирмы разрабаты. вщот десятки ЭС тJiЩl •in-hщ1se• для: в;нутреннеrо пользования. Эти системы ин . тегрируют опыт специалистов комl)ании по ключевым � страniгически важным технологиям. В начале '90-х· iт. itоя:вилась новая наука - •менеджмент знаний• 36 Гл ава 1 • Введени е в интеллеКJУа льные си стемы (knowledge management), ориентированная на методы обра6отк� и управлени.я: корпоративными знаниями ( см. главу 5). Современные ЭС - это сложные программные комплексы, аю(умулирующие зна ния специалистов конкретных предметных областях и распространяющие этот эмпирический опыт для консультирования менее квалифицированных пользо вателей. Разработка экспертных систем, как активно развивающаяся ветвь ин форматики, направлена на использование ЭВМ для обработки информации в тех областях науки и техники, где традиционные математические методы моде лирования малопригодны. В этих областях важна смысловая и логическая обра ботка информации, важен опыт экспертов. Приведем некоторые условия, которые могут свидетельствовать о необходимо сти разрабqтки и внедрения экспертных систем (частично из [Уотермен, 1989]): • нехва'l'ка специалистов, затрачивающих значительное время для оказания по мощи другим; • вьmолнение небольшой задачи требует многочисленного колле1(Тива специа листов, пос�ольку ни один из них не обладает достаточным знанием; • сниженная производительность, пос1(ольку задача требует полного анализа сложного набора условий, а обычный специалист не в состоянии просмотреть (за отведенное время) все эти условия; • большое расхождение между решениями самых хороших и самых плохих ис полнителей; • наличие конкурентов, имеющих преимущество, в силу того, что они лучше справляются с поставленной задачей. Подходящие задачи имеют следующие характеристики: • являются узкоспециализированными; • не зависят в значительной степени от общечеловеческих знаний или сооб ражений здравого смысла; • не являются для эксперта ни слишком легкими, ни слишком сложными. (Время, необходимое эксперту для реmения проблемы, может составлять от трех часов до трех недель.) Э1(спертные системы достаточно молоды - первые системы такого рода, MYCIN [Shortliffe, 1976] и DENDRAL [Buchanan, Feigenbaum, 1978], появились в США в середине 70-х годов. В настоящее время в мире насчитывается несколько тысяч промышленных ЭС, которые дают советы: ' • при управлении сложными диспетчерскими пультами, например сети распределения электроэнергии, - Alarm Analyser [Walker, Miller, 1987]; • при постановке медицинских диагнозов - ARAMIS [Shortliffe, Buchanan, Fei genbaum, J979], NEUREX [Reggia, 1988]; • при поиске' неисправнос'Гей в электронных приборах, диагности1(а отказов контрольно-измерительного оборудования - Intelligence Ware [Slagle, Gardi ner, Kyungsook, 1 990], Plant Diagnostics [Уотермен, 1989 ] , FOREST [Finin, McAdams, Кleinosky, 1984]; в 37 1 .5. Прикладные 1,1нтеллектуал ьн ые систем ы • по проектированию интегральных мю<росхем - DAA [Сойер, Фостер, 1988], NASL [Walker, Miller, 1988], QO [ Pega, Sticklen, Bond, 1993]; • по управлению перевозками - AIRPLAN [Masui, McDermott, 1983]; • по прогнозу военных действий - ANALYST [ Bonasso, 1984], BATTLE [Slagle, Gaynor, 1983]; • по формированию портфеля инвестиций, оценке финансовых рисков - RAD [Kestelyn, 1992], налогообложению - RUNE [ Durkin, 1998] и т. д. Наиболее популярные приложения ИС отображены на рис. 1.10 [Durkin, 1998] . Транспорn1ые системы Космонавтика - Наука 111D Системы управления Горная промышленность ное дело Воен М етеорология 1Ш1Ш Медицина Математика вод о роиз ств ЮП риспруденция Управление информацией Обработка изображений Геоnогия Окружающая среда Инженерия - V' Злектроника Образование Компьютерные системы Коммуникации Химия Бизнес Сельское ХОЗЯЙСТВО о 50 100 150 200 250 300 350 Рис. 1 . 1 О. Основны е прил ожения ИС Сейчас легче назвать области, где еще нет ЭС, чем те, где они уже применяются. Уже в 1987 г. опрос пользователей, проведенный журналом <ilntelligent Techno logies>> ( США), показал, что примерно: • 25 % пользователей используют ЭС; . • 25 % собираются приобрести ЭС в ближайшие 2-3 года; , • 50 % предпочитают провести исследование об эффективности их использования. Главное отличие ИС и ЭС от других программных средств - это наличие базы знаний ( БЗ), в которой знания хранятся в форме, понятной спещ1алистам пред метной области, и могут быть изменены и дополнены также в понятной форме. Это и есть языки представления знаний - ЯПЗ. До последнего времени именно различные Я П З были центральной проблемой при разработке ЭС. Сейчас существуют десятки языков или моделей представ ления знаний (см. параграф 1 .3). Наибольшее распространение получили следу ющие модели: • продукции (OPS5 [ Forgy, 1 981] , RO S I E [Fain, Hayes-Roth, Sowizral, Water man, 1982]); 38 Глава 1 • Введение в и нтеллектуальные системы • семантические сети (SIMER+MIR [Осипов, 1997]; NET [Цейтин, 1985]); • фреймы (FRL [Байдун, Бунин, 1988; Справочник по ИИ, 1990]); • логическое программирование (ПРОЛОГ [Макалистер, 1990; Стерлинг, Ша пиро, 1990]); • объектно-ориентированные языки (SMALLTALK [Goldberg, Robson, 1 9 83; Буч, 1993] , CLOS [ Pega, Sticklen, Bond, 1993]). Для перечисленных выше модеJiей сущест�уеt соответствующая математическая нотация, разработаны системы программирования, реализующие эти ЯПЗ, и имеется большое количество ре!1-7ч,ных, КQммерчес1<их ЭС. Подробнеl:! вопросы программной реализации прикладнЬI:х ЙС' рассмотрены в главе 6. Современное состояние разраб.оток, в облачu ЭС. в Росси.и можно охарактеризо вать как стадию все возрастающего интереса среди широких слоев специалис тов - финансистов, топ-менеджеров, преподавателей, инженеров, медиков, пси хологов, программистов, лирrвистов. В последние годы этот интерес имеет пока достаточно слабое !',fатериальное подкрепление - явная нехватка учебников и специальной литературы, отсутствие символьных процессоров и рабочих стан ций, ограниченное финансирование исследований в этой области, слабый отече ственный рынок программных продуктов для разработки ЭС. Поэтому появляется возможность распространения •подделок� под экспертные системы в виде многочислен ных диалоговых систем и интерактивных пакетов прикладных программ, которые дискредитируют в глазах пользователей это чрез вычайно перспективное направление. Процесс создания экспертной системы тре бует участия высококвал]fфициро�а1шых специалистов в области искусственн<;> го интеллекта, которых ПОI<а вь1пускает небольшое количество высших учебных . заведений страны. Наибольшие трудности в разработке ЭС вызывает сегодня не процесс машинной реализации d\:стем, а домашинный этап анализа знаний и проектирования базы знаний. Этим занимается специальная наука - инженерия знаiшй [Гаврилова, Червинская, 1992; Adeli, 1994; Scott, Clayton, Gibson, 1994] . Современному состоянию этой науки и посвящены последующие главы этой книги. Разработка Систем , основанных на знаниях 1 о о □ о Введение в экспертные системы. Определение и структура Классификация систем, основанных на знаниях Коллектив разработчиков Технология проектирования и разработки 2. 1 . В в едение в экспертные системы . О п ределен ие и структура В качестве рабочего определения экспертной- системы примем следующее. Экспертные системы (ЭС) - это сложные программны е ко мплексы, аккумулирующие знания специалистов в конкретных п редметных о бластях и тиражирующие этот эм п ири ческий о пыт для консультаций менее квалифици рованных пользов ателей . Обобщенная структура экспертной системы представлена на рис. 2 . 1 . Следует учесть, что реальные ЭС могут иметь более сложную структуру, однако блоки, изображенные на рисунке, непременно присутствуют в любой действительно эк спертной системе, поскольку представляют собой стандарт de facto структуры современной ЭС. В целом процесс функционирования ЭС можно представить следующим обра зом: пользователь, желающий получить необходимую информацию, через поль зовательский интерфейс посылает запрос к ЭС; решатель, пользуясь базой зна ний, генерирует и выдает пользователю подходящую рекомендацию, объясняя ход своих рассуждений при помощи подсистемы объяснений. 40 Глава 2 • Разработка систем, осн ованных на знани ях Решатель Интерфейс пользователя Беза знаний П одсистема объяснений Интеплектуальный редактор базы знаний � + i . Инженер Экаnерт по знаниям Рис. 2. 1 . Структура экспертной системы Польэоlilатель Так как терминология в области разработки ЭС постоянно модифицируется, оп ределим основные термины в рамках данной работы. Пользователь - специалист предметной области, для которого предназначена си стема. Обычно его квалификация недостаточно высока, и поэтому он нуждается в помощи и поддержке своей деятельности со стороны Э С. Инженер по знаниям - специалист в области искусственного интеллекта, высту пающий в роли промежуточного буфера между экспертом и базой знаний. Сино нимы: когнитолог, инженер-интерпретатор, аналитик. Интерфейс пользователя - комплекс программ, реализующих диалог пользова теля с ЭС как на стадии ввода информации, так и при получении результатов. База знаний (БЗ) - ядро ЭС, совокупность знаний предметной области, записан ная на машинный нос·итель в форме, понятной эксперту и пользователю ( обычно на некотором языке, приближенном к естественному). Параллельно такому «че ловеческому• представлению существует БЗ во внутреннем «машинном• пред ставлении. Решатель - программа, моделирующая ход рассуждений эксперта на основании знаний, имеющихся в БЗ. Синонимы: дедуктивная машина, машина вывода, блок логического вывода. ' . Подсистема обьяснений - проtрамма, позволяющая пользователю получить от "'i_еты на вопросы: « Как была получена та или иная рекомендация?• и «Почему си��РJ:I»яла такое решение?• Ответ на вопрос «как• - это трассировка всего проце(t{\ролучения решения с указанием использованных фрагментов БЗ, то есть вс� Ul'S{OB цепи умозаключений. Ответ на вопрос «почему• - ссылка на умо заключеiще, �посредственно предшествовавшее полученному решению, то есть отход на о�а : назад. Развитые подсистемы объяснен�й поддерживают и другие типы вопро�. Интеллектуальный редактор БЗ - программа, представляющая инженеру по знаниям возможность создавать БЗ в диалоговом режиме. Включает в себя систему вложенных меню, шаблонов языка представления знаний, подсказок ( «help• - режим) и других сервисных средств, облегчающих работу с базой. 2.2. Кл ассифи каl.lJ,4 я систе м, основанн ы х на знаниях 41 Еще раз следует подчеркнуть, что представленная на рис. 2.1 структура является минимальной, что означает обязательное присутствие указанных на ней блоков. Если система объявлена разработчиками как экспертная, только наличие всех этих блоков гарантирует реальное использование аппарата обработки знаний. Однако промышленные прикладные ЭС могут быть существенно сложнее и до полнительно включать базы данных, интерфейсы обмена данными с различными пакетами прикладных программ, электронными библиотеками и т. д. 2 . 2 . Кл асс ифи ка ци я с и с те м , осн ов анны х на знан и я х Класс ЭС сегодня объединяет несколько тысяч различных программных комп лексов, которые можно классифицировать по различным критериям. Полезными могут оказаться классификации, представленные на рис. 2.2. Экспертные системы По задаче Интерпретация данных По сеяэям с реальным временем Статическое Диагностика " Квазидинамические Проектирование Динамические Прогнозир ование ни о ан е Ппа р в и Обучение nу П о ти эвм На супер эвм По сте п ен и и нтеrр еции Авто11омные '! Гибридные (интеrрированн ые) На сммеольных процессорах На рабоч их станциях на ПЭВМ Рис. 2 .2. Класс иф и каци я экспертных с и стем 2 . 2 . 1 . Классификация- по решаемой задаче Рассмотрим указанные на рисунке типы задач подробнее. • Интерпретация. данных. Это одна из традиционных задач для экспертных сис тем. Под интерпретацией понимается процесс определения смысла данных, результаты которого должны быть_ согласованными и корректными. Обычно предусматривается многовариантный анализ данных. 42 Глава 2 • Разработка систе м, ос нова нных на з на_н иm< • Все примеры далее из работ [Попов и .n:p., (ред.), 1 990; Соловьев, Соловьев'!, 1 989; Хейес-Рот и др., 1987]. 1 • Обнаружение и идентификация различных типов океанских судов по результатам аэрокосмического сканирования - SIAP; • определение основных свойств личности по результатам психодиагности ческого тестирования в системах АВТАНТЕСТ и МИКРОЛЮШЕР и др. • Диагностика. Под диагностикой понимается процесс соотнесения объекта с некоторым классом объектов и/или обнаружение неисправJfОСТИ в не�<оторой системе. Неисправность - это отклонение от нормы. Такая трактовr<а поз воляет с единых теоретических позиций рассматривать и неnсправность 'обо рудования в технических системах, и заболевания живых организмов, и вс� возможные природные аномалии. Важной спецификой является здесь необходимость понимания функциональной сrруктуры («анатомии•) ди агностирующей систещ,r. • Диагностика и терапия сужения коронарных сосудов - ANGY; • диагностика ошибок в аппаратуре и математическом обеспечении ЭВМ система CRIB и др. • Мониторинг. Основная задача мониторинга - непрерыв_ная интерпретация данных в реальном масштабе времени и сигнализация о выходе тех ·или иных параметров за допустимьrе пределы. Главные проблемы � «пропуск•. тревож ной ситуации и инверсная задача «ложного• срабатывания. Сложность этих проблем в размытости симптомов тревожных ситуаций и необх�димо�ть уче та временного контекста. • Контроль. за работой электростанций СПРИНТ, помощь дцспетчерам атом ного реактора - REACTOR; • контроль. аварийных датчиков на химичес�ом_ заводе - FALCON и др, • Прдектирование. Проектирование сосtоит в подготовке спецификаций на со здание «объектов• с заранее определенными свойствами. Под. спецификацией понимается весь набор необходимых документов - чертеж, пояснительн� зl писка и т. д. Основные проблемы здесь -' получение четкого струr<турноrо описания знаний об объекте и проблема «�леда•. Для организации эффектив ного проектирования и в еще большей степени перепроектирования необхо димо формировать не только сами проектные решения, но и мотивы их приня тия. Такuм .образом, в_ задачах. проектироваJIИЯ тесно связы)?аются два основ ных процесса, выполняемых в рамках соответствующей ЭС: процесс вы.вода . ', .) решения и n]Х)цесс ооьяснепия. в • Проектирование конфигураций ЭВМ VAX; - 1 1/780 системе XCON (или R 1 ), проектирование БИС - CADHELPi · · · · · • синтез элеiщщчес:ких цепей - SYN и др . . 43 2.2. Классифи�а� систем; осно ванных на зна ниях • . Прогнозирование. Прогнозирование позволяет предсказывать последствия не которых событий или явлений на основании анализа имеющихся данных. Прогнозирующие системы логически выводят вероятные следствия из задан ных ситуаций. В прогнозирующей системе обычно используется параметри ческая динамическая модель, в которой значения параметров •подгоняются• под заданну1? ситуацию. Выводимые из этой модели следствия составляют основу для прогнозов с вероятностными оценками. • Предсказание погоды - система WILLARD; • оценки будущего урожая - PLANT; • прогнозы в экономике - ECON и др. • · Планирование. Под планированием понимается нахождение планов действий, относящихся к объектам, способным выполнять некоторые функции. В та1шх ЭС используются модели поведения реальных объектов с тем, чтобы логичес ки вывести последствия планируемой деятельности. • Планирование поведения робота � STRIPS; · • планирование промышленных заказов - ISIS; \ • планирование эксперимента - MOLGEN и др. • Обучение. Под обучением понимается использование !\ОМПьютера для обуче ния 1<акой-то дисциплине JiЛИ предмету. Системы обученця диагностируют ошибки при изучении какой-либо дисциплины с помощью и ПОДСI(азы вают правильные решения. Они аккумулируют знания о гипотетическом •ученике• и его харакtерных ошиб!\ах, затем работе они способны диагнос тировать слабости в познаниях обуч аемых и находить соответствующие сред ства для их ликвидации. Кроме того, они планируют акт общения с учеником в зависимости от успехов ученика с целью передачи знаний 7 в эвм • Обучение язь1ку программирования ЛИСП в системе •Учитель ЛИСПа•; • система PROUST - обучение языку Паскаль и др. • Управление. Под управлением понимается функция организованн9й системы, поддерживающ!lЯ оnределенный режим деятельности. Такого рода ЭС осуще ствляют управление поведением сложных систем в соответствии с заданными · ' спецификациями. --J/1' • Помощь в управлении газовой котельной - GAS; • управленце системой календарного планирования Project Assistant и др. • Поддержка принятия решений. Поддержка принятии решения - это совокуп ность процедур, обеспечивающая лицо, принимающ�е решения, .необходимой информацией и рекомендациями, облегчающими процесс принятия решения. Эти ЭС помогают специалистам выбрать и/или сформировать нужную аль тернативу среди множества выборов при принятии ответственных 'решений. 44 Глава 2 • Разработка с и стем, ос н ован н ых 1-1а зна1:1 и ях • Выбор стратегии выхода фирмы из кризисной ситуации - CRYSIS ; • помощь в выборе страховой компании или инвестора - CHOICE и др. В общем случае все системы, основанные на знаниях, можно подразделить на си стемы, решающие задачи анализа, и на системы, решающие задачи синтеза. Основ ное отличие задач анализа от задач синтеза заключается в том, что если в задачах анализа множество решений может быть перечислено и включено в систему, то в задачах синтеза множество решений потенциально не оrраничедо и строится из решений крмпонент или под-проблем. Задачами анализа являются: интерпрета ция данных, диагностика, по,zщержка принятия решения; I< задачам синтеза отно сятся проектирование, планирование, управление. Комбинированные: обучение, мониторинг, прогнозирование. 2 . 2 . 2 . Классификация по связи с реальным временем • Статические ЭС разрабатываются в предметных областях, в которых база зна ний и интерпретируемые данные не меняются во времени. Они стабильны. Пример Диагностика не исправностей в автомобиле. • КвазидинамичесlСUе ЭС интерпретируют ситуацию, которая меняется с некото рым фиксировашiым интервалом времени: При мер Микробиологические ЭС, в которых снимаются лабор аторные изм ерения <: технологи ческого процесса один раз в 4-5 часов (производство лизина, на пример) и анализиру ется ди намика полученных показателей по отношению к предыдущему измерению. • Ди намические Э С работают в сопряжении с датчиками объектов в режиме ре ального времени с непрерывной интерпретацией поступающих в систему дан ных. Примеры Управлени е гибкими производственными комплексами, мониторинг в реанимацион ных п алатах; программный инструментарий для разработки дин амических с исте м - G2 [ Попов, 1996] . 2 . 2 . З . Классификация по типу ЭВМ Н а сегодняшний день существуют: • ЭС для уникальных стратегически важных задач на суперЭ В М (Эльбрус, CRAY, CONVEX и др.); • ЭС на ЭВМ' средней производительности (типа ЕС ЭВМ, mainframe); 2.3 . Колле ктив разработч и ков 45 • ЭС на символьных процессорах и рабочих станциях (SUN, Silicon Graphics, APOLLO); • ЭС на мини- и супермин-ЭВМ (VAX, micro-VAX и др.); • ЭС на персональных компьютерах (IВМ Р�, МАС II и т. п.). 2 . 2 . 4. Классифи кация по степени и'нте грации с дру гими про граммами Автономные ЭС работают непосредственно в режиме консультаций с пользовате лем для специфически «экспертных,> задач, для решения которых не требуется привлекать традиционные методы обработки данных (расчеты, моделирование и т. д.). Гибридны е ЭС представляют программный комплекс, аrреrирующий стандарт ные пакеты прикладных .программ (например, математическую статистш<у, лис нейное программирование или системы управления базами данных) и средства манипулирования знаниями. Это может быть интеллектуальная надстройка над ППП (пакетами прш<ладных программ) или интегрированная среда для реше ния сложной задачи с элементами экспертных знаний. Несмотря на внешнюю привлекательность гибридного подхода, следует отме тить, что разработка таких систем являет собой задачу на порядок более сложную, чем разработка автономной ЭС. Стыковка не просто разных пакетов, а разных методологий (что происходит в гибридных системах) порождает целый комплекс теоретических и практичесrшх трудностей. 2 . 3 . Коллектив разработчиков Под коллективом разработчиков (КР) будем понимать группу специалистов, от ветственных за создание ЭС. Как видно из рис. 2.1, в состав КР входят по крайней мере три человека - пользо ватель, эксперт и инженер по знаниям. На рисунке не видно программиста. Та ким образом, минимальный состав КР включает четыре человека; реально же он разрастается до 8- 1 0 человек. Численное увеличение коллектива разработчиков происходит по следующим причинам: необходимость учета мнения нескольких пользователей, помощи нескольких экспертов; потребность как в проблемных, так и системных программистах. На Западе в этот коллектив дополнительно тра диционно включают менеджера и одного технического помощника. Если использовать аналогии из близких областей, то КР более всего схож с группой администраторi{баз,ь1 да�шъ1х при построении интегрированных. ин формационных систем или бригадой программистов, разрабатывающих слож ный программный комплекс. При отсутствии профессионального менеджера руководителем КР, участвующим во всех стадиях разработки, является инженер по знаниям, поэтому к его квалификации предъявляются самые высокие требо вания. В целом уровень и численность rруппы зависят от характеристиr< постав ленной задачи. 46 Глав а - 2 • Разработка систем, основанных ма -знания;. Для обеспечения эффективности сотрудничества любой творче�ой группы, в том �исле и группы КР ЭС, необходимо во.з никновение атмосферы взаимопони мания и доверия, которое, в свою очередь, обусловщшо психологической совмес тимостью членов группы; следовательно, при формировании КР должны учиты ваться психологические свойства участников.. В настоящий момент в ттсихолоrии существует uескальl(о десятков методик по определению свойств личuости, широко исцользуемых в вопросах профессио uальной ориентации. Эти психодиагностические ме:r(?дики, часть из коТQр�I� уже автоматизирована, различаются направлещюстью, глубиной, временем оµроса и способами интерпретации. В частно<;ти, систем.а АВЛНТЕСТ (Аl;Пома�ический Анализ ТЕСТов) [Гаврилова, 1984) позволяет'моделироJiать рассуждения психо лога при анализе результатов тестирования по 1 6-факторному опроснику Р: Кэт� тела и выдает связuое психологическое заключение на естественном русском язы� ке, характеризующее такие свойства личнос·щ, каr< общительность, аналщ;ичность, добросовестность, самоконтроль и т. п. Модифицированная база знаний системы АВТАНТЕСТ позднее была использована в ЭС •Cattell• (см. параграф 7.3). Ниже приведены два аспекта характеристик членов КР: 1 - ттсихофизиолоrиче ский, 2 - профессиональный. Пол.ьзоваm(JЛь 1 . К пользователю предъявляются самые слабые требования, поскольку его не выбирiООТ, Он является в н;екотором роде заказчиком системы. Желательные качества: а) дружелюбие; б) умение объяснить, что же он хочет от системы; в) отсутствие психологического барьера к применению вычислительной тех ники; r) интерес к новому. От пользователя зависит, будет ли применяться разра ботанная ЭС. Замечено, что наиболее ярко качества в) и г) проявляются в молодом возрасте, поэтому иногда такие пользователи охотнее прим�няют ЭС, не испытывая при этом комплекса неполноценнооти оттого, что. ЭВМ им что-то цодсказывает. 2. Необходимо, чтобы пользователь имел некоторый базовый уровень квалифи кации, который позволит ему правильно истолковать рекомендации ЭС. Кро ме того, должна быть полная совместимость в терминологии интерфейса к ЭС с той, которая привь1чна и удобна для пользователя. Обычно требования к ква лификации пользователя не очень вели!(и. иначе .он переходит в ра:}ряд экс пертов � совершенно. не нуждается в ЭС; . , Экспер т 1 . Эксперт - чрезвычайно важная фигура в группе Х{Р. В конечном счете, его под готовка определяет уровень компетенции базы знаний. Желательные качества: а) доброжелатедьносТРi б) готовность поделиться своим опытом; 47 2.3. Коллектив рааработч и ков В) ум�ние ОО'ЬЯСИИТЬ ,(ПедагоmЧесl(Ие навыки);•. r) заинтересованность (моральная, а лучше еще и материальная) успешнос ти разработки. Возраст эксперта обычно почтенный, что необходимо учи тывать всем членам группы. Часто встает вопрос о количестве экспертов. Поскольку проблема совмещения подчас противоречивых знаний остается открытой, ·обычно с каждым из экспертов· работают индивидуально, иног да создав1µ1 альтернативные базы. 2. П()мимо безус:ловно высокого профессионализма в выбранной предметной об ласти, желательно знакомство эксперта с популярной литературой по искус . ственному интеллекту и экспертным системам для тоrо, чтобы эффективнее прошел этап извл�чения знан�й. ·в Про�раммист 1 . · Известно, что программисты обладают самой низкой потребностью в общении среди представителей разных профессий . Однако при разработ1<е ЭС'необхо дим тесный контакт членов группы, поэтому желательны следующие его 1саче ства: а) общительность; б) способность отказаться от традиционных навыков и освоить новые методы; в) интерес к разработке. 2. Поскольку современные ЭС - сложнейшие и дорогостоящие программные ком плексы, программисты в КР должны иметь опыт и навыки разработки про грамм. Обязательно знакомство с основными структурами представления зна ний и механизмами вывода, состоянием отечественного и мирового рынка программных продуктов для разработки ЭС и диалоговых интерфейсов. Инжен ер по зна ниям 1 . Существуют такие профессии и виды деятельности, для которых природные качества лич:ности (направленность, способности, темперамент) могут иметь характер абсолютного показания или противопоказания к занятиям. По-ви димому, инженерия знаний nринадлежит к таким профессиям. По различным оценкам, это одна из самых малочисленных, высокооплачиваемых и дефицит ных в мире специальностей. Попытаемся дать наброски к портрету инженера по знаниям (без претензии на полноту и точность определений). ,,,Пол. Психологи утверждают, что ·мужчины более склонны к широкому охвату явлений и в среднем у них выше аналитичность, чрезвычайно полезная инже11еру по знаниям, коtорому 'надо имеn. развитое логическое мышление и уме нйе оперировать сложными формальными структурами: Кроме того, при- об щении с экспертами, которые в большинстве своем настроены скептически по отноше�ию к будуще;i ЭС, инженер по знаниям-мужчина вызывает более высокую мотивацию успешнQсти _со стороны эксперта-женщины . С другой стороны, известно, что у женщин выше наблюдательность к отдельным дета лям объектов. Так что пол не является окончательным показанием или проти вопоказанием к данной профессии. 48 Гл ава 2 • Разработка систем , ос но ванн ы х на знан ия х Ин теллект. Это понятие вызывает самые бурные споры психологов; суще ствует до 50 .о пределений интеллекта, но с прагматической точки зрения оче видно, что специалист в области искусственного интеллекта должен стре миться к максимальным оценкам по тестам как вербального, так и невербаль ного интеллекта. СmШLь общения. Инженер по знаниям «задает тон• в общении с эr<спертом, он ведет диалог, и от него в конечном счете зависит его продуктивность. Можно выделить два стиля общения: деловой (или жесткий) и· дружеский (или мяг кий, деликатный). Нам кажется, что дружеский будет заведомо более успеш ным, так как снижает «эффект фасада• у эксперта, расr<репощает его. Дели катность, внимательность, интеллигентность, ненавязчивость, скромность, умение слушать и задавать вопросы, хорошая коммуникабельность и в то же время уверенность в себе - вот рекомендуемый .с тиль общения. Безусловно, что это дар и искусство одновременно, однако занятия по психологическому тренингу могут дать полезные цавыки. Портрет инженера по знаниям можно было бы дополнить другими характери стиками - широтой взглядов и интересов, артистичностью, чувством юмора, обаянием и т. д. 2. При определении профессиональных требований к аналитику следует учиты вать, что ему необходимы различные навыки и умения для грамотного и эф фективного проведения процессов извлечения, концептуализации и формали зации знаний. Инженер по знаниям имеет дело со всеми формами знаний ( см. параграф 1 .3). Z 1 (знания в памяти) ➔ Z2 (знания в книгах) ➔ ZЗ (поле знаний) ➔ Z4 (модель знаний) ➔ ZS (база знаний). Работа на уровне Z 1 требует от инженера по знаниям знакомства с элементами rюгнитивной психологии и способами репрезентации понятий и процессов в па мяти человека, с двумя основными механизмами мышления - логическим и ас социативным, с таrшми способами активизации мышления как игры, мозговой ш1урм и др., с различными моделями рассуждений. Изучение и анализ текстов на уровне Z2 подразумевает широкую общенаучную подготовку инженера; знакомство с методами реферирования и аннотирования текстов; владение навыками быстрого чтения, а также текстологическими мето дами извлечения знаний. Разработка поля знаний на уровне ZЗ требует квалифицированного знакомства с методологией представления знаний, системным анализом, теорией познания, аппаратом многомерного шкалирования, кластерным и факторным анализом. Разработка формализованного описания Z4 предусматривает предварительное изучение аппарата математической логики и современных языков представле ния знаний. Модель знаний разрабатывается на основании результатов глубоко го анализа инструментальных средств разрабоч:ки ЭС и имеющихся «оболочек• . Кроме того, инженеру по знаниям необходимо владеть методологией разработки ЭС, включая методы быстрого прототипирова:ния. 2.4. Техн ол оги я про е ктирова н и я и разр аботк и 49 И наконец, реализация базы знаний ZS, в которой инженер по знаниям участвует вместе с программистом, подразумевает овладение практическими навыками ра боты на ЭВМ и, возможно, одним из языков программирования. Так I(ак инженеров по знаниям «выращивают�, из программИ<;тов, уровень ZS обычно не вызывает затруднения, особенно если разработка ведется на традици онных языках типа С или Паскаль. Специализированные языки искусствённого интеллекта Лисп и Пролог требуют некоторой перестройки архаично-алгорит мичесrшго мышления. Успешность выбора и подготовки коллектива разработчиков ЭС определяет эф фективность и продолжительность всего процесса разработки. 2 . 4 . Технология проектирован·и я и разработки 2 . 4 . 1 . П роблемы р азработки промышленных ЭС Разработка программных комплексов экспертных систем как за рубежом, так и в нашей стране находится на уровне скорее искусства, чем науки. Это связано с тем, что долгое время системьr искусственного интеллекта внедрялись в ос}jовном во время фазы проектирования, а чаще всего разрабатывалось несколько прототип ных версий программ, и - на их основе уже создавался конечный продукт. Такой подход действует хорошо в исследовательских условиях, однако в коммерческих условиях он является слишком дорогим, чтобы оправдать затраты на разработку. Процесс разработки промышленной эr<спертной системы, опираясь на тради ционные. технолопщ [Николов и др., 1 990 ; Хейес-Рот и др., 1987 ; Tuthill, 1 994 ] , практичесrш для любой предметной области можно разделить на шесть более или менее независимых этапЬв (рис. 2.3). Выбор проблемы 2 Разработка п рототи па ЭС З Доработка до-промышленной ЭС 4 О ценка ЭС 5 Стыковка ЭС 6 Подцержка ЭС Рис . 2.3. Эта п ы разработки ЭС 50 Глава 2 •• Разработка сио:rем ; оснощзнных на з1-1анияJ;< Последовательность этапов, д�на только с целью 11ОJ1ученип �щеrо, прwщrавде� ния .о .процессе создания, ид�алрноrо цроекта. Конечно, ПQ<Щед()Вательность эта не вполне фикс�рованная . В дей ствительности КЭ)J(дый посл�ющий этап раз работки может принести новые идеи , которые могут повл�ть на пред1'{дущие решения и даже привести к их переработке. Именно поэтому многие специалис ты по .информатике весьма критично относятся к, м�тодолоrии экспертных сис тем. Они считают , что расходы на разработку тщ<их си стем очень большие, время разработки слишком велико, а полученны� в результате проrраммы на1<Ладыва ют тяжелое бремя на вычислительные ресурсы. В целом за разработку экспертных систем целесообраз110 браться организацип, где накоплен опыт по автоматизации рутинных процедур обработI<И информа� ции, таких как: • формирование корпоративных информационных систем; • орrанизация сложных ра счетов; • работа с компьютерной графикой; • обработка текстов и автоматизированный документооборот. Решение таких задач, во-первых, подготавливает высококвалифицированных .спе циалистов по информатике, необходимых для создания интеллектуальных систем, во-вторых, позволяет отделить от экспертных систем неэкспертные задачи, 2 . 4 . 2 . Выбор подхQдящей проблемы. Этот этап определяет деятельность, предшествующую решению начать разраба• тывать конкретную ЭС. Он включает [Николов и др . , 1 990]: • определение пробл емной области и задачи; • нахождение эксперта, желающего сотрудничать при решении проблемы, 'и назначение коллектива разработчиков; • определение предварительноrо подхода к решению проблемы; • анализ расходов и прибылей от разработки; • подготовку подробного плана разработки. Правильный выбор проблемы представляет самую критическую час ть разработ к и в целом. Если выбрать неподходящуld проблему, можно очень быстро увяз нуть в сбол оте• проектирования задач, которые ни1<то не знает, как решать. Не подходящая проблема может также привести к созданию экспертной системы, которая стоит намного больше, чем экономит. Дело будет обстоять еще хуже, если разработать си стему, которая·работает, но неприемлема для пользователей. Даже если разработка выполняется самой орrанизацией для собственных целей, эта фаза является подходящ им моментом :для ·получения· рекомендаций извне, чтобы гарантировать удачно выбранный и осуществимый с технической точки зрения первоначальный проект. При выборе области применения следует учитывать, что если знание, необход и мое дЛя решения задач, постоянное, четко формулируемое и связано с вычисли тельной обработкой, то обычные алrоритмические , программы, по всей вероятн<J, сти, будут самым делесообра;эным спосо6Qм решения проблем в этой области. ,, 2.4,• Технология п�оектирования и разработки 51 ЭRспертная система ни в коем случае не устранит потребность в релящюнных базах данных, статистическом программном обеспечеflии, электронных таблицах и системах текстовой обработки. Но если результативность задачи зависит от знания, которое является субъективным, изменяющимся, символьным или выте кающим частично из соображений здравого смысла, тогда область может обосно ванно выступать претендентом на экспертную систему. Обычно экспертные системы разрабатываются путем получения специфических знаний от эксперта и ввода их в систему. Некоторые системы могут содержать стратегии одного индивида. Следов-ательно, найти подходящего эксперта - это клЮ'Iеоой шаг в создании экспертных систем. В процессе разработки и последующего расширения системы инженер по знани ям и эксперт обычно работают вместе. Инженер по знаниям помогает эксперту структурировать знания, определять и формализовать понятия и правила, необ ходимые для решения пробле1Wы. Во время первоначальных бесед они должны решить, будет ли их сотрудничество успешным. Это немаловажно, поскольку обе стороны будут работать совместно, по меньшей мере в течение одного года. Кроме них в коллектив разработчиков це лесообразно включить потенциальных пользователей и профессиональных про граммистов. Подробно функции каждого члена коллектива описаны в следую щем параграфе. Предварительный подход к программной реализации задачи определяется, ис ходя из характеристик задачи и ресурсов, вьiделенных на ее решение. Инженер по знаниям выдвигает обычно несколько вариантов, связанных с использовани ем имеющихся на рынJ<е программных средств. Окончательный выбор возможен лишь на этапе разработки прототипа. После того как задача определена, необходимо подсчитать расходы и прибыль от разработки экспертной системы. В расходы включаются затраты на оплату труда коллектива разработчиков. В дополнительные расходы будет включена сто имость приобретаемого программного инструментария, с помощью которого бу дет разработана экспертная система. Прибыль может быть получена за счет снижения цены продукции, повышения прщыводительности труда, расширения номенклатуры продукции или услуг или даже разработки новых видов продукции или услуг в области, в которой .будет использоваться ЭС. Соответствующие расходы и прибыль от систем.ы определя ются относительно времени, в течение которого возвращаются средства, вложен ные в разработку. На современном этапе большая часть фирм, развивающих крупные экспертные системы, предпочли разрабатывать дорогостоящие проекты, приносящие значительную прибыль. Можно ожидать развития тенденции разработки менее дорогостоящих систем, хотя и с более длительным ср01�ом окупаемости вложенных в них средств, так как программные средства разработки экспертных систем непрерывно совершен ствуются. После того как инженер по знаниям убедился, что: •, данная задача может быть решена с помощью экспертной системы; • экспертную систему можно создать предлагаемыми на рынке средствами; 52 Глава 2 • Разработ ка систем, ос н ованн ых на з нани ях • имеется подходящий эксперт; • предложенные критерии производительности являются разумными; • затрf!ТЫ и срок их окупаемости прием�емы для заказчика, он составляет план разработки. План определяет шаm процесса разрабопси и не обходимые затраты, а также ожидаемые результаты. 2 . 4 . 3 . Технология быстрого прототипирования Прототипная система является усеченной версией экспертной системы, спроек тированной для проверки правильности кодирования фактов, связей и стратегий рассуждения эксперта. Она также дает возможность инженеру по знаниям при влечь эксперта к активному участию в процессе разработки экспертной системы, и, следовательно, к принятию им обязательства прилож ить все усилия к созда-. нию системы в полном объеме. Объем прототипа - несколько десятков правил, фреймов и.ли примеров. На . рис. 2.4 изображено шесть стадий разработки прототипа и минимальный коллек тив разриботчиков, занятых на каждой из стадий (пять стадий заимствовано из работы [. {ейес-Рот и др., 1 987]). Приведем краmую характеристи1су каждой из стадий, хотя эта схема представляет собой грубое приближение к сложному, ите ративному процессу. Идентификация проблемы (переопределение проблемы) Проблема Получение знаний (дополнительное извпечение) Знания Структурирование (изменение поля) Поле знаний Формализация (переформализация) БЗ на языке nредос;тавпения знаний ® �+1 ® ® ® Пользователь Реализация прототипа (перепро граммирование) П рограмма-прототип ЭС Тестирование � Инженер по знаниям j Эксперт ® Про граммист Рис. 2 . 4 . Стади и разработки п рототипа ЭС 2. 4. Тех нологи я проект ирован и я и разработки 53 Хотя любое теоретиче ское разделение бывает часто условным, осознание кол ле1стивом разработчиков четких задач каждой стадии представляется целесооб разным. Роли разработчиков (эксперт, программист, пользователь и аналитик) являются постоянными на протяжении всей разработки. Совмещение ролей не желательно. Сроки приведены условно, так как зависят от квалификации спе циалистов и осо бенностей задачи. И дент ифика ц ия п робл е м ы Уточняется задача, планируется ход разработки прототипа экспертной системы, определяются: • . необходимые ресурсы (время, люди, ЭВМ и т. д.); • источники знаний (книги, дополнителыtые эксперты, методики); • имеющиеся аналогичные экспертные системы; • цели (распространение опыта, автоматизация рутинных действий и др.); • классы решаемых задач и т. д. Ид ентификация про блемы - зн а ком ст во и о буч е н ие ч л е н ов к оллекти ва ра зр а ботчи ко в , а так ж е с о зда н ие неформал ьн о й формули ровки пр о бле м ы . Средняя продолжительность 1 -2 недели. И з вл е ч ен ие з н а н ий · На этой стадии происходит перенос компетентности от эксперта к инжен еру по знаниям, с использованием различных методов (см. главу 4): • анализ текстов; • диалоги; • экспертные игры; • лекции; • дис1<уссии; • интервью; • наблюдение и друmе. Из влече ние з н а н и й - п олуче ние инжен ером п о з н а н и я м н аиболее полн о го и з во з м ожн ых предс та влен ий о предм етн о й о бл асти и с п о с обах при н яти я реше н и я в ней . Средняя продолжительночь 1 -3 месяца. Стру ктурирование или ко нце птуали з ац ия з н а н ий Выявляется структура полученных знаний о предметной области, то есть опреде ляются: • терминология; • списш< основных понятий и их атрибутов; 54 Глава 2 • Раз()!бQтка сие.те м, осно�нных на знаниях • отношения между понятия,ми; • / структура входной и вых<'Щной информации; • стратегия принятия решений; • ограничения стратегий и. т. д. Структурнрсва нне ( нлн конц ептуалнзацня) знаний - разра б отка неформального опи сани я знаний о предметной о бласти в виде графа , та бл ицы, диаграммы или текста , ко торое отражает основные концепции и взаимосвязи между понятиями предметной о б ласти . Такое описание называется полем знаний. Средняя продолжительность этапа 2-4 недели. Подробно стадия структурирования описана в главе 3. . Формализация Строится формализованное представление концепций предметной области на основе выбранного язы1<а представления знаний (ЯПЗ). Традиционно, на этом ' этапе используются: • • • • • логические методы (исчисления предикатов I-ro порядка и др.); продукционные модели (с прямым и обратным выводом); семантические сети; фреймы; объектно-ориентированные языки, основанные на иерархии классов, объек� тов. фQрмализацня знаний - разработка базы знаний на языке nредс:тавления -энаниЯ'; ко� · : · торый , с одной стороны , соответствует структуре поля знаний, а с другой - позволяет реализовать прототип системы на следующей стадии программной реализации_. . Все чаще на этой стадии· используется симбиоз языков представления знаний, например, в системе ОМЕГА [ Справочник по ИИ, 1 990] - фреймы + _семаJ-пи� ческие сети + полный набоР. возможностей языка исчисления. fIРедикат�в. �ред няя продолжительност:r:, 1 -2 месяца. Подробно см. в �ла�ах 3, 4. Р еапизация Создается прототип экспертной системы, включающий базу знаний и остальные блоки, при помощи одного из следующих способов: • программирование на традиционных языках типа Pascal, С++ и др.; • программирование на специа.лизирован;ных ,языках, применяемых в зада.чах искусственно� инте�лекта: LISP [Хювянен; Сеппянен, 199 1 }, FRL [Байдун, Бунин, 1990), SMALLTALK [ Справочник по ИИ, 1990} и др.; • использование инструментальных средств разработки ЭС типа СПЭИС [Ков• риrин, Перф;илъев, 1988), ПИЭС [Хорощевский, 1993), G2 [ Попов, Фоминых, Кисель, 1 996]; -2.4. Техн ол огия nро е кти ров аtt и я и р азработки • использовани е �пустых� ЭС или �оболочек� типа ЭКСПЕРТ [Кирсанов, По пов, 1990], ФИАКР [Соловье в, Соловьева, 1 989] и др. Реализация - разработка про граммно го комплекса , демонстри рующего жизнес посо б ность подхода в целом. Ч а ще все го первый прототип отб рас ывается на эта п е реал изаци и действ ующе й ЭС . Средняя продолжительность 1 -2 месяца. Более подробно эти вопросы рассмат риваются в главе 6. Те сти р ова н ие Оценивается и проверяется работа программ прототипа с целью приведения в соответствие с реальными запросами пользователей. Прототип проверяется на: • удобство и адекватность интерфейсов ввода/вывода (характер вопросов в ди алоге, связность выводимого текста результата и др.); • эффективность стратегии управления (порядок перебора, использование не четкого вывода и др.); • качество проверочных примеров; • корректность базы знаний (полнота и непротиворечивость правил). Тестирование - выя влени е оши бок в подходе и реал изаци и прототи па и выраб от ка реко мендаци й по доводке системы до-промышленного варианта. Средняя продолжительность 1 �2 недели. 2 . 4 . 4 . Развитие прототипа до промышленной ЭС При неудовлетворительном функционировании прототипа эксперт и инж енер по знаниям имеют возможность оценить, что именно будет включено в разработку окончательного варианта системы. Если первоначально вь1бранные объекты или свойства оказываются неподходя щими, их н еобходимо изменить. Можно сделать оценку общего числа эвристи ческих правил, необходимых для создания окончательного варианта экспертной системы. Иногда [Хювянен, Сеппянен, 1 99 1 ] при разработке промышл ещюй и/ или коммерческой системы выделяют дополнительные этапы для перехода (табл. 2. 1 ). демонстрационный прототип коммерческая система ➔ действующий прототип ➔ промышленная система ➔ Однако чаще реализуется плавный переход от демонстрационного прототипа к промышленной системе, при этом, если программнъ1й инструментарий был вы бран удачно, не обязательно даже переписывать окончательный вариант други ми программными средствами. Понятие же коммерческой системы в нашей стране входит в понятие �промыш ленный программный продукт�, или �промышленная эс� (в этой работе). 56 Гла в а 2 • Разработка систем, основа нн ых н а знаниях Основная работа на данном этапе заключается в существенном расширении базы знаний, то есть в добавлении большого числа дополнительных правил, фреймов, узлов семантической сети или других элементов· знаний. Эти элементы знаний обычно увеличивают глуби ну системы, обеспечивая большее число правил для трудно уловимых аспектов отдельных случаев. В то же время эксперт и инженер по знаниям могут увеличить базу знаний системы, включая правила, управляю щие дополнительными подзадачами или дополнительными аспектами эксперт ной задачи (метазнания). Тебnице 2 . 1 . Переход от прототипа к про мышленной экспертной системе Сист•ме Описан ие Демонстрационный прототип ЭС Система решает часть задач, демонстрируя жизнеспособность подхода ( несколько десятков правил или понятий) Исследовательский прототип ЭС Система решает большинство задач, но неустойчива в работе и не полностью проверена (несколько сотен правил или понятий) Действующий прототип ЭС Система надежно решает все задачи на реальных примерах, но для сложной зада чи требует много времени и памяти Про мышленная система Система обеспечивает высокое качество решени й при мини миза ции требуемого времени и памяти ; переписывается с использованием более эффективных средств представлени я знан и й Коммерческая система Промышленная система, пригодная к продаже , то есть хорошо документирована и снабжена сервисом После установления основной структуры ЭС знаний инженер по знаниям при ступает к разработке и адаптации интерфейсов, с помощью которых система бу дет общаться с пользователем и экспертом. Необходимо обратить особое внима ние на языковые возможности интерфейсов, их простоту и удобство ДЛЯ управ ления работой ЭС. Система должна обеспечивать пользователю возможность лег ким и естественным образом уточнять непонятные моменты, приостанавливать работу и т. д. В частности, могут оказаться полезными графические представле ния. На этом этапе разработки большинство экспертов-узнают достаточно о вводе пра� вил и могут сами вводить в систему новые правила. Таким образом, начинается процесс, во время которого ицженер по знаниям передает право собственности и контроля за системой эксперту для уточнения·, детальной разработки и обслужи вания. 2 . 4 . 5 . Оценка системы После завершения этапа разработки промышленной экспертной системы необ ходимо провести ее тестирование в отношении критериев эффективности. К те стированию широко привлекаются другие эксперты с целью апробирования ра- 2. 4 . Технология проектирования и разработки 57 ботоспособности системы на различных примерах. Экспертные системы оцени ваются главным образом для того, чтобы проверить точность работы программы и ее полезность. Оценку можно проводить, исходя из различных критериев, ко торые сгруппируем следующим образом: • критерии пользователей (понятность и �прозрачность� работы системы, удоб ство интерфейсов и др.); • критерии приглашенных экспертов (оценка советов-решений, предлагаемых системой, сравнение ее с собственными решениями, оценка подсистемы объяс нений и др.) ; • критерии коллектива разработчиков (эффективность реализации, производи тельность, время от1<лика, дизайн, широта охвата предметной области, не�ро тиворечивость БЗ, количество тупиковых ситуаций, когда система не может принять решение, анализ чувствительности программы к незначительным из менениям в представлении знаний, весовых коэффициентах·, применяемых в механизмах логического вывода, данных и т. п. ). 2 . 4 . 6 . Ст ыков ка сис тем ы На этом этапе осуществляется стыковка экспертной системы с другими программ ными средствами в с:реде, в которой она будет работать, и обучение щодей, кото рых она будет обслуживать. Иногда это означает внесение существенных изме нений. Такие изменения требуют непременного вмешательства инженера по знаниям или какого-либо другого специалиста, который сможет модифициро вать систему. Под стыковкой подразумевается также разработка связей между экспертной системой и средой, в которой она действует. Когда экспертная система уже готова, инженер по знаниям должен убедиться в том, что эксперты, пользователи и персонал знают, как эксплуатировать и обслу живать ее. После передачи им своего опыта в области информационной технологии инженер по' знаниям может ' полностью предоставить ее в распоряжение пользавателей. Для подтверждения полезности системы.важно предоставить каждому из пользо вателей возможность поставить перед Э С реальные задачи, а затем проследить, как она выполняет эти задачи. Для того чтобы система была одобрена, необходи мо представить ее как помощника, освобождающего полъзоватедей от обремени тельных задач, а не как средство их замещения. Стыковка включает обеспечение связи ЭС с существующими базами данных и другими системами на предприятии, а также улучшение системных факторов, зависящих от времени, чтобы можно было обеспечить ее более эффективную ра боту и улучшить характеристики ее технических средств, если система работает в необычной среде (например, связь с измерительными устройствами). . П ри мер 2. 1 Успешно состыкована со своим окружен ием система PUFF - экспертная с и стема для диагностики заболеваний легких [Хейес- Р от и др., 1987]. После того как PUFF была 58 Глава 2 • Разработка систем, осн ованных на зн аниях закончена и все были удовлетворены ее работой, систему перекодировали с LISP на Бейсик. Затем систему перенесли на ПЭВМ, которая уже работала в больнице. В свою очередь, эта ПЭВМ была связана с измерительными приборами. Данные с измеритель ных приборов сразу поступают в ПЭВМ. PUFF обрабаты вает эти данные и печатает рекомендации для врача. Врач в принципе не взаимодействует с PUFF. Система пол ностью интегрирована со своим окружением - она представляет собой интеллектуаль ное расширение аппарата исследованиg легких, котор�й в'рачи давно используют. П р и м е р 2.2 Другой системой, которая хорошо фующионирует в своем окружении, являе-rся САТ-1 [Уотермен, 1 990 } - экспертная система для диагностики неисправностей:4:щ� елей лq комотивов. Эта система была разработана также на LISP, а затем была переведена на FORTH с ·тем, чтобы ее можно было более эффективно использовать в различных локомотивных це хах. Мастер по ремонту запрашивает систему о возможных причинах неисправности дизеля. Система связана с видеодиском, с помощью которого мастеру показывают ви зуальные объяснения и подсказки, касающ иеся более подробных проверок, котdрые он должен сделать. Кроме того, если оператор не уверен в том, как устранить неисправность,. си стема пре доставляет ему обучающие материалы, которые фирма подготовила предварительно, и показывает ему их на видеотерминале. Таким образом, мастер по ремонту может с по мощью экспертной системы диагностировать проблему, найти те стовую процедуру, которую он должен использовать, получ ить на дисплее объясн�ии�. как провести тесr, или получить инструкции о том, как справиться с возникшей проблемой. 2.4. 7 . П одде ржка системы При перекодировании системы н а язык, подобный С, повышается е е быстр одей;-, ствие и увеличивается переносимость, однако гибкость при этом уменьшается . Это приемлемо лишь в том случае, если система сохраняет все знан:ия пробJJе�- . ной области и это знание не будет изменяться в ближайшем будущем. Однако если экспертная система создана именно из-за того, что проблемная ,область из�е няется, то необходимо поддерживать систему в ее инструментальной среде разработки. Пример 2.3 Удачным примером ЭС, внедренной таким образом, является XCON {R1 ) - ЭС, кото рую фирма DEC использует для комплектации ЭВМ семейства VАХ. Одной из клю- . чевых проблем, с которой столкнулась фцрма DEC, является необходимость постоян ного внесения изменений для новых версий оборудования, новых спецификаций и т. д. Для этой цели XCON поддерживается в программной среде OPSS. Теоретические аспекты инженерии знании, □ □ □ □ П оле зн аний Стр ат е ги и п олуч е н ия зн а н и й Теор ети ч еск и е аспекты и з вле ч е н ия зн а н и й Те орет и ч еск и е ас п екты с труктуриро ва н ия зн а н ий 3. 1 . Поле знаний Инженерия знания - достаточно молодое направление искусственного интел лекта, появившееся тогда, когда практические разработчики столкнулись с весь ма нетривиальными проблемами трудности •добычи� и формализации знаний. 'В первых: книгах по ИИ эти факты обычно только постулировались, в дальней шем нача.tiись серьезные исследования по выявлению оптимальных ' стратегий в:ь1явления знан:ий [Boose, 1990; Wielinga, Schreiber, Breuker, 1992; Tuthill, 1 994; Adeli, 1994}. Данная глава целиком посвящена теоретическим проблемам инженерии знаний, другими слова:ми - проектированию баз знаний - получению и структурирова нию знаний специалистов для последующей разработки баз знаний. Централь ным понятием на стадиях получения и структурирования является rак называе мое поле знаний, уже упоминавшееся в параграфе 1 .3 . . Поле знаний - это условное неф ор мально е описан и е основных понятий и вза им освя зей между пон яти ями п редметной области , выявленных из си стемы знан ий ·эксперта , в виде графа, диагра ммы , табли цы или текста . 3 . 1 . 1 . О язы ке описания пол я знаний Поле знаний Pz формируется на третьей стадии разработки ЭС ( см. п. 2.4) - ста дии структурирования. Поле знаний, как первый шаг к формализации, представляет модель знаний о предметной области, в том виде, в каком ее сумел выразить аналитик на некото- 60 Гла в а З • Те о ретические ас п екты инженерии з наний ром <�:своем,> языке. Что это за язык? Известно, что словарь языка 1юнкретной на уки формируетея путем пополнения общеупотребительного языка епециальны ми терминами и знаками, которые либо заимствуются из повеедневноrо языка, либо изобретаютея [ Кузичева, 1 987] . Назовем этот язык L и раеемотрим его же лаемые евойства, учитывая, что стандарта этого языка пока не еуществует, а каж. дый инженер по знаниям вь�нужден еам его изобретать. Во-первых, как и в языке любой науки, в нем должно быть как можно меньше не точностей, приеущих обыде·н ным языкам. Частично точность достигается более етрогим определением понятий. Идеалом точноети, конечно, являетея язык ма тематики. Язык L, в идимо, занимает промежуточное положение между еете ственным языком и языком математики. Во-вторых, желательно не иепользовать в нем терминов иных нау1< в другом, то ееть новом, смыеле. Это вызывает недоразумения. В-третьих, язык L, видимо, будет либо еимволъным языком, либо языком rрафи чееким (ехемы, рисунки, пюаограммы). При выборе .нзыка опиеания поля з н аний не еледует забывать, что на етадии формализации необходимо его заменить на машинно-реализуемый язык пред ставлеиия з11а11и й (ЯПЗ), выбор которого зависит от структуры поля знаний. Сущеетвует ряд языков, доетаточно универеальных, чтобы претендовать на роль языка инженерии знаний, - это структурно-логический язык SLL, включающий аппарат лямбда-конвереии [Вольфенrаrен и др., 1979], язык К-еиетем [ Кузнецов, 1989] , УСК [Мартынов, 1977] и др. Однако они не нашли широкого применения. В некотором смыеле еоздание языка L очень близко к идеям разработки универ еальных языков науtш [ Кузичева, 1 987] . К XVII веку еложилиеь два подхода в разработке универсальных языков: еоздание языков-1<Лассификаций И' лoгuico icoucmpyicmuвныx языков. К первому примыкают проекты, воеходящие к идее Ф. Бэкона, - это языки Вилкинеа и Далrарно. Второй подход евязан е исследо ваниями в рамках поиека универсального метода познания, наиболее четко выс казанного Р. Декартом, а затем в проекте универеальной характериетики Г. Лейб ница. Именно Лейбниц наметил оеновные контуры учения о еимволах, которые в еоответетвии е его замыслами в XVIII веке развивал Г. Ламберт, который дал имя науке <�:еемиотика>-'>. Семиотика в оеновном нашла евоих адептов в ефере гу манитарных наук. В поеледнее время сложилась также новая ветвь семиотики прикладная еемиотика [ Pospelov, 1 995]. Представители еетественных наук еще не до конца осознали доетоинетва ееми отики только из-за того, что имеют дело с достаточно проетымй .и <�:жееткими>-'> предметными облаетями. Им хватает аппарата традиционной математюш. В ин женерии знаний, однако, мы имеем дело с -с:, мяrкими>-'> предметными областями, где щшо не хватает выразительной адекватноети клаееичеекоrо математичее коrо аппарата и где большое значение имеет эффективноеть нотации (ее ком пактноеть, простота модиq�икации, ясноеть интерпретации, наглядность и т. д.). В главе 8 раеематриваютея еовременные тенденции в этой облаети и вводитея понятие онотолоrическоrо инжиниринrа, как одного из подходов к семиотичее кому моделированию предметной ьблаети. 61 З . 1 . Пол е зн а ний Языки семиотического моделирования [Осипов, 1988 ; Поспелов, 1986) как есте ственное развитие языков ситуационного уnравления являются, как нам кажет ся, первым приближением к языку инженерии знаний. Именно изменчивость и условность зна1<ов делают семиотическую модель применимой к сложным сфе рам реальной человеческой деятельности. Поэтому главное на стадии концептуа лизации - сохранение естественной структуры поля знаний, а не выразительные возможности языка. Традиционно семиотика включает (рис. 3. 1 ): • синтаксис ( совокупность правил построения языка или отношения м�жду знаками); • семантику ( связь между элементами языка и их значениями или отношения между знаками и реальностью); • прагматику (отношения между знаками и их пользователями). Mac ll аки ◄111(1-----�<Зн -="'""" ) ____.,. ► компьютер ПРАГМАТИКА (отношения между знаками и их пользоеа тепя-) (чел овек) (объект) Рис. 3 . 1 . Структура семиоти ки З. 1 . 2 . Семиотическая модель поля знаний Поле знаний Pz я вляется некоторой семиотической моделью, которая может быть представлена как граф, рисунок, таблица, диаграмма, формула или текст в зависимости от вкуса инженера по знаниям и особенностей предметной области. Особенности ПО могут оказать существенное влияние на форму и содержание компонентов структуры Pz. 62 Гл ав а 3 • Те оретичес ки е ас п е кты инже не р и и зна ни й · Рассмотрим соответствующие компоненты Pz .(рис. 3.2). п м Рис . 3.2. Структура пол я з н а н и й Синтаксис. Обобщенно синтаксическую структуру поля знаний можно предста вить как П = (I, О, М), где I - структура исходных данных, подлежащих обработке и интерпретации в экспертной системе; О- структура выходных данных, то есть результата работы системы; М - операциональная модель предметной области, на основании которой про исходит модификация I в О. Включение компонентов I и О в Р обусловлено тем., что составляющие и структу ра этих интерфейсных компонентов имплицитно ( то есть неявно) присутствуют в модели репрезентации в памяти эксперта. Оnерациональная модель М может быть представлена как совокуп�_ость концептуш�ьной структуры S k , отражающей понятийную структуру предметной области, и функционш�ьной структуры Sr, мо делирующей схему рассуждений эксперта: м = (Sk,Sr). S k выступает как статическая, неизменная·�оставляющая Р, в то время как Sr пред ставляет динамическую, изменяемую составляющую. Формирование S k основано на выявлении понятийной структуры предметной области. Параграф 3.4. описывает достаточно универсальный алгоритм проведе ния концептуального анализа на основе модификации парадигмы структурного анализа [Your<;lon, 1989] и построения иерархии понятий (так называемая �пира мида знаний,> ). П р�мер S k .и S 1 представлен на рцс. 3.3 и 3.4. 63 З. 1 . Лоле знаний Пор8Ж8МИ8 С1'М3ИСТЫХ ЯаwкоdпоженныА о.течнwА Я оЫI< С\l)Фй •р-й Яаwк еоnеанеммwА с ,р..........,. Рис. 3.3. Концептуальная составляющая поля знаний Рис. 3.4. Функциональная составляющая поiiя знаний 64 Гла в а 3 • Те о ретиче ски е аспекты и нж е н ерии зна н ий Структура S r включает понятия предметной области А и моделирует основные функциональные связи RA или отноµ�ения между понятиями, образующими S k . Эти связи отражают модель или стратегию принятия решения в выбранной ПО. Таким образом S 1 образует стратегическую составляющую М. Семантика. Семантика, придающая определенное значение предложениям любо го формального языка, определяется на некоторой области. Фактически это на бор правил интерпретации предложений и формул языка. Семантика L должна быть композиционной, то есть значение предложения определяется ка�< функция значений его составляющих. Семантика язьп<а L зависит от особенностей предметной области, она обладает свойством полиморфизма, то есть одни и те же операторы языка в разных зада чах могут иметь свои особенности. Семантику поля знаний Pz можно рассматривать на двух уровнях. На первом уро вне p;Zg есть семантическая модель знаний э ксперта i о некото рой предметной области Оg• На втором уровне любое поле знаний Pz явл.srеtся моделью некоторых знаний, и, следовательно, можно говорить о смысле его как некото рого зеркала действительности. Рассматривать первый уровень в отрыве от конкретной облас ти нецелесообразно, поэтому остановимся подробнее на втором. Схему, отображающую отношения между реальной действительностью и полем знаний, можно представить та�<, как показано на рис. 3.5. M gj Mgi с:=:> Эксперт i .,,,,_____ Инженер по знаниям j \.Г"""" Og Рис. 3 . 5. �Ис порченный телефон• гiри формирован ии п оля з�аний Ка1< следует из рисунка , поле p;jzg - это результат, полученный • после 4 - й транс ляции». (если говорить на языке информатики). • 1 -я трансляция (1;) - это восприятие и интерпретация действительности О предметной области gi-м э1<спертом. В результате I; в памяти э1<сперта образу ется модель Mg; как семантическая репрезентация действительности и его лич ного опыта по работе с ней. 65 3. 1 . Пол е з наний • 2-я трансляция (V; ) - это вербализация опыта i-ro эксперта, когда он пытает ся объяснить свои рассуждения S; и передать свои знания Z; инженеру по зна ниям. В результате v; образуется либо текст Т;, либо речевое сообщение С; • 3-я трансляция ( !) - это восприятие и интерпретация сообщений Т; или С;j -м инженером по знаниям. В результате в памяти :инженера по знаниям образует ся модель мира Mt,i. • 4 -я трансляция ( Kj) - это кодирование и вербализация модели Мю в форме поля знаний p;jzg• Более всего эта схема напоминает детскую игру в 4Испорченный телефон».; перед инженером по знаниям стоит труднейшая задача - добиться максимального со ответствия М81 и pij • У читателей не должно возникать иллюзий, что Pzg отобра жает 08 • Ни в коем случае, ведь знания - вещь сугубо авторизованная, следовало бы на каждой ЭС ставить четкий ярлык i-j, то есть 4база знаний э1<сперта i в пони мании инженера по знаниям j»-. Стоит заменить, например, инженера по знаниям j на h, и получится совсем другая картина. Zg Прим е р 3 . 1 П р и ведем пример вли яни я субъективных взглядов эксперта на м. и Vi. Реаль ность (08 ): два человека прибегают на вокзал за 2 минуты до отхода поезда. В кассы очередь. В автоматических кассах свободно, но ни у того, ни у другого пет мелочи. Сле дующий поезд через 40 минут. Оба опаэдывают на важную встречу. Интерпретация 1-ro эксперта ( 1 1 ): нельзя приходить на вокзал менее чем за 10 минут. Интерпретация 2-ro эксперта ( 1 2 ): надо всегда иметь мелоч ь в карман е. Вербализация 1 -ro эксперта (V 1 ): опоздал к нужному поезду, так как не рассчитал время. Вербализация 2-ro эксnерта (V 2 ) : опоздал , так как на вокзале неразбериха, в кассах толпа. Последующие трансляции еще больше будут искажать и видоизменять модель, но те перь уже с учетом субъективного восприятия инженеров по знаниям. Таким образом, если считать поле знаний смысловой (семантической) моделью пред метной о_бласти, то эта модель дважды субъективна. И если модель Mg; (см. рис. 3.5) это усеченное отображение 011, то само P.t - лишь отблеск Mg; через призму V1 и Мю, Прагматика. В качестве прагматической составляющей семиотичес1<0й модели следует рассматривать технологии проведения структурньго анализа ПО, поль зуясь которым инженер по знаниям может сформировать Pz по результатам ста дии извлечения знаний. Таким образом, под праrматикой будем понимать практические аспекты разра ботки и использования поля, то есть как от хаоса черновиков и стенограмм сеан- _ сов извлечения знаний перейти к стройной или хотя бы ясной модели. Подробнее эти вопросы освещен'ы в п�раrрафах 3.4. и 4.4. Однако поле знаний, несмотря на все старания инженера по знаниям и эксперта, всегда будут лишь бледным отпечатком реально существующей предметной области, ведь окружа ющий нас мир так изменчив, сложен и многообразен, а то, что хранится в нашем сознании, так плохо поддается вербализации. Тем не менее с точки зрения науч- 66 Гла ва З • Те о рети ч ес кие аспе кты ин ж е нерии знан и й ной методологии без продуманного, четкого и красивого пол!{ знаний не может · · · идти и речи о создании базы знаний промышленной ЭС. 3 . 1 . 3. « П ирамида)) знаний Иерархичность понятийной структуры сознания подчеркивается в работах мно гих психологов [Брунер, 1 97 1 ; Беккер, 1 976]. Поле знаний можно стратифициро вать, то есть рассматривать на различных уровнях абстракции понятий . В 4Пира миде знаний,> каждый следующий уровень служит для восхождения на новую ступень обобщения и углубления знаний в предметной области. Таким образом, возможно наличие нескольких уровней понятийной структуры S k. Представляется целесообразным связать это с глубиной профессионального опы та (например, как в системе АВТАНТЕСТ [ Гаврилова, Червинская, 1 992]) или с уровнем иерархии в структурной лестнице организации (рис. 4. 1 2 главы 4). Естественно, что и стратегии принятия решений, то есть функциональные струк туры S1, на различных уровнях будут существенно отличаться . Если попытаться дать математическую интерпретацию уровней пирамиды эна ний U = (U 1 , U 2 , U 3 , ••• , U" ), то наиболее прозрачным является понятие гомомор физма - отображения некоторой системы Е, сохраняющего основные операции и основные отношения этой системы. Пусть Е = ( Е 1 (oi : i Е 1), (rj : j Е J)) некоторая система с основными понятиями o i , i Е I и основным и отношениями rj ; j Е J. Гомоморфизмом с и стемы Е в однотипную ей систему Е': Е' = ( Е', (о'; : i Е 1), (r'j : j Е J)), называется отображение Ф : Е ⇒ Е', удовлетворяющее следующим двум условиям: Ф(о i (ер . .. , еп) ) = о / ( Ф (е 1 ) , •• • , Ф (e nj )) ; (е 1 , • • • , е ,,) Е rj ::::::> ( Ф (е 1 ) , • . . , Ф (е11 Е r'j • )) Для всех элементов e l ' . . . , е 111 из Е и всех i Е 1, j Е J . Согласно введенным обозначениям уровни пирамиды суть rомоморфизмы моде лей (то есть понятий и отношений) предметной области Ф : М ⇒ М', где М = (А, R, S); М ' = (А', R', S'), А' - мета-понятия, или понятия более в ы сокого уровня абстракции; R' - мета-отношения; S ' - мета-стратегии . Во сходя по ступеням пирамиды, мы получаем систему гомоморфизмов, что со ответствует результатам, полученным в I<оrнитивной психологии об уменьше нии размерности семантического пространства памяти с увеличением опыта эк спертов. 3.2. Страте гии получен ия знаний 67 3 . 2 . Стратегии получения знаний , При формировании поля знаний ключевым вопросом является сам процесс по лучения знаний, коrда происходит перенос компетентности экспертов на инженеров по знаниям. Для названия этоrо процесса в литературе по ЭС получило распространение несколько терминов: приобретение, добыча, извлечение, полу чение, выявление, формирование знаний. В англоязычной специальной литера туре в основном используются два: acquisition (приобретение) и elicitation (вы явление, извлечение, установление). Термин •приобретение,,. трактуется либо очень широко - тогда он включает весь процесс передачи знаний от эксперта к базе знаний ЭС, либо уже как способ автоматизированного построения базы знаний посредством диалога эксперта и специальной программы (при этом структура поля знаний заранее закладывает ся в программу). В обоих случаях термин •приобретение,,. не касается самого та инства экстрагирования структуры знаний из потока информации о предметной области. Этот процесс описывается понятием )4:Uзвлечение,,,. Авторы склонны использовать этот термин как более емкий и более точно выра жающий смысл процедуры переноса компетентности эксперта через инженера по знаниям в базу знаний ЭС. Извлечение знаний (knowledge e/icitation) - эт о п р о цедура взаимодействия эк сперта с источником знаний, в результате которой становятся я вными про цесс рассуждений спе циалистов при принятии реш ения и структура их представлений о предметной области. В настоящее время большинство разработчиков ЭС отмечает, что процесс извле чения :таний остается самым •узким• местом при построении промышленных ЭС. При этом им приходится практически самостоятельно разрабатывать �етодъr из влечения, сталкиваясь со следующими трудностями [Gaines, 1 989): • организационные неувязки; • неудачный метод извлечения, не совпадающий со структурой знаний в данной области; • неадекватная модель (язык) для представления знаний. Можно добавить к этому [Гаврилова, Червинская, 1 992) : • неумение наладить контакт с экспертом; • терминологический разнобой; • отсутствие целостной системы знаний в результате извлечения только •фрагментов•; • упрощение •картины мира• эксперта и др. Процесс извлечения зн:ший - это длительная и трудоемкая процедура, в кото рой инженеру по знаниям, вооруженному специальными знаниями по когнитив ной психологии, системному анализу, математической лоrике и пр., необходимо воссоздать модель предметной области, которой пользуются эксперты для при- 68 Гла ва 3 • Те о р ет и че ски е ас пе кт ы и нже нер ии знани й нятия решения. Часто начинающие разработчики ЭС, желая упростить эту про цедуру, пытаются подменить инженера по знаниям самим экспертом. По многим причинам это нежелательно. Во-первых, большая часть знаний эксперта - это результат многочисленных на слоений, ступеней опыта. И часто, зная, что из А следует В, эксперт не отдает себе отчета, что цепочка его рассуждений была гораздо длиннее, например А ➔ D ➔ С ➔В или А ➔ Q ➔ R ➔ B. Во-вторых, как было известно еще Платону, мышление диалоrично. И поэтому диалог инженера по знаниям и эксперта - наиболее естественная форма изуче ния лабиринтов памяти эксперта, в которых хранятся знания, частью носящие невербальный характер, то есть выраженные не в форме слов, а в форме нагляд ных образов, например. И именно в процессе объяснения инженеру по знаниям эксперт на эти размытые ассоциативные образы надевает четкие словесные яр лыки, то есть вербализует знания. В-третьих, эксперту труднее создать модель предметной области вследствие глу бины и объема информации, которой он владеет. Еще в ситуационном управле нии [ Поспелов, 1986) было выявлено: объекты реального мира связаны более чем 200 типами отношений (временные, пространственные, причинно-следственные, типа •часть-целое» и др.). Эти отношения и связи предметной области образуют сложную систему, из которой выделить •скелет» или главную структуру иногда доступнее аналитику, владеющему к тому же системной методологией. Термин •приобретение• в рам1,ах данного учебника оставлен за автомати зированными системами прямого общения с экспертом. Они действительно непосредственно приобретают уже готовые фрагменты знаний в соответствии со структурами, заложенными разработчиками систеl\f: Большинство этих ин струментал·ь ных средств специально ориентировано на конкретные ЭС с жестко обозначенной предметной областью и моделью представления знаний, то есть не являются универсальными. Приобре тение знаний ( know/вdge acquisition) - п роце сс н ап олнен ия б азы з н ан и й э кс п ертом с и сп ол ьзов а н ие м сп еци ал и з и рованных п рогр ам мн ы х средств. Например, система TEIRESIAS [Davis, 1982), ставшая прародительницей всех инструментариев для приобретения знаний, предназначена для пополнения базы знаний системы MYCIN или ее дочерних ветвей, построенных на •оболочке» EMYCIN [Shortliffe, 1976) в области медицинской диагностики с использованием продукционной модели представления знаний. Три поколения и основные тен денции СПЗ будут подробно описаны в параграфе 4.5. Более современные конк ретные системы описаны далее в параграфе 4.6. Термин формирование знаний традициоlfно закрепился за чрезвычайно перспек тивной и активно развивающейся областью инженерии знаний, которая занима ется разработкой·моделей, методов и алгоритмов обучения. Она включает индук тивные модели формирован!'{Я знаний и автоматического порождения гипотез, например ДСМ-м_етод [Аншаков, Скворцов, Финн, 1 986] на основе обучающих выборок, обучение по аналогии и другие методы. Эти модели позволяют выявить З.2. Страте гии получения знаний 69 причинно-следс�енные эмпирические зависимости· в базах данных с неполной . информацией, с_одержащих структурированные числовые и символьные объекты (часто в условиях неполноты информации). Формирование знаний (machine leaming) - п роцесс анализа данных и вы я в ление скрыты>\ закономерностей с ис п ол ьзованием с п е циального математического апп арата и nрогр$ммн ых средств. Традиционно к задачам формирования знаний или машинного обучения отно сятся задачи прогнозирования, идентификацня (синтеза) функци�, расшифров ки языков, индуктивного вывода и синтеза с дополнительной информацией [Епифанов, 1 984] . В широком смысле к обучению по примерам можно отнести и методЪJ обучения распознавацию образов [Аrкинсон, 1989; Schwartz, 1988] . Индуктивный в ывод правил из фактов применен также в сис'rемах AQ, AQUINAS, KSSI, INSТIL и некоторых других. Н аиболее продвинутыми среди методов машинного обуч ения являются, по-ви димому, методы распознавания образов , в частности, алгебраический подход, в котором предусматривается обогащение исходных эвристических алгоритмов с помощью алгебраических операций и построение семейства алгоритмов, гаран тирующего получение корректного алгоритма для решения изучаемого класса задач, то есть алгоритма, правильно классифицирующего конечную выборку по всем классам [Берков, 1972]. Однако применение методов формирования зна ний пока не стало · промышленной технологией разработки баз знаний. Для того чтобы эти методы стали элементами технологии интеллектуальных си стем, необходимо решить ряд задач [Осипов, 1997]: • обеспечить механизм сопряжения независимо созданных баз данных, имею щих различные схемы, с базами знаний интеллектуальных систем; • установить соответствие между набором полей базы данных и множеством элементов декларативной компоненты базы знаний; • выполнить преобразование результата работы алгоритма обучения в способ представления, поддерживаемый программными средствами интеллектуаль ной системы. Помимо перечисленных существуют также и другие стратегии получения знаний, например, в случ ае обучения на примерах ( case-based reasoning) , ког да источник знаний - это множество примеров предметной области [ Оси пов, 1997 ; Попов, Фоминых, Кисель , 1996) . Обучение на основе примеров (прецедентов ) включает настройку алгоритма распознавания на задачу по средством предъявления примеров, классификация которых известна [Ибер1 ла, 1980) . Обучение н а примерах тесно связано с машинным обучением. Различие заключа ется в том, что результат обучения в рассматриваемом здесь случае должен быть интерпретирован в некоторой модели, в которой, возможно, уже содержатся факты и законймерности nредмеnюй области, и преобразован в способ представ- 70 Глава З • Те орет ичес к ие ас пе кты и нже н е р и и знаний ления, который допускает исполь�ование ре�ультата обучения � базе з наний, для моделирования рассуждений, для работы механизма объяснения и т. д., то есть делает результат обучения элементом соответствующей технологии. Например, в системе INDUCE [Коов и др., 1 988) порождается непротиворечивое описание некоторого класса объектов по множествам примеров и контр-приме ров данного класса. В качестве языка представления используется язык перемен но-знач)!ОЙ логики первого порядка (вариант языка многозначной логики первого порядка). Следует отметить также появление двух новых •Флагов• в стане сторонников методов машищюго обучения - это data mining и knowledge discovery. Оба подхо да базируются на анализе данных и поиске закономерностей. Таким образом, можно выделить три основные стратегии проведения стадии по лучения знаний при разработке ЭС (рис. 3.6). 1 . С использованием ЭВМ при наличии подходящего программного инструмен тария, иначе приобретение знаний. 2. С использованием программ обучения при наличии репрезентативной (то есть достаточно представительной) выборки примеров принятия решений в пред метной области и соответствующих пакетов прикладных программ, иначе фор мирование знаний. 3. Без использования вычислительной техники путем непосредственного контак та инженера по знаниям и источнИI<а знаний (будь то эксперт, специальная литература или другие источники), иначе извлечение знаний . Идентификация проблемы ...._п _о _л_уч ....ен_и_е__,�Структурироаание\ � • • L.y знаний i-vi Без применения С применением эвм ' 1 И з влечение знаний _ эвм 2 П рио ретение б знаний 3 Форми рование знаний Рис. 3 . 6. Стратеги и получения энани А В учебнике подробно будут рассматриваться процессы извлечения и приобрете ния знаний, так как на современном этапе разработки ЭС эти стратегии являются наиболее эффективными и перспективными. Формирование знаний, тяготеющее в большей степени к области machine learning, то есть индуктивному обучению, основываясь на хорошо исследован ном аппарате распознавания образов [Гаек, Гавранек, 1 983) и обнаружения сходства объектов [Гусакова, Финн, 1 987] , выхо дит за рамки данного учебника. Также вне этой книги остались вопросы форми рования знаний из данных (data mining, knowledge- discovery) и др. 3 .3. Тео ретические ас пекты извлечения зна ний 71 3.3. Теоретические аспекты и звлечения · знаний Поскольку основной проблемой инженерии знаний является процесс извлечения знаний, инженеру по знаниям необходимо четко понимать природу и особенное. ти этих процессов. Для того чтобы разобраться в природе извлечения знаний, выделим три. основных аспекта этой процедуры (рис. 3.7): А = { А 1 , А2, АЗ} ... {психологический, лингвистический, гносеологический}. Ри с . 3 . 7 . Те о рети чес ки е ас п е кты инже не р ии знаний 3 . 3 . 1 . Психологический аспект Из трех аспектов извлечения знаний психологический - А 1 - является ведущим, поскольку он определяет успешность и эффективность взаимодействия инжене ра по знаниям (аналитика ) с основным источником знаний - э кспертом-профес сионалом . Психологический аспект выделяется еще и потому, что извлечение знаний происходит чаще всего в процессе непосредственного общения разработ чиков системы. А в общении психология является доминантной. Общение, или коммуникация (от лат. communicatio - связь), - это междисцип линарное понятие, обозначающее все формы непосредственных контактов между людьми - от дружеских до деловых. Оно широко исследуется в психологии, фи лософии, социологии, этологии, лингвистике, семиотике и других науках. Суще ствует несколько десятков теорий общения, и единственное, в чем сходятся все авторы, - это сложность, многоплановость процедуры общения. Подчеркивает ся, что общение - не просто однонаправленный процесс передачи сообщений и не двухтактный обмен порциями сведений, а нерасчлененный, процесс циркуля ции информации , то есть совместный поиск истины [ Каган, 1 988] (рис. 3.8 ) . Итак, общение есть процесс выработки новой информации , общей для общаю щихся людей рождающей их общность. И хотя общение - первый вид деят�ль ности, которым овладевает человек в онтогенезе, по-настоящему владеют куль турой и наукой общения единицы. и 72 Глава З • Тео ретич ес кие асп екты инжен ерии зна ний Неправильная схема Эксперт Правильная схема Эксперт Инженер по знаниям � � ИЮl<енер по знаниям Рис. 3.8. Структура процесса общен ия Можно выделить четыре основных уровня общения [Саrатовский, 1 980]. 1 . Уровень манипулирования, когда один субъект рассматривает другого как сред ство или помеху по отношению к проекту своей деятельности. 2. Уровень •рефлексивной игры•, когда в процессе своей деятельности человек учитывает •контрпроект• другого субъекта, но не признает за ним -самоцен ность и стремится к •выигрышу•, к реализации своего проекта. 3. Уровень правового общения, когда субъекты признают право на существова ние проектов деятельности друг друга и пытаются согласовать их хотя бы вне шне. 4. Уровень нравственного общения, коtда субъекты внутренне прйнимают общий проект взаимной д�ятельности. Стремление и умение общаться на высшем, четвертом, уровне может характе ризовать степень профессионализма инженера по знаниям. Язвлечение зна ний - это особый вид общения, который можно отнести к духовно-информа ционному типу. Согласно работе [Каган, 1 988] общение делится на мате риально-практическое; духовно-информационное; практически-духовное. При этом информационный аспект общения для инженера по знаниям с прагмати ческой точки зрения важнейший. Известно, что потери информации при разговорном общении велики [ Мицич, 1 987] (рис. 3.9). l :i:: о i:: 111 Эксперт Инженер по знаниям Рис. 3.9. Потери информации при разговорном общении 73 З . З . Те орет ическ ие аспе кты из влечен и я знани й В связи с этим рассмотрим проблему увеличения информативности общения аналитика и эксперта за счет использования психологических знаний. Можно выделить такие структурные компоненты модели общения при извлече нии знаний: • участники общения (партнеры); • средства общения (процедура); • предмет общения (знанчя). В соответствии с этой структурой выделим три •слоя; психологических проблем, возникающих при извлечении знаний (рис. 3. 1 О): А1 = {S 1 1 , S 1 2 , S 1 3 } = {контактный, процедурный, когнитивный}. "• '<r\ } <:-,<f S11 Контактный слой S12 П роцедурный слой S13 Когнитивный слой Ри с . 3 . 1 О. Психол оги ч еский ас пе кт из вл ече ния знани й Ко н та ктны й с лой (S 1 1 ) Практически все психологи отмечают, что на любой коллективный процесс вли яет атмосфера, возникающая в группе участников. Существуют эксперименты, результаты которых неоспоримо говорят, что часто дружеская атмосфера в кол лективе больше влияет на результат, чем индивидуальные способности отдель ных членов группы [ Немов, 1 984] . Особенно важно, чтобы в коллективе раз работчиков складывались кооперативные, а не конкурентные отношения. Для кооперации характерна атмосфера сотрудничества, взаимопомощи, заинтересо ванности в успехах друг друга, то есть уровень нравственного общения, а для от ношений конкурентного типа - атмосфера индивидуализма и межличностного соперничества (более низкий уровень общения). В настоящее время прогнозировать совместимость в общении со 100%-й гаран тией невозможно. Однако можно выделить ряд факторов и черт личности, ха рактера и других особенностей участников общения, несомненно, оказываю щих влияние на эффективность процедуры. Разработка проблематики контактного слоя позволила выявить следующие па раметры партнеров, влияющие на результаты процедуры извлечения знаний: 74 Гл ава 3 • Те о рети чес к и е аспекты и нженер ии з н аний S 1 1 - {s1 1_i} - {пол, возраст, личность, темперамент, мотивация и др.}, часть из 1<оторых впоследствии вошли в формирование модели пользователя. Значения параметрqв пола (s 1 1_1) и возраста (s 1 1_2) хотя и влияют на эффек тивность контакта, но не являются критическими. В литературе [ Иванов, 1986] отмечается, что хорошие результаты дают гетерогенные пары (мужчина/женщи на) и соотношение: 20 > ( В, - В.) > 5, где В" - возраст эксперта; Б. - возраст аналитика. Под личностью (s1 1_3) обычно понимается устойчивая система психолоrичес� ких черт, характеризующая индивидуальность человека. Рекомендуемые компо ненты s 1 1_3 исследованы в работе [ Гаврилова, 1 990] и дополнены качествами из руководства для журналистов в работе [Schouksmith G., 1978]. s 1 1_3 = (доброже лательность, аналитичность, хорошая память, внимание, наблюдательность, во ображение, впечатлительность, большая собранность, настойчивость, общитель ность, находчивость). Со времен Галена и Гиппократа, выделивших четыре классических типа темпе рамента (s 1 1_4), вошли в научную термино}lоrию понятия s 1 1_4 = (холерик, сангвиник, меланхолик, флегматик). Известно, что флегматики и меланхолики медленнее усваивают информацию [Лунева, Хорошилова, 1 987] . И для обеспечения психологического контакта с ними не следует задавать беседе слишком быстрый темп, торопить их с ответом. Зато они гораздо лучше усваивают новое, в отличие от холериков, для которых свойственно поверхностное усваивание информации. Последних следует специ ально наводить на размышление и рефлексию. У меланхоликов часто занижена самооценка, они застенчивы и в беседе их надо подбадривать. Таким образом, наиболее успешными в рамках слоя S 1 1 являются сангвиники и холерики. На эффективность коллективного решщшя задач влияет также и мотивация (s 1 1_5), то есть стремление к успеху. Инженер по знаниям в зависимости от ус ловий разработки должен изыскивать разнообразные стимулы для экспертов (включая, разумееtся, и материальные). Эксперт передает аналитику один из са мых дорогих в мире продуктов - знания. И если одни люди делятся опытом доб ровольно и с удовольствием, то другие весьма неохотно приоткрывают свои про фессиональные тайны. Иногда полезно оказывается возбудить в эксперте дух соперничества, конкуренции (не нарушая, естественно, обстановки кооператив ности в коллективе). П р оцедурн ы й слой (S 1 2) Параметры процедурного слоя S 1 2 описывают непосредственно процесс прове дения процедуры извлечения знаний. Фактически это профессиональные пара метры: S 1 2 - {s1 2_i} = {ситуация общения (место, время, продолжительность); оборудо вание (вспомогательные средства, освещенность, мебель) ; профессиональные приемы (темп, стиль, методы и др.)}. З . З . Теоретичес кие аспект ы извлечения знан ий 75 Инженер по знаниям, успешно овладевший наукой установления атмосферы до верия и взаимопонимания с эиспертом (контактный слой '-- S 1 1 ), должен еще су� меть воспользоваться благоприятным воздействием этой атмосферы. Проблема процедурного слоя касается проведения самой процедуры извлечения знаний. Здесь мало проницательности и обаяния, полезных для решения проблемы кон таr<та, тут необходимы профессиональные знания. Остановимся на общих закономерностях проведения процедуры. s12_1 - ситуация общения определяется следующими компонентами: • s 1 2_1_1 - место проведения сеансов; • s 1 2_1_2 - продолжительность проведения сеансов; • s 1 2_1_3 - время проведения сеансов. ,Беседу с экспертом лучше всего проводить в небольшом помещении наедине (s12_1_1: место), поскольку посторонние люди нарушают доверительность бесе ды и могут породить эффект •Фасада• . Рабочее место эксперта является не са мым оптимальным вариантом, так как его могут отвлекать телефонные звон1ш, сотрудниr<и и пр. Атмосфера замкнутого пространства и уединенности положи тельно влияет на эффективность. Американский психолог И. Атватер считает, что для делового общения наиболее благоприятная дистанция от 1,2 до З метров [ Schouksmith, 1 978). Минимальным •комфортным• расстоянием можно считать 0,7-0,8 метра. Реконстру1щия собственных рассуждений - трудоемкий процесс , и поэтому длительность одного сеанса ( s 1 2_1_2: �родолжительность) обычно не превыша ет 1 ,5-2 часа. Эти два часа лучше выбрать в первой половине дня, например с 10 до 1 2 часов, если эксперт типа •жаворонок• ( s 1 2_1_3: время). Известно, что взаимная утомляемость партнеров при беседе наступает обычно через ·20-25 минут [Ноэль, 1 978) , поэтому в сеансе нужны паузы. s 12_2 - оборудование включает: • s 12_2_1 - вспомоrа:rельные средства; • s 1 2_2_2 - освещенность; • s 1 2_2 З - мебель. -;; Вспомогательные средства (s1 2_2_1): • средства для увеличения эффективности самого процесса извлечения знаний; • средства для протоколирования результатов. К средствам для увеличения эффективности процесса извлечения знаний прежде всего относится наглядный материал. Независимо от метода извлечения (см. гла ву 4), выбранного в конкре.тной ситуации, его реализаци·я возможна разными спо собами. Например, можно учитывать следующий фактор: широко известно, что людей, занимающихся интеллектуальной деятельностью, можно отнести к худо жественному либо мыслительному типу. Термины тут условны и не имеют отно шения к той деятельности, которую традиционно называют художественной или 76 Глава З • Теоретич ес кие а спект ы ин.жен ер �и знаний мыслцтельной. Важно, что, определив. тип эксперта, инженер по знаниям может плодотворне.е использовать любой из методов извлечения, зная, что люди худо жественного типа легче воспринимают зрительную информацию в форме рисун ков, графиков, диаграмм, так как эта информация воспринимается через первую сигнальную систему. Напротив, эксперты мыслительного типа лучше понимают язык формул и текстовую информацию. При этом учитывается факт, что боль шую часть информации человек получает от зрения. Совет пользоваться актив нее наrлядным материалом из работы [ Хейес- Рот, Уотермена, Ленат, 1987) . можно считать универсальным. Такие методы, как свободный диалог и игры, пре доставляют богатые возможности использовать слайды, чертежи, рисун1(и. Для протоколирования результатов в настоящее время используются следую щие способы: • запись на бумагу непосредственно по ходу беседы (недостатки - это часто ме шает беседе, кроме того, трудно успеть записать все, даже при наличии ·навы! ков стенографии); • магнитофонная запись (диктофон) , помогающая аналитику проанализиро вать весь ход сеанса и свои ошибки (недостаток - может сковывать э1(сперта); • запоминание с последующей записью после беседы (недостаток - годится только для аналитиков с блестящей памятью). Наиболее распространенным способом на сегодня является первый. При этом наибольшая опасность тут - потеря знаний, поскольку любая запись ответов это уже интерпретация, то есть привнесение субъективного понимания предмета. Значения параметров освещенности (s 1 2_2_2) и мебели (s 1 2_2_3) очевидны и связаны с влиянием внешних факторов на эксперта. s12_3 - профессиональные приемы аналитика, включают, в частности: . • s 1 2_3_1 - темп; • s1 2_3_2 - стиль; • s 1 2_3_3 - методы. Учет индивидуального темпа (s1 2_3_1) и стиля (s 1 2_3_2) эксперта позволяет аналитику снизить напряженность процедуры извлечения знаний. Типичной ошибкой является навязывание собственных темпа и стиля. На успешность также влияет длина фраз, которые произносит инженер по зна ниям. Этот факт был установлен американскими учеными - лингвистом Ингве и психологом Миллером при проведении исследования о причинах низкой усвояемости команд на Военно-морском флот� США (Gammack, Young, 1 985]. Причина была в длине команд. Оказалось, 'JTO человек лучше всего воспринимает предложения глубиной (или длиной) 7 + 2 (-2) слова. Это число (7±2) получило название число Инrве-Миллера. Можно считать его мерой •разговорности� речи. Опытные лекrоры используют в лекции в основном короткие фразы, умень шая потерю информации с 20-30 % (у плохих лекторов) до 3-4 % [ Горелов, 1987). Большая часть информации поступает к инженеру по знаниям в форме предло жений на естественном языке. Однако внешняя речь эксперта есть воспроизведе ние его внутренней речи (мышления), которая гораздо богаче и многообразнее. 3.3. Тео рети чес ки е асп екты и звл ече ни я зн ан ий 77 При этом для передачи этой внутренней речи эксперт использует и невербаль ные средства, такие как интонация, мимика, жесты. Опытный инженер по знани ям старается записывать по возможности в протоколы (в форме ремарок) эту до полнительную интонацию. В целом, невербальная компонента стиля общения важна и для проблем контакт ного слоя при установлении контакта, когда по отдельным жестам и выражению лица эксперта инженер по знаниям может установить границу возможной •дру жественности• общения. Значение параметра методов (s 1 2_3_3) подробно рассмотрено в следующей главе, ll:сходя из позиции, что метод должен подходить к эксперту как •ключ к замку• . Ког ни т и в н ый с л ой (S1 3) Когнитивные ( от англ" cognition - познание) науки исследуют познавательные процессы человека с позиций возможности их моделирования (психология, ней рофизиология, эргономика, инженерия знаний). Наименее исследованы на сегод няшний день проблемы когнитивного слоя S 1 3, связанные с изучением семанти ческого пространства памяти эксперта и реконструкцией его понятийной струк туры и модели рассуждений. Основными факторами, влияющими на когнитивную адекватн6сть, будут: S 1 3. = {s 1 3_i} = {когнитивный стиль, семантическая репрезентативность поля зна ний и концептуальной модели}. Под когнитивным стилем (s 1 3_1) человека понимается совокупность критериев предпочтения при решении задач и познании мира, специфическая для каждого человека. Когнитивный стиль определяет не столько эффективность деятельно сти, сколько способ достижения результата [Алахвердов, 1986] . Это способ по знания, который позволяет людям с разными способностями добиваться оди наковых результатов в деятельности. Это система средств и индивидуальных приемов, к которым прибегает человек для организации своей деятельности. Инженеру по знаниям полезно изучить и прогнозировать свой когнитивный стиль, а также стиль эксперта. Особенно важны такие характеристики когнитив ного стиля, как: • s13_1_1 - (полезависимость - поленезависимость); • s 1 3_1_2 - (импульсивность - рефлективность (рефлексивность); • s 1 3_1_3 - (ригидность - гибкость); • s 1 3_1_4 - (когнитивная эквивалентность). s13_1_1 . Поленезависимость позволяет человеку акцентировать внимание лишь на тех аспектах проблемы, к.оторые необходимы для решения конкретной зада чи, и уметь отбрасывать все лишнее, то есть не зависеть от фона или окружаю щего задачу шумового поля. Эта характеристика коррелирует с такими чертами личности, как невербальный интеллект, аналитичность мышления, способность 78 Гл ава З • Те о рети чес к и е аспект ы инженер ии знаний к пониманию сути. Очевидно, что помимо того, что самому аналитику необходи мо иметь -в ысокое значение параметра s 1 3_1_1, поленезависимый эксперт - это тоже желательный фактор. Однако приходится учитывать, что больше нуждают ся в общении полезависимые люди, а потому они и более контактны [ Орехов, 1 985}. Особенно полезны для общения гетерогенные (смешанные) пары, например •по лезависимый - поленезависимый• [ Иванов, 1 986]. В литературе описаны раз личные эксперименты, моделирующие общение, требующее понимания и совмест ной деятельности. Наиболее успешным в понимании оказались поленезависимые испытуемые (92 % успеха) , для сравнения полезависимые давали 56 % успеха [ Кулюткин, Сухобская, 1 9 7 1 } . Для совместной профессиональной деятельности важна также гибкость когни тивной организации, которая связана с поленезависимостью. Итак; большую способность к адекватному пониманию партнера демонстрируют субъекты с вы сокой психологической дифференциацией, то есть поленезависимостью. Поленезависимость является одной из характерных профессиональных черт ког нитивного стиля наиболее квалифицированных инженеров по знаниям. По неко торым результатам [ Алахвердов, 1 986] мужчины более поленезависимы, чем жен щины. s13_1_2. Под импульсивностью понимается быстрое принятие решения (часто без его достаточного обоснования), а под рефлексивностью - склонность I< рас судительности. Рефлексивность по экспериментальным данным коррелирует со способностью к формирования понятий и продуктивностью стратегий решеюtя логических задач [ Кулюткин, Сухобская, 1 97 1 ]. Таким образом, и 11нженеру, по знаниям, и эксперту желательно быть рефлексивным, хотя собственный стиль изменяется лишь частично и с большим напряжением. s13_1_3. Ригидность - гибкость характеризует способность человека к измене нию установок и точек зрения в соответствии с изменяющейся ситуацией. Ригид ные люди не склонны менять свои представления и структуру восприятия, напро тив, гибкие легко приспосабливаются к новой обстановке. Очевидно, что если эксперт еще может себе позволить ригидность (что характерно для долго работа ющих над одной проблемой специалистов, особенно старшего возраста), то для инженера по знаниям эта характеристика когнитивного стиля явно противопо казана. Увеличение ригидности с возрастом отмечается многими психологами [Кулюткин, Сухобская, 197 1 ; Орехов, 1985]. s13_1_4. Когнитивная эквивалентность характеризует способность человека к различению понятий и разбиению их на классы и подклассы. Чем уже диапазон когнитивной эквивалентности, тем более тонкую классификацию способен про вести индивид, тем большее количество признаков понятий он может выделить. Обычно у женщин диапазон когнитивной эквивалентности уже, чем у мужчин. Семантическая репрезентативность (s 1 3_2) подразумевает подход, исключающий традиционное навязывание эксперту некой модели представлений (например, продукционной или фреймовой ) , и заставляет инженера по знаниям последова тельно воссоздавать модель мира эксперта, используя как неформальные методы, 79 З . З. Теоретическ ие ас пе кты извлечени я знаний та�< и математический аппарат, например многомерное шкалирование (см. главу, 4). Проблема семантической репрезентативности ориентирована на достижение rюrнитивной адекватност'и поля знаний и концептуальной модели. В настоящий момент она может быть сформулирована как проблема •испорченного телефона• [Гаврилова, Червинская, 1 992) ( см. рис. 3.5) - возможные трансформации и по тери в цепи передачи информации: (Og: предметная о бласть или реальный мир) ➔ Д: интерпретация i-zo эксперта] ➔ (Mg;: модель мира эксперта) ➔ [V;: вербализация модели мира эксперта] ➔ (Тi & Ci: вербальные и невербальные сообщения i-zo экспертаj- м� аналитику) ➔ f½: их интерпретация j-ым аналитиком] ➔ (Mgj: модель мира j-zo аналитика) ➔ [К;: кодирование при формировании поля знаний с последующей структуризацией в концептуальную модель]. Круглые скобки определяют понятия, квадратные - процессы. 3.3.2. Л ингв и ст и чески й аспект Лингвистический (А2) аспект касается исследований языковых проблем, так I<ак язык - это основное средство общения в процессе извлечения знаний. Сразу же следует оговорить, что поскольку тема данной книги ограничена изло жением теории и технологии инженерии знаний, то область разработки есте ственно-языковых интерфейсов и весь спектр проблем, связанных с ней - лекси ческих , синтаксических, семантических, прагматических и т. д. [Виноград, 1 976; Мальковский, 1985; Попов, 1 982) , - не рассматривается. В инженерии знаний можно выделить три слоя лингвистических проблем (рис. 3. 1 1 ): А2 - {S2 1 , S22, S23} = {•общий код•, понятийная структура, словарь пользова теля}. S21 сОбщий код• !--- а ------- � S22 Понятийная структура S23 Словарь пользователя Ри с . 3. 1 1 . Лингвистический аспект извлече ния знаний 80 Глава 3 • Теорет ич еск и е асп екты и нженер и и знани й ссОбщий КОД)> (52 1 ) «Общий КОД\> решает проблему языковых ножниц между профессиональной тер минологией эксперта и обыденной литературной речью инженера по знаниям и включает следующие компоненты: S2 1 = {s2 1_i} = {общенаучная терминология; специальные понятия из профессио нальной литературы; элементы бытового языка; неологизмы, сформированные за время совместной работы; профессиональный жаргон и др.}. Детализация схемы общения (см. рис. 3.8) на рис. 3. 1 1 позволяет представить средства общения как два потока [Горелов, 1987], в которых нас интересуют ком поненты V1 и V2 - языки, на которых говорят аналитик и эI<сперт (V 1 ', V2' невербальные компоненты). Различие язы1<ов V 1 и V2 и обусловли(Jает «языко вый барьер;, или «языковые ножницы;, в общении инженера по знаниям и экс перта. Эти два языка являются отражением «внутренней речи» эксперта и аналитш<а, поскольку большинство психологов и лингвистов считают, что язык - это ос новное средство мышления наряду с другими знаковыми системами «внутрен него пользования;, (универсальный семантический код - УСК [ Мартынов, 1977], языки «смысла;, [ Мельчук, 1 97 4 ] , концептуальные языки [ Шенк, 1980] и др.). Язык аналитика V 1 состоит из трех компонентов: • s2 1_1 - общенаучной терминологии из его «теоретичес1<0го багажа;, ; • s2 1_2 - терминов предметной области, которые о н почерпнул из специальной литературы в период подготовки; • s2 1_3 - бытового разговорного языка, которым пользуется аналитик Язык эксперта V2 включает: • s2 1_1 - общенаучную терминологию; • s2 1_2 - специальную терминологию, принятую в предметной области; • s2 1_3 - бытовой язык; • s2 1_4 - неологизмы, созданные экспертом за время работы, то есть его профессиональный жаргон. Если считать, что бытовой и общенаучный языки у двух участников общения примерно совпадают (хотя реально объем второго компонента у эксперта суще ственно больше), то некоторый общий язык или код, который необходимо выра ботать партнерам для успешного взаимодействия, будет складываться из пото ков, представленных на рис. 3. 12. В дальнейшем этот общий код преобразуется в некоторую понятийную (семан тическую) сеть, которая является прообразом поля знаний предметной области. Выработка общего кода начинается с выписыванием аналитиком всех терминов, употребляемых экспертом, и уточнения их смысла. Фактически это составление словаря предметной области. Затем следует группирование терминов и выбор синонимов (слов, означающих одно и то же). Разраб отка общего кода заканчи- 81 3.3 . Те оретические аспекты извлечения зна ний вается составлением словаря терминов предметной области с предварщ:ельной группировкой их по смыслу, то есть по понятийной близости (это уже первый шаг структурирования знаний). На этом этапе аналитик должен с большим вниманием отнестись ко всем специ альным терминам, пытаясь максимально вникнуть в суть решаемых проблем и терминологию. Освоение аналитиком языка предметной области - первый ру беж на подступах к созданию адекватной базы знаний. s21_3 Бытовой язык s2 1_4 Специальная терминология эксперта Эксперт =)1 IJ Общий код u ! (= s21 2 Специал ьные термины из литературы И нже нер по знан иям s21 1 Об щенаучные термины Рис. 3 . 1 2. Структура общего кода Рисунок 3. 1 2 дает представление о процессе неоднозначности интерпретации терминов двумя специалистами. В семиотике, науке о знаковых системах, проблема интерпретации является одной из центральных. Интерпретация свя зывает •Знак» и •означаемый предмет». Только в интерпретации знак получает смысл. Так, на рис. 3. 13 слова •прибор Х» для эксперта означает некоторую кон кретную схему, которая соответствует схеме оригинала прибора, а в голове начи нающего аналитика слова •прибор Х» вызывают пустой образ или некоторый черный ящик с ручками. Образ 1 Объект Е] О браз 2 ООО оО оО оО 11 Эксперт ◄�1---------1 «Прибор Х» 1-------• JIII Инженер по знаниям Знак Р ис-. 3. 1 3. Неоднознач ность и нтерпретаци и 82 Глава 3 • Те о ретич еские аспе кт ы инженерии з нани й Внимание к лингвистическому аGпекту проблемы извлечения знаний способству ет сближе)':!ИЮ образа 1 с образом 2 и интерпретации 1 1 с »нтерпретацией 12, а сло ва «прибор Х• перейдут в действительно «общий• код. Таким образом, слой S21 включает изучение и управление процессом разработ ки специального промежуточного языка, необходимого для взаимодействия ин женера по знаниям и эксперта. П о ня ти й ная стру ктура (S22) Проблемы формирования понятийной структуры представляют следующий слой S22 линrвистиче:;скоrо аспекта проблемы извлечения знаний. Особенности формирования понятийной структуры обусловлены установленным постулатом когнитивной психологии о взаимосвязи понятий в памяти челове1<а и наличии семантической сети, объединяющей отдельные термины во фрагменты, фраг менты в сценарии и т. д. Построение иерархической ,сети понятий, так называе мой «пирамиды знаний• , - важнейшее звено в проектировании интеллектуаль ных систем. Большинство специалистов по искусственному интеллекту и когнитивной пси хологии считают, что основная особенность естественного интеллекта и памяти в частности - это связанность всех понятий в некоторую сеть. Поэтому для раз работки базы знаний и нужен не словарь, а «энциклопедия• [ Шенк, Бирнбаум, Мей, 1 989] , в которой все термины объяснены в словарных статьях со ссылками на друmе термины. Таким образом, лингвистическая работа инженера по знаниям на данном слое проблем заключается в построении таких связанных фрагментов с помощью «сшивания• терминов. Фактически зта работа является подготовкой к этапу кон цептуализации, где это «шитье• (по Шенку - КОП, концептуальная организация памяти [Шею<, Хантер, 1987]) приобретает некоторый законченный вид. При тщательный работе аналитика и эксперта в понятийных структурах начина ет просматриваться иерархия понятий, подробно о которой будет говориться в параграфах 4.4. и 8.2. Такие структуры имеют важнейшее rносеолоrическое и дидактическое значение и последнее время для них используется специальный термин - онтологии. Следует заметить, что эта иерархичес1<ая организация хо рошо согласуется с теорией универсального предметного кода (УПК) [Горелов, 1 987; Жинкин, 1 982), согласно которой при мышлении используются не языко вые конструкции, а их коды в форме некоторых аб стракций, что в общем согла суется с результатами когнитивной психологии [Величковский, 1 982]. Иерархия абстракций - э_то глобальная схема, которая может б ыть положена в основу концептуального анализа структуры знаний любой предметной области. Лингвистический эквивалент иерархии - иерархия понятий, которую необхо димо построить в понятийной структуре, формируемой инженером по знаниям (рис. 3. 14). Следует подчеркнуть, что работа по составлению словаря и понятийной структу ры требует. лингвистического «чутья•, легкости манипулирования терминами и 3.3 . Те орет ические ас пект ы извлечения з н а ни й 83 богатого словарного запаса инженера по знаниям, так как зачастую аналитик вы нужден самостоятельно разрабатывать словарь признаков. Чем богаче и вырази тельнее получается общий код, тем более полнее база знаний. Обобщение Ин вариа нты п редм етов Образная память Следы ощущений, восприятий. представлений Рис. 3. 1 4. Пример иерархии Аналитик вынужден все время помнить о трудности передачи образов и пред ставлений в вербальной форме. Полезными тут оказываются свойства многознач ности слов естественного языка. Часто инженеру по знаниям приходится под сказывать слова и выражения эксперту, и такие новые лексические конструкции оказываюrся полезными. Способность к словесной интерпретации зависит и от пола аналитика (параметр s 1_1). Установлено, что традиционно женщины придают большую значимость невербальным компонентам общения, а в вербальных имеют более обширный ал фавит признаков. И вообще, существуют половые различия восприятия не толь ко в бытовой сфере, что очевидно, но и в профессиональной. Следовательно, у эксперта-мужчины и у эксперта-женщины могут существенно отличаться алфа виты для вербализации признаков воспринимаемых объектов. Сло вар ь п ол ь зо вателя (S23) Лингвистические результаты, соотнесенные к слоям общего кода и понятийной структуры, направлены на создание адекватной базы знаний. Однако часто про фессиональный уровень конечного пользователя не позволяет ему применить специальный язык предметной области в полном объеме. Неожиданными для начинающих разработчиков являются проблемы формиро вания отдельного словаря для создания дружественного интерфейса с пользова телем ЭС, исследуемые в слое S23. Необходимы специальные приемы, увеличи вающие •прозрачность• и доступность системы. Для разработки пользователь ского интерфейса требуется дополнительная доработка словаря общего кода с по правкой на доступность и •прозрачность• системы. 84 Глава 3 • Те о ретические ас пекты и н женерии зна ни й Так, при разработке экспертной системы по психодиагностике АВТ АНТЕСТ [ Гаврилова, 1 984] пришлось разработать два словаря терминов - один для психо логов-профессионалов, второй - для неспециалистов (испытуемых). Поскольку результат психодиагностического тес;rирования всегда интересен испытуемому, ему выдается листинг с психологическим заключением на общелитературном . языке без употребления специальных терминов. Интересно, что при внедрении системы использовался в основном этот второй словарь; даже профессиональные психологи предпочитали получать тексты на обыденном языке . 3 . 3 . 3 . Гносеологическ и й а спект и звлечен и я знан и й Гносеология - это раздел философии, связанный с теорией познания, или теорией отражения действительности в сознании человека. Гносеологический аспе1ст (АЗ) извлечения знаний объединяет методологические проблемы получения нового научного знания, поскольку при создании БЗ эксперт часто впервые формулиру ет некоторые закономерности, до того момента составлявшие ero личный опыт. Инженеr ия знаний как наука, если можно так выразиться, дважды гносеолоrич на - сна·�ала действительность (О) отражается в сознании эксперта ( М 1 ), а за тем деятельность и опыт эксперта интерпретируются сознанием инженера по знаниям (М2), что служит уже основой для построения третьей интерпретации (Р) - поля знаний экспертной системы (см. рис. 3.5). Процесс познания, в сущ ности, направлен на создание внутренней репрезентации окружающего мира в сознании человека. Предметом данного учебника являются в основном процессы отображения 12 и 13 (1 1 - изучают психология и философия); подробно интерпретация 13 будет рас смотрена далее. Если описать процессы 12 и 13 в терминологии, введенной в главе 1 , то мы имеем дело с превращением экспертного знания и теоретического (книжного) опыта Z 1 в поле знаний Z2, которое есть материализация модели мира М 2 инженера п о зна ниям. В процессе извлечения знаний аналитика в основном интересует компонент Z 1 , связанный с неканоническими индивидуальными знаниями экспертов, посколь ку предметные области, требующие именно такого типа знаний, считаются наи более восприимчивыми к внедрению экспертных систем. Эти области обычно называют эмпирическими, так как в них накоплен большой объем отдельных эм пирических фактов и наблюдений, в то время как их теоретическое обобщение вопрос будущего. Если считать, что инженер по знаниям извлекает только фрагмент Z t\ то есть часть из системы знаний эксперта Z 1 , то его задача, во-первых, стараться, чтобы структура Z 1 ' соответствовала Z 1 , и, во-вторых, чтобы Z 1 ' как можно более пол но отражал Z 1 . Познание часто сопровождается созданием новых понятий и теорий. Иногда экс перт порождает новые знания прямо в ходе беседы с аналитиком. Такая генера- 3.3. Те ор е тичес кие аспекты извлечен и я знан ий 85 ция знаний цолезна и самому эксперту, который до того момента мог не осозна вать ряд соотношений ff закономерностей предметной области. Аналитику может помочь тут и инструментарий системной методологии, позволяющий использо вать известные принципы логики научных исследований, понятийной иерархии науки. Эта методология заставляет его за частным всегда стремиться увидеть об щее, то есть строить цепочки. Гносеологическая цепочка: факт � обобщенный факт � эмпирический закон � теоре тический зако н . Не всегда удается дойти до последнего звена этой цепочки, но уже само стремле• u ние к движению бывает чрезвычайно плодотворным. Такои подход полностью согласуется со структурой самого знания, которое имеет два уровня: 1 . Эмпирический (наблюдения, явления). 2. Теоретический (законы, абстра1щии, обобщения). Но теория - это не только стройная система обобщения научного знания, это та1< же некоторый способ производства новых знаний. Основными методологически ми критериями научности, позволяющими считать научным и само новое знание и способ его получения, являются [Коршунов, Манталов, 1 988]: АЗ = { S3 1 , S32, S33} = {внутренняя согласованность, системность, объективность, историзм}. В н ут р е н няя с о глас ова нн о ст ь (53 1 ) Основные характеристики эмпирического знания: S3 1 = {s3 1_i} = {модальность, противоречивость, неполнота}. На первый взгляд критерий внутренней согласованности знания не соответству ет реальным характеристикам, описывающим знания с точки зрения слоя s3 1_i. Эти хара1перистики эмпирических знаний подчеркивают его «многоуклад ность• - столь часто факты не согласуются друг с другом, определения противо речат, �<ритерии диффузны и т. д. Аналитику, знающему особенности эмпиричес кого знания, - приходится сглаживать эти «шероховатости• эмпирюш. Модальность (s31_1 ) знания означает возможность его существования в различ ных категориях, то есть в конструкциях существования и долженствования. Та ким образом, часть закономерностей возможна, другая обязательна и т. д. Кроме того, приходится. различать такие оттенки модальности, как: • эксперт знает, что... ; • эксперт думает, что ... ; • эксперт хочет, чтобы ... ; • э1<сперт считает, что ... . Возможная противоречивость (s3 1�2) эмпирического знания - естественное следствие из основных законов диалектики, и противоречия эти не всегда долж- 86' Глава 3 • Теор ети чески е асп екты и нженер ии знаний ны р�рещат,ься в поле знаний, а напротив, именно противоречия служат чаще всего отправной точкой в рассуждениях экспертов. Неполнота (s3 1_3) знания связана с невозможностью полного описания предмет ной области. Задача аналитика эту неполноту ограничить определенными рам1<а ми •полноты• , то есть сузить границы предметной области либо ввести ряд ограничений и допущений, упрощающих проблему. С исте мн ость (S32) \ Системно-структурный подход к познанию (восходящий еще к Гегелю) ориен тирует аналитика на рассмотрение любой предметной области с пооиций зако номерностей системного целого и взаимодействия составляющих его частей. Современный структурализм исходит из многоуровневой иерархической органи зации любого объекта, то есть все процессы и явления можно рассматривать ка1< множество более мелких подмножеств (признаков, деталей) и, наоборот, любые объекты можно ( и нужно) рассматривать как элементы более высокnх классов обобщений. Например, системный · взгляд на проблематику структурирования знаний позволяет увидеть его иерархическую организацию. Подробнее об этом в параграфе 3. 4 . Объект и в ност ь (S33) Процесс познания глубоко субъективен, то есть он существенно зависит от осо бенностей самого познающего субъекта. • Факты существуют для одного глаза и отсутствуют для другого• (Виппер). Таким образом, субъективность начинается уже с описания фактов и увеличивается по мере углубления идеализации объек тов. Следовательно, более корректно говорить о глубине понимания, чем об объек тивности знания. Понимание - это сотворчество, процесс истолкования объекта с точки зрения субъекта. Это сложный и неоднозначный процесс, совершающий ся в глубинах человеческого сознания и требующий мобилизации всех интел лектуальных и эмоциональных способностей человека. Все свои усилия анали тик должен сосредоточить на понимании проблемы. В психологии известен результат [Величковский, Капица, 1987), подтверждаю щий факт, что люди, быстро и успешно решающие интеллектуальные зада9:и, большую часть времени тратят на понимание ее, в то время как плохие решатели быстро приступают к поискам решения и чаще всего не могут его найти. И сто р изм (S34) Этот критерий связан с развитием. Познание настоящего - есть познание поро дившего его прошлого. И хотя большинство экспертных систем дают •горизон тальный• срез знаний - без учета времени (в статике), инженер по знаниям дол жен всегда рассматривать процессы с учетом временных изменений - как связь с прошлым, так и связь с будущим. Например, структура цоля знаний и база зна ний должны допускать подстройку и коррекцию как в период разработки, так и во время эксплуатации Э С. 3.3. Теорети ческие аспе кты и звлече ни я з н а ни й 87 Рассмотрев основные критерии научности познания, попытаемся теперь описать его структуру. Методологическая структура познания может быть представлена как некоторая последовательность этапов (Коршунов, Манталов, 1 988]. Параметры { SЗi} органически вписываются в эту структуру познания, которая может быть представлена как последовательность этапов, описанных далее с позиций инженера по знаниям: • Э_1 : описание и обобщение фактов; • Э_2: установление логических и математических связей, дедукция и индукция заI<ОНОВ; • Э_З: постро�ние идеализированной модели; • Э_4: объяснение �1 предсказание явлений. Э_ 1 . О п иса н ие и о бо бще ни е ф акто в · Тщательность и полнота ведения протоколов во время процесса извлечения и пунктуальная <iдомашняя работа» над ними - вот залог продуктивного первого этапа познания и материал для описания и обобщения фактов. На практике оказывается трудным придерживаться принципов объективности и системности, описанных выше. Чаще всего на этом этапе факты просто собирают и как бы бросают в <,общий мешок» ; опытный инженер по знаниям часто сразу пытается найти �полочку» или <iящичек» для каждого факта, тем самым подспуд но готовясь к этапу концептуализации . 3_2 . Уста но влен ие с в язе й и зако но мерно стей В памяти эксперта все понятия увязаны и закономерности установлены, хотя ча сто и неявно задача инженера -,выявить каркас умозаключений эксперта. Рекон струируя рассуждения эксперта, инженер по знаниям может опираться на две наиболее популярные теории мышления - логическую и ассоциативную. При этом если логическая теория благодаря горячим поклонникам в ли це математи ков широко цитируется и всячески эксплуатируется в работах по искусственному интеллекту, то вторая, ассоциативная, гораздо менее известна и популярна, хотя имеет также древние корни. Так, Р. Фейнман в своих <,Лекциях по физике,> отме чает, что в физике по-прежнему преобладающим является вавилонский, а не гре ческий метод построения· знаний. · Известно, что древневосточные математики умели делать сложные вычисления, но формулы их не были логически увязаны. Напротив, греческая математика дедуктивна (например, <iНачала» Евклида). Традиционная логика формирует критерии, которые гарантируют точность, ва лидность, непротиворечивость общих понятий рассуждений и выводов. Ее осно вы заложены еще в �Органоне,> Аристотеля в 4 в. до н. э. Большой вклад в разви тие логики внес Джон Стюарт Милль ( 1 806-1 873). Инженер по знаниям и сам использует операции традиционной логики и выде ляет их в схеме рассуждений эксперта. Эт_о следующие операции: • определение; • сравнение и различение; \ 88 Глава 3 • Теорети чески е аспекты и нже н е р и и з н ан и й • анализ; • абстрагирование; • обобщение; • классификация; • категоризация; • образование суждений; • умозаключение; • составление силлогизмов и т. д. Однако красота и стройность логической теории не должны заслонять того, что человек редко мыслит в категориях математической логики [ Поспелов, 1989] . Теория ассоциаций представляет мышление как цепочку идей, связанных общи ми понятиями. Основными операциями такого мышления являются: • ассоциации, приобретенные на основе различных связей; • припоминание прошлого опыта; пробы и ошибки со случайными успехами; • привычные ( •автоматические•) реакции и пр. Однако эти две теории не исчерпы'вают всего многообразия психологических школ. Большой интерес для инженерии знаний может представлять гештальт психология. Одним из ее основателей является выдающийся немецкий психолог М. Вертrеймер ( 1 880- 1943). Под rештальтом (нем. Gestalt) понимается прин цип целостности восприятия - как основа цышления. Гештальт-психологи ста раются во всем выделять некий целостный образ или структуру как базис для по нимания процессов и явлений окружающего мира. Эта теория близка теории фреймов и объектному подходу и направлена на постижение глубинного знания, которое характеризуется стабильностью и симметрией. При этом важен так на зываемый •центр ситуацию, , относительно которого развивается знание о пред метной области. Для инженера по знаниям это означает, что, выявляя различные фрагменты зна ний, он не должен забывать о главном, о rештальте фрагмента, который влияет на остальные компоненты и связывает их в некоторую структурную единицу. Геш тальтом может быть некий главный принцип, или идея, или гипотеза эксперта, или его вера в силу каких-то отдельных концепций. Этот принцип редко форму лируется экспертом явно, он всегда как бы за •кадром•, и искусство инженера по знаниям обнаружить этот основной гештальт эксперта. В гештальт-теории существует закон •стремления к хорошему гештальту•, со гласно которому структуры сознания стремятся к гармонии, связности, простоте. Это близко к старинному классическому принципу •бритвы Оккама• - •сущно сти не должны умножаться без необходимости• - и формулируется как принцип прегнантности Вертгеймера [Вертrеймер, 1 987] : •Организация поля И!-fеет тен денцию быть настолько простой и ясной, насколько позволяют данные условия•. Рассуждения о гештальте подводят вплотную к третьему этапу в структуре позна ния. 3 . 3. Теоретич еские аспекты из влечения з н аний 89 Э_З . П острое н и е идеализи рова н н о й м одели Для построения модели, отражающей представление субъекта о предметной об ласти, необходим специализированный язык, с помощью которого можно опи сывать и конструировать те идеализированные модели мира, которые возникают в процессе мышления. Язык этот создается постепеАно с помощью катеrориаль ноrо аппарата, принятого в соответствующей предметной области, а также фор мально-знаковых средств математики и логики. Для эмпирических предметных областей такой язык пока не разработан, и поле знаний, которое полуформализо ванным способом опишет аналитик, может быть первым шаrом к созданию тако го языка. Любое познавательное отражение включа�т в себя условность, то есть упрощение и идеализацию. Инженеру по знаниям необходимо овладение такими специфи ческими rносеолоrическими приемами, как идеализация, огрубление, абстраrи• .рование, которые позволяют адекватно отображать в модели реальную картину мира. Эти приемы доводят свойства и признаки объt!ктов до пределов, позволяю� щих воспроизводить законы действительности в более лаконичном виде (без вли яния несущественных деталей). На тернистом пути познания проверенный диалектический подход оказывается лучшим •поводырем• . Инженер по знаниям, который стремится познать про блемную область, должен быть готов постоянно изменять свои уже утвердившие� ся � пособы восприятия и оценки мира и даже отказываться от них. При этом тща тельнее всего следует проверять правильность суждений, которые кажутся самыми очевидными. Э_4. Объ я сн е н ие и п редсказа н ие моделей Этот завершающий этап в ·структуре познания является одновременно и частич ным критерием истинности полученного знания. Если выявленная система зна· ний эксперта полна и объективна, то на ее основании можно делать прогнозы и объяснять любые явления из данной предметной области. Обычно базы знаний ЭС страдают фрагментарностью и модульностью (несвязанностью) компонен тов. Все это не позволяет создавать действительно интеллектуальные системы, которые, равняясь на человека, могли бы предсказывать новые закономерности n · объяснять случаи, не указанные в явном виде в базе. Исключением тут являются обучающие системы, которые ориентированы на генерацию новых знаний и •предсказание•. Предлагаемая методология вооружает аналитика аппаратом, позволяющим избе жать традиционных ошибок, приводящих к неполноте, противоречивости, фраг ментарности БЗ, и указывает направление, в котором необходимо двигаться раз работчикам. И хотя на сегодняшний день большинство БЗ прорабатываются лишь до этапа Э_3, знание полной схемы обогащает и углубляет процесс проекти рования. 90 Глава 3 • Теорети ч ески е аспекты и нженер и и з наний 3 . 4 . Те о рет ические ас пекты структур и р ова н и я знан ий Разделение стадий извлечения и структурирования знаний является весьма ус ловным, поскольку хороший инженер по знаниям, уже извлекая знания, начинает работу по структурированию и формированию поля знаний, описанному в пара графе 3. 1 . Однако в настоящее время прослеживается тенденция опережения технологи ческих средств разработки интеллектуальных систем по отношению к их теоре тическому обоснованию. Практически сейчас существует пропасть между блес тящими, но несколько •постаревшими• математическими основами киберне тики (труды Винера, Эшби, Шеннона, Джорджа, Клира, Йордона, Ляпунова, Глушкова и др.) и современным поколением интеллектуальных систем, которые основаны на парадигме обработки знаний (экспертные системы, ·лингвистичес кие процессоры, обучающие системы и т. п.). С одной стороны, это объясняется тем, что с первых шагов наука об искусствен ном интеллекте ( ИИ) была направлена на моделирование слабоформализуе мых смысловых задач, в которых не применим традиционный математический аппарат; с другой стороны, ИИ - это ветвь информатики и активно развивается как промышленная индустрия программных средств в условиях жесткой конку ренции, где подчас важнее быстрое внедрение новых идей и подходов, чем их анализ и теоретическая проработка. Необходимость разработки теоретических основ науки о методах разработки си стем, основанных на знаниях - инженерии знаний, - обосновывается в работах Поспелова Д. А., Попова Э. В., Стефанюка В. Л., Шенка Р., Минского М. - веду щих специалистов в области ИИ в России и зарубежом. Первые шаги в создании методологии (работы Осипова Г. С., Хорошевскоrо В. Ф., Яшина А. М., Wielinga, Slagle, etc.) фактически являются пионерскими и чаще всего ориентированы на определенный класс задач, моделируемых в рамках конкретного программного инструментария. В данном параграфе рассмотрена новая методология [Гаврилова, 1995 ] , позволя ющая провести стадию структурирования независимо от последующей прщрамм ной реализации, опираясь на достижения в области разработки сложных систем. 3 . 4 . 1 . Историческая справка Стадия концептуального анализа или структурирования знаний традиционно является (наряду со стадией извлечения) сузким местом• в жизненном цикле разработки интеллектуальных систем [Adeli, 1 994). Методология структурирова ния близка к современной теории больших систем [Гиr, 198 1] или сложных сис тем [Courtois, 1985; Peters, 1981 ) , где традиционно акцент делается на процессе проектирования таких систем. Большой вклад в эту теорию внесли классики объектно-ориентированного анализа [Буч, 1 992]. 3.4. Теоретиче ские аспекты ст рукту рирования зна ний 91 Разработку интеллектуальных систем с уверенностью можно отнести к.данному классу задач, поскольку они обладают основными признаками сложности (иерар хия понятий, внутриэлементные и межэлементные связи и пр.). Сложность про еr<тирования ИС определяется в основном сложностью предметных областей и управления процессом разработки, а также сложностью обеспечения гибкости конечного программного продукта и описания поведения отдельных подсистем. Среди первых сторонников исследований по теории систем наиболее заметными были Берталанфи [Bertalanffy, 1950], Раппопорт и Боулдинг [Boulding, 1 956] . Аналогичные концепции, но связанные не с общесистемными исследованиями, а рассматривающие информационные процессы в системах, таrшх как связь и уп равление, положили начало кибернетике как самостоятельной науке [ Винер, 1 958; Эшби, 1 959] . Этот подход был существенно поддержан работами Шеннона по математическому моделированию понятия информации [Шеннон, Уивер, 1963; Feinstein, 1958; Watanabe, 1969]. Позднее, в 1960-х гг. было сделано несколько попыток сформулировать и развить математические теории систем высокого уровня общности [Mesarovic, 1964; Ар биб, 1975]. Существенный вклад в математичесr<ую теорию систем и основы структурирования внесли отечественные исследователи Моисеев Н. Я. [Моисе ев, 198 1 ], Глушков В. М. [Глушков, 1 964], Ивахненко А. Г. [Ивахнешщ 1 97 1 ] , По спелов Д. А. [ Поспелов, 1986] и другие. Системный анализ тесно переплетается с теорией систем и включает совокупность методов, ориентированных на исследо вание и моделирование сложных систем - технических, экономических, экологи ческих и т. п. 3 .4.2. Ие рар хический п одход Проектирование сложных систем и методы структурирования информации тра диционно использовали иерархический подход [ Месарович, Такахара, 1972] как методологический прием расчленения формально описанной системы на уровни (или блоки, или модули). На высших уровнях иерархии ·используются наименее детализованные представления, отражающие только самые общие черты и осо бенности проектируемой системы. На следующих уровнях степень подробности возрастает, при этом система рассматривается не в целом, а отдельными бло ками. В теории САПР такой подход называется блочно-иерархическим (БИП) [Норен !(ОВ, 1983; Петров, 199 1 ]. Одно из преимуществ БИП состоит в том, что сложная задача большой размерности разбивается на после,цовательно решаемые группы задач малой размерности. На каждом уровне вводятся свои представления о системе и элементах. Элемент к-го уровня является системой для уровня к- 1 . Продвижение от уровня к уров ню имеет строгую направленность, определяемую стратегией проектирования сверху вниз или снизу вверх. Глава з. 92 • Те о рети ческие аспекты инже н е р ии зна н ий Предлагаемый.ниже объектно-структурный подход позволяет объединить две, обычно . противопоставляемые, стратегии проектирования - нисходящую или дедуктивную STRtd (top-down) с последовательной декомпозицией объектов и процессов сверху вниз и восходящую или индуктивную STRbu (bottom-up) с по степенным обобщением понятий и увеличением степени абстрактности описа ний снизу вверх. Синтез этих стратегий, а также включение возможности итеративных возвратов на предыдущие уровни обобщений позволили создать дуальную концепцию, пре доставляющую аналитику широкую палитру возможностей на стадии стру1,тури рования знаний как для формирования концептуальной структуры предметной области Sk , так и для функциональной структуры S rРисунок 3. 1 5. иллюстрирует дуальную концепцию при проектировании S k для ЭС помощи оператору энергетического блока, U1 процесс Запуск rенератора р 23_1 1 U2 части процесса uз режим работы u:: U4 фун к циональ ные состав ляющие :s: us блоки U6 действия оператора Рис. з. 1 5 . Дуальная стратеги я п роектирован и я и о а ия з нан и й 3. 4. Те оре ти ч еские аспекты структур р в н 93 Нисходящая концепция (top-down) декларирует движение от n ⇒ n+ l , где n - n-й уровень иерархии понятий ПО (предметной области) с последующей дет�иза цией понятий, принадлежащим соответствующим уровням. 1 п+ 1 STR td : рjп ⇒ pn+ 1 , •• , рki } где n � номер уровня порождающего концепта; i - номер порождающего концепта; k; - число порождаемых концептов, сумма всех k, по i составляет общее число концептов на уровне n+ 1 . Восходящая концепция (bottoш-up) предписывает движение n ⇒ n-1 с последова тельным обобщением понятий. STRbu .• Р"t , •• , Р,пki ⇒ рiп-1 , где n - номер уровня порождающих концептов; i - номер порождаемого концепта; k; -- число порождающих концептов, сумма всех k, по i составляет общее число концептов на уровне n. Основанием для прекращения агрегирования и дезагре гирования является пол ное использование словаря терминов, которым пользуется эксперт, при этом чис ло уро в ней является значимым фактором успешности структурирования ( см. «вербальные отчеты�, в главе 4). 3 . 4 . З . Тр адици о нн ы е м етодологии стр уктури ров а н и я Существующие подходы к проектированию сложных систем можно разделить на два больших класса: • Структурный (системный) подход или анализ, основанный на идее алгорит мической декомпозиции, где каждый модуль системы выполняет один из важ нейших этапов общего процесса. • Обьектный подход, связанный с декомпозицией и выделением не процессов, а объектов, при этом каждый объект расс�атривается как экземпляр определен ного класса. В структурном анализе [Yourdon, 1989; DeMarco, 1 979; Gane & Sarson, 1979] раз работано большое число выразительных средств для проектирования, в том чис ле графических [Буч, 1 993]: диаграммы потоков данных ( DFD ...:.... data-flow diag rams), структурированные словари (тезаурусы), языки спецификации систем, · таблицы решений, стрелочные диаграммы « объект-связь�, ( E RD - entity-rela tionship diagraшs), диаграммы переходов (состояний) , деревья целей, блок-схе мы алгоритмов (в нотации Насси-Шнейдермана, Гамильтона-Зельдина, Фест ля и др.), средства управления проектом ( РЕRТ-диаграммьr, J,J.Иаграммы Ганта и др.), модели окружения. 94 Глава 3 • Тео ретические аспекты инжене ри и з нани й Множественность средств и их некоторая избыточность объясняются тем, что каждая . предметная область, используя структурный подход как универсальное средство моделирования, вводила свою терминологию, наиболее подходящую для отражения специфики �fонкретной проблемы. Поскольку инженерия знаний имеет дело с широким классом ПО (это «мягкие• ПО), встает задача разработки достаточно универсального языка структурирования. Объектный (объектно-ориентированный) подход (ООП), возникший как техно логия программирования больших программных продуктов, основан на следую щих основных элементарных понятиях [ Буч, 1992): объекты, классы как объекты, связанные общностью структуры и свойств, и классификации как средства упо рядочения знаний; иерархии с наследованием свойств; инкапсуляции как сред ства ограничения доступа; методы и полиморфизм для определения функций и отношений. ООП имеет свою систему условных обозначений и предлагает богатый набор логически х и физических моделей для проектирования систем высокой степени сложности, при этом эти системы хорошо структурированы, что порождает лег кость их модификации. Впервые принцип ООП установлен в 1 979 Uones, 1979), а затем развит в работах [Shaw, 1984; Peterson, 1987; Буч, 1992]. Широкое распространение объектно-ориентированных языков программирова ния С++, CLOS, Smalltalk и др. успешно демонстрирует жизнеспособность и перспективность этого подхода. 3 . 4 . 4 . О бъектн о -стру ктурн ы й п одход ' (О СП} Можно предложить в качестве базисной парадигмы методологии структурного анализа знаний и формирования поля знаний Р, обобщенный обьектно-струк турный подход ( ОСП), последовательно разработанный от математического обо снования до технологии и программной реализации [Гаврилова, 1 995). Основные постулаты этой парадигмы заимствованы из ООП и расширены. 1. Системность (взаимосвязь между понятиями). 2. Абстрагирование (выявление существенных характеристик понятия, кото рые отличают его от других). 3. Иерархия (ранжирование на упорядоченные системы абстракций). 4 . Типизация (выделение классов понятий с частичным наследованием св9йств в подклассах). 5. Модульность (разбиение задачи на подзадачи или «возможнь1е миры•). 6. Наглядность и простота нотации. Использование пятого постулата ОСП в инженерии знаний позволяет строить глобальные БЗ с возможностью выделить локальные задачи с помощью горизон тальных и вертикальных сечений на отдельные модули пространства-описания предметной области. 3. 4. Те оретическ ие ас п екты структурирования знани й 95 Шестой постулат внесен в список последним, но не по значимости. В инженерии знаний формирование Р. традиционно является критической точ1<0й [Гаврилова, Червинская, Яшин, 1 988; Гаврилова, Червинская, 1 992), так каI< создаваемая не формальная модель предметной области должна быть предельно ясной и лако ничной. Традиционно языком инженерии знаний были диаграммы, таблицы и другие графические элементы, способствующие наглядности представлений. Именно поэтому премагаемый в данной работе подход к языку связан с возмож ной 'lшзуализацией процесса проектирования. ОСП позволяет наглядно и компактно отобразить объекты и отношения предмет ной области на основе использования шести постулатов. Объектно-структурный подход подразумевает интегрированное использование сформулированных выше постулатов от первой до последней стадий разработки БЗ интеллектуальных и обучающих систем. На основе ОСП предлагается алго ритм обьектно-структурного анализа ( ОСА) предметной области, позволяюще го оптимизировать ,и упорядочить достаточно размытые процедуры стру1<тури рования знаний. Стратифика ц ия зн а ний Основы ОСА были предложены автором еще в работах [Гаврилова, 1 989; Гаври лова, Красовская, 1 990] и успешно применялись при разработке ЭС МИКРО ЛЮШЕР [Гаврилова, Тишкин, Золотарев, 1 989) и АВЭКС [Гаврилрва, Минко ва, Карапетян, 1992). ОСА подразумевает дезагрегацию ПО, как прав ило , на восемь страт ил и сло ев (табл. 3.1 и 3.2). Таб n и ца 3. 1 . Ст ратиф и кация зна ни й п редметной области s_1 s_2 s_З s_4 s_5 ЗАЧЕ М-зна ни я Стратегнческнi,f а нализ: назначен и е и фун кции с и сте мы Ч Т О-зна н и я Концептуальный анализ: основны е концепты , понятийна я структура ГДЕ-з нания Пространственныi,f а нал и з: окружен и е, обо рудов а н и е, коммуникации ПОЧЕМУ-знани я Каузальный ил и при ч ин но-следстве нный ана11t11э: фо р м и рован и е подс и стемы о бъяснен и й КТО-знан и я КАК-з нания s_6 s_7 КОГДА-знан и я s_8 СКОЛ ЬКО-знан и я Орrаннэацнонныi,f анал и з: коллектив раз работчи ков системы Функцнональныi,f ан ал из: ги потезы и модели п ри нят и я реше н и я Временной а нализ: в ре м енные па рам етр ы и о гран и чен и я Экономнческнi,f а нал и з: ре сур сы , затраты , п риб ыль, окупаемост ь Объектно-структурный анализ подразумева�т разработку и использование мат рицы ОСА (см. табл. 3.2), которая позволяет всю собранную информацию деза грегировать последовательно по слоям-стратам (вертикальный анализ), а затем Глава 3 • Те оретичес кие ас п екты инженерии з наний по уровням - от уровня проблемы до уровня подзадачи ( горизонтальный ана лиз). Или наоборот - сначала по уровням, а потом по стратам. Табn и ца 3 . 2 . Матрица объектно -структурно г о анализа Уровни Страты Уровень области u1 Организационны й анализ s2 Е 21 Стратеrический анал из s 1 l:1 1 Концептуал ь ный анализ Sэ Еэ 1 Пространственны й анал из ss Es 1 Функциональн ы й анал из 54 Временн ой а н ал из se Каузал ь ный ан ал из s 1 Эконом ически й анализ Se .... Sm Уровен ь Уровень проблемы u2 задачи u, l: 12 l: 1 3 Уровень подзадачи 14 Е 14 . ... Un E 1n l:41 Е в1 Е11 Е в1 Eu E m1 E rm При необходимости число страт может быть увеличено. В свою очередь знания каждой страты подвергаются дальнейшему ОСА и декомпозируются на ..состав ляющие где m - номер уровня, n - номер страты, а концептов (понятий) предметной области. Е тп = етп принадлежит множеству К всех е1 " ( 1) Матрица ( 1 ) является матрицей над К . Пусть М (К) - совокупность всех mxn матриц над К. Тогда можно определить клеточную матрицу Е, в которой m - m 1 + ... + mk, n == n 1 + ... + nl, где m и n - целые положительные числа. Е е M m n ( К), и ее можно представить в виде: 3. 4 . Теоретические ас п е кт ы с труктури рования зн а ний Е= 97 (2) Ek l где Eµv Е М, µ (К), µ = 1 , ... ,k; v = 1 , ... ,1. Матрица Е является несимметричной, так как часть клеточных элементов Eµv мо гут подвергаться декомпозиции, а часть представляет некоторые базисные ато марные концепты из К, не подлежащие детализации. Предлагаемый подход предполагает реализацию концепции последовательного генезиса ОСП через ОСА к объектно-структурной разработке (ОСР). 11 Алгорит м ОСА Алгоритм ОСА ( объектно-структурного анализа) предназначен для детального практического структурирования знаний ПО. В основе ОСА заложен алгоритм заполнения ОСА- матрицы Е , Алгоритм содержит последовательность аналити ческих процедур, позволяющих упростить и оптимизировать процесс структури рования. Алгоритм разделяется на две сост,авляющие: • A_I. Глобаль н ый (вертикальный) анализ, включающий разбиение ПО на мето дологические страты (что-знания, как-знания и т. д.) на уровне всей ПО. В ре зультате заполняется первый столбец матрицы (2). • А_П. Анализ страт (горизонтальный), включающий построение многоуров невых структур по отдельным стратам. Число уровней n определяется особен ностями стратифицированных знаний ПО и может существенно отличаться для разных страт. С точки зрения методологии n<З свидетельствует о слабой проработке ПО. Первый уровень соответствует уровню всей ПО (уровень области). Второй уровню проблемы, выделенной для решения. Третий - уровню конкретной ре шаемой задачи. Дальнейшие уровни соответствуют подзадачам, если имеет смысл их выделять. При этом возможно как последовательное применение восходящей (bottoш-up) и нисходящей концепций (top-down), так и их одновременное применение. 1111• Глобальный анализ Технология глобального анализа сводится к разбиению пространства основной задачи структурирования ПО на подзадачи, соответствующие особенностям ПО. Для разрабопш интеллекту<l.!Iь�ых систем существует минимальный набор s-страт, обеспечивающий формирование БЗ. Минимальный набор включает три стратьr: • s3 - формирование концептуальной структуры S k ; • s4 - формирование функциональной структуры Sr; • s 7 - формирование подсистемы объяснений S0 • 98 Глава 3 • Тео рети че ски е аспекты инже нерии зна ний Формирование остальных страт позволяет существенно оптимизировать процесс разработки и избежать многих традиционных ошибок проектирования. Страты s4 и s5 являются дополнительными и формируются в случаях, когда знания предмет ной области существенно зависят от временных и пространственных параметров (системы реального времени, планирование действий роботов и т. п.). Алгоритм А_1 глобального анализа может быть кратко сформулирован следую щим образом: • А_1_1. Собрать все материалы по идентификации задачи и по результатам из влечения знаний. • . А"_1_2. Выбрать набор страт N, подлежащих формированию (Nmin = З). • А_1_3. Отобрать всю информацию по первой выбранной страте (i-1 , где i номер из выбранного набора страт N). • · А_1_4. Повторить шаг А_1_) для i+ 1 для всех выбранных страт до i <= N. • А_1_5. Если часть информации останется неиспользованной, увеличиtь чис ло страт и повторить для новых страт шаг А_1_3; иначе перейти к последова тельной реализации алгоритмов горизонтального анализа страт А_2. Анализ страт Последовательность шагов горизонтального анализа зависит от номера страты, но фактически сводится к реализации дуальной концепции структурирования для решения конкретной подзадачи. Ниже предлагается алгоритм ОСА для одной из обязательных страт s3 (ЧТО-ана лиз), результатом которого является формирование концептуальной структуры предметной области S k . • А_2_3_1 . Из группы информации, соответствующей ЧТО-страте, выбрать все значимые понятия и сформулировать соответствующие концепты. • А_2_3_2. Выявить имеющиеся иерархии и зафиксировать их rрафичес1<и в виде стру1пуры. • А_2_3_3. Детализировать концепты, пользуясь нисходящей концепцией (topdown). • А_2_3_4. Образовать метапонятия по концепции (bottom-up). • А_2_3_5. Исключить повторы, избыточность и синонимию. • А_2_3_6. Обсудить понятия, не вошедшие в структуру S 1, с экспертом 1, пере нести их в другие страты или исключить. • А_2_3_7. Полученный граф или набор графов разделить на уровни и обозна чить - согласно матрице ОСА ( 1 ). Аналогичные алгоритмы разработаны для всех страт и апробированы при разра боТI<е экспертных систем ПРОГОР и АВЭКС. Технологии инженерии знаний о Классифика ция методов пра ктического извлечения знаний о Коммуникативные методы о Текстол огические м етоды о Просте йшие методы структури рования о Состо я ние и пе рспект ивы автом атизированного приобрете ни я зн аний о П римеры методов и систем приобретения зн а ний 4 . 1 . Кла сс и ф ик а ц и я м етодов п р а кт и че с кого и звл е ч е н и я з н ан ий Подробно рассмотрев в главе 3 теоретические аспекты инженерии знаний, мы, однако, в явном виде не определили, каким практическим методом эти знания будут получены. В неявном виде предполагалось, что это некоторое взаимодей ствие инженера по знаниям и эксперта в форме непосредственного живого обще ния. Однако это не 'е динственная форма извлечения знаний, хотя и довольно рас ..: пространенная. В работах [ Волков, Ломнев, 1 989; Осипов, 1998; Boose, 1 989; Cullen, Bryman, 1 988; Gammack, Young, 1 985; Hart 1 986) упоминается около 1 5 ручных (неавтоматизированных) методов извлечения и более 2 0 автоматизиро ванных методов приобретения и формирования знаний. Рисунок 4. 1 иллюстрирует предлагаемую классификацию методов извлечения знаний, в которой используются наиболее употребительные термины, что позво лит инженерам по знаниям в зависимости от конкретной задачи и ситуации выб рать подходящий метод. Из предложенной схемы классификации видно, что основной принцип деления связан с источником знаний. Глава 4 • Техноло гии инженери и зн а ний 1 00 Извлечение знаний Коммуникетивные методы Текстологические методы Активные Пассивные Н аблюдение Протокол «мыслей вслух» Лекции Групповые «Мозговой штурм» Кругл ый стол Ролевые игры Индивидуальные Анкетировани<'! Интервью Анализ учебников Анелиз литературы Анализ документов Диалог Экспертные игры Рис. 4. 1 . Классификвция методов извлечения знаний Коммуникативные методы извлечения знаний охватывают метод1>1 и про цедуры контак тов и нженера по знаниям с непосредствен ным источником знаний - эксп е ртом , а тек стологические включают методы извлечен и я знаний и з документов (методик, пособий , руководств) и специал ьной литер атуры (стетей , монографий, учебников) . Раздел е н ие эти х групп методов на в ерхнем уровне класси ф икац ии н е означ ает их антагонистичности, обычно и нже нер по знан ия м ко мб и нирует разл ичны е мето ды, напри мер с начала изучает литературу, затем беседует с экспертам и , ил и на оборот. В с вою оче р едь, ко ммуникати вные методы м ожно такж е разде лить на дв е груп пы: активные и пасс и вные . Пассивн ые м етоды подразуме в ают , что в еду щая р оль в про цедур е извл ече н ия как бы пе редается эк сперту, а и н же не р по зн а н ия м толь ко протокол и рует р ассужде н и я эк сперта во вр емя его р е ал ьной работы по п р иня тию ре ш е ний или зап и сыв ает то, ч т о э к спе рт сч итает нужн ым самост оя тельно р асс казать в фо рме л ек ции . В активных методах, напротив , и н и ц иатива п ол нос тью в рук ах и нже не ра по з нан ия м, котор ый активно контакт ирует с экспертом р азли ч ным и спо собам и - в игр ах , диал огах, беседах з а кру глы м с толом и т . д. Следует е ще р аз подче ркнуть, что и акти в ные и пасси вн ы е методы могут ч ередо в аться даже в р амках одно го сеанса извл еч е ния знан ий. Н ап ри мер , если и нже не р по зн ания м засте нчив и не имеет большо го опы та, то вначал е он может и спол ьзо в ать пасс и вные метод ы , а по степе нно, ближе зн акомя сь с экспертом , зах в атыв ать ин и циати ву и пер еходить «в н ас тупл е н и е ». 4 . 1 . Кл ассифика ция методов п ра ктиче ско го и з вле ч ения зн аний 101 Пассивные методы на первый взгляд достаточно просты, но н а самом деле требу ют от инженера по знаниям умения четко анализировать поток сознания эксперта и выявлять в нем значимые фрагменты знаний. Отсутствие обратной связи (пас сивность инженера по знаниям) значительно ослабляет эффективность этих ме тодов, чем и объясняется их обычно вспомогательная роль при активных методах. Активные методы можно разделить на две группы в зависимости от числа экс пертов, отдающих свои знания. Если их число больше одного, то целесообразно помимо серии индивидуальных контактов с каждым применять и методы груп повых обсуждений предметной области. Такие групповые методы обычно акти визируют мышление участников дискуссий и позволяют выявлять весьма не тривиальные аспекты их знаний. В свою очередь, индивидуальные методы на сегодняшний день остаются ведущими, поскольку столь деликатная процедура, как «отъем знаний�,,, не терпит лишних свидетелей. Отдельно следует сказать об играх. Игровые методы сейчас широко используются в социологии, экономике, менеджменте, педагогике для подготовки руководите лей, учителей, врачей и других специалистов. Игра - это особая форма деятель ности и творчества, где человек раскрепощается и чувствует себя намного свобод нее, чем в обычной трудовой деятельности. На выбор метода влияют три фактора: личностные особенности инженера по зна ниям, личностные особенности эксперта и характеристика предметной области. Одна из возможных классификаций людей по психологическим характеристи кам [Обозов, 1 986] делит всех на три типа: • мыслитель (познавательный тип); • собеседник ( эмоционально-коммуникативный тип); • практик (практический тип). Мыслители ориентированы на и нтеллектуальную работу, учебу, теоретические обобщения и обладают такими характеристиками когнитивного стиля, как поле независимость и рефлексивность (см. параграф 3.3). Собеседники - это общи тельные, открытые люди, готовые к сотрудничеству. Практики предпочитают действие разговорам, хорошо реализуют замыслы других, направлены на ре зультативность работы. Для характеристики предметных областей можно предложить следующую клас сификацию: • хорошо документированные; • средне документированные; • слабо документированные. Эта классификация связана с соотношением двух видов знаний Z 1 и Z2, введен ных в п. 1 .3, где Z 1 - это экспертное «личное�,, знание, а Z 2 - материализованное в книгах «общее�,, знание в данной конкретной области. Если представить знания z no предметной области как объединение I и 2• то есть z no = Z 1 E Z 2 , то рис. 4.2 на глядно иллюстрирует предложенную классификацию. z z Гл ава 4 • Технологии инженерии з н а н и й 1 02 Предметные области Хорошо документированные Средне документированные Слабо документи рованные Рис. 4.2. Классификация предметных облестей Кроме этого, предметные области можно разделить по критерию структуриро ванности знаний. Под структурированностью будем понимать степень теорети ческого осмысления и выявленности основных закономерностей и принципов, действующих в данной предметной области. И хотя ЭС традиционно применя ются в слабо структурированных предметных областях, сейчас наблюдается тен денция расширения сферы внедрения экспертных систем. По степени структурированности знаний предметные области могут быть: • хорошо структурированными - с четкой аксиоматизацией, широким приме нением математического аппарата, устоявшейся терминологией; • средне структурированными - с определившейся терминологией, развиваю щейся теорией, явными взаимосвязями между явлениями; • слабо структурированн�u - с размытыми опре]!:елениями, богатой эмпирикой, скрытыми взаимосвязями, с большим количеством «белых пятен�>. Введенные в данном параграфе классификации методов и предметных областей помогут инженеру по знаниям, четко о пределив свою предметную область, соот нести ее с предложенными типами и наметить подходящий метод или группу ме тодов извлечения знаний. Однако, скорее всего, реальная работа полностью зачеркнет его выбор, и окажется, что его хорошо документированная область яв ляется слабо документированной, а метод наблюдений надо срочно заменят.!;, иг рами ! Такова реальная сложность процедуры извлечения знаний. 4 . 2 . Коммуникативные методы В соответствии с классификацией, представленной на рис. 4. 1 , рассмотрим под робнее обе разновидности коммуникативных методов: пассивные и активные. 4 . 2 . 1 . Пассивные методы Термин «пассивные» не должен вызывать иллюзий, поскольку он введен как про тивовес к «активным» методам. В реальности же пассивные методы требуют от инженера по знаниям не меньшей отдачи, чем такие активные методы, как игры и диалог. 4. 2. Ко м мун икатив ны е м етоды 1 03 пассивные методы извлечения знаний,вкnючают rакие методы, где в едущая роль в про цедуре извлечения фактически передается эксперту, а инженер по знаниям только фик сирует рассуждения эксперта во время работы по принятию решений. Согласно �лассификации (см. рис. 4. 1) к этой группе отtюсятся : • наблюдения; • анализ протоколов •мыслей вслух•; • лекции. Наблюдения В процессе наблюдений инженер _по знаниям находится непосредственно рядом с экспертом во время его профессиональной деятельности или имитации этой дея тельности. При подготовке к сеансу извлечения эксперту необходимо объяснить цель наблюдений и попросить максимально комментировать свои действия. Во время сеанса аналитик записывает все действия эксперта, его реплики и объяснения. Может быть сделана и видеозапись в реальном масштабе времени. Непременное условие этого метода - невмешательство аналитика в работу экс· перта хотя бы на первых порах. Именно метод наблюдений является единствен но счистым• методом, ИС}<Лючающим вмешательство инженера по знаниям и на вязывание им каких-то своих структур представлений. Существуют две основные разновидности проведения наблюдений: • наблюдение за реальным процессом; • наблюдение за имитацией процесса. Обычно используются обе разновидности. Сначала и нженеру по знаниям по лезно наблюдать за реальным процессом, чтобы глубже понять предметную об ласть и отметить все внешние особенности процесса принятия решения. Это не, обходимо для проектирования эффе�тивноrо интерфейса пользователя. Ведь будущая ЭС должна работать именно в контексте такого· реального производ ственного процесса. Кроме того, только наблюдение позволит аналитику уви деть предметную область, а, как известно, случше один раз увидеть, чем сто раз услышать•. Наблюдение за имитацией процесса проводят обычно также за р�бочим местом эксперта, но сам процесс деятельности запускается специально для аналитика. Преимущество этой разновидности в том, что эксперт менее напряжен, чем в пер• вом варианте, когда о н р аботает на •два фронта• - и ведет профессиональную деятельность, и демонстрирует ее. Недостаток совпадает с преимуществом именно меньшая напряженность эксперта может повлиять на результат - раз ра бота ненастоящая, то и решение может отличаться от настоящего. Наблюдения за имитацией проводят также и в тех случаях, когда наблюдения за реальным процессом по каким-либо причинам невозможны (например, профес сиональная этика врача-психиатра может не допускать присутствия посторонне го на приеме). 1 04 Глава 4 • Те хн ологии инженер и и з нан и й Сеансы наблюдщшй могут потребовать от инженера по знапиям: • овладения техникой стенографии для фиксации действий эксперта в реаль ном масштабе времени; • ознакомления с методиками хронометража для четкого структурирования производственного процесса по времени; • развития навыков счтения по глазам•, то есть наблюдательности к жестам, ми мике и другим невербальным компонентам общения; • серьезного предварительного знакомства с предметной областью, так как из-за отсут�твия собратной связи• иногда многое непонятно в действиях экспертов. Протоколы наблюдений после сеансов в ходе домашней работы тщательно рас шифровываются, а затем обсуждаются с экспертом. Таким образом, наблюдения - один из наиболее распространенных методов из влечения знаний на начальных этапах разработки. Обычно он применяется не самостоятельно, а в совокупности с другими методами. Ан ал из протоколов «мы слей вслух » Протоколирование смыслей всдух• отличается от наблюдений тем, что эксперта просят не просто прокомментировать свои действия и решения, но и объяснить, как это решение было найдено, то есть продемонстрировать всю цепочку своих 1 рассуждений. Во время рассуждений эксперта все его слова, весь споток сознания• протоколируется инженером по знаниям, при этом полезно отметить даже паузы и междометия. Иногда этот метод называют свербальные отчеты• [Морrо ев, 1988] . Вопрос об и<;пользовании для этой цели магнитофонов и диктофонов является дискуссионным, поскольку магнитофон иногда парализующе действует на экс перта, разрушая атмосферу доверительности, которая может и должна возни кать при непосредственном общении. Основной трудностью при протоколирован ии смыслей вслух• является прин ципиальная сложность для любого человека объяснить, как он думает. При этом существуют экспериментальные \{сихологические доказательств а того факта, что люди не всегда в состоянии достоверно описывать мыслительные процессы. Кроме того, часть знаний, хранящихся в невербальной форме ( например, различ ные процедурные знания типа скак завязывать шнурки• ), вообще слабо корре лируют с их словесным описанием. Автор теории фреймов М. Минский считает, что «только как исключение, а не как правило, человек может объяснить то, что он знает• [ Minsky, 1 98 1 ] . Однако существуют люди, склонные к рефлексии , для которых эта работа является вполне доступной. Следовательно, описанная в па раграфе 3.3. такая характеристика когнитивного стиля, как рефлексивность, яв ляется для эксперта более чем желательной. Расшифровка полученных протоколов производится инженером по знаниям са мостоятельно с коррекциями на следующих сеансах извлечения знаний. Удач но 4. 2 . Коммун и кати в ные методы 1 05 проведенное протоколирование •мыслей вслух• .является одним из наиболее эф� фективных методов извлечения, поскольку в нем эксперт может проявить себя максимально ярко, он ничем не скован, никто ему не мешает, он как бБ1 свободно парит в потоке собственных умозаключений и рассуждений. Он может здесь блеснуть эрудицией, продемонстрировать глубину своих познаний. Для большо го числа экспертов это самый приятный и лестный способ извлечения знаний. От инженера по знаниям метод •мысли вслух• требует тех же умений, что и метод наблюдений. Обычно •мысли вслух• дополняются потом одним из активных ме тодов для реализации обратной связи между интерпретацией инженера по знани ям и представлениями эксперта. Лекци и Лекция является самым старым способом передачи знаний. Лекторское искусст во издревле очень высоко ценилось во всех , областях науки и культуры. Но нас сейчас интересует не столько способность к подготовке и чтению лекций, сколь ко способность эту лекцию слушать, конспектировать и усваивать. Уже говори- , лось, что чаще всего экспертов не выбирают, и поэтому учить эксперта чтению лекции инженер по знаниям не сможет. Но если эксперт имеет опыт преподава теля (например, профессор КЛИJIИКИ или опытный руководитель производства), то можно воспользоваться таким концентрированным фрагментом знаний, как лекция. В лекции эксперту также предоставлено много степеней свободы для са мовыражения; при этом необходимо сформулировать эксперту тему и задачу лекции. Например, тема цикла лекций • Постановка диагноза - воспаление лег ких»- , тема конкретной лекции •Рассуждения по анализу рентгенограмм• , зада ча - научить слушателей по перечисленным экспертом признакам ставить диаг ноз воспаления легких и делать прогноз. При такой постановке опытный лектор может заранее структурировать свои знания и ход рассуждений. От инженера по знаниям в этой ситуации требуется лишь грамотно законспектировать лекцию и в конце задать необходимые вопросы. Студенты хорошо знают, что конспекты лекций одного и того же лектора у раз ных студентов сущест�нно отличаются. Списать конспект лекций просят, как правило, у одного-двух студентов из группы. Люди, умело ведущие конспект, обычно сильные студенты. Обратное не верно. В чем же заключается искусство ведения конспекта? В •помехоустойчивости•. Записывать главное, опускать вто ростепенное, выделять фрагменты знаний (параграфы, под-параграфы), записы вать только осмысленные предложения, умет ь обобщать. Хороший вопрос по ходу лекции помогает и лектору и слушателю. Серьезные и глубокие вопросы могут существенно поднять авторитет инженера по знаниям в глазах эксперта. Опытный лектор знает, что все вопросы можно условно разбить на три группы: • умные вопросы, углубляющие лекцию; • глупые вопросы или·вопросы не по существу; • вопросы •на засыпку• или провокационные. 1 06 Гл а ва 4 • Техно л огии инжене р ии зна н и й Если инженер по знаниям задает воп р осы второго типа, то ·возможны две реак ции. Вежливый эксперт будет разговаривать с таким аналитиком как с ребенком, который сейчас не понимает и все равно ничего уже не поймет. Заносчивый экс перт просто выйдет из контакта, не желая терять время. Если же инженер по зна ниям захочет продемонстрировать свою эрудицию вопросами третьего типа, то ничего, кроме раздражения и отчуждения, он, по-видимому, в ответ не получит. Продолжительность лекции рекомендуется стандартная - от 40 до 50 минут и через 5 - 10 минут - еще столько же. Курс обычно от двух до пяти лекций. Метод извлечения знаний в форме лекций, как и все пассивные Методы, использу ют в начале разработки как эффектюшый способ быстрого погружения инженера по знаниям в предметную область. В заключе:�,ш е несколько советов, как слушать лекции [ Ребельский, 1989]. 1 . К лекции подготовьтесь, то есть познакомьтесь с предметной областью. 2. Слушайте с максимальным вниманием, для этого: устраните мешающие фак торы ( скрип двери, шорохи и т. д. ); удобно устройтесь; поменьше двигайтесь. 3. Учитесь отдыхать во время слушания (например, когда лектор приводит циф ры, которые можно взять из справочника). 4. Слушайте одновременно и лектора, и самого себя (параллельно с мыслями лек тора по ассоциации возникают собственные мысли). 5. Слушайте и одновременно записывайте, но записывайте текст сокращенно, ис пользуя условные значки (для этого вовсеяе следует непременно быть стено графом, достаточно толы<о установить для себя ряд условных значков и ими неизменно пользоваться). 6. Расшифруйте записи лекции в тот же день. 7. Не спорьте с лектором в процессе лекции. 8. Рационально используйте перерывы в лекции для подведения итогов прослу шанного. Сравнительные характеристики пассивных методов извлечения знаний пред ставлены в табл: 4. 1 . Таблица 4 . 1 . Сравнительн ые характери стики пассивных методов извлечения знаний Пассивный метод извлечения знаний Наблюдения •М ысли вспух» Л екции Достоинства Отсутствие вл и яния аналитика и его субъективной позици и Максимальное пр и ближение анал итика к предметно й о бласти Свобода самовыражен и я дл я эксперта Свобода самовыражен и я для эксперта Обнаже нность структур рiiссуждени й Структур и рованное изложение. В ысокая концентрация 1 07 4.2. Ко ммуникативные методы ПассивныА метод и авпечения ананиА Недостатки Требования к аксnерту (ТИПЫ и основные качестаа) Требования к аксnерту (тип ы и основные качества) Характеристика предметно А обпа сти Набп�одени• Отсутствие обратной связи Фрагментарность полученных комментариев Собеседник или мыслитель (с пособность к ве рбализации + мысл ей + аналитичность + открытость + рефлексивность) Мыслитель (наблюдательность + nол е н езависимость) Слабо и средне структурированные; слабо и средне документированные ..Мыоп и вспух,. Лекци и Отсутствие влияния аналитика и его субъективной позиции Отсутствие обратной связи Возможность ухода «в сторону• в рассуждениях эксперта Отсутстви е влияния аналитика и его субъективной Собеседник или мыслитель . (способность к ве рбализации + мыслей + аналитичность + открытость + рефлексивность) Мыслитель или собеседник ( контактность + nопенеэависимость) То же ПОЗИЦИИ «Зашумленность» деталями Слабая обратная связь Недостаток хо роших л е кторов среди экспертовпрактиков Мыслитель (лекторски е способности ) Мыслитель ( поленезависимость + способность к обобщению) Слабо документи рованны е и слабо ст руктурированны е 4 . 2.2 . Актив ные индивидуальные методы Активные и ндивидуальны е м етоды извлече ния з нан и й на се годняш ний де нь наиболее распространен ны е . В той ил и и ной с тепе ни к н и м приб егают пр и раз работ1с е практич ес ки любой ЭС. К ос новным акт и вным методам можно отнест и : • анкет и рован и е ; • и нте рвью; • с вободн ый диалог; • игры с э кспертом. Во в сех этих методах активную функци ю выполня ет инже не р по знаниям, кото рый пи шет с це нари й и режиссирует сеансы извле ч е н ия знаний . И гры с э кспе ртом ' 1 08 Глава 4 • Техноло гии ин же н ер ии з нан и й существенно отличаются от трех других методов. Три оставшихся метода очень схожи между собой и отличаются лишь по степени свободы, которую может себе позволить инженер по знаниям при прове�нии сеансов извлечения знаний. Их можно назвать вопросными методами поиска знаний. Анкетирование Анкетирование - наиболее жесткий метод, то есть наиболее стандартизирован ный. В этом случае инженер по знаниям заранее составляет вопросник или анrсе ту, размножает ее и использует для опроса нескольких экспертов. Это основное преимущество анкетирования. Сама процедура может проводиться двумя способами: 1 . Аналитик вслух задает вопросы и сам заполняет анкету по ответам эксперта. 2. Эксперт самостоятельно заполняет анкету после предварительного инстру1стирования. Выбор способа зависит от конкретных условий (например, от оформления анке ты, ее понятности, готовности эксперта). Второй способ нам кажется предпочти тельнее, так как у эксперта появляется неограниченное время на обдумывание ответов. Если вспомнить схему общения, представленную ца рис. 3.8, то основными фак торами, на которые можно существенно повлиять при анкетировании, являются средства общения (в данном случае это вопросник) и ситуация общения. Вопросник (анкета) заслуживает особого разговора. Существует несколько об щих рекомендаций при составлении анкет. Эти рекомендации являются универ сальными, то есть не зависят от предметной области. Наибольший опыт работы с анкетами накоплен в социологии и психологии, поэтому часть рекомендаций за имствована из [Ноэль, 1 978; Погосян, 1985). • Анкета не должна быть монотонной и однообразной, то есть вызывать скуку или усталость. Это достигается вариациями формы вопросов, сменой темати ки, вставкой вопросов-шуток и игровых вопросов. • Анкета должна быть приспособлена к языку экспертов ( см. п. 3.3). • Следует учитывать, что вопросы влияют друг на друга и поэтому последова тельность вопросов должна быть строго продумана. • Желательно стремиться к оптимальной избыточности. Известно, что в анкете всегда много лишних вопросов, часть из них необходима - это так называемые контрольные вопросы ( см. о них ниже), а другая часть должна быть минимизи рована. П р им ер 4 . 1 Лишн и е в опросы п оявляются, нап ри м ер, в таких с итуациях. Фрагмент анкеты: •В 12. Считаете ли вы, что лечения анzины эффеюпивнет эритромицин ?• •В 13. Какие дозы эритро,wицина вы обычно рекомендуете?• 4.2. Ко ммун и кати в ные методы 1 09 При отрицательном ответе на 1 2-й вопрос 1 3-й является лишним. Его можно избежать, усложнив вопрос. «В 12. Применяете ли вы эритромицин для лече11ия ашины и если да, то в каких дозах?» • Анкета должна иметь «хорошие манеры;., то есть ее язык должен быть ясным, понятным, предельно вежливым. Методическим мастерством составления ан кеты можно овладеть только на практике. И н тервь ю Под интервью будем понимать специфическую форму общения инженера по зна ниям и эксперта, в которой инженер по знаниям задает эксперту серию заранее подготовленных вопросов с целью извлечения знаний о предметной области. Наибольший опыт в проведении интервью накоплен, наверное, в журналистике и социологии. Большинство специалистов этих областей отмечают тем не менее крайнюю недостаточность теоретических и методических исследований по тема тике интервьюирования [ Ноэль, 1 978; Шумилина, 1 973]. Интервью очень близко тому способу анкетирования, когда аналитик сам запол няет анкету, занося туда ответы эксперта. Основное отличие интервью в том, что оно позволяет аналитику опускать ряд вопросов в зависимости от ситуации, вставлять новые вопросы в анкету, изменять темп, разнообразить ситуацию об щения. Кроме этого, у аналитика появляется возможность «взять в плен;. экспер та своим обаянием, заинтересовать его самой процедурой и тем самым увеличить эффективность сеанса извлечения. В опросы для инте рвью Теперь несколько подробнее о центральном звене активных индивидуальных ме тодов - о вопросах. Инженеры по знаниям редко сомневаются в своей способно сти задавать вопросы. В то время как и в философии и в математике эта проблема обсуждается с давних лет. Существует даже специальная ветвь математической логики - эротетическая логика (логика вопросов). Есть интересная работа Бел напа «Логика вопросов и ответов�,, [ Белнап, Стил, 1 98 1 ], но, к сожалению, исполь зовать результаты, полученные логиками, непосредственно при разработке ин теллектуальных систем не удается. Все вопросительные предложения можно разбить на два типа [Сергеев, Соколов, 1 986]: • вопросы с неопределенностью, относящейся ко всему предложению ( «Дей ствительно, введение больших доз антибиотиков может вызвать анафилакти ческий шок?); • вопросы с неполной информацией ( « При каких условиях необходимо включать кнопку?�>), часто начинающиеся со слов «кто,> , что�>, « где�,,, «когда�> и т. д. Это разделение можно дополнить классификацией, частично описанной в работе [ Шумилина, 1973] и представленной на рис. 4.3. 1 10 Глава 4 • Технологии инженер ии гнаний Вопросы По функции По форме По воздействию Открытые Закрытые Личные Безличные Прямые Основные Н ейтральные Зондирующие Н а в одящие Контрольные Косвенные Вербальные С исп ользованием наглядного материала Рис. 4.3. Классификация вопросов Открытый вопрос называет тему или предмет, оставляя полную свободу экспер ту по форме и содержанию ответа ( «Не могли бы вы рассказать, как лучше сбить высокую температуру у больного с воспалением легких? ►). В закрытом вопросе эксперт выбирает ответ из набора предложенных («Укажи те, пожалуйста, что вы рекомендуете при ангине: а) антибиотики, б) полоскание, в) компрессы, г) ингаляции�>). Закрытые вопросы легче обрабатывать при после дующем анализе, но они более опасны, так как «закрывают�> ход рассуждений эк сперта и «программируюн его ответ в определенном направлении. При состав лении сценария интервью полезно чередовать открытые и закрытые вопросы, особенно тщательно продумывать закрытые, поскольку для их составления тре буется определенная эрудиция в предметной области. Ли-чиый вопрос касается непосредственно личного индивидуального опыта экс перта ( « Скажите, пожалуйста, Иван Данилович, в вашей практике вы применяете вулнузан при фурункулезах? ► ). Личные вопросы обычно активизируют мышле ние эксперта, «играют�> на его самолюбии, они всегда украшают интервью. Безли-чиый вопрос направлен на выявление наиболее распространенных и обще принятых закономерностей предметной области ( «Что влияет на скорость про цесса ферментации лизина? ► ) . При составлении вопросов следует учитывать, что языковые способности экс перта, как правило, ограничены и вследствие скованности, замкнутости, робости 4.-2 . Коммуни кативн ые методы 11 1 он не может сразу высказать свое мнение и предоставить знания, которые от него требуются (даже если предположить, что он их четко для себя формулирует). Поэтому часто при «зажатости• эксперта используют не прямые вопросы, кото рые непосредственно указывают на предмет или тему ( «Как вы относитесь к ме тодИI,е доктора Сухарева?•), а косвенные, которые лишь косвенно у1<азывают на интересующий предмет ( « Применяете ли вы методику доктора Сухарева? О пи шите, пожалуйста, результаты лечения•). И ногда приходится задавать нес1,оль ко десятков косвенных вопросов вместо одного прямого. Вербш�ьные вопросы - это традиционные устные вопросы. Вопросы с использо ванием наглядного материш�а разнообразят интервью и снижают утомляемость эксперта. В этих вопросах используют фотографии, рисунки и карточки. Напри мер, эксперту предлагаются цветные картонные карточки, на которых выписаны признаки заболевания. Затем аналитик просит разложить эти карточки в поряд ке убывания значимости для постановки диагноза. Деление вопросов по функции на основные, зондирующие, контрольные связано с тем, что часто основные вопросы интервью, направленные на выявление знаний, · не срабатывают - эксперт по каким-то причинам уходит в сторону от вопроса, отвечает нечетко. Тогда аналитик _ использует зондирующие вопросы, которые направляют рассуж дения эксперта в нужную сторону. Например, если не сработал основной вопрос: «Какие параметры определяют момент окончания процесса ферментации лизи на?• - аналитик начинает задавать зондирующие вопросы: «Всегда ли процесс ферментации длится 72 часа? А если он заканчивается раньше, как это узнать? Если он продлится больше, то что заставит микробиолога не закончить процесс на 72-м часу? • и т. д. Контрольные вопросы применяют для проверки достоверности и объективности информации, полученной в интервью ранее ( «Скажите, пожалуйста, а мос1,ов ская школа психологов так же как вы трактует Uil(aлy К опросника M MPI?• или сРе!(омендуете ли вы инъекции АТФ?• (АТФ - препарат, снятый с производ ства). Контрольные вопросы должны быть схитро• составлены, чтобы не оби деть эксперта недоверием (для этого используют повторение вопросов в другой · форме, уточнения, ссылки на другие источники). •Лучще два· раза спросить, чем один раз напутать• ( Шолом-Алейхем). И наконец, о нейтральных и наводящих вопросах. В принципе интервьюеру • (в нашем случае инженеру по знаниям) рекомендуют быть беспристрастным, от сюда и вопросы его должны носить нейтрш�ьный характер, то есть не должны ука зывать на отношение интервьюера к данной теме. Напротив, наводящие вопросы заставляют респондента (в данном случае эксперта) прислушаться или даже при нять во внимание позицию интервьюера. Нейтральный вопрос: « Совпадают ли симптомы кровоизлияния в мозг и сотрясения мозга?• Наводящий вопрос: «Не правда ли, очень трудно дифференцировать симптомы кровоизлияния в мозг?.• 1 12 Глава 4 • Технологии и нженерии з наний Кроме перечисленных выше, полезно различать и ВКJ,Iючать в интер вью следую щие вопросы [Ноэль, 1 978]: • контаК'Тные ( «ломающие лед• между аналитиком и э1<спертом); • буферные (для разграничения отдельных тем интер вью); • оживляющие память экспертов (для реконструкции отдельных случаев из праI(ТИК и); • •провоцирующие• (для получения спонтанных, неподготовленных ответов). В заключение описания интервью у1<;ажем три основные характеристики вопро сов ( Шумилина, 1 973], которые влияют на качество интервью: • язык воп роса (понятность, лаконичность, терминология); • порядок вопросов (логическая последовательность и немонотонность); • уместность вопросов ( этика, вежливость). Вопрос в инте р вью - это не просто средство общения, но и способ передачи мыс лей и п озиции аналитика. с Вопрос представляет собой форму движения мысли, в нем ярко выражен момент перехода от незнания к знанию, от неполного, неточного знания I< более полному и более точному• [Лимантов, 1 97 1 ] . Отсюда н еобходимость в протоI<олах фикси ровать не только ответы, но и вопросы, предварительно тщательно отрабатывая их форму и содержание. Очевидно, что любой воп рос имеет смысл только в контексте. Поэтому вопросы может готовить инженер по знаниям, уже овладевший ключевым набором зна ний. Вопросы имеют для экспе р та диагностическое значение - несколько откро венных «глупых• вопросов могут полностью разочаровать эксперта и отбить у него охоту к дальнейшему сотрудничеству. Известен ответ Маркса на во прос Прудона: • Вопр ос был до такой степени н е п равильно поставлен, что на него нев озможно было дать правильный отв ет•. С во бодн ы й ди ап оr Свободный диалог - это метод извлечения знаний в форме беседы инжене ра по знаниям и эксп�рта, в которой нет жесткого регламенти рованного плана и во просника. Это определение не означает, что к свободному диалогу не надо го товиться. Напротив, внешне свободная и легкая фо р ма этого метода требует высочайшей профессиональной и психологичес1<0й подготовки. Подготов1<а к свободному диалогу практически может совпадать с предлагаемой в работе [Шу милина, 1 973] подготовкой к журналистскому интер вью. Рисунок 4.4 графичес ки иллюстр и рует схему такой подготовки, дополненную в связи со спецификой инженер ии знаний. Подготовка занимает разное время в зависимости от степени профессионализма аналитика, но в любом случае она необходима , так как не с1<0лько уменьшает вероятность самого нерационального метода - метода проб и ошибок. 113 4 .2. Комм ун икативн ы е м етоды 1 1 1 Общая 1 - Повышение научной эрудиции - Обл адание общей культурой - 1 1 Специальная \ - 1 Подrотовка Оаладение теорией и навыками интервьюирования 1 Конкретная - Изучение предметной области по литературе - Подrотовка ситуации общения н Знакомство с системной методологией , 1 1 Психолоrическая 1 - Знакомство с теорией общения - Изучение когнитивной nсихолоrии Знакомство с экспертом ц Тестирование эксперта · Рис. 4.4. Подготовка к и з влечению знаний Квалифицированная подготовка к диалогу помогает аналитику стать истинным драматургом или сценаристом будущих сеансов, то есть запланировать гладкое течение процедуры извлечения: от приятного впечатления в начале беседы пере ход к профессиональному контакту через пробуждение интереса и завоевание доверия эксперта. При этом для обеспечения желания эксперта продолжить бе седу необходимо проводить •поглаживания» (терминология Э. Берна [Берн, 1 988]), то есть подбадривать эксперта и подтверждать всячески его уверенность в собственной 1,омпетентности (фразы-вставки: •Я вас понимаю... •, .... это очень интересно» и т. д.). Так, в одном из исследований по технике ведения профессиональных журналист ских ди<1:7юго� [Matarozzo, Wettman, Weins, 1 963] было экспериментально дока зано, что одобрительное и поощрительное •хмыканье» интервьюера увеличива ет длину ответов респондента. При этом одобрение должно быть искренним, как ·показал опрос интервьюеров Института демоскопии Германии: «Лучшая улов1,а - это избегать вся1,их уловок: относиться к опрашиваемому с истинным чело веколюбием, не с наигранным, а с подлинным интересом• [ Ноэль, 1 978] . Чтобы разговорить собеседника, можно сначала аналитику рассказать о себе, о работе, то есть поговорить самому. Мы уже писали о профессиональной пригодности инженеров по знаниям и необ ходимости предварительного психологического тестирования при подготовке инженеров по знаниям. Здесь только приведем каталог свойств идеального ин тервьюера [Ноэль, 1 978] . На наш взгляд, это в полне подходящий образец порт рета инженера по знаниям перед серией свободных диалогов: •Он должен вы глядеть здоровым, спокойным, уверенным, внушать доверие, быть искренним, веселым, проявлять интерес к беседе, быть опрятно одетым, ухоженным•. Хоро- 1 14 Глава 4 • Техн ологии инже нf1) р ИИ зн аний ший ан� итик . м�жет личным обаядием, и .умени��. ск� щть и;зъяны подготовк�. Блестящая кр'аткая характеристика интервьюера приведена в той же JЩботе • общи тельный педа н т � . В свободном диалоге важно также выбрать правильный темп или ритм беседы: без больших пауз, так как эксперт может отвлечься, но и без гонки, иначе быстро утомляются оба участника и нарастает напряженность, кроме того, некоторые люди говорят и думают очень медленно. Умение чередовать разные темпы, на пряжение и разрядку в беседе существенно влияет на результат. Подготовка к диалогу так же, как и к другим активным методам извлечения зна ний, включает составление плана проведения сеанса извлечения, в котором необ. ходимо предусмотреть следующие стадии: 1. Начало беседы (знакомство, создание у эксперта «образа>> аналитика, объяс нение целей и задач работы). 2. Диалог по извлечению знаний. 3. Заключительная стадия (благодарность эксперту, подведение итогов, договор о последующих встречах). Девизом для инженера по знаниям могут послужить взгляды одного из классиков отечественного литературоведения М. М. Бахтина [Бахтин, 1975 ] : �Диалог - столкновение разных умов, разных истин, несходных культурных по-· зиций, составляющих единый ум, единую истину, общую культуру•. • д иалог предполагает: • уникальность каждого партнера и их принципиальное равенство друг другу; • различие и оригинальность их точек зрения ; • ориентацию каждого на понимание и на активную интерпретацию его точки зрения партнером ; • ожидание ответа и его предвосхищение в собственном высказывании; • · взаимную дополнительность позиций участников общения, соотнесение кото рых и является целью диалога�. Сравнительные характеристики активных индивидуальных методов извлечения знаний пред ставлены в табл. 4.2. Таблица 4.2. Сравнительные характеристики активных индивидуальных методов извлечения Активный Анкетирование индивидуальный метод извлечения знаний Достоинства Возможность стандартизиро ванного опроса нескольких экспертов Интерв1аю Свободный диалог Наличие обратной связи (возможность уrочнений и разрешения противоречий) для эксперта Гибкость Сильная обратная связь изменения 1 15 4;2. Коммун и ка ти в ные мет оды Активный ' инди видуаn�.ный метод и эаn е ч ения зн ани й Ан кетмрова lfие Свободный диапоr Возможность и з мен ен ия сцен а ри я и ф о р мь1 сеанса Недостатки Не требует особенного напряжения от анал итика во в ремя процедуры а нкетиро вания Требует умения и оnыта соста вления анкет Требо вания к э к с пе рту (Тl!IПЫ кач ества) Требо аания к анап ити ку (тип w и ка ч е ст ва) Характе ри сти ка п редм етн ой области Требует з на ч ител ьного времени на подготовку во п росо в интерв ыо Отсутствие контекста между э кспертом , нет обратной свя з и . Вопросы анкеты моrут быть непра вил ьно поняты экспертом Практик и м ы слитель М ы слител ь (педа нтиз в сосtа влении а нкет, внимател ьность) Собеседник и л и м ы слите л ь С обеседник ( жур налистские навыки, умение сл ушать) То же Сла бо структури р ованные, сл або и средне документированн ые Требует от анал итика высоча йше го напряжения Отсутствие форм ал ьн ы х методик проведени я Трудность протоколировани я резул ьтатов Собеседник или мыслител ь Со беседник ( н абл юдател ьность ум ение слушать, обаяние ) То же 4 . 2 . З . Активные групповые методы К групповым методам извлечения знаний отно�тся ролевые игры, дискуссии за «круглым столом• с участием нескольких экспертов и «мозговые штурмы•. Ос новное достоинство групповых методов - это возможность одновременного «поглощения• знаний от нескольких экспертов, взаимодействие которых вносит в этот процесс элемент принципиальной новизны от наложения разных взглядов и позиций. Поскольку эти методы менее популярны, чем индивидуальные (что связано со сложностью организации), попытаемся описать их подробно. сс Кру rлый сто л » Метод круглого стола (термин заимствован из журналистики) nредусматривает обсуждение какой�либо проблемы из выбранной предметной области, в котором принимают участие с равными правами несколько экспертов. Обычно вначале 1 16 Глава 4 • Техн ологии инженерии знаний участники высказываются в определенном порядке, а затем переходят к живой свободной дискуссии. Число участников дискуссии колеблется от трех до пя ти-семи. Большинство общих рекомендаций по "Извлечению знаний, предложенных ранее, применимо и к данному методу. Однако существует и специфика, связанная с поведением человека в группе. Во-первых; от инженера по знаниям подготовка «круглого стола�,, потребует до полнительных усилий: как организационных (место, время, обстановка, мине ральная вода, чай, кворум и т. д.), так и психологических (умение вставлять уме стные реплики, чувство юмора, память на имена и отчества, способность гасить конфликтные ситуации и т. д. ). Во-вторых, большинство участников будет говорить под воздействием «эффекта фасада>> совсем не то, что они сказали бы в другой обстановке, то есть желание произвести впечатление на других экспертов будет существенно «подсвечивать�,, их высказывания. Этот эффект часто наблюдается на защитах диссертаций. Чле ны ученого совета спрашивают обычно не то, что им действительно интересно, а то, что д�монстрирует их собственную компетентность. Ход бесЕды за круглым столом удобно записывать на магнитофон, а при расшиф ровке и 1нализе результатов учитывать этот эффект, а также взаимные отноше ния участников. Задача дискуссии - коллективно, с разных точек зрения, под разными углами ис следовать спорные гипотезы предметной области. Обычно эмпирические области богаты таким дискуссионным материалом. Для остроты на «круглый стол�,, при глашают представителей разных научных направлений и разных поколений, это также уменьшает опасность получения односторонних однобоких знаний. Обмен мнениями по научным вопросам имеет давнюю традицию в истории чело вечества (античная Греция, Индия). До наших дней дошли литературные памят ники обсуждения спорных вопросов (например, Протагор «Искусство спорить�,,, работы софистов), послужившие первоосновой диалектики - науки вести бесе ду, спорить, развивать теорию. В самом слове дискуссия ( от лат. discussio - иссле дование) содержится указание на то, что это метод научного познания, а не просто споры (для сравнения, полемика - от греч. polemikos - воинственный, враждеб ный). Несколько практических советов по процедурным вопросам «круглого стола�,, из работы [Соколов, 1980]. Перед началом дискуссии ведущему полезно: • убедиться, что все правильно понимают задачу (то есть происходит сеанс извлечения знаний); • установить регламент; • четко сформулировать тему. По ходу дискуссии важно проследить, чтобы слишком эмоциональные· и разговор чивые эксперты не подменили тему и чтобы критика позиций друг друга была обо снованной. Научная плодотворность дискуссий делает этот м�тод привлекательным и для самих экспертов, особенно для тех, кт9 знает меньше. Это заметил еще Эпикур: 4.2. К омму ни кати в н ые методы 1 17 «При философской дискуссии больше выигрывает побежденный - в том отно шении, что он умножает знания,> [Материалисты, 1 955]. Хорошим напутствием для проведения «круглого стола1> служат слова П. Л. Капицы: «Когда в какой либо науке нет противоположных взглядов, нет борьбы, то эта наука идет по пути к кладбищу, она идет хоронить себя,> [Капица, 1 967] . « М озгов о й штурм» Активные групповые методы обычно используются в качестве острой приправы при извлечении знаний, сами по себе они не могут служить источником более или менее полного знания. Их применяют как дополнительные к традиционным ин дивидуальным методам (наблюдения, интервью и т. д.), для активизации мышле ния и поведения экспертов. «Мозговой штурм,> или «мозговая атака>> - один из наиболее распространенных методов раскрепощения и активизации творческого мышления. Другие методы (метод фокальных объектов, синектика, метод контрольных вопросов [Шепотов, Шмаков, Крикун, 1 985]) применяются гораздо реже из-за меньшей эффективно сти. Впервые этот метод был использован в 1 939 г. в США А. Осборном как способ получения новых идей в условиях запрещения критики. Замечено, что боязнь критики мешает творческому мышлению, поэтому основная идея штурма - это отделение процедуры генерирования идей в замкнутой группе специалистов от процесса анализа и оценки высказанных идей. Как правило, штурм длится недолго (около 40 минут). Участникам (до 10 чело век) предлагается высказывать любые идеи (шутливые, фантастические, ошибоч ные) на заданную тему (критика запрещена). Обычно высказывается более 50 идей. Регламент до 2 минут на выступление. Самый интересный момент штур ма - это наступление пика (ажиотажа), когда идеи начинают «фонтанировать,> , то есть происходит непроизвольная генерация гипотез участНИI<ами. Этот пик имеет теоретическое обоснование в работах выдающегося швейцарского психо лога и психиатра 3. Фрейда о бессознательном. П р и последующем анализе всего лишь 1 0- 1 5 % идей ОI<азываются разумными, но среди них бывают весьма ориги нальные. Оценивает результаты об�1чно группа экспертов, не участвовавшая в генерации. Ведущий «мозгового штурма,> - инженер по знаниям - должен свободно вла деть аудиторией, подобрать активную группу экспертов -- «генераторов1>, не за жимать плохие идеи - они могут служить катализаторами хороших. Иекусство ведущего - это искусство задавать вопросы аудитории, «подогревая1> генера цию. Вопросы служат «крючком1> [Шепотов, Шма1<0В, Крикун, 1 985] , которым извлекаются идеи. Вопросы также могут останавливать многословных экспер тов и служить способом развития идей других. Основной девиз штурма - «чем больше идей, тем лучше1>. Фиксация хода сеан са - традиционная (протокол или магнитофон). Достоинства и недостатки активных групповых методов извлечения знаний пред ставлены в табл. 4.3. 118 Глава 4 • Технологии и н же н ерии з нан ий Таблица 4.3. Сравнение активных групповых методов из�л,эчения знаний _ . Активный rрупповой · «Круrпый c:ron• метод иэаnечения знаний Позволяет получить более Достоинства объективные фрагменты знаний Недостатки Требования к эксперту (тип и качестаа) Требования к июкенеру по знаниям (тип и качества) Характеристика предметной области «Мозговой wтурм• Позволяет выявлятьглубинные пласты знаний ( на уровне бессознательного) Ожи вляет процедуру и звлечения Активизирует экспертов Позволяет участникам обмен и ваться знаниям и Требует больших организа ционных затрат Позволяет получать новое знание (гипотезы) Отличается СJ'IОжностью проведен и я Не всегда эффективны (довольно низкий про цент продуктив1::1ых идей) Собеседник или мысл итель (искусство полемики) Собеседн и к (диплома тические способности ) Слабо структури рованные и слабо документированные с наличием спорных проблем Возможен только для новых и нтересных и сследовательских проблем Мыслитель{креативность, то есть способность к творчеству) Собеседн и к или мыслитель (быстрая реак ция и чувство юмора) СЛабо струкrурированные и слабо документирова+1ные с нали чи ем перспе ктивных «белых пятен• Э ксп е рт н ы е игры называют такой вид человеческой деятельности, который отражает ( вос создает) другие ее виды [ Комаров, 1 989]. При этом для игры характерны одно временно условность и серьезность. Игрой Понятие экспертной игры или игры с экспертами в целях извлечения знаний вос ходит к трем источникам - это деловые игры, широко используемые при подго товке специалистов и моделировании [Борисова, Соловьева и др., 1 988; Бурков, 1980; Комаров, 1 989]; диагностические игры, описанные в работах [Алексеевская, Недоступ, 1 988; Гельфанд, Розенфельд, Шифрин, 1 988] , и компьютерные игры, все чаще применяемые в обучении [ Пажитнов, 1 987]. В настоящее время в психолого-педагогических науках нет развитой теоретичес1юй концепции деловых игр и других игровых методов обучения. Тем не менее на практике эти игры широко используются. Под деловой игрой чаще всего понима ют эксперимент, где участникам предлагается производственная ситуация, а они на основе своего жизненного опыта, своих общих и специальных знаний и пред- 1 19 4 .2. Коммуникати в ны е м етоды ставлений принимают решения [Бурков, 1 980]� Решения анализируются, и вскрываются закономерности мышления участников эксперимента. Именно эта анализирующая часть деловой игры полезна для получения знаний. И если уча стниками такой игры становятся эксперты, то игра из деловой превращается в экспертную. Из трех основных типов деловых игр (учебных , планово-производ ственных и исследовательских) к экспертам ближе всего исследовательские, ко торые исnользуются для анализа систем, проверки правил принятия решений. Диагностическая игра - это та же деловая игра1 но применяемая конкретно для диагностики методов принятия решения в медицине (диагностика методов диаг ностики). Эти игры возникли при исследовании способов передачи опыта от опытных врачей новичкам. В нашем понимании диагностическая игра - это игра, безусловно, экспертная без всяких оговорок, только с жестко закрепленной пред метной областью - медициной. Плодотворность моделирования реальных ситуаций в играх подтверждается се годня практически во всех областях науки и техники. Они развивают логическое мышление, умение быстро принимать решения, вызывают интерес у экспертов. В соответствии с классификацией, введенной в п. 4.1 , будем разделять эксперт ные игры на: • индивидуальные� • групповые. Кроме этого (рис. 4.5), продолжим и разовьем эту классификацию введением других критериев: • использование �пециального оборудования; • применение вычислительной техники. 1 Экспертн ы е 1 игры 1 1 По ч исл у участнико в - ' 1 1И д ндиви уальн ы е ( и гр ы с экспертом ) Группов ы е (ролевые и гр ы в группе ) По применению специально го оборудовани я - И гры с wенаж.ером 1 1 По использов а нию 1 - И гр ы без реквизита Рис. 4.5. Кл асс и ф и кация экс пе ртных и гр ЭВМ Комп1аютерн ы е игрw Руч н ы е и гры 1 20 Глава 4 • Технологии и нженер ии знани й Иг ры с э кс п ерто м В этом сл учае с эксп ертом играет инженер по знания м , которы й берет на себя ка кую - нибудь роль в модели руемой ситуации. Напр имер, о дном у из авторов ч асто приходилос ь р азыгр ывать с экспертом игру •Учитель и ученик• , в которо й ин жене р по знания м берет на себя роль уч еника и на гл азах у эксперта выполня ет его работу ( нап р имер , пишет психодиагн о стическое заключение ) , а эксперт по правля ет ошибки •уч еника• . Эта игр а - удобны й с пособ разговорить застенч и вого эксперта. Пример 4. 2 Другая игра (заимствована и з работы [ Гельфанд, Розенфельд, Шифрин, 1988]) застав ляет инженера по знаниям взять на себя роль врача, который знает хорошо больного, а эксперт играет роль консультанта. Консультант задает вопросы и делает прогноз о це лесообразности применения того или иного вида лечения (в описанной игре это ·был прогноз целесообразности электростимульной терап ии при сердечной аритмии). Игра сдвух врачей• позволила выявить, что эксперту понадобилось всего 30 вопросов для . успешного прогноза, в то время как первоначальный вариант вопросника, составлен ный медиками для той же цели, содержал 170 вопросов. Пример.4.3 Сначала эксперта просят написать обоснование для собственного прогноза. Напр:имер, почему он считает, что язва у больного Х заживает. Накапливается несколько таких обоснований [ Гельфанд, Розенфельд, Шифрин, 1988] , а через некоторое время экспер ту зачитывают только его обоснование и просят сделать прогноз. Как правило, этого он сделать не может, то есть обоснование (или его знания) было неполным. Эксперт до полняет обоснование, тем самым выявляютс� скрытые (для самого эксперта) пласты знаний. Так, в играх с Обоснование прогноза рецидива язвенного кровотечения• уда лось выявить, что значимыми для прогноза являются всего три правила. Причем два правила входили в традиционно-диагностический вопросник, а третье было сформу лировано во время игры. Пример 4.4 Игра сфокусировка на контексте•: эксперт играет роль ЭС, а инженер по знаниям роль пользователя. Разыгрывается ситуация консультации. Первые вопросы э ксперта выявляют наиболее значимые понятия, самые важные аспекты проблемы. Роль пользователя может взять на себя и другой эксперт [Rabblts, Wright, 1987]. Основные советы инженеру п о знаниям п о проведению индивидуал ьных игр : • играйте смелее, придумывайте игры сами ; • не навя зывайте игру эксперту, если он не расположен ; • в игре •не давите• .на эксперта, не забыв айте цели игры; • играйте вес ел о, нешаблонно ; • не забывайте о в р емени и о том, ч то игра утомительна дл я эксперта. Ро лев ые иг р ы в г ру п п е Групповые игры предусматривают участие в игре нескольких эксперто в. К тако й игре обыч н о зар анее составля ется сценар ий , р аспределя ютс я роли , к каждо й р оли 4.2. Коммуникати вные методы 1 21 готовится портрет-описание (лучше с дев изом) и разрабатывается система оце нивания игроков [Борисова, Соловьева и др., 1 988] . Существует несколько способов проведения ролевых игр. В одних играх игроки могут придумать себе новые имена и играть под ними. В других все игроки пере ходят на • ты•. В третьих роли выбирают игроки, в четвертых роли вытягивают по жребию. Роль - это комплекс образцов поведения. Роль связана с другими рqля ми . • Короля играет свита• . Поскольку в нашем случае режиссером и сценаристом игры является инженер по знаниям, то ему и предоставляется полная свобода в выборе формы про ведения игры. Пример 4 .5 Так, в работе [Л азарева, Пашинин, 1987] описана игра •План•, предназначенная для извлечения знаний из специалистов предприятия, разрабатывающих производствен ные планы выпуска для цехов и принимающих различные решения по управлению производством . В игре экспертов разбили н а три игровые группы: ЛПР 1 - группа планирования; ЛП Р 2 - группа менеджеров; Э - группа экспертизы по оцениванию действия ЛПР 1 и Л ПР2 • Группам ЛПР 1 и ЛПР2 задавались различные производственные ситуа ции и тщательно протоколировались их споры, рассуждения, аргументы по принятии реше ни й. В результате игры был создан прототип базы знаний экспертной системы плани рования. Обычно в игре принимает участие от трех до шести экспертов, если их больше, то можно разбить всех на несколько конкурирующих игровых бригад. Элемент со стязательности оживляет игру. Например, чей диагноз окажется ближе к истин ному, чей план рациональнее использует ресурсы, кто быстрее определит причину неисправности в техническом блоке. Создание игровой обстановки потребует немал� фантазии и тв о рческо й выдумки от инженера по знаниям. Ролевая игра, как правило, требует некоторых простей ших заготовок (например, табличек •директор•, •Бухгалтерия •, • План овый от дел• , специально напечатанных инструкций с правилами игры). Но rла�щое, ко нечно, чтобы эксперты в игре действительн о •заиграли• , раскрепостились и •раскрыли свои карты •. И гры с т ренаже ра м и Игры с тренажерами в значительной степени ближе не к играм, а к имитацион ным упражнениям в ситуации, прирлиженной к действительности. Наличие тренажера позволяет воссоздать почти производственную ситуацию и понаблюдать за экспертом. Тренажеры широко применяют для обучения (напри мер, летчиков или операторов атомных станций). Очевидно, что применение тре� нажеров для извлечения знаний п озволит зафиксировать фрагменты •летучих• знаний, возникающих во время и на месте реальных ситуаций и выпадающих из памяти при выходе за пределы ситуации. Ко мпьютер ные эксп ертные и г р ы Идея использовать компьютеры в деловых играх известна дав но. Но только когда компьютерные игры взяли в плен практически всех пользователей пер - 1 22 Глава 4 • Техноло гии инжене рии знаний сональных ЭВМ от мала до велика, стала очевидной особая притягательность такого рода игр. Традиционная современная классификация компьютерных игр из журнала GAME.EXE: • Action/Arcade games (экmн/аркады) . Игры-действия. Требуют хорошего глазомера и быстрой реакции. • Simulation games (симуляторы) . Базируются на моделировании реальной действительности и отработки практических навыков, например в вождении автомобиля, пассажирского самолета, поезда, авиадиспетчера и даже симу ляторы рыбной ловли. Также популярны спортивные симуляторьi - теннис, бокс и др. • ЗD Action games ( ◄стрелялки► ). То же, что и экшн, но с активным использо ванием трехмерной графики. • Strategy games ( стратегические игры). Требуют стратегического планирова ния и ответственности при принятии решений, например развитие цивилиза ций, соперничество миров, экономическая борьба. Особый класс стратегичес ких игр- wargames (военные игры). В последнее время упор в ЗD Action делается на многопользовательский режим (игру по сети). • Puzzles (настольные игры-головоломки). Компьютерные реализации различ ных логических игр. • Adventure/Quest (прИКJ1Юченческие игры). Обычно обладают разветвленным сценарием, красивой графикой и звуком. Управляя одним или несколькими персонажами, игрок должен правильно вести диалоги, разгадывать множество загадок и головоломок, замечать и правильно использовать предметы, спря танные в игре. • Role-playing games RPG (ролевые игры) . Распространенный жанр, берущий свое начало в старых английских настольных играх. Существует один или не сколько персонажей, обладающих индивидуальными способностями и харак теристиками. Им приходится сражаться с врагами, решать загадки. По мере выполнения этих задач, у героев накапливается опыт, и по достижении опреде ленного значения их характеристики улучшаются ... Следует отметить, что многие игры могут быть отнесены сразу к нескольким классам; и в целом, эту классификацию нельзя считать строrой. Игры иногда по лезны для развлечения эксriертов перед сеансом извлечения знаний. Кроме того, очевидно, что экспертные игры, сочетая элементы перечисленных выше IСЛассов, могут успешно применяться для непосредственного извлечения знаний. Однако разработка и программная реализация такой игры потребуют существенных вло жений временных и денежных ресурсов. П рим ер 4 .6 Одна из первых отечественных экспертных компьютерных игр описана в работе [ Гин кул, 1989). Основной принцип игры сЗоосад• состоит в создании иг.ровой ситуации при организации диалога с экспертом. При этом задача извлечения знаний маскиру ется нацеленностью на решение чисто игровой задачи: необходимо определить содер� жимое •черного ящика•, в котором находится некое животное, при этом надо набрать 1 23 4. 2. Ко ммуникати вные мето ды наи большее количество очков, не истратив выделенного ресурса денег. В ходе игр ы эксперт делает ставки на различн ые гипотезы, указ ывая при этом , как и ми призна�са ми обладает то или иное животное. После каждого ответа он получает н еобходимую · инфо рмацию о результатах. По ходу игры невидимо для эксперта формируются п равила, отражающие знания эксперта на основании сделанных им ходов. В данной игре - зто знания о том, какими п р изнаками обладают те или иные животные. Таки м образом, в ыя вляется алфавит значимых признаков для диагностики и классифика ции животных. Сравнительные характеристики экспертных игр приведены в табл. 4.4. Табл и ца 4 . 4. С равнительные характерис"f'ики э кс пертных игр Э кспе ртные и гры Достоинства И ндивидуальные Групповые Дают возм ожность сравнительно быстро получит ь качественную картину принят ия решения Реалистично воссоздают Выз ывают интерес ат м осф еру конкретной у эксперта задачи Поз воляют выясн и ть , какую инфор м ацию и как использует эксперт Недостатки «Группо вые � з нания более объе кти вны Выявляют логику и аргум е нтацию э кспертов Отсутствие м етодик стандартного набора игр Требует от аналитика зна ния осно в игротехники Высоки е профессиональн ые т ребования к а н алитику Сложность создания игр для конкретных предм етн ых областей Собеседник или практик Тре бования к э ксперту (раскованность (тип и кач ес тва) и а ктерское м астерство) С обеседник Требовани я к анал ити ку ( ре жиссерски е (тип и кач еств а) спос о бности + ум ение создавать сце нарии + а ктерское м астерство) Требования к предм етн о й обл асти Раскрепощают экс пертов Средне и слабо структурированн ые и слабо докум е нтированные То же Ком пьютер ные Привле кают ди зайном и дина м и кой Сложносп. и высокая цена создания специализирован н ых игр в кон кр етн ой П О Практик без психологического б арьера к ЭВ М С о б еседни к Мыслит ел ь (контакт ( способность к веде нию с програ м м истом ) ко нферанса + ре ж иссерс кие способности + с це нарист + актерс ко е м астерство) То же То же 1 24 Глава 4 • Технологи и инжене р ии знани й 4 . 3 . Текстол о г ические метод ы Гр уппа текстологических методов объединяет методы извлечения з наний, осно ванные на изучении специальных текстов из учебников, монографий, СТ,:iтей, ме тодик и др угих носителей п рофессиональных знаний. В буквальном смысле текстологические методы не относятся к текстологии - на уке, которая родилась в русле филологии с целью критического п р очтения лите р атур ных текстов, изучения и интер пр етации источников с узкоприкладной за дачей - подготовки текстов к изданию. Сейчас текстология расшир ила свои гра ницы включен ием аспектов смежных наук - ге рменевтики ( науки правильного толкования д р евних текстов - библии, античных р укописей и др.), семиотики, психолингвистики и д р . ' Текстологические методы извлечения знаний, безусловно, используя основные положения текстологии, отличаются п р инципиально от ее методологии, во - пер вых, характером и п р иродой своих источников (п рофессиональная специал ьная литер атур а, а не художественная, живущая по своим особым законам) , а во-вто рых, жесткой п р агматической нап равленностью извлечения конкретных профес сиональных знаний. С р еди методов извлечения знаний эта группа является наименее разработанной, по ней практически нет никакой библиографии, поэтому дальнейшее изложение является как бы введением в методы изучения текстов в том виде, как это пред ставляют авторы. Задачу извлечения знаний из текстов можно сфо рмули ровать как задачу поиима иия и выделения смысла текста. Сам текст на естественном языке является лишь п роводником смысла, а замысел и знания авто ра лежат во вторичной ст руктуре (смысловой ст р укту р е или мак р ост р укту р е текста), настраиваемой н ад есте ственным текстом [ Величковский, Капица, 1 987 ] , или, как сформулировано в работе [Файн, 1 987 ] , «текст не содержит и не пер едает смысл, а является лишь ин струментом для авто р а текста». При этом можно выделить две такие смысловые структуры: М1 - смысл, кото рый пытался заложить автор, это его модель мир а, и М2 - смысл, кото рый постигает читатель, в данном случае инжене р по знаниям (рис. 4.6), в проц ессе инте р п р етации 1 . П р и э том Т - это словесное одеяние М1, то есть р езуль тат вербализации V. Сложность процесса заключается в п р инципиальной невозможности совпадения знаний, обр азующ их М1 и М2 , из -за того , что М1 образуется за счет всей совокуп ности пр едставлений, потребностей, интер есов и опыта авто ра, лишь малая часть кото р ых находит отражение в тексте Т. Соответственно, и М2 обр азуется в п роцес се интерпретации текста Т за счет п р ивлечения всей совокупности научного и че ловеческого багажа читателя. Таким образом, два инжене ра по знаниям извлекут из одного Т две различные модели М i1 и М ; 2 • 125 4.3. Текстол ог и че ские методы 1 •..,;,.,_> Эксперт Текст книги @ nож�-> � Инженер no знаниям Рис . 4.6. Схема извлечения знани й из специальных текстов Встает задача: выяснить, за счет чего можно достичь максимальной адекватности М1 и М2, помня п р и этом, что понимание всегда относительно, поскольку это син тез двух смыслов •свое-чужое• [Бахтин, 1975] . Рассмотр им подро бнее, какие источники питают модель М1 и создают текст Т. В работе [Сергеев, 1 987] указаны два компонента любо го научного текста. Это пер вичный матер иал наблюдений а и система научных понятий /3 в момент создания текста. В дополнение к этому, на наш вз гляд, помимо объективных дан'ных э кспе р иментов и наблюдений, в тексте обязательно пр исутствуют субъективные взгля ды авто ра у, результат его личного опыта, а также некото рые •общие места• или •вода• 8. Кроме этого, любой научный текст содержит заимствования из дру гих источников (статей, моно графий) и т. д. П р и этом все компоненты по гружены в языковую среду L. Можно записать: Т - ( а, /3 ,уДО ) L. Таким образом, компоненты научного текста можно представить в виде следую щей схемы ( р ис. 4.7). При этом компоненты /3 , у, часть а входят и в модель М1• т Рис. 4. 7. Компоненты научно го текста При извлечении знаний аналитику, интерпретирующему текст, приходится решать задачу декомпозиции этого текста на перечисленные выше компоненты для выделе ния истинно значимых для реализации базы знаний фрагментов. Сложность интер претации научных и специальных текстов заключается еще и в том, что любой текст 1 26 Глава 4 • Техноло ги и инжене р ии зн ани й приобретает смысл только в контексте, где под контекст ом понимается окружение, в которое •погружен� текст. Различают микро- и макроконтекст. Микроконтекст - это ближайшее окруже ние текста. Так, предложение получает смысл в контексте абзаца, абзац в контек сте главы и т. д. Макроконтекст - это вся система знаний, связанная с предмет ной областью (то есть знания об особенностях и свойствах, явно не указанных в тексте) . Другими словами, любое знание обретает смысл в контексте некоторого . метазнания. Теперь несколько подробнее о центральном звене процедуры извлечения зна ния - о понимании текста. Классическим в текстологии является определение немецкого философа и языковеда В. фон Гумбольдта [Фон Гумбольдт, 1 984 ] : • .. .Люди понимают друг друга н е потому, что передают собеседнику знаки пред• метов, и даже не потому, что взаимно настраивают друг друга на точное и полное воспроизведение идентичного понятия, а потому, что взаимно затрагивают друг в друге одно и то же звено цепи чувственных представлений и зачатков внутрен них понятий, прикасаются к одним и тем же клавишам инструмента своего духа, благодаря чему у каждого вспыхивают в сознании соответствующие, но не тож· дественные смыслы.• Говоря на языке современного языкознания, понимание - это формирован�е •второго текста�, то есть семантической структуры (понятийной структуры) [ Сиротко-Сибирский, 1 968] . В нашей терминологии - это попытка воссоздания семантической структуры М1 в процессе формирования модели М2, то есть это ·первый шаг структурирования знаний. Как происходит процесс понимания I? Одна-из возможных схем изложена в ра боте [ Соколов, 1 947; Соколов, 1 968]. Мы внесли несколько изменений в эту схе му в связи с тем, что в ней трактуется понимание текста на иностранном языке, а нас интересует понимание текста в новой для познающего субъекта предметной области. Кром� этого, дополним ее некоторыми положениями герменевтики. В целом полученная схема согласуется со стратегией изучения всего нового. Основными моментами понимания текста являются: • Выдвижение предварительной гипотезы о смысле всего текста ( предугадыва ние). • Определение значений непонятных слов (то есть специальной терминоло гии) . • Возникновение общей гипотезы о содержании текста (о знаниях). • Уточнение значения терминов и интерпретация отдельных фрагментов текста под влиянием общей гипотезы (от целого к частям). • Формирование некоторой смысловой структуры текста за счет установления внутренних связей между отдельными важными ( ключевыми) словами и фрагментами, а также за счет образования абстрактных понятий, обобщаю щи� конкретные фрагменты знаний. 4. 3. Текстологи че ские мет о ды 1 27 • Корректировка общей гипотезы относительно содержащихся в тексте фраrментов знаний (от частей к целому). • Принятие основно й гипотезы, то есть формирование М2• Следует отметить наличие как дедуктивной (от целого к частям), так и ·индук тивной ( от частей к целому) составляющей процесса понимания. Та1<0й двуе диный подход позволяет охватывать текст как смысловое единство особого рода, с е го основными признаками, такими как связность, цельность, закон ч енность и др. [ Сиротко- Сибирский, 1 968] . Центральными моментами процесса I являются шаги 5 и 7, то есть формирование смысловой структуры или выделение •опорных• , ключевых, слов или •смысло вых вех• [ Сирот ко - Сибирский, 1 968] , а также заключительное связывание •смысщ>вых вех• в единую семантическую структуру. При анализе текста важно выявление внутренних связей между отдельными эле ментами текста и понятиями. Традиционно выделяют два вИда связей в тексте эксrтицитные (или явные связи), которые выражаются во внешнем дроблении текста, и имплицитные ( скрытые связи). Эксплицитные связи делят текст на па раграфы с помощью перечисления компонентов , в водных слов ( или коннекто ров) типа •во-первых ... , во-вто рых... , однако и т. д.• . Имплицитные, или внут ренние, связи между отдельными •смысловыми вехами• вызы вают осн овное затруднение п ри понимании. И так, семант�ческая структура текста образуется в сознании познающего субъек та с помощью знаний о языке, знаний о мире, а также общих (фоновых) знаний в той предметной обЛ,\СТИ, которой посвящен текст. •TeKCTj,l пишут для посвя щенных • . Другими словами, если текст не является науч но-популярным, то для его адекватного прочтения требуется некоторая подготовка. Таким образом, путь к знаниям удлиняется еще на одно звено. Если мы раньше говорили, что сами текстологические методы редко употребляются как самостоя тельный метод извлечения, а обыч но используются как некоторая подготовка к коммуникативному взаимодействию, то теперь утверждаем, что и для прочтения текстов нужна подготовка. Какая же? Подготовкой к проч тению специальных текстов является выбор совместно с эк спертами некоторого •базового• списка литературы , который постепенно введет аналитика в предметную область. В этом списке могут быть уч ебники для начи нающих, главы и фрагменты из монографий, популярные издания. Только после ознакомления с «базовым• списком целесообразно приступать к чтен ию специ альных текстов. Таким образом, на проц есс п онимания (или интерпретации) 1 и модель М2 вли яют следующие компоненты (рис. 4.8): • экстракт компонентов (а, (3, у, 0)', почерпнутый из текста Т; • предварительные знания аналитика о предметной области оо; • общенауч ная эрудиция аналитика Е; • его лич ный опыт q,. 128 Глава 4 • Технологии и нже н е р ии зн а н ий М2 - [(а, (3, у, 0)', ro, е, <Р], Процесс 1 - это сложный, не поддающийся формализации процесс, на который существенным образом влияют такие чисто индивидуальные компоненты, как когнитивный стиль познания, интеллектуальные характеристики и др. Экстракт текста Т (Cl, JS,f, 8 ) Рис. 4 . 8 . Компоненты формиро вания смысла текста Но процедура разбивки текста на части ( • смысловые группы� ), а затем сгущение, сжатие содержимого каждого смыслового куска в • смысловую веху� является, видимо, основой для любого индивидуального процесса понима�шя. Такая комп рессия: (сжатие) текста в виде набора ключевых слов, передающих основное со держание текста, может служить удобной методологической основой для прове дения текстологических процедур извлечения знаний. В качестве ключевого слова может служить любая часть речи ( существительное, прилагательное, глагол и т. д.) или их сочетание. Набор ключевых слов ( И КС) это набор опорных точек, по которым развертывается текст при кодировании в память и осознается при декодировании, это семантическое ядро цельности [ Си ротко-Сибирский, 1 968] . Прим ер 4 .7 В кач_естве примера при ведем результаты эксперимента по формированию Н КС. Зна ния извлекались из следующего текста [Уэно, Исидзука, 1989]. •Теория фреймов относится к психологическим понятиям, касающимся понимани я · того, что мы видим и слышим. Эти способы воспр и ятия трактуются с последователь ной точки зрения, на их основании осуществляется концептуаль ное моделирование, целесообразность полученных моделей исследуется вместе с различными проблемами, возникающими в этих двух областях. Для осознания того факта, что заданная и н формация в этих областях имеет единствен ный смысл, человеческая память прежде всего должна быть способна увязывать эту информацию со специальными концептуальн ы ми объектами. В проти вном случае не удается систематизировать информацию, которая выглядит разрозненной. В основе теории фреймов лежит восприятие фактов посредством сопоставлен и я полученной извне информации с конкретными элементами и значениями, а также с рамками, опре' 4.3. Те кстол огические ме тод ы 1 29 деленными для каждого концептуального объекта в нашей памяти. Структура, п ред ставляющая; эти рамки, называется фреймом . Поскольку между различными 1<онцеп туальными объектами имеются некоторые аналогии, то образуется иерархическая структура с классификационными и обобщающи м и свойствами. Собственно, она пред ставляет собой иерархическую структуру отношений типа •абстрактное-конкретное• . .Сложные объекты представлены комбинацией нескольких фреймов, другими словами, они соответствуют фреймовой сети. Кроме того, каждый фрейм дополняется связан ными с ним фактами и процедурой, обеспечивающей выполнение запросов к другим фреймам. Причиной, по которой представление знаний фреймам и в ыглядит до статочно точным , является возможность более полного описания процесса мышления че ловека посредством определения крупной и структурированной основной едини цы представления знаний и более тесной связи знаний, ос нованных на фактах, и процедурных знаний. Тем не менее, как было отмечено ее автором, теор�,:ю фрей мов следует скорее отнести к теории по становки задач, чем к результативной тео рии. Можно считать, что она существенно повышает уровень и детализирует ме ханизм памяти человека, выводов, понимания и обучения.• В группе из 34 испытуемых не было получено ни одного совпадающего Н КС и, соответственно, все структуры с ущественно отличались. Для примера приведем две работы (рис. 4.9, а, 6). Интересно, что одна из гипотез линrвостатистики о том, что наиболее употребля емые слова являются наиболее важными с точки зрения содержания текста, то есть отражают ero тематическую структуру, частично подтвердилась. Следует сказать несколько слов о том, почему мы выделяем три вида текстоло ги чес1шх методов ( см. рис. 4 . 1 ): • анализ специальной литературы; • анализ учебников; • анализ методик. Перечисленные три метода существенно отличаются, во-вторых, по степени 1<он центрированности специальных знаний, и, во - вторых, по соотношению специ альных и фоновых знаний. Наиболее просtым методом является анализ учеб ников, в которых логика изложения обычно соответствует ло гике предмета и поэтому макроструктура такого текста будет, наверное, более знач има, чем структура текста какой - нибудь специальной статьи. Анализ м етодик затруднен как раз сжатостью изложения � практическим отс утствием комментариев, то есть фоновых знаний, облегчающих понимание для неспециалистов. Поэтому мож но рекомендовать для практическо й работы комбинацию перечисленных мето дов. В заключение предложим одну из возможных практических методик анализа тек стов с целью извлечения и структурирования з наний. 1 30 Гла ва 4 • Технологии инженер.ии зн а ний Абстра ктное 1------1� Моделирование (видим, слышим) Знания, основанные Процедурные знания на фактах Конкретное Концептуальный объект Процедуры Сложный объект Факт Конкретное t--t--,-+-- значение Конкретны зпементы Фрайм (рамки) Фреймовая сеть Механизм памяти (теория фреймов) · Сопоставление 8 <теория фреймов ТФ (ISA - теория постановки задач), (АКО - психологическое понятие), (НАЗНАЧЕНИЕ - систематизация+ описание мышления). (П РИНЦИП - восприятие внешних факторов и сопоставление с фреймами), ( ОС НОВНОЕ ПОНЯТИЕ - фрейм, сеть фреймов)> <фрейм (ISA - понятие ТФ) , (ОПРЕДЕЛЕНИЕ - •.. ), )> (... б Рис. 4.9. Примеры смысловых структур, извлеченных из текста , 4.4. П ростей шие м етоды структуир ов а ни я 1 31 Алгоритм извлечения знаний из текста 1. Составление •базового• списка литературы ДЛЯ ознакомления с предмет ной областью и чтение по списку. 2. Выбор текста для извлечения знаний. 3. Первое знакомство с текстом (беглое прочтение). Для определения зна чения незнакомых слов - консультации со специалистами или привле чение справочной литературы. 4. Формирование первой гипотезы о макроструктуре текста. 5. Внимательное прочтение текста с выписыванием ключевых слов и выра жен·и й, то есть выделение •смысловых вех• (компрессия текста). 6. Опре�еление связей между ключевыми словами, разработка макрострук туры текста в форме графа или •сжатого• текста (реферата). 7. Формирование поля знаний на основании макроструктуры текста. 4 . 4 . П ростейшие методы структурирован ия Методы извлечения знаний, рассмотренные выше, являются непосредственной подrотов1,ой к структурированию знаний. Данный параграф посвящен изучению практических методов структурирования знаний. 4 . 4 . 1 . Алгоритм для «чайников» В качестве простейшего прагматического подхода к формированию поля зна ний начинающему инженеру по знаниям можно предложить следующий алrо ри-rм дл� •чайников• ( рис. 4.1 0). 1. Определение входных {Х} и выходных {У} данных. Этот шаr совершенно необ ходим, так как он определяет направление движения в поле знаний - от Х к У. Кроме того, структура входных и выходных данных существенно влияет на форму и содержание поля знаний. На э.том- шаrе определение может быть до статочно размытым, в дальнейшем оно будет уточняться. 2. Составление словаря терминов и наборов ключевых слов N. На этом шаге про водится текстуальный анализ всех протоколов сеансов извлечения знаний и выписываются все значимые. слова, обозначающие понятия, явления, процес сы, предметы, действ,ия, признаки и т. п. При этом следует попытаться разобраться в значении терминов. Важен осмысленный словарь. 3. Выявление объектов и понятий {А}. Производится •просеивание• словаря N и выбрр значимых для принятия решения понятий и их признаков. В идеале на этом шаге образуется полный систематический набор терминов из какой-либо области знаний. 4. Выявление связей между понятиями. Все в мире связано. Но определить, как направлены связи, что ближе, а что дальше, необходимо на этом этапе. Таким 132 5. 6. 7. 8. Гл а в а 4 • Тех нол о гии инже нерии знан ий образом, строится сеть ассоциаций, где связи только намечены, но пока не по именованы. Например, понятия •день•, •ночь•, •утро• и •вечер• явно как-то связаны, связаны также и понятия •красный флаг• и � красный галстук• , но характер связи тут существенно отличен. Выявление метапонятий и детализации понятий. Связи, полученные на пре дыдущем шаге, позволяют инженеру по знаниям структурировать понятия и как выявлять понятия более высокого уровня обобщения (метапонятия), так и детализировать на более низком уровне. Построение пирамиды знаний. Под пирамидой знаний мы понимаем иерар хическую лестницу понятий, подъем по которой означает углубление понима ния и повышения уровня абстракции (обобщенности) понятий. Количество уровней в пирамиде зависит от особенностей предметной области, профессио нализма экспертов и инженеров по знаниям. Определение отношений { RA}. Отношения между понятиями выявляются ка:к внутри каждого из уровней пирамиды, так и между уровнями. Фактически на этом шаге даются имена тем связям, которые обнаруживаются на шагах 4 и 5, а 1 также обозначаются причинно-следственные, лингвистические, временные и другие виды отношений. Определение стратегий принятия решений (Sr). Определение стратегий при нятия решения, то есть выявление цепочек рассуждений, связывает все сфор мированные ранее понятия и отношения в динамическую систему поля зна ний. Именно ст.ратеrии п ридают активность знаниям, именно они •пе ретряхивают• модель М в поиске от Х к У. Оп ределе ни е в ходных и выходных данных Сосrавпение словаря терми нов Выявnение объе ктов , понятий и их атрибутов Выявnение связе й между понятиями Выделение метаnонятий и детализация понятий Построе н ие пирамиды знаний О предвnе ние отнош е ний Определение стратегии п ринятия решения Структурирование поля знаний Рис. 4. 1 0. Стади и структурирования зна ний - алгор итм для «ча йн иков» 4 . 4 . Просте й ш ие м етоды структуриро ва н ия 1 33 Однако на практике при использовании данного алгоритма можно столкнуться с непредвиденными трудно�ями, связанными с ошибками на стадии извлечения знаний и с особенностями знаний различных предметных областей. Тогда воз можно привлечение других, более •прицельных» методов структурирования. При этом на разных этапах схемы (рис. 4. 1 0) возможно использование различных методик. 4 . 4 . 2 . Спе циальн ы е метод ы структурир ования Используя представленный на рис. 4.1 О алгоритм, инженер по знаниям может испытывать необходимость в применении специальных методов структурирова ния на разных шагах алгоритма. При этом, естественно, для таких простых и оче видных шагов, как определение входных и выходных понятий или составление словаря, никаких искусственных методов предлагаться не будет. Методы в ыявл ен ия объектов , п о н ятий и и х атрибуто в Понятие или концепт - это обобщение предметов некоторого класса по их спе цифическим признакам. Обобщенность является сквозной характеристикой всех 1<0гнитивных психических структур, начиная с простейших сенсорных образов. Так, понятие •автомобиль» объединяет множество различных предметов, но все они имеют четыре колеса, двигатель и массу других деталей, позволяющих пере возить на них грузы и людей. Существует ряд методов выявления понятий пред метной области в общем словаре терминов, который составлен на основании се ансов извлечения знаний. При этом важно выявление не только самих понятий, но и их признаков. Возвращаясь к терминологии, введенной в параграфе 1 .3 , на этом этапе опреде ляются также интенсионалы и экстенсионалы понятий предметной области. Ин тенсионал очерчивает пЬнятие через взаимосвязь значимых признаков, а эк стенсионал - через перечисление конкретных экземпляров объекта. Если задача выделения реальных объектов А связана только с наблюдательнос тью и лингвистическими способностями эксперта и инженера по знаниям, то оп ределение метапонятий В требует от них умения проводить операции обобщения и классификации, которые никогда не считались тривиальными. Поспелов Д. А. [ Поспелов, 1 986] предложил ряд подходов к созданию основ тео рии обобщения и классификации применительно к ситуационному управле нию и искусственному интеллекту в целом, а также выделил ряд особенностей задач формирования понятий. Среди них особое место занимает выявление прагматически значимых признаков для формирования понятий, способствую щих решению задачи. Сложность заключается в том, что для многих понятий практически невозможно однозначно определить их признаки, это связано с различными формами репре зентации понятий в памяти человека. 1 34 Гла ва 4 • Тех нологии ин жен ер ии знаний Все методы выявления понятий мы разделили на: • традиционные, основанные на математическом аппарате распознавания образов и классификации; • нетра ди ционные, основанные на методологии инженерии знаний. Если первые достаточно хорошо освещены в литературе, то вторые пока менее из вестны. Пример 4.8 Интересный экёперимент по выявлению понятий описан в работе [Кук, Макдональд, 1�86). Тридцати студентам, имеющим права на вождение автомобиля, предложили составить словарь терминов предметной области с помощью четырех методов: 1. Формирование перечня понятий ( 1 7 %). 2. Интервьюирование специалистов (35 %). 3. Составление списка элементарных действий ( 18 %). 4. Составление оглавления учебника (30 %). Цифры в скобках характеризуют продуктивность соответствующего метода, то есть показывают, какой процент понятий из общего выявленного списка (702 тер мина) был получен соответствующим методом. Для классификации понятий были привлечены еще два участника эксперимента, которые разделили 702 выявленных по нятия на семь категорий (методом сортировки карточек). Таблица 4.5 отражает чис ленные данные концептуализации. Таблица 4.5. Данны е ко нцептуализации Категории О бъяснение О бщие правила Режимные правила Понятия П роцедуры Факты П рочие по нят ия Процент от общего числа терминов, поnученныА Процент соответствующим от общего числа терминов методом Перечень п о нятий Интервьюирование Списо к о иераций Составление о главления 6 22,0 9,0 5,5 43,6 9,8 7 ,2 1 8,9 8,4 7,0 36,8 1 1 ,6 4, 9 4, 9 6,6 42,0 9 ,0 9,0 1 8,4 5, 1 1 5,0 38,9 9,5 1 2,5 8, 5 25,6 8,9 77,7 1 ,2 1 ,2 2,6 4,6 1 ,6 3,0 3,5 В целом результаты показали, что для выявления непосредственно концептов наиболее результативными оказались методы интервьюирования и составления оглавления учебника. Однако наибольшее число общих правил было порождено в методе списка действий. Таким образом, еще раз подтвердилось утверждение о том, что нет •лучшего• метода, есть методы, подходящие для тех или иных ситу� ций и типов знаний. 4,4 . П ростейшие методы стру'iсrурирования 135 Интересно, что число правил - продукций •если - то • - с оставило небольшой проц�нт во всех четь�рех методах. Это говорит о том, что популярная продукци онная модель вряд ли является естественной дЛЯ человеческих моделей репрезен тации знаний. Методы выявл ения с вязей между п онятия м и Концепты не существуют независимо, они включены в общую понятийную структуру с помощью отношений. Выявление связей между понятиями при раз работке баз знаний доставляет инженеру по знаниям немало проблем. То, что зна ния в памяти - это некоторые связные структуры, а не отдельные фрагменты, общеизвестно и очевидно. Тем не менее основной упор в существующих моделях представления знаний делается на понятия, а связи вводят весьма примитивные (в основном причинно-следственные). В последних работах по теории ИИ все больше внимания уделяется взаимосвя� занности структур знаний. Так, в работе [Шенк, Бирнбаум, Мей, 1989) введено понятие сценария (script) как некоторой структуры представления знаний. Ос нову сценария составляет КОП (концептуальная организация памяти) и мета КОПы - некоторые обобщающие структуры. Сценарии, в свою очередь, делятся на фрагменты - или сцены (chunks). Связи между фрагментами - временные или пространственные, внутри фрагмента самые различдые: ситуативные, ассоциативные, функциональные и т. д. Все методы выявления таких связей можно разделить на две группы: • Формальные. • Неформальные ( основаны на дополнительной работе с экспертом). Неформальные методы выявления связей придумывает инженер по знаниям для того, чтобы вынудить эксперта указать явные и неявные связи между понятиями. Наиболее распространенным является метод •сортировка карточек• в группы [ Волков, Ломнев, 1989; Rabblts, Wright, 1987), широко применяемый и для фор мирования понятий. Другим неформальным методом является построение замк нутых кривых. В этом случае эксперта просят обвести замкнутой кривой свя· занные друг с другом понятия [ Olson, Reuter, 1 987) . Этот метод может быть реализован как на бумаге, так и на экране дисплея. В этом случае можно говорить о привлечении элементов когнитивной графики [Зенкин, 1 99 1 ). После того как определены связи между понятиями, все понятия как бы распада ются на группы. Такого рода группы представляют собой метапонятия, присвое ние имен которым происходит на следующей стадии процесса структурирования. Методы выдел е ни я мет а п онятий и детали за ц ия п он я тий (п ирамида з наний ) Процесс образования метапонятий, то есть интерпретации групп понятий, полу ченных на предыдущей стадии, как и обратная пр<:щедура - детализация (разук рупнение) понятий, - видимо, принципиально не поддающиеся формализации операции. Они требуют высокой квалификации экспертов, а также наличия спо собностей к •наклеиванию• лингвистических ярлыков. Если на рис. 4. 1 1 показа- 136 Гл а ва 4 • Техноло гии и нженерии з на н ий ны схемы обобщения и детализации на тривиальных примерах, то в реальных предметных областях эта задача оказывается весьма трудоемкой. При этом неза висимо от того, формальными или неформальными методами были выявлены понятия или детали понятий, присвоени� имен которым или интерпретация их всегда неформальный процесс, в котором инженер по знаниям просит эксперта дать название некоторой группе понятий или отдельных признаков. li Рис. 4. 1 1 . Обобщение и детализация понятий Это не всегда удается. Так, в системе АВТ АНТЕСТ [Гаврилова, Червинская, 1 992] при образовании метапонятий, полученных методами кластерного анализа, интерпретация заняла несколько месяцев и не может считаться удовлетворитель ной. Это связано с тем, что формальные методы иногда выделяют «искусствен ные» концепты, в то время как неформальные обычно - практически исполь зуемые и потому легко узнаваемые понятия. Методы построения пирамиды знаний обязательно включают использование на глядного материала - рисунков, схем, кубиков. Уровни пирамиды чаще возника ют в сознании инженера по знаниям именно как некоторые образы. Построение пирамиды знаний может быть основано и на естественной иерархии предметной области, например связанной с организационной структурой пред приятия или с уровнем компетентности специалистов (рис. 4.12). Знания консультанта uз З нания медсестры U1 Знания глав ного технолога uз Знания технолога цеха U1 Знания врача Знания начальника цеха Р ис . 4. 1 2. П и рамиды знаний U2 U2 4. 5 . Состоян ие и перс пе ктив ы автом атизиро ва нно го приобрете н и я знаний 1 37 М етоды о пре делени я от,ноw е ни й Если на стадии 4 (см. рис. 4. 1 0) мы выявили связи между понятиями и использо вали их на стадиях 5 и 6 для получения пирамиды знаний, то на стадии ? мы даем имена связям, то есть превращаем их в отношения. В работе [ Поспелов, 1 986) указывается на наличие более 200 базовых видов раз личных отношений, существующих между понятиями. Предложены различные классификации отношений [ Келасьев, 1984; Поспелов, 1 986]. Следует только подчеркнуть, что помимо универсальных отношений (пространственных, вре менных, причинно-следственных) существуют еще и специфические отноше ния, присущие той или иной предметной области [ Гаврилова, Червинская, Яшин, 1988). Интересные возможности к структурированию знаний добавляют системы ког нитивной графики. 'Гак, в системе OPAL [Olton., Muser, Combs et al., 1987] экс перт может манипулировать на экране дисплея изображениями простейших по нятий и строить схемы лечения заболеваний, обозначая отношения явными линиями, которые затем именуются. Предлагаемая в данном учебнике методология структурирования опирается на современные представления о структуре человеческой памяти и формах репре зентации информации в ней [Величковский, 1982]. Скудность методов структурирования объясняется тем, что методологическая база и нженерии знаний только закладывается, а большинство инженеров 110 зна ниям проводит концептуализацию, руководствуясь наиболее дорогими и неэф фективными способами - •проб и ошибок• и •по наитию•, то есть исходя из со ображений здравого смысла. 4 . 5 . Состоя ние и перспективы автоматизированного приобретения знаний В данном параграфе мы рассмотрим автоматизированный подход I< проблеме из влечения и структурирования знаний, традиционно называемый приобретен ием знаний (knowledge acquisition).Пocкoлькy основную трудность в создании интеллектуальных систем представ ляет домашинный этап проектир о ва н ия, выполняемый инженером по знаниям (или аналитиком), - анализ предметной области, получение знаний и их струк турирование, - эти процедуры традиционно считаются •узким местом• (bottle neck) проектирования экспертных систем [Gaines, 1 987; Boose, 1 990]. Последние 5-6 лет усилия разработчиков направлены на создание инструментальной про граммной поддержки деятельности инженера по знаниям и эксперта именно на этих этапах. 1 38 Глава 4 • Тех н �ло гии ин женери � знаниV. 4 . 5 . 1 . Эволюция систем приобретения знаний Первое поkоление таких систем появилось в середине 80-х - это так называемые системы приобретения знаний (СПЗ) (TEIRESIAS [Davis, 1982 ), SIMER+ MIR [ Осипов, 1988], АРИАдНА [ Моргоев, 1988]). Это средства наполнения так называемых •пустых• ЭС, то есть систем, из БЗ которых изъяты знания (напри мер, EMYCIN - Е МРТУ MYCIN, опустошенная медицинская ЭС MJCIN со спе циальной диалоговой системой заполнения базы знаний TEI RESIAS). Их авто ры считали, что прямой диалог эксперта с компьютером через СПЗ поможет сократить жизненный цикл разработки. Однако опыт создания и внедрения СПЗ продемонстрировал несовершенство такого подхода. Основные недостатки СПЗ I поколения: • Слабая проработка методов извлечения и структурирования знаний. • Жесткость модели представления знаний, встроенной в СПЗ и связанной с привязкой к программной реализации. • Ограничения на предметную область. Таким образом, традиционная схема разработки СПЗ I поколения: создание конкретной ЭС ➔ опустошение БЗ ➔ разработка СПЗ для новых наполнений БЗ ➔ формирование новой БЗ для другой ЭС 1 оказалась несостоятельной для промышленного применения. Второе поколение СПЗ появилось в конце 80-х и было ориентировано на более . широкий модел�ный подход [Gaines, 1989; Борисов, Федоров, Архипов, 1991] с акцентом на предварительном детальном анализе предметной области. Так, в Ев ропе широкое применение получила методология KADS (Knowledge Acquisition and Documentation Structuring) [Wielinga et al. , 1989] , в основе которой лежит понятие интерпретационной модели, позволяющей процессы извлечения, струк турирования и формализации знаний рассматривать как •интерпретацию• линг вистичес�их знаний в другие представления и структуры. КАDS- м етодоло гия Рисунок 4.13 демонстрирует преобразование знаний согласно методологии KADS [ Breuker, Wielinga, 1989] через спецификацию пяти шагов анализа «идентифика ция - концептуализация - гносеологический уровень - логический уровень - уро вень анализа выполнения• и стадии или пространства проектирования. Результатом анализа является концептуальная модель экспертизы, состоящая из четырех уровней (уровня области - уровня вывода ...,.. уровня задачи - стратеги ческого уровня), которая затем вводится в пространство проектирования и преоб разуется в трехуровневую модель проектирования (рис. 4.14). При решении реальных задач KADS использует библиотеку интерпретацион ных моделей, описывающих -общие экспертные задачи, такие как диаmостика, мониторf1НГ ·(см. классификацию 1 из п. 2.2) и пр., без конкретного наполнения объектами предметной области. Интерпретацuонная модель представляет собой ;_4 . 5 . Состоя ние и перспекти в ы авто матизиро ванно го прио брете ния знаний 1 39 концептуальцую МОJ;\,ель без уровн� области. На основаниtt извлеченных лин�и стических данных происходит отбор, комбинация и вложение верхних уровней модели, то есть уровней вывода и задачи, которые наполняются конкретными объектами и атрибутами из уровня области и представляют в результате концеп туальную модель рассматриваемой задачи. На рис. 4 .15 представлена модель жизненного цикла KADS. Л ингвистические данные Концептуальная модел ь М одель проектирования Детальная модель проектирования Коды 1 1 111 1 с: 1 !& 1 i с: \--\ Концептуальный уровень \�\ \ Лоrический уровень 1! i 111 � Уровень анализа выполнения Рис. 4. 1 3. Методология КADS Первые системы программной поддержки КАDS-методолоrии представлены на бором инструментальных средств KADS Power Tools [Schreiber G., Breuker J. et al., 1 988]. В этот набор входят следующие системы: редактор протоколов PED (Pro tocol Editor); Редактор системы понятий ( Concept Editor); Редактор 1<онцепту альных моделей СМЕ (Conceptual Model Editor) и ИМ-библиотекарь IML (Inter pretation Model Librarian). Редактор протоколов - программное средство, помогающее инженеру по знани ям в проведении анализа знаний о предметной области на лингвистичес1шм уров не. При работе со знаниями на этом уровне исходным• материалом являются тек сты (протоколы) - записи интервью с экспертом, протоколы •мыслей вслух• и любые другие тексты, nолезные с точки зрения инженера знаний. Редактор про токолов реализован как гипертекстовая система, обеспечивающая выделение фрагментов в анализируемом тексте, установление связей между фрагментами, группирование фрагментов, аннотирование фраrментов. Фрагменты могут иметь любую ,длину - от отдельного слова до протокола в целом. Фрагменты могут пе рекрывать друг друга. Глава 4 • Технол о гии инже н е р ии знаний 1 40 Планы Стратеrически й уровень Контроли рует Уровень з адач и ----1 Метаправила Цепи �-- З адачи П рим�няет уРоввнь вывода Уровень задачи Метаклассы .____ Источники знаний Оп и сывает Структуры Рис. 4. 1 4. Осно вные модел и'КАDS Возможны следующие типы связей между фрагментами: • аннотация ( связь между фрагментом протокола и некоторым текстом, введен. ным инженером знаний для спецификации этоrо фрагмента); • член группы ( связь между фрагментом и названием - именем rруппы фраг ментов; объединение фрагментов в rруппу позволяет инженеру знаний струк турировать протоколы, при этом rруппа фрагментов получает уникальное имя ); • поименованная связь ( связь между двумя фрагментами, имя связи выбирает ся инженером знаний); • по нятийная �вязь (поименованная связь между фрагментом и понятием; обычно используется, если фрагмент содержит определение понятий). Редактор понятий помогает инженеру знаний организовывать предметные зна ния в виде набора понятий и связывающих их.отношений. Каждое понятие име ет имя и может иметь атрибуты; каждый атрибут может иметь значение. Какие именно атрибуты используются - это определяет инженер знаний с учетом спе цифики предметной области. С помощью Редактора понятий инженер знаний может вводить произвольные отношения между понятиями и создавать иерар хические структуры по тому или иному отношению. Существует единственное отношение (ISA), семантю(а которого свстроена» в Редактор. Если инженер зна ний устанавливает это отношение между двумя понятиями, то имеет место на следование атрибутов. 4.5. С остояние и п ерсп е ктивы автом атизированного п р иобретения знани й 1 41 Извпечение лингвистически х данных Библиотека интерп ретацион ных модепей Отбор интерпретационных модепей Планирование На блюдение Диаrностика · Комбинация и впожения верхн их · уровней моделей Планировение Модеnи реаnьноrо мира Вложение на уровне области Концеnтувпьная модель Рис . 4. 1 5. Жиз н ен н ый цикл КADS ИМ-библиоте карь помогает инженеру знаний проводить анализ предметных зна ний на эпистемологическом уровне. Основное назначение Библиотекаря состоит в том, чтобы помочь инженеру знаний выбрать одну или более ИМ, подходящих для исследуемой проблемной области (ПО). Помощь Библиотекаря проявляется в чисто информацио!-IНОМ аспекте. Вначале Библиотекарь демонстрирует пользо ватещо иерархию типов задач, для которых в библиотеке имеются ИМ. После тоrо как пользователь выбрал интересующую ero ИМ, ему демонстрируется ее краткое описание и список атрибутов, включающий в себя следующие атрибуты: •краткое описание•, •определение•, 4:структура задачи•, •стратегии•, •ПО-зна- 1 42 Глав а 4 • Технологии инжен ер ии зна ний нИЯ!>. Выбрав атрибут «определение�, , пользователь сможет увидеть на экране графическое изображение структуры вывода, элементами которой являются ис точники знаний и метаклассы. Как источники знаний, так и метаклассы имеют сври наборы атрибутов; инженер знаний может просмотреть их, указывая на со ответствующий элемент. Пс и хо с е ман ти ка Помимо идеологии KADS на разработку СПЗ II поколения большое влияние оказали методы смежных нау1<, в частности психосемантики, одного из молодых направлений прикладной психологии [Петренко, 1 988; Шмелев, 1983], перспек тивного инструмента, позволяющего реконструировать сема1пическое простран ство памяти и тем самым моделировать глубинные структуры знаний эксперта (см . параграф 5. 1 ). Уже первы е приложен l!я психосемантики в И И в середине 80-х годов позволили получить достаточно наглядные результаты [Кук, Макдо нальд, 1986] . В дальнейшем развитие этих методов шло по линии разрабоп<И удобных пакетов прикладных программ, основанных на методах многомерно го шкалироnания, факторного анализа, а также специализированных методов обработки репертуарных решеток [ Франселла, Ваннистер, 1 987] (параграф 5.2). Примерами СПЗ такого типа являются системы KELLY [ Похилько, Страхов, 1990], MADONNA [Терехина, 1988], MEDIS [Алексеева и др., 1 989] . Специфи ка 1<онкретных приложений требовала развития также «нечисленнЫХ!> методов, использующих парадигму логического вывода. Примерами систем этого направ ления служат системы ETS [Boose, 1986] и AQUINAS [Boose, Bradshaw, Scheшa,1988]. Успехи СПЗ II поколения позволили значительно расширить рынок Э С, кото рый к концу 80-х оценивался в 300 млн долларов в год [ Попов, 1 99 1 ] . Тем не менее и эти системы были не свободны от недостатков, 1< важнейшим из которых можно отнести: • несовершенство интерфейса, в результате чего неподготовленные эксперты не способны овладеть системой и отторгают ее; • сложность настрой1<и на конкретную профессиональную языковую среду; • необходимость разработки дорогостоящих лингвистических процессоров для �нализа естественно-язы1<овых сообщений и текстов. Третье поколение СПЗ - КЕА TS [ Eisenstadt et al., 1990], МАСЛО [Aussenac Gilles, Natta, 1 992] , NEXPERT-O BJ ECT [NEXPERT-OBJECT, 1990] - перенес ло акцент в проектировании с эксперта на инженера по знаниям [Гаврилова, 1988; Gruber, 1 989] . Новые С П З - это программные средства для аналитика, более сложные, гибкие, а главное использующие графические возможности со временных рабочих станций и достижения САSЕ-технолоrии (Computer-Aided Software Engineering). Эти системы позволяют не задавать заранее интерпрета ционную модель, а формировать структуру БЗ динамически. Существуют различные классификации СПЗ - по выразительности и мощнос ти инструментальных средств [ Попов, 1 988]; по обобщенным характеристикам [Boose, 1990] ; в рамках структурно-функционального подхода [ Волков, Ломнев, 1989]; интегрированная классификация предложена в работе [Гаврилова, Чер винская, 1992]. 4.5 . Со сто яние - и перс пективы а втоматизированно го п риобретения знаний 1 43 Учитывая новейшие :rенденции в инженерии знаний можно предложить следую· щую схему таксономии СПЗ, представленную на рис. 4. 16. i� с ::::Е i! � i1 } о с: о с: 15 15 Jj1 i ! 8 � i j§ J I 1 1 -- 11 1 1!! В� 'D u!. t ф 1 i ..: l J 1 1i 1:1 1 ! f !s ! 1l 1 1�,� ! 11 j 1 1l i 1 1 J 1 1 � � � 1 С) i :z: Рис. 4 . 1 6. Кл ассификация систем приобретения з наний Однако и современные СПЗ не полностью лишены серьезных недос татков СПЗ 1 и II поколений, большая ч асть которых обусловлена отсутствием теоретической концепции проектирова ния БЗ. ,в результате эта область до нас тоящеrо времени справедливо считается скорее •и скусством•, чем наукой и основана на «ad hoc• технологии (то есть применительно к случаю). 4 . 5 . 2 . Совре-м енное состояние автоматизированных систем приобретения знаний Анализ с овременного состояния программных средств приобретения зн а ний и поддержки деятельнос ти инженера по ,JНаниям позволяет выявить две групп ы проблем, характерных для существующих СПЗ: • Методологич еские проблемы. • Технологич е ские проблемы. 1 44 Глава 4 • Техн ологии инженер ии знаний А. Методологические проблемы Основная проблема, встающая перед разработчиками, - отсутствие теорети ческого базиса процесса извлечения и структурирования знаний - порождает дочерние более узкие вопросы и казусы на всех этапах создания интеллектуаль ных систем. Даже тщательно проработанная методология KADS, описанная в пре дыдущем параграфе, страдает громоздкостью и явной избыточностью. Н1iже пе речислены наиболее общие из возникающих проблем в последовательности, соответствующей стадиям жизненного цикла (см. рис. 2.4): • размытость критериев выбора подходящей задачи; • слабая проработанность теоретических аспектов процессов извлечения зна ний (философские, лингвистические, психологические, педаrоrичес1ше, ди дактические и другие аспекты), а также отсутствие обоснованной классифи кации методов извлечения знаний и разброс терминологии; • отсутствие единого теоретического базиса процедуры структурирования зна ний; • жесткость моделей представления знаний, заставляющая разработчиков обед нять и урезать реальные знания экспертов; • несовершенство математического базиса моделей представления знаний (дес криптивный, а не конструктивный характер большинства имеющихся матема тических моделей); • эмпиричность процедуры выбора программного инструментария и процесса тестирования (отсутствие критериев, разрозненные классификации, etc. ). Б. Техн ологические проблемы Большая часть технологических проблем является естественным следствием ме тодологических и порождена ими. Наиболее серьезными из технологических проблем являются: • отсутствие 1юнцептуальной целостности и согласованности между отдельны ми приемами и методами инженерии знаний; • недостаток или отсутствие квалифицированных специалистов в области ин женерии знаний; • отсутствие технико-экономических показателей оценки эффективности ЭС (в России); • несмотря на обилие методов извлечения знаний ( фактически более 200 в обзо ре [Boose, 1990] ), практическая недоступность методических материалов по практике проведения сеансов извлечения знаний; • явная непол нота и недостаточность имеющихся методов структурирования знаний [Кук, Макдональд, 1986; Гаврилова, Черви нская, 1992], отсутствие классификаций и рекомендаций по выбору подходящего метода; • несмотря на обилие рынка программных средств, недостато1( промышленных систем поддержки разработки и их узкая направленность (зависимость от платформы, языка реализации, ограничений предметной области) , разрыв между ЯПЗ и языками, встроенными в «оболочки>> ЭС; 4.6. П р и меры м етодов и систе м п р иобретения знани й 1 45 • жесткость программных средств, их низкая адаптивность, отсутствие индиви дуальной настройки на пользователя и предметную область; • . слабые графические возможности программных средств, недостаточный учет когнитивных и эргономических факторов; • сложность внедрения ЭС,' обусловленная пс и хологическими проблемами пер сонала и неприятия новой технологии решения задач. 4 . 6 . Примеры методов. и систе м приобретения зн а ний Данный параграф посвящен обзору некоторых наиболее известных методов и си стем приобретения знаний, на основе переработки материалов из работ [ Осипов, 1 990; Молокова, 1992; Осипов, 1997). 4 . 6 . 1 . Автоматизированное структурирован ное интервью Впервые структурированное интервью применено при созда нии системы TEI RESIAS [Davis, 1 982] для формиров а ния новых правил и новых понятий. Для этих целей в системе использованы следующие соображения: в случа е неудачи в режи ме консультации (или тестирования) система предлагает эксперту выде лить пр и ч и ны неудачи. Контекст, полученный в результате этого, позволяет сис теме сформировать некоторые •ожидания•, характеризующие содержание ново го правила, которое будет вводиться экспертом для устранения неудачи. Система ROGET [ Bennet, 1 985) - это первая попытка заменить инженер а знаний программной системой н а начальном этапе пр и обретения знаний. Эта система беседует с экспертом как инженер по знаниям, стремящийся понять, как концеп туально могут быть организованы экспертные знания, необходи мые для создания диагностической ЭС. В системе MOLE [Eshelman, 1987) приобретение знаний осуществляется в два этапа : на первом этапе используется стру�:сrурированное интервью и эксперту (или инжене,ру по зна ниям) предлагается ввести список событий предметной об ласти и определить связи между ними; на втора){ этапе выполняется контекстное приобретение знаний, как это сделано в системе TEIRESIAS. С и стема состоит из двух частей: интерпретатор а базы предметных знаний и подсистемы приобретения знаний. Последняя поддерживает как процесс перво� начального заполнен и я БЗ, так и процесс отладки и уточнения БЗ. Интерпl? етатор БЗ ориентирован н а класс диагностических задач и о(?уществляет вывод решения путем сопоставлени я заранее определенного множества гипотез (о причине неисправности, о заболевании и т. д.) с совокупностью наблюдений (симптомов, показа ний приборов и т. д.). Иными словами, и нтерпретатор систе мы MOLE реализует некоторый вариант метода эвристической классификации. 1 46 Гл ава 4 • Техн оло�;и.и и нже не рии зн ан и й В базе знаний MOLE п�рвоначально существуютзнания о том, какие тииы .1юrН:J1тивнь1х структур необходимы для осуществления вывода ц как распознать зна ния того ил и иного типа в информации, сообщаемой экспертом. MOLE зацраши вает у эксперта список объектов, играющих роли гипотез и наблюдений. Эксперт, кроме того, должен указать, какие пары «наблюдение - гипотеза:�, и «гипотеза гипотеза,> ассоциативно связаны. Результатом этого этапа извлечения знаний является сеть объектов. Затем MO LE пытается получ и ть дополнительную и нфермацию: о ти пе объекта (является объект наблюдаемым или выводимым); о природе ассоциативной связи (какой ти п знаний лежит в основе ассоциации - объясняющие, предс1<азывающие или иные); о направлении ассоциативной связи, о численной оценке «силы» ассоциа тивной связи. Однако MOLE понимает, что эксперт не всегда может предоста вить та кую информацию. Поэтому на этом этапе MOLE использует стратегию ожиданий: она пытается вывести необходи мую и нформаци ю из сообщен и й экс перта на основе свои х ож иданий. На этапе начального формирования базь1 знаний MOLE назначает ч и сленные веса ассоциативных связей по умолчанию на основе следующих посылок: • каждое наблюдение должно быть объяснено некоторой гипотезой; • только одна из гипотез, объясняющих данное наблюден и е, является в каждом конкретном случае наиболее вероятной; • сумма оценок для связей данного наблюдения с объясняющими его гипотезами равна единице. Тогда по умолчанию MOLE назначает для каждой связи данного наблюдения оценку, полученную как частное от деления единицы на число rипоте�. объясня ющи х данное наблюдение. MOLE предполагает, что если эксперт сообщил не сколько объяснений для одного и того же объекта, то, вероятно, он может сооб щить и знания, позволяющие различать эти объяснени я. Система приобретения знаний SALT [Ma rkus, 1 987] создана в университете Car negie Mellon. Система SALT - система приобретения знаний для задач конструи рования. Система SALТ разрабатывалась в предположении, что решение этой за дачи осуществляется методом пошагового распространения ограничений. Для решения задач конструиров ания методом пошагового распространения огра ничений необходимы знания следующих типов: • процедуры установлен и я значений параметров; • процедуры проверки ограничений; • процедуры коррекции значений параметров с указан�ем •цены» каждого корректирующего действия. Важно, чтобы все эти зн ания составляли целостную и непроти воречивую БЗ. Наибольшую трудность для эксперта представляет необходимость последова тельно, шаг за шагом описать вес свои действия при разработке проекта. Р аботая с системой SAL Т, эксперт избавлен от этой необходимости. 4 .6. П ри м е ры методов и систем п риобретени я знаний 1 47 Исходя из того, как именно экспертные знания будут использоваться в ЭС при составлении конкретных проектов, SALТ анализирует текущее состояние БЗ и предлагает эксперту-пользователю ввести или пересмотреть тот или иной фраг мент знаний. Диалог с пользователем в SALТ ведется либо посредством вопро сов-подсказок, либо посредством меню. Инициатива в диалоге принадлежит си стеме. Система приобретения знаний OPAL [Musen, Fagan, et al., 1 987] была создана в начале 80-х годов в Стэнфордском университете. Эта система обеспечивает формирование и наращивание базы знаний для ЭС ONCOCIN, дающей советы по лечению онкологических больных. Система приобретения знаний OPAL ос нована на детально проработанной модели медицинских знаний, используемых врачами-онкологами для рекомендации лечения. Системой используется девять типов знаний: • схема лечения (порядок и длительность режимов лечения); • критерий выбора протокола; • химиотерапия ( описание комбинаций лекарств, назначаемых в том или ином .режиме, их дозировка); • радиотерапия (локализация и дозировка радиотерапии); • изменения в составе крови, требующие модификации дозировки; • негативные реакции на лечение, выявленные путем лабораторных исследова ний; • другие отрицательные последствия проводимого лечения, требующие моди фикации дозировки лекарств; • перерыв или прекращение лечения; • лабораторные исследования, необходимые для обнаружения токсичности лечения и для соХ!)анения истории течения болезни. Эти типы медицинских знаний связаны в иерархическую структуру. Для ввода каждого типа знаний разработан специальный графический интер фейс, учитывающий то, как принято фиксировать соответствующие знания. Так, например, для записи схемы лечения онкологи используют диаграммы перехо дов с условиями на дугах. В системе OPAL ввод таких знаний осуществляется с помощью графического языка программирования. Схема лечения создается как программа на этом языке. Схемы прот-околов и заполненные формы транслируются системой OPAL во внутреннее представление БЗ ЭС ONCOCIN. Этот процесс осуществляется без участия пользователя. По схемам протоколов порождаются диаграммы перехо дов, называемые генераторами; по формам-бланкам порождаются правила про дукций, присоединяе�ые к соответствующим состояниям в диаграмме. Система KNA СК создана в 1 989 r. в университете Carnegie Mellon. Она представ ляет собой ориентированный на экспертов предметной области инструмент для создания ЭС, помогающих оценивать и улучшать различные виды проектов. 1 48 Гл а в а 4 • Технол огии и н жен ерии зн а н и й Единственными знаниями , изначально встроенными в систему KNACK, явля ются знания о процессе оценки проектов вообще, то есть независимо от конкрет ного содержания проектов. Все остальные знания приобретаются системой KNACK на основе диал ога и анализа документов, называемых отчетами. Отчет описывает процесс оценк и' ка1юго-либо конкретного проекта. Пр и обретение знаний, необход и мых для оценки проектов определенного класса, система KNACK осуществляет в два этапа. Первый этап - это настрой1<а на класс проектов. На этом этапе си стема КNАСК с помощью эксперта со_здает предв ар и тельную модель. Расш иренная с помощью специальных процедур модель пред метной области автоматически транслируется в программу на языке OPS-5. К методам структурированного и нтервью примыкают и использованные при по строении системы МЕДИКС [Ларичсв, Мечитов и др., 1989] процедуры эксперт ной классификац и и. Задача экспертной классификаци и формулируется в работе [Ларичев, Мечитов и др., 1989] для: • множества независимых свойств Р; • множ�ства признаков Q; • множ�ства Q,, возможных значеннй ш-rо пр изнака; • множества А всех возможных состояни й. Эксперту (или группе экспертов) предлагается идентифи ц ировать налич и е свойств из множества Р и тем самым построить класси фикаци ю множества А = UK,, та кую, что состояние а О А относится к некоторому классу Kj, есл и·, по мнению экс перта, это состояни е обладает свойством Р О Р. Повысить эффекти вность экспер тной классификации в этом случае удается благодаря использованию априорно заданного отношения л инейного порядка на множестве состоян ий. 4 . 6 . 2 . И м ита ц ия конс ультаций Этот метод реал и зован в системе АРИАДНА fMoproeв, 1 988] , В основе этого ме тода - многократное решен и е экспертЪм проблемы класс и ф и каци и в режиме последовательной вопросно-ответной консультации «кл и ент - эксперт». При этом роль клиента моделируется всеми участни ками работы, а эксперт выполня ет функции, близкие к его профессиональной консультативной деятельности. С появлением персональных компьютеров связано появление игр эксперта с компьютером [Андриенко Г., Андриенко Н., 1 992]. В системе ЭСКИЗ реализо ван набор игр для приобретения знаний, являющихся той или и ной моди ф и ка цией принципа репертуарных решеток. Например , в игре «Регата» объектами, для которых эксперт долж·ен указать различающие пр и знаки, являются яхты. В ходе гонок яхты должны проходи ть в пролеты мостов; в один и тот же пролет проходят яхты, соответствующи е сходным по какому-либо атрибуту объектам. Рассмотренные выше системы поддержки процессов пр и обретения знаний, как правило, ориентированы на отдельные фазы всего технологического цикла. В связи с вышесказанным и нтересно хотя бы кратко рассмотреть интегрирован ные средства поддержки определенных методологи й. 4 .6. Пр и меры методов и с и стем пр и обрете н и я знани й 1 49 4 . 6 . 3 . И нтегрированные среды приобретения знаний Интегрированная среда приобретения знаний A QUINAS [Boose, Bradshaw, Sche ma, 1988] представляет собой набор программных средств для извлечения экс пертных знаний разл и чных т и пов различными методами. В состав AQUINAS входят: • система Dialog Manager для помощи новичкам в работе с AQUINAS; • система ETS для извлечения и анализа репертуарных решеток с последующим преобразованием их в базу продукционных правил; • средства конструирования различных иерархических структур знаний; • средства извлечения, представления и использования неточных знаний; • средства тестирова ния и коррекции БЗ; • средства, позволяющие эксперту оценивать конструкторы п,о наиболее подходящи м шкалам; • средства работы с несколькими экспертами; • средства автоматического пополнения и коррекции БЗ. Dialog Manager представляет собой ЭС, специально созданную для тоrо, чтобы консультировать эксперта о возможностях, представляемых AQUINAS, и руко водить экспертом при р аботе с AQUINAS. Возможны три режима взаимодей ствия с Dialog Manager: • автоматический, при котором Dialog Manager полностью берет на себя руко водство процессом извлечения знаний; • ассистирующий, при котором хотя эксперту и даются рекомендации относительно ero дальнейш и х действий, но он может им не следовать; • режим наблюдения за действиями эксперта и сохранения истории. Выбрав а втоматический или ассистирующий режим, экспрет должен выбрать степень подробности подсказок и объяснений, даваемых системой («полностью», «на среднем уровне», «кра,тко» ). В БЗ Dialog Manager имеются эвристики, которые позволяют этой системе при накоплении экспертом достаточного опыта перейти от автоматического режима к ассистирующему. Dialog Manager информирует эксперта о переключении ре жимов. Работая в ассистирующем режиме, Dialog Manager оставл·яет за экспер том выбор деятельности , но на основе сво и х эвристик рекомендует наиболее подходящую. В частност и, если Dialog Manager сч и т ает, что эксперту следует заняться анал и зом БЗ, то в рекоме'ндации обычно указывается, какой именно аспект нужда ется в анализе. Так, эксперту может быть рекомендова но обрат и ть ся л и бо к процедурам анализа сходства элементов (конструкторов), либо I< про цедурам I<Ластеризации элементов (конструкторов), либо к разбиению исходной решетки на несколько и ерархически связ анных. 1 50 Глава 4 • Технол оги и инже н ерии, знан ий Ин тегриро ванная среда при о бреm(fния з наний КЦ:ТДN (Knowledge lniti�twn & transfer Tools for Experts and Novices) [Show, Woodward, .1988] , подобно AQПI NAS, основана на построении и анализе репертуарных решето1<. Отличие KIT TEN от AQUINAS заключается в том, что в KIТTEN обеспечивается извлечение элементов и конструкторов из текстов, а кроме того, имеются прощщуры, ащщи зирующие примеры решения задач экспертом и генерирующие по ним проду1< ционные правила. Продукционные правила, порождаемые из примеров и реше ток, могут быть загружены в Б З оболочки NEXPERT, с помощью которой про -водится тестирование БЗ. Завершая обзор прямых методов приобретения знаний, суммируем проблемы, которые этими методами не решаются: • эти методы не устраняют посредника между системой и экспертом; • автономное использование описанных методов не решает таких проблем ин женерии знаний, как устранение •nробелов• в знаниях, выявление •глубин ных•, невербальных знаний; сохраняется большая •время-емкость• и субъек тивность интервью; • фаза приобретения знаний идеологически и теоретически не связывается со следующими фазами инженерии знаний. 4 . 6 . 4 . Приобретение зн,а ний из текстов Как было у1,азано в параграфе 4.3, даже ручные методы выявления знаний из тек ста I<райне слабо разработаны. В тех же немногих случаях, когда применяются автоматизированные методики, речь, как правило, идет о методах лекси1,о-семан тическоrо анализа, а также о моделях понимания текста. Наибольшую известность имеют модели понимания на лингвистическом уровне. Системы, основанные на них, состоят в большинстве сJiучаев из двух частей: • первая - морфологический и синтаксический анализ; • вторая - семантический анализ, который использует результаты рiботы пер вой части, а также словарную или справочную информацию для построения формализованного образа текста. Говоря о семантическом анализе текста, надо иметь в ВИдУ, что всякие отношения текста с его семантикой начинаются, после того, как в нашем распоряжеtt:ии.ока зывается некоторая модель действительности. Объектами этой модели, в частно сти, могут являться индивиды и отношения. Таким образом, первая проблема, возникающая при попытках автоматического извлечения знаний из текста, - это выявление свойств элементов текста для со отнесения этих элементов с объектами модели. Крайне редко эти свойства при сутствуют в тексте эксплицитно, то есть явно. Вторая особенность существующих с11стем анализа текста - это, как правило, необходимость использования словаря предметной области для выполнения 4.6. Пр и м ер ы методов и с и стем пр и обрете ни я знани й 1 51 морфологического анализа, выделения имен и словосочетаний и т. д. Однако тре бование nредварительноrо создания словаря п редметной области одновременно сильно осложняет задачу и уменьшает степень универсальности п олучаемой сис темы. Понимание текста на семантическом уровне п редп олагает выявление не только лингвистических, но и л о гических отношений между я зы к о в ы м и объектами [ Апресян, 1 974 ] . Среди подходов к пониманию текста на семантическом уровне следует выделить модели типа •смысл - текст•, в частности, модель семантик предпочтения [Wilks, 1 976], модель концептуальной зависимости [ Хейес-Рот и др., 1 987]. В модели •смысл - текст• [Мельчук, 1 974] предлагается семантичес кое п редставление на основе семантического графа и описания коммуникатив ной структуры текста. В сист еме KRITON [ Diderich, Ruchman, Мау, 1987 ] анализ текста ис пользуется для выявления хорошо структурированных знаний из книг, документов,_ описа ний, инструкций. Основанный на контент-анализе метод протокольного анализ а ис пользуется для выявления процедурных з наний. Он осуществляется в пять шагов. 1 . Протокол делится на сеrу.tенты на основании пауз, которые делает эксперт в процессе записи. 2. Семантический анализ сегментов, формирование высказываний для каждого сегмента. 3. Из текста выделяются операторы и аргументы. 4 . Делается п о пытка п оиска по образцу в БЗ для обнаружения переменных в высказываниях ( п еременная вставляется в высказывание, если соответствую щая ссылка в тексте не обнаружена). 5. Утверждения упорядочиваются в соответствии с их появлением в протоколе. В системе TAKT(Tool for Acquisition of Knowledge from Text) [ Kaplan, Berry.:..Rog ghe, 1 99 1 ] п ред п олагается предварительная подготовка (разметка посредством введения явной скобочной структуры) предложений текста до начала работы тек стового анализатора. В результате анализа выделяются объекты, процессы и от нщuения каузального характера. 4 . 6 . 5 . Инструментарий прямого приобретения знаний SI M ER + M I R Программная система SIMER + MIR, разработанная в ИПС РАН под руководством Осип ова Г. С. [Оси пов, 1 997], представляет собой совокупность программных · средств для формирования модели и базы знаний предметной области. Система ориентирована преимущественно на области с неясной структурой объектов, с неполно описанным множеством свойств объектов и богатым наборо·м связей различной •связывающей силы• между объектами. 1 52 Гла в а 4 • Техн ологи и ин жене р ии знаний Одна из ос'обенностей системы состоит в том, что ее использование на заключи тельном этапе не предполагает участия специалистов-разработчююв экспертных сист,ем. Это означает, что система SIMER + MIR представляет собой технологию создания систем, основанных на знаниях о предметной области, причем техноло гию, ориентированную на экспертов. Архитектура. Система SIMER + M I R включает модуль прямого приобретения знаний SIMER, систему моделирования рассуждений типа аргументации MIR, программу адаптации системы MIR к базе знаний, сформированной с помощью SIMER + и программной среды поддержки базы знаний, над которой работают все названные модули. Конструкции базы знаний создаются и просматриваются с помощью языка инженера знаний FORTE, 1юторый включается в технологию в специальных случаях (рис. 4.1 7 ) . И нте рфе йс nользоватепя Программа MIR Программа + Инте рф е йс эксnе р,а Система SIMER пользо вателя Программная среда базы з н а н ий пользователя Инте рфе йс и нже н е ра no зн а н иям Яз ык Форте Рис. 4. 1 7. Созда н и е ко нструкции баз ы з на ни й с п омощью языка FORTE Представление и база знаний. Одним из наиболее распространенных видов экспертизы являются высказывания ( сообщения ) эксперта об объектах (событиях ) предметной области. Эти высказывания имеют вид: < имя обьекта > < имя отношения > < имя обьекта > . Для ряда <1бластей - медицины, экологии, политики, социологии - можно выде лить формы сообщений, показанные в табл. 4.6: Та блица 4.6. Ф о р м ы сооб ще ни й Но м е р фо р м ы Имя ф ор м ы Ном ер фо рм ы Имя фор м ы Ф1 а ха рактер н о для fl Фа П ри а н е р едко п р исутс тв уе т fl а отм еча етс я n ри 1} Ф10 Ф2 а н аблюдаетс я n ри fl Ф. а е сть п р оявл ение f1 Фе а со про вождает р Фз Фs Ф1 а е с ть п р и з н ак fl а н е редко с о п ро вождается р Ф9 а может н аб людать ся п р и 1} Ф, 1 П р и а как п рав и ло р Ф,2 Ф 1з ф14 а обыч н о соп ро вождаетс я 1} П ри аобыч н о р а ин огда с о провождае тся р а часто со п ро в ожда е тся р 1 53 4.6. Пр и м е р ы м етодов и сис те м пр ио бретени я знаний Н ом ер форм ы Имя форм ы Номер фо р м ы Имя форм ы Ф, 6 а. при в оди т к [3 Ф2 , [3 разви ва ется п ри а. Ф, s Фн Ф, в Ф, g а. ис кл юча ет [3 Ф 20 П ри а. во з ни кае т [3 а. м о жет при в ест и к [3 а. м о же т разв и ватьс я в [3 Ф22 Ф 2з С а. н а ч ин ае тс я [3 [3 м о жет разв и ваться при а. [3 может н ача ть ся с а. Этот список не является исчерпывающим, однако дает представление о тех ког нитивных структурах, которые необходимо пред ставлять и обрабатыв ат ь в базе знани й . Каждая из этих форм может иметь различный смысл; уточнение смысла можно получить при рассмотрении «прямого�> сообщения с «обращенным>> . Ин ыми сло вами, если для некоторых фиксированных а или t3 справедливо сообщение ф ор м ы Ф 10 , то необходимо поп ытаться установить , какое из сообщений Ф 1 - Ф 23 справедливо при замене а на t3 , t3 на а. Так, для соо бщения «Гром наблюдается при грозе,> справедливо «обращенное>> сообщение « Гроза сопро в ожд а ется гро мом�>, а для сообщения « Воспалител ь ный процесс может наблюдаться при повы шенной температуре >> справедливо сооб щ ение « Повышенная температура ха рактерна для воспалительного процесса >> . Таким образом , смысл сообщений уточняется построением « конъюнкци й,,. форм Ф 1 - Ф 23_ Такие << кон ъ юнrщ ии >> форм сообщений будут называться типам и сообщеиий . Возможные типы сообще ни й приведены в табл. 4.7. С каждым типом сообщения из табл. 4 . 7 связывается форм альная конструкция базы знаний, то есть бинарное отношение на множестве объектов ( событий). Эти конструкции можно проиллюстрировать следующим образом : если каждый объект ( событие) представить в виде «двухмерного,> множества, по первому из мерению которого можно откладывать атрибуты этого объекта, а по второму множества значений соответствующих атрибутов, то кажды й объект предс тав ляется в виде фигуры : 1 АТР 1 1 АТР 2 1 АТР 3 1 й ы Те блица 4. 7. Тип сооб щени Тип I AT P n 1 Сооб щен ие а. есть п ро явл ение р, и р м ож ет с о пр овождать а. а е ст ь пр о явление р , и [3 с о п ровождается а. а. м о же т уве л и ч и вать в о змо жн о ст ь р, и р у вел и ч и ва ет возм ож н о ст ь а. а м о ж ет с о про в ождат ься [3, и [3 может бы ть про явл е ни е м а. а со про вожда ется р , и [3 м о же т бы ть п р оявлени е м а а ест ь про явл ение р, и р е сть про явл ение а продолжение # 1 54 Гла ва 4 • Технологи и инже н е ри и знан ий . Табnица 4. 7. (продолжение ) Тип Сообщение а может увеличивать возможность �. и � может увеличивать возможность а а может протекать с �. и � может протекать с а а увеличивает возможность �. и � увеличивать во зможность а а сопровождается �. и � может сопровождает а а сопровождается �. и � сопровождаться а а исключает �• . и � исключает а а приводит к � а может привести к � а увеличивает возможность развития � а может увеличить возможность развития � а исключает возможность развития � Если считать множества всех атрибутов равновеликими, то можно рисовать пря моугольники. Тогда типу сообщения Т 1 можно поставить в соответствие диаграмму (пересече ние а и Р всюду далее заштриховано). ш В качестве примера приведем интерпретации некоторых диаграмм. Так, диаграм му, соответствующую сообщению типа Т3, можно интерпретировать следующим образом: для всякого примера объекта р качестве примера приведем интерпрета ции некоторых диаграмм. Так, диаграмму, соответствующую сообщению типа Т3, можно интерпретировать следующим образом: для всякого примера объекта Р найдутся такие примеры объекта а, в которых равны совпадающие имена и. значе ния атрибутов. Для остальных типов сообщений получим диаграммы, представленные в табл. 4.8. Табnица 4.8. Диаграммы для различных типов сообщений Т2 Тз Т4 Ts 1 а , р . � Те Т7 \ а 1 р 4.6. Пр и м е р ы м етодов и с и сте м п риобретени я з нани й 1 55 т" а � T,s а Для сообщения типа Т8 : для всякого имени атрибута примера объекта а найдется совпадающее с ним имя атрибута из примера объекта 13, и наоборот; при эт9м со ответствующие значения атрибутов равны. Найдутся такие примеры объекта а, в которых равны совпадающие имена и значения атрибутов. Каждой из изображенных диаграмм можно дать такую теоретико-множествен ную интерпретацию, связав с каждым· из типов сообщений 1\ некоторое бинарное отношение R k примеров объектов (при k = i). Способ представления с определенными так отношениями называется неодно родной семантической сетью. В реализации базы знаний основ ными элементами структур данных являются элементы -«Вершина•, -«Элемент кортежа•, •атрибут•, -«цепь•, •стрелка•. Э лемент •вершина• соответствует объекту (событию), он содержит имя, списки входных и выходных 4стрелок• и список типа •элемент кортежа•. Список •элементов кор тежа• соответствует совокупности атрибутов события. Для обеспечения 'простого способа определения указателя •вершины• существу ют элементы типа «цепь•. Элемент типа •цепь• содержит указатель на •верши ну• и указатель на следующий элемент типа «цепь•. Указатель на первый элемент списка •цепь• входит в описание элемента типа -«атрибут•. «Атрибут• характе ризуется также именем, множеством значений и единицей измерения. Отношения на множестве объектов реализованы в элементах типа •стрелка• . Каждый такой элемент содержит имя, сорт, вес, тип веса, указатель на 4Вершину• и указатель на следую щий элемент типа -«стрелка•. Отношения на двух объектах описьщаются парой элементов типа «стрелка•, один из которых входит в список 1 56 Гл а ва 4 • Технологи и ин жен ер ии з наний входя щих стрелок одного объекта, другой - в список входящих стрелок другого объекта. Процедурная компонента системы содержит функции создания струr(тур дан ных, поддержки корректности базы знаний, наследования свойств и ряд других функций. Для обеспечения поиска по именам элементов типа «вершина» и «ат рибут• в системе реализовано В-дерево. Доступ ко всем элементам базы осуще ствляется через виртуальную память. Каждый элемент имеет внутренний иден тификатор, по значению которого однозначно определяется его размещение в оперативной или внешней памяти. Для работы с объектами, отсутствую щими в оперативной памяти, осуществляется их динамический перенос из внешней па мяти в оперативную. Это позвол�ет системе работать на компьютере с ограничен ным объемом оперативной памяти. Прямое приобретение знаний в системе SIMER Для выявления структурных знаний о предметной области используются страте гии разбиения на ступени и репертуарных решеток. Подробнее о репертуарных решетках см. параграф 5.2. Стратегия разбиения на ступени направлена на выявление структурны х и клас сификационных свойств событий (понятий, объектов). области и rаксонометри ческой структуры событий предметной области. Стратегия разбиения на ступени реализуется в одном из двух сценариев, который выбирается экспертом 1. «Имя -_ свойство:!> . 2 . « Множество имен· - свойство•. Сценарий сс И мя - свойство» 1. 2. 3. 4. 5. Вопрос системы об имени события. Сообщение эксперта об имени события. Вопрос системы об имени свойства. Сообщение эксперта об имени свойства. Вопрос системы о существовании множества значений свойства. 6. Ответ эксперта (Да/Нет) . 7. В случае отрицательного ответа имя свойства воспринимается ка.к имя события. 8. Если имя события, образованного на шаге 3, отсутствует в базе знаний, то это событие рассматривается ка.к новое, и для него выполняются шаги 2-7. 9. Вопрос системы о типе множества значений свойства ( непрерывноt:!'/дис кретное ). 10. Ответ эксперта. 4.6. Пр и м е р ы м етодов и систе м п р и обр етени я з наний 1 57 11. Вопрос системы о единице измерения свойства. 1 2 . Сообщение эксперта о единице измерения. 13. Вопрос системы о множестве значений свойства. 14. Сообщения эксперта о множестве значений свойства. 15. В процессе выполнения шагов 2-6 создается глобальный объект 4ИМЯ свойства• и область его значений. Совокупность таких объектов будем называть базисом свойств области. 1 6. Вопрос системы о подмножестве значений свойства, характерного для описываемого события. 1 7. Сообщение эксперта о подмножестве значений свойства. В результате выполнения шага 7 один из элементов базиса свойств связывается с описываемым событием ( с указанием подмножества области значений элемента базиса, характеризующего описываемое событие). Сценарий «Множество имен - свойство» При работе сценария шаг 1 многократно повторяется, а затем выполняются шаги 2-7 для каждого имени события. Стратегия репертуарных решеток направлена на прео;tоление когнитивной за щиты эксперта. Механизм преодоления основан на выявлении его личностных конструктов. Каждый конструкт описывается некоторой совокупностью шкал, а каждая шкала образуется _о ппозицией свойств. Наиболее эффективный способ выявления противоположных свойств - предъяв ление эксперту триад семантически связанных событий с предложением назвать свойство, отличающее одно событие от двух других [Kelly, 1 955] . На следующем шаге эксперту предлагается назвать противоположное свойст�ю. Таким способом выявляются элементы·множества лич�остных психолоzических конструктов кон кретного эксперта. С другой стороны; свойства, различаю щие события, - это те свойства, кот-орые влияют на формирование решения. Так как при этом не ставится задача выявле ния когнитивной организации индивидуального сознания эксперта, то описан ная процедура используется для формирования базиса свойств области, а не для построения личностных конструктов. Пополнение базиса свойств области осу ществляется путем повторения это й процедуры с другими триадами. Прим е р 4 . 9 Наприме р, э кс перту в области пред ст�вле ния з нан и й предъявля ется триада п о н ятий , оп исыв ающих сп ос обы представле н и я: се м анти че ские сети , фре ймы, с и сте мы пр оду к ци й . Э ксперту предл агается ответи ть н а следующи е во про с ы: Какой из указанных способов представления отличается от двух других? 1 58 Глава 4 • Техноло гии ин женерии з нан ий системы продукций; Какое свойство отличает системы продукций от семантических сетей и фреймов? леrкость описания динаМИIСи; Назовите противоположное свойство свойс�у .легкость описания динамики•? трудность описания дииамнки; Дайте имя свойству, имеющему значения ,меzкость описания динамики• и •трудность описания динамики•? возможность описания дниаМИIСИ. В результате формируется шкала с именем •возможность описания динамики• и с о значением •легкость описания динамики• дJJЯ объекта •системы продукций•; •труд ность описания динамики• для объектов • семантические сети• и •фреймы•. ПредJJаrая э ксперту аналогичные вопросы об отличии семантических сетей от си стем продукций и фреймов, можно выявить и другие с войства базиса области. Еще один пример - выявление каузальных знаний о предметной области. К кау зальным знаниям о предметной области в соответствии с работой [Поспелов, 1986) относятся: • связи между следствиями и необходимыми и достаточными причинами; • связи между следствиями и достаточными причинами; • связи между следствиями и необходимыми со-причинами; связи между следствиями и возможными со-причинами. Будем пон и мать каузалf:\ные знания несколько шире, включив в рассмотрение, кроме связей событий настоящего с будущим и событий прошлого с настоящим, и связи между событиями настоящего. В соответствии с этим отнесем к каузаль ным знаниям все типы сообщений из табл. 4.6. Тогда задача выявления каузальных знаний сведется к установлению соответ ствия между множеством типов сообщений и множеством отношений R 1 -R 17 , то есть к поиску отображения Т в R. Для поиска этого отображения используется стратегия выявления с ходства [Осипов, 1 989). Она основана на выявлении в ин терактивном режиме алгебраических свойств сообщений Т; (таких как симмет ричность - ассимметричность, рефлексивность - иррефлексивность и др уги х) и появлении на основании этого гипотез о принадлежности сообщений тем или иным отношениям Rk (именно эти свойства оказываются нужными при работе механизма рассуждений). Пример 4 . 1 0 Н апример, относительно двух событий: •рост заработной платы• и •повышение уров ня жизни• эксперт сооб щил, что •рост заработной платы• обычно сопровождается •повышением уровня жизни•. Тогда возникают вопросы: а) повышение уровня жизни всегда сопровождается ростом заработной платы? б) повь1шение уровня жизни обычно сопровождается ростом заработной платы? в) повышение уровня жизни может сопровождаться ростом заработной платы? 4 .6. ·Прим ер ы м е тодов и с и сте м приобр етени я знани й 1 59 Ответ э кспе рта а ) �дет свидетельст вов ать о том , что исходн ое сообщён ие относится к типу Т2 табл. 4.6; ответ в) - исход н ое сооб щение относится к ти п у Т10 той же табл ицы. Дал ее п оявля ютс я ги п отез ы о то м, что сооб щение эксперта ц нтерпретирует�я отн оше нием R2 и л и R10 в зависи мост и от ответа а) или в). По вышение степени до стоверн ости такой rи п отезьi в озможн о при исп ол ьзов ан ии стратегии п одт вержден и я · сходств а [ О си по в , 1989]. · Стратегия подтверждения сходства является комбинированной, о_с нованной на взаимодействии стратегий разбиения на ступени и выявления сходства, а также на анализе свойств событий (если они определены). Например, в результате работы стратегии выявления сходства ус;т ановлена при надлежность предыдуще го пр имера отно·шению R2 • На основании определения отношения R;i для всякого свойства первого события найдется единственное свойство второго события, и наоборот, TaI< что область значения свойства перво го события является подобластью области значений соответствующего свойства второго события. В случае выполнения этого услов ия гипотеза о принадлежнос ти предыдущего примера отношению R2 считается достоверным ут�ерждением, в противном случае запускается стратегия разбиения на ступени с целью выявле ния новых свойств событий, для которых было бы верно это условие. Если, не смотря на это, условие достоверности не выполняется, то статус гипотезы сохра няется, одющо в базе знаний системы появляется информация о некорре1,тности соответствующей связи между событиями. Эта информация ограничивает воз можность использования построенной связи, например, с точки зрения механиз ма наследования свойств. При работе стратегий выявления и подтверждения сходства сценарий работы называется системой. Моделирование рас�уждений в системе MIR Введем следующие обозначения: • О - опрос признаков из множества S; • П - порождение множества гипотез Г; • И - исключение м ножества гипотез Г. Э.1I ементы данных типа • стрелка �- , соответствующие отношению R 12, буде м назы вать отрицательными связями, остальные - положительными. Работа системы MIR начинается с работы модуля О, затем моду-!,(Ь П строит м но жество гипотез Г на основе анализа положительных связей S с Г для подтвержден ных признаков S. М ножество гипотез Г используется модулем О для порождения нового множества признаков S " связанных с гшютезами из Г положи:тельными связями, и осуществления их тести рования. К подтвержден н ым признакам из S 1 применяется модуль П для порожд ения нового множества гипотез Г I " Выполня ются операции Г: "" Г u Г 1 , S: = S u S 1 • Этот процесс продолжается итеративно до стабилизации множества S и Г. Затем выполняется модуль И исключения гипотез из Г на основе анализа отрицательных связей для подтверждения симптомов и анализа положительных связей для обусловленных признакрв, то есть таких не- 160 Глава 4 • Технологи и инженер ии знан и й подтвержденных признаков, отсутствие которых имеет большее значение для принятия решения, чем их присутствие. Если в результате выполнения модуля И во множестве гипотез осталось более одной гипотезы, то выполняется поиск дифференциальных признаков для под множеств множества гипотез (дифференциальным признаком для некоторого множества гипотез называется значение свойства, характерное для одной гипо тезы из множества и нехарактерное для других, или событие, связанное положи тельной связью с одной гипотезой из множества и не связанное та1<овой с други ми). В результате этого процесса происходит исключение соответствующих гипотез. При необходимости процедура повторяется для оста�шегося множества гипотез до его стабилизации. После выполнения еще нескольких модулей осуществляется анализ полученного множества гипотез с целью поиска его минимального подмножества, связанного положительными связями со всеми подтвержденными признаками и тем самым объясняющего их. Это последнее множество и считается окончательным резуль татом. Новые тенденции и прикладные аспекты ин�енерии знании о о □ о □ Латентные структуры знаний и психосемантика Метод репертуарных решеток Управление знаниями Визуальное проектирование баз знаний как инструмент ·п ознания Проектирование гипе р медиа БД и адаптивных обучающих систем 5. 1 . Латентные структуры знаний и психосемантика Большинство систем приобретения знаний (обзор в п. 4.5) облегчают сложньiй и трудоемкий процесс формирования баз знаний и реализуют прямой диалог с экспертом. Однако выявляемые таким образом. струnуры знаний часто отражают лишь поверхностную составляющую знаний эJ(сперта, не затрагивШ.J их глубин- · ной структуры. Этим же недостатком обладает большинство методо� непосред ственного извлечения знаний (параграфы 4. 1 .-4.3). Для извлечения глубинных пластов экспертного знания можно воспользоваться методами психосемантики - науки, возникшей на стыке когнитивной психоло гии, психолингвистики, психологии восприятия и исследований индивидуаль ного сознания. Психосемантика исследует структуры сознания через моделиро вание индивидуальной системы знаний [Петренко, 1988] и выявление тех _ категориальных: структур сознания, которые могут не осознаваться (латентные, имплицитные или скрытые) [Петренко, 1983; Терехина, 1988; Шмелев, 1 983] . Глава 5 • Н ов ы е тенден ции и при кл адн ы е асп е кты и н женерии зна н ий 5 . 1 . 1 . Семантичес кие п ространства и п сихол о ги ч еское w ка 11 ирован ие Основным методом экспериментальной психосемантики является метод рекон• струкции субъективных семантических пространств. Здесь психосемантика ·тес но сплетается с психолингвистикой и лингвистической семантикой - с методо логией выявления значений слов, лексикографией, •падежной грамматикой• и структурными исследованиями (Апресян, 1977; Мельчук, 1974; Соссюр, 1977; Филлмор, 1983; Щерба, 1974) . Однако лингвистические методы в основном на· правлены на анализ текстов, отчужденных от субъекта, от его мотщюв и замыс лов. Психолингвистические методы обращаются непосредственно к испытуемому. Большинство из них связано с различными формами субъективного шкалирова ния. Перед испытуемым ставится задача оценить •сходство знаний• с помощью некоторой градуированной шкалы, например от О до 5 или от О до 9. В этом случае исследователь получает в руки численно представленные стандартизированные данные; легко поддающиеся статистической обработке. Психосемантика - как одно из молодых направлений современной психологии [ Петренко, 1988; Шмелев, 1 983) - сразу была оценена специалистами в области искусственного интеллекта как перспективный инструмент, позволяющий ре конструировать семантическое пространство памяти как психологическую мо дель глубинной структуры знаний эксперта. Уже цервые приложения психосе мантики в ИИ в середине 80-х годов позволили получить достаточно наглядные результаты. В психологии семантические прос_транства выступают как модель категориальной структуры индивидуального сознания. При концептуальном анализе знаний структуру семантического пространства эксперта можно считать основой для формирования поля знаний. При этом отдельные параметры семан тического пространства соответствуют различным компонентам поля (размер ность пространства соотносится со сложностью поля, выделенные понятийные структуры с метапонятиями, содержательные связи между понятиями-стиму лами - это суть отношения и т. д.). Легче всего познакомиться с экспериментальной психосемантикой на примере, связанном с выявлением структуры и размерности семантического пространства знаний из некоторой предметной области [Петренко, 1988). В основе построения семантических пространств, как правило, лежит статисти ческая процедура (например, факторный анализ [Аверкин, Батыршин, Блишун и др., 1986] , многомерное шкалирование [Тиори, Фрай, 1985) или йластерный анализ [Дюран, Оделл, 1977)), позволяющая группировать ряд отдельных при знаков описания в более емкие категории-факторы. Говоря на языке поля знаний, это - построение кон1:'ептов более высокого уровня абстракции. При геометри ческой интерпретации семантического пространства значение отдельного при знака отображается :как точка или вектор с заданными координатами внутри n-мерного пространства, координатами которого выступают выделенные факто- 1 63 5. 1 . Л ате нт н ы е стру ктур ы з н а н и й и пс ихосе ма н ти ка ры. Построение семантического пространства, таким образом, включает переход к описанию предметной области на более высокомуровне абстракции, то есть пе реход от язьiка, содержащеrо большой алфавит признаков описания, к более ем кому языку концептуализации, содержащему меньшее число концептов и вы ступающему своеобразным метаязыком по отношению к первому. В зависимости от опыта и профессиональной компетентности испытуемых раз мерность пространства и расположение в ней первичных понятий может суще ственно варьироваться. Эта особенность семантических пространств может быть использована на стадии контроля в процессах обучения, при тестировании экс периментов и пользователей. П р имер 5 . 1 l)к, для проверки знаний и понимания английского языка в работе [Терехина, 1988] были взяты десять наиболее распространенных предлогов, достаточно трудно перево димых. На экране дисплея испытуемому предъявлялась пара предлогов и спрашива лось, часто ли у него вызывает затруднения выбор одного из этих предлогов. Степень затрулнения оценивалась в баллах от 1 до 9 . На этих данных методами многомерного шкалиров�ния была построена структура сложности употребления английских пред логов с точки зрения носителя русского языка. Эта модель существенно зависит от уровня знаний. Так, модель новичка не представляет организованной структуры . У людей, имеющих определенные навыки, проявилась некоторая структурирован ность семантического пространства, в нем отчетливо обозначились пары и тройки сходных предлогов. to from Рис. 5. 1 . Семантическое пространство близости английских предлогов 1-lаиболее четкая и связная структура приведена на рис. 5. 1 . По ней можно объяснить особенности дифференциации предлогов в английском языке. Основа структуры пред . с'тавляется в виде окружности, близкие точки на которой соответствуют трудно диф ференцируемым предлоrам. Структура опирается на две ортогональные оси. Ось абс . цисс соответствуt;:r предлогам направления движения, а ось ординат - предлогам цел'и средства. 1 64 Глава 5 • Н овы е тенденции и при кл адн ы е ас п екты �1-1женер и и з н а н и й На Qсновании получаемых методами псщосемантики мо,целей, можно чроводить контроль знаний. При анализе индивидуальных семантических пространств вы являются вопросы, которые не усвоены и не уложились в систему. Контроль структуры знаний проводится на основе сопоставления семантических про странств хороших специалистов и новичков ( студентов, слушателей, молодых специалистов). Степень согласованности семантических пространств (их размер ности, признаки и конфигурации понятий) будет определять уровень знаний но вичка. Однако здесь необходимо учесть, что семантические пространства двух квалифи цированных специалистов могут быть разными, так как содержат индивидуаль ные различия восприятия, отражающие опыт и характер деятельности человека. Поэтому не всегда можно формально сравнить семантические пространства экс перта и новичка, следует предварительно изучить семантические пространства нескольких специалистов, а затем уж производить сравнение. В работе [ Кук, Макдональд, 1 986) описан подобный эксперимент. Были получе ны когнитивные структуры знаний опытного летчика-истребителя и пилота-но вичка, с использованием двух методов: многомерного шкалирования (алгоритм MDS - Alscal) и сетевого шкалирования со взвешенными связями (алгоритм Pathfinder). Оба алгоритма основаны на использовании оценок психологичес кой близости. Опытный пилот и пилот-новичок оценивали все возможные nap Hf:de сочетания 30 связанных с полетом понятий, приписывая числа от О до 9 каж дой паре, где О обозначал самую слабую степень связи между понятиями, а 9 самую сильную. Эти оценки затем обрабатывались с применением обоих алго ритмов шкалирования. В соответствии с алгоритмами; MDS каждый концепт, выражающий некоторое понятие, помещается в к-мерное пространство таким образом, что расстояние между точками отражает психологическую близость соответствующих кон цептов. Алгоритм Pathfinder строит семантическую сеть [Schvaneveldt, Durso, Dearholt, 1 985) . Дуги могут быть либо ориентированными (несимметричное отношение), либо неориентированными (симметричное отношение). Оба мето да обеспечивают сжатия больших объемов данных (в форме попарных оценок) к меньшему набору параметров; однако нацелены они на выявление разных . свойств исследуемых структур. Если в алгоритме Pathfinder центром внимания являются локальные отношения между концептами, то алгоритм MDS обеспечи вает более широкое понимание свойств метризуемого пространства концептов. Результирующие когнитивные структуры оказались близкими для летчиков-ис требителей с одинаковым уровнем опыта, но были различными для разных групп испытуемых. Авторы экспериментов обнаружили, что по когнитивной структуре, характерной для летчика-истребителя, можно установить, новичок он или опыт ный пилот. Наконец, проведенный ими же анализ когнитивных структур вьrявил наличие концептов и отношений, общих для представлений онытноrо специали ста и новичка, и, кроме того, ряд концептов и отношений, которые появились 1 65 5. 1 . Л ате нтн ые структур ы зн а н ий и психосема нти ка тоnько в одном из представлений. Прямым развитием рассмотренной работы ста ла экспертная система управления воздушным боем ACES [ Goldsmith, Schvane · veldt, 1985 ]. Аналогичное исследование механизмов накопления опыта было проведено в об ласти программирования на ЭВМ [Cooke, 1985]. С помощью методов шкалиро вания было показано, что один из аспектов программистского опыта включает в себя организацию знаний соответственно замыслу программы, или семантике, а не в соответствии с синтаксисом. Прим е р 5.2 Сетевое представление абстрактных понятий программирования н а основе оценок связности концептов у программистов показано на рис. 5.2. Эксперимент показал, что в�ех программистов на основе анализа структуры семантического пространства можно разбить на три группы: новички, неопытные -специалисты среднего уровня, опытные специалисты. Это заключение совпадает с результатами, полученными в работе [Гав рилова, 1 984] . Кроме того, исследовалась эволюция коrnитивной структуры програм миста по мере его продвижения от новичка до опытного специалиста. Параметр -.-----т-- Подnроrрамма i----------1 Оператор Отладка Проrрамма Выход Чисnовые данные Глобал ьная переменная Симвоnьные .,____, данные - 1--------t..__......__ Сортировка Покск ПОвторение Рис . 5 .2. Ассоци ативная сеть структуры зн аний эксперта-п рограммиста Интерпретация выявленных отношений (связей) между понятиями требует дополни тельн�х усили� от коллектива разработчиков ЭС. Так, например, означивание дуг на _ рис. 5.2. потребовало дополнительного эксперимента , участникам которого была пред ложена пара понятий и поставлена задача дать словесное описание связи между поня тиями. пары. Результаты представлены в табл. 5. 1 . Таким образом, ассоциативная сеть на рис. 5.2 может быть превращена в семантическую. 166 Гл ава 5 • Н ов ы е тенде н ци и и п ри кл адные ас П(tКТЫ инженери и з на н и й Таблица 5. 1 . Описание свя� между понятиями Свяэвнные'nвры nонятий Отношение между связанной nарой понятий Подпрограм ма - программа Си маольные данные - выход Параметр - программа Программа - выход Сортировка - поиск Численные данные - параметр Функция - оператор Функция - программа Отладка - программа Выход - численные данные Массив - си м вольные данные Функция - подпрограмма Присваивание значений - параметр Массиа - глобальная перемена Массив - численные данные Повторение - сортировка Программа - алгоритм Сортировка - алгоритм Сортировка - численные данные Присваивание - оператор Есть часть Есть тип Используется Производит Вкл ючает в себя Может быть Есть Есть часть Подвергается Состоит из Может состоять из Есть Используется для Может быть Может состоять из Есть часть Есть выполнение Есть Делается на Есть Все упомянутые выше методы (включая кластерный анализ) можно отнести к методам псих ологического шкалирования. Их основу составляют алгоритмы преобразования сложных структур данных в более понятную форму, которая предполагается псих ологически содержательной. Результирующее представле ние зависит от метода: • кластерный анализ порождает древовидную структуру [Дюран, Оделл, 1 977]; • многомерное шкалирование и факторный анализ - пространственную [Окунь, 1974; Терехина, 1986] ; • алгоритм MDS - сетевую [Кук, Макдональд, 1986] ; • репертуарные решетки (см. параграф 5.2 и работу [ Франселла, Баннистер, 1987] ) порождают конструкты или метаизмерения [Кintsch, 1 974]. Формальная методология психосемантического шкалирования позволяет час тично автоматизировать процесс структурирования знаний и получать «когни тивный разрез• его представлений о предметной области. Методология шкалиро вания позволяет выявлять структуры знания косвенным путем при получении ответов от экспертов на довольно простые вопросы (например, «насколько близ I<И понятия Х 1 и Х 2 • вместо «скажите, какова связь между Х 1 и Х 2 как они :влияют друг на друга•). 5. , . Лате нтн ы е стру ктуры �наний и nсихос еманти ка 1 67 Почти все эксперименты позволили выявить одну закономерность. Размерность семаmического просtранства с повышением уровня профессионализма умень шается. Этот вывод согласуется с известными положениями когнитивной психо логии о том, что процесс познания сопровождается обобщением. Построение семантического пространства обычно включает три последователь ных шага [Петренко, 1 983). 1 . Выбор и применение соответствующего метода оценки семантического сход ства. Этот шаг включает в себя эксперимент с испытуемыми, которым предла гается оценить общность предъявляемых стимульных признаков на некоторой шкале. 2. Построение структуры семантического пространства на основе математичес кого анализа полученной матрицы сходства. При этом происходит уменьше ние числа исследуемых понятий за счет обобщения и получения генерализо ванных осей. 3. Идентификацию, интерпретацию выделенных факторных структур, кластеров или групп объектов, осей и т. д. На этом шаге необходимо найти смысловые эквиваленты, языковые •ярлыки• для выделенных структур. Здесь большое значение приобретает лингвистическое чутье и профессионализм специалис та, проводящего исследование, и экспертов-испытуемых. Часто к интерпрета ции привле�т группу экспертов. . 5 . 1 . 2 . Методы многомерного ш калирования В дальнейшем развитие методов психqсемантики шло по .линии разработки удобных пакетов прикладных программ, основанных на методах многомерного шкалирования (МШ), факторного анализа, а также специализированных мето дов (статистической) обработки репертуарных решеток [Франселла, Баннистер, 1987) . Примерами пакетов такого типа являются системы KELLY [ Похилько, Страхрв, 1990], MADONNA [Терехина, 1 988], MEDIS [Алексеева, Воинов и др., 1 9891. С другой стороны, специфика ряда конкретных приложений, прежде все го - в инженерии знаний, требовала также развития иных (не численных) мето дов обработки психосемантических данных, использующих - в той или иной форме - парадигму логического вывода на знаниях. Ярким примером этого на правления служит система AQUINAS [Boose et al. , 1 989; Boose, 1 990) . Однако анализ практического применения систем обоих типов к задачам инженерии знаний приводит к выводу о несовершенстве имеющихся методик и необходимо сти их развития в соответствии с современными требованиями инженерии зна ний. Наибольшие перспективы в этой области, по-видимому, у методов много мерного шкалирования). Многомерное шкалировщше (МШ) сегодня - это математический инструмен тари;й, предназцаченный для обработки данных о попарных сходствах, связях и.ли отношениях между анализируемыми объектами с целью представления этих объектов в виде точек некоторого координатного пространства. МШ представ� ляет собой один из разделов прикладной статистики, научной дисциплины, раз- 1 68 Глава 5 • Н о вы е те нде н ции и п рикл адны е ас пе кты инже н ери и з наний рабатывающей и систематизирующей понятия, приемы, математические методы и модели, предназначенные для сбора, стандартной записи, систематизации и обработки стапiстических данных с целью их лаконичного представления, ин терпретации и получения научных и практических выводов. Традиционно МШ используется для решения трех типов задач: 1 . Поиск и интерпретация латентных (то есть скрытых, непосредственно не на блюдаемых) переменных, объясняющих заданную структуру попарных рассто яний (связей, близостей). 2. Верификация геометрической конфигурации системы анализируемых объек тов в координатном пространстве латентных переменных. 3. Сжатие исходного массива данных с минимальными потерями в их информативности. Независимо от задачи МШ всегда используется как инструмент наглядного представления (визуализации) исходных данных. М Ш широко применяется в исследованиях по антропологии, педагогике, психологии, экономике, социологии [Дэйвисон, 1 988]. В основе данного подхода .лежит интерактивная про цедура субъективного шка лирования, когда испытуемому (то есть эксперту) предлагается оценить сходство между различными элементами П с помощью некоторой градуированной шкалы (например, от О до 9, или от -2 до +2). После такой процедуры аналитик распола гает численно представленными стандартизованными данными, поддающимися обработке существующими пакетами прикладных программ, реализующими раз личные алгоритмы формирования концептов более высокого уровня абстракции и строящими геометрическую интерпретацию семантического пространства в ев клидовой системе координат. Основной тип данных в МШ - меры близости между двумя объектами (i, j ) dij. Если мера близости такова, что самые большие значения dij соответствуют парам наиболее похожих объектов, то dij - мера сходства, если, наоборот, наиме нее похожим, то dij - мера различия. МШ использует дистанционную модель различия, используя понятие расстоя ния в геометрии как аналогию сходства и различия понятий (рис. 5.3). Для того чтобы функция d, определенная на парах объектов (а, Ь), бьiла евКJtидо вым расстоянием, она должна удовлетворять следующим четырем аксиомам: d(a,b) � о, d(a,a) = О, d(a,b) = d(b,a), d(a, b ) + d(b, c ) � d(a,c) . Тогда, согласно обычной формуле евклидова расстояния, мера различия двух объектов i и j со значениями признака k у объектов i и j соответственно х и х : 2 Би = du = I, (x;k - xjk ) [ k=l К ]½ ik jk 5. 1 69 J, Лат:ентные структуры з наний и психосема нти ка L (3; 1 ) М (-3; 2) Рис . 5 . 3 . Расстоян ие в евклидовой метрике Дистанционная модель была многократно проверена в социологии и психологии [Monahan, Lockhead, 1 977; Петренко, 1 988; Шмелев, 1 983] , что дает возможность оценить ее пригодность для использования. В большинстве работ по МШ используется матричная алгебра. Геометрическая интерпретация позволяет представить абстрактные понятия матричной алгебры в конкр,етной графической форме. Для облегчения интерпретации решения за дачи МШ к первоначально оцененной матрице координат стимулов Х применя ется вращение. Среди множества алгоритмов МШ широко используются различные модифика ции метрических методов Торrерсона [Torgerson, 1958], а также неме трические модел�. например Крускала [ Kruskal, 1964] . При сравнении методов МШ с другими методами анализа, теоретически приме нимыми в инженерии знаний (иерархический кластерный анализ [Д юраи, Оделл, 1977] или факторный анализ [Иберла, 1 980]), МШ выигрывает за счет возможно сти дать наглядное количественное координатное представление, зачастую более простое и поэтому легче интерпретируемое экспертами. 5 . 1 . 3 . Использован ие метафор для выявления «с крытых» структур знаний Несмотря на кажущуюся близость задач, инженерия знаний и психосемантика существенно отличаются как в теоретических основаниях, на которых они бази руются, так и в практических методиках. Но главное отличие заключается в том, что инженерия знаний направлена на выявление - в конеч:ном итоге - модели рассуждений [Поспелов, 1 989], динамической или операциональной составляю щей ментального пространства (или функциональной структуры поля знаний S 1), в то время как психосемантика, пытаясь представить ментальное простран ство в виде евклидова пространства, позволяет делать fшдимой статическую структуру взаимного •расположения• объектов в памяти, в виде проекций скоп лений объектов (концептуальная структура S k ). · 1 70 Глава 5 • Новые тенденции и прикладные ас�кты 1-1нженерии ·энаний Помимо этого следует отметить ряд недостатков методов психосемантики с точ·ки зрения практиче<::кой инженерии знаний. 1. Поскольку в основе психосемантическоrо эксперимента лежит процедура из мерения субъективных расстояний между предъявляемыми стимулами, то и результаты обработки такого эксперимента, как правило, используют геомет рическую интерпретацию - евклидово пространство небо�ьшоrо числа изме рений (чаще всего - двумерное). Такое сильное упрощение модели памяти может привести к неадекватным базам знаний. 2. Естественность иерархии как глобальной модели понятийных структур созна ния служит методологической базой ОСП. Кроме того, и в естественноh,J· языке понятия явно тяготеют к различным уровням обобщения. Однако в бdльшин стве прикладных пакетов не предусмотрено разбиение семантического про странства на уровни, отражающие различные степени общности понятий, -вклю ченных в экспериментальный план. В результате получаемые кластеры понятий, пространственно изолированные в геометрической модели шкали рования, носят таксономически неоднородный характер и трудно поддаются интерпретации. 3. Единственные отношения, выявляемые процедурами психосемантики, - это -.далеко - близко• по некоторой шкале. Для проектирования и построения баз знаний выявление отношений является на порядок более сложной задачей, чем выявление понятий. Поэтому семантические пространства, полученные в р� зультате шкалирования и кластеризации, должны быть подвергнуты дальней шей обработке на предмет определения отношений, особенно функциональ нь1х и каузальных. Нельзя ожидать, что эти противоречия могут быть разрешены быстро и безболез ненно, в силу того, что математический аппарат, положенный в основу всех паке тов прикладных программ по психосемантике, имеет определенные границы применимости. Однако одним из возможных путей сближения без нарушения чистоты процедуры видится расширение пространства конкретных объектов стимулов предметной области за счет добавления некоторых абстрактных объек тов из мира метафор, которые заставят эксперта-испытуемого выйти за рамки объективности в мир субъективных представлений, которые зачастую в большей степени влияют на его рассуждения и модель принятия решений, чем традицион ные правильные взгляды. Ниже описан подход, разработанный совместно с Воиновым А. В. [Voinov, Gav rilova, 1 993; Воинов, Гаврилова, 1 994] и позволяющий вывести эксперта за гра ницы традиционной установки и тем самым выявить субьективные, часто скры ваемые или скрытые структуры его профессионального опыта. Большинство результатов, полученных в коmитивной психологии, подтвержда ют, что у человека (в том числе и у эксперта) формальные знания о мире (в част ности, о той предметной области, где он является экспертом) и его личнь1й пове денческий опыт не могут существовать изолированно, они образуют целостную, стабильную структуру. В западной литературе за этой ·структурой закрепилось 51 1 .._.Ла,;�н.т ные структуры знани й и пс ихосемантика 171 название •11,Jодел11 (или картина) мира•. Принципиальным сво·й ством модели мира является то, что ее структура не дана человеку - .ее носИ1'ел;ю -· в интрос пекции, она работает на существенно латентном, . неосознаваемом уровне, зачас тую вообще ничем не отмеченном (в символической форме) на поверхности вер бального сознания. Изучение модели мира человека является задачей когнитивной психологии, пси хосемантики и прочих родственных дисциплин. Что же касается эксперта как объекта пристального внимания инженерии знаний, то здесь одна из проблем, в решении которых может помочь психосемантика, связана с необходимостью (и неизбежностью) отделения опыта эксперта от его объективных знаний в про цессе формализации и структурирования последних для экспертных систем. Строго говоря, невозможно указать ту грань, за которой знания (которые можно форма..�шзовать и извлечь) переходят в опыт (то есть в то, что остается уникаль ной, неотчуждаемой собственностью эксперта). Более корректно, по-видимому, говорить о неком континууме, детальность градации которого может зависеть от конкретной задачи. Например, можно выделить следующие три уровня: 1 . Знания, предназначенные для изложения или доказательства (аргументации), например, на междисциплинарном уровне или для популярной лекции (вер бальные). 2. Знания, которые применяются в реальной практике, - знания еще вербализуемые, но уже нерефлектируемые. 3. Собственно опыт, то есть знания, лежащие на наиболее глубоком, неосознава емом уровне, отвечающие за те решения эксперта, которые внешне ( в том чис ле и для него самого) выглядят как мгновенное озарение или -.инсайт�, интуц тивный творческий акт (интуитивные). Классическая методика психосе.м антическоrо эксперимента также не позволяет выделить из его результатов интуитивный уровень. Это видно из самой тестовой процедуры. Просят ли испытуемого оценить сходство-раэличие стимулов напря мую или же предлагается оценить их соответствие некоторым -.конструктам• - в любом случае испытуемый вольно или невольно настраивается на необходимость доказательности своего ответа в терминах объективных с�ойсtв стимулов. Большинство методов извлечения зн�ний ориентировано на верхни� - вербаль ные или вербализируемые - уровни знания. Необходим косвенный метод, ори ентированный на выявление скрытых предпочтений практического опыта или операциональнwс составляющих опыта. Таким методом может служить метафо рический подход. Метафорический подход, впервые описанный с чисто лингвис тических позиций [Black, 1962; Ricoeur, 1975], а также с позиций практической психолоrцlf [Гордон, 1987], был видоизменен для нужд инженерии знаний. На пр 1:1мер, в экспериментах no объ ективному сравнению языков проrраммирова1-JИЯ м�у собой были также использованы два метафорических «мира• - мир живщных и мир транспорта. 1 72 1 Глава 5 • Но в ы е тенден ци и и при кладн ы е аспекты и нже н ерии , э н.ани й В рамках этого подхода удалось экспериментально доказать следующие тезисы: • метафора работает как фw�ьтр, выделяющий, посредством подбора адекват ного объекта сравнения, определенные свойства основного объекта (то ееть того, о котором собственно и идет речь). Эти вь1деляемые свойства имеют су щественно операциональный характер, проявляющийся на уровне полимор физма методов, так как метафора по самой своей сути исключает возмож ность сравнеция объектов по их внутренним, объективным свойствам; • метафора имеет целью скорее не сообщить что-либо о данном объекте (то есть ответить на вопрос • что это?•), а призвать к определенному отношению к нему, указать на некую парадигму, говорящую о том, как следует вести себя по отношению к данному объекту; • субъективному сдвигу в отношении к основному объекту (например, 1( языку программирования) сопутствует также и сдвиг в восприятии объекта сравне ния (например, к конкретному животному) в силу вышеуказанной специфики фильтруемых метафорой свойств. Поэтому объект сравнения выступает в ме тафоре не по своему прямому назначению, то есть это не просто •лев• как представитель фауны, а воплощение силы, ловкости и могущества; • в том случае, когда метафора сопоставляет не единичные объекты, а некоторые их множества, в которых объекты связаны осмысленными отношениями, про странство объектов сра1внения должно быть изоморфно пространству основ ных объектов по системе указанных отношений. На эти тезисы опирается предлагаемая модификация классической методики со поставления объектов, применяемой, например, в оценочной решетке Келли [Kelly, 1955]. При проведении эксперимента была использована система MEDIS [Алексеева, Воинов и др., 1989; Воинов, Гаврилова, 1994]. Эта система позволяет планировать, проводить и обрабатывать данные произвольного психосеманти ческоrо эксперимента. Помимо классической парадигмы многомерного шкалиро вания, система MEDIS включает в себя некоторые возможности теста репертуар ных решеток. В частности, она позволяет работать со стимулами двух сортов так называемыми элементами и конструктами (с единственным исключением: конструкты в системе MEDIS - в отличие от классического теста репертуарных решеток - монополярны). Естественно, выбор базового инструментария суще ственно повлиял на описываемую экспериментальную реализацию методики. В качестве предметной области был выбран мир языков программирования. В про странство базовых понятий (выступавших в методике в качестве элементов) бы ло включено несколько более или менее популярных языков программирова ния, принадлежащих к следующим классам: • языки искусственного интеллекта; • традиционные процедурные языки • так называемые •макроязыки•, обычно реализуемые в оболочках операционных систем, текстовых редакторах и т. д. В качестве метафорических прос'Jlранств выбраны мир животных и мир транс порта. Объекты этих миров выступали в методике в качестве (монополярных) конструктов, На первом этапе эксперимента каждьJЙ из респондентов · выпол- 5 .' 1 . · Латентны е с труктуры з н аний и психосем антика 1 73 нял классическое попарное субъективное шкалирование элементов. На воп рос, -.Есть·ли что-либо общее между данными язьrками программирования•, рес понденту предлагалось ответить одной из следующих альтернатив. /JA! /JjJ. ??? Нет НЕТ! r 1 2 3 4 5 Объекты оч е н ь-бли зки Между об ъектам и есть что-то об щ ее Неоп ределенны й ответ О бъекты различны О бъекты сове ршенн о несов мести мы Данные этого этапа (отдельно для каждого из респондентов) подвергались об работке методами многомерного шкалирования (см . выше) и представлены на рис. 5.4. Результатом такой обработки является некоторое евклидово пространство не большого числа измерений, в котором исходные оценки различий представлены геометрическими расстояниями между точкам». Чем лучше эти расстояния соотi ветствуют исходным различиям, тем более адекватным считается результат обра ботки в целом . При этом буквальное совпадение расстояний и числовых кодов ответов, естественно, не является обязательным (хотя оно и возможно в некото рых модельных экспериментах). Более важным оказывается ранговое соответ ст вие расстояний исходным оценкам . А именно, в идеальном случае все расстоя ния. между точками, .соответствующие (например) ответам •дА I • в исходных данных, должны бьпь меньше (хотя бы и на доли процента масштаба шкалы) всех расстояний, соответствующих ответам •да•, и т. д. В реальном эксперименте идеальное соответствие невозможно в принципе, так как целью обработки является сжатие, сокращение размерности данных, что ог раничивает ·ч исло координат ных осей результирующего пространства . Тем не менее алгоритм шкалирования пытается - насколько это возможно - миними зировать ранговое несоответствие модели исходным данным. Геометрическую модель шкалирования можно интерпрет ировать по-разному: • во-первых, можно выяснить·смысл координатных осей результирующего про с транст ва .. Эти оси по сути своей аналогичны факторам в факторном анализе, что позволяет использовать соответствующую парадигму интерпретации, де тально разработанную в эксперимент альной психологии. В данном случае можно считать, что выявленные факторы играют роль базовых категорий, или базовых (латентных) конструктов, с помощью которых респондент (как ·пра вило, неосознанно) упорядочивает свою картину мира (точнее, ее проекцию на данную предметную область); • во-вторых; можно проанализировать компактные группировки стимулов этом nрост ранстве, отождествив их с некоторыми существенными (хотя 'и скрытыми о т ин троспекции) таксономическими единицами, реально при сутствующими в модели мира эксперта. Сущест венно , что делается попы тка интерпретировать кластеры; полученные по модели шкалирования, а не по исходным числовым кодам различий. Это вытекает из предположения, что в 1 74 Гла ва 5 • Н о в ые тенде н ции и при кладн ые аспекты и нже н ерии з на ний информация, не воспроизводимая главными (наиболее нагруженными) ,фак• торами, является «шумом•, сопутствующим любому (а особенно психологи ческому) эксперименту. Рисунок 5.4 отражает традиционную классификацию языков программирова ния и легко поддается вербальной интерпретации. Например, на рисунке r9ри зонтальная ось соответствует делению языков программирования на. « языки ис кусственного интеллекта• (левый полюс шкалы) и « традиционные яз.ь1 ки программирования• (правый полюс). Вертикальная ось отражает 1шассифика цию языков программирования в зависимости от уровня - языки высокого уровня (нижний полюс) и языки низкого уровня или системные яз.ык.и (верхний полюс). у • AssemЫer • С++ • Pвscal .с • Fortran • Prolog • Smalltalk • LISP х • Dbaselll+ • Clipper • Basic • Multi-Edit Масго • DOS Batch . Рис. 5.4. Класс ификация языков прог раммирования Основная экспериментальная процедура - попарное сравнение некоторых объек тов и выражение степени их сходства (несходст ва) на числовой оси или выделе ние пар близких объектов из предъявленной триады - сама по себе накладывает больmое количество ограничений на выявляемую структуру, в частности: 1 . Из-за выбора стимульноrо материала (выбор объектов ост ается за инженером по знаниям). 2. Из-за несовершенства шкалы измерений. 3. В связи с рядом допущений математического аппарата. Но главное, что полу ченная структура знаний чаще всего носит академический характер, то есть отражает объективно существующие, но легко объяснимые, как бы лежащие на поверхности закономерности. Это связано с психолрrической установкой самого эксперимеJПа, во время кото рого эксперта как бы проверяют, экзаменуют и он, естественно, стремится да·вать правильные ответы. На следующем этапе эксперимента респонденту nредлаrалось сопоставить каж дый из языков программирования с каждым из метафорических персонажей. Как и на первом этапе, пары предъявлялись в равномерно-случайном порядке (ана.r.10- 1 75 5А :-Л атентные структуры знаний и пс и хосе м ант ика гичном расписанцю кругового турнира в спортивных играх). Инструкция для со· поставления выглядела следующим образом: Попробуйте оценить выразительную силу данной метафоры: .ЛИСП - это слон• или .с++ - это. яхта •. , Результирующая таблица числовых кодов оценок (идентичная оцено�ной решет ке Келли) была также обработана методами многомерного шкалирования про граммы М�ДИС. Результаты представлены на рис. 5.5 и 5.6. у • Multl-Edit Мвсrо ' □ Pcen • Basic □ Кот . • DOS Вatch □П х ету 8 Dbaselll+ □ Обезья на • AssemЫer □ Л иса • Prolog • Pascal 8 LISP □ Павл ин □ Тиrр ) Зая ц □ Волк 8 Smalltalk □ Ле в 4 Fortran ,с □ Конь 8 Clipper □ Слон х • С++ Рис. 5.5. Метафорическая классификация я з ыков програ ммирования (ми р животных) у • Pascal 1 Вasic □ IТ'влеrа ;:� Велосипед □ Поезд • Fortran □ Автомобиль • С++ □ Па роход □ Яхта 8 DOS Batch .с 8 Smalltalk • Prolog 8 Dbaselll+ □ Самолет • Clipper 8 LISP 8 Multi-Edit Macro □ Метро □ Слон □ Авто&iс □ Грузовик l х 8 Clipper Рис. 5.6. Метафорическая классификация языков п рограммирования (мир тр анспо рта) При интерпретации удалось выявить такие латентные понятия и структуры, как •степень. изощренности языка• (шкала Х рис. 5.5), •сила• (шкала У рис. 5.5), •универсальность• (шкала У рис. 5.6), •скорость• (шкал;� Х рис. 5.6) и др. Кроме этого, полученные рисунки позволили выявить скрытые предпочтения эк· сперта и существенные характеристик и объектов, выступ<Ц)mих в виде стиму лов -:- •силу• �зыка С ( •с,лон• ); скорость С++ (•яхта•); •старомодность• Форт рана (•телега•) и пр. 1 76 Глава 5 • Н овы е тенден ции и пр икл адн ые асп екты инжене рии э н ани й В применении к реальному процессу извлечения знаний это обстоятельство ста новится принципиальным, так как позволяет на самом деле отделить те знания, благодаря которым эксперт является таковым (уровень В), от общезначимых; ба нальных (для экспертов в данной предметной области) знаний (уровень А), кото рые возможно и не стоят того, чтобы ради них создавать собственно экспертную систему. Однако можно ожидать, что во многих (если не в большинстве) случаях выявлен ные латентные структуры могут полностью перевернуть представления инжене ра по знаниям о предметной области и позволить ему существенно углубить базу знаний. Введение мира метафор - это некая игра, а игра раскрепощает сознание эксперта и, как все игровые методики извлечения знаний (п. 4.2), является хоро шим катализатором трудоемких серий интервью с экспертом, без которых сегод ня невозможна разработка промышленных интеллектуальных систем. 5 . 2 . Метод реп е ртуа р ных решеток 5 . 2 . 1 . Осно вные п онятия Среди методов когнитивной психологии - науки, изучающей то, как человек по знает и воспринимает мир, других людей и самого себя, как формируется целост ная система представлений и от ношений конкретного человека, особое место за нимает такой ме тод личност:ной психодиагностики, как метод репертуар11ых ре шеток (•repertory grid� ). Впервые метод был сформул·и рован автором теории личностных конструктов Джорджем Келли в 1955 r. Чем шире набор личностных конструктов у субъекта, тем более многомерным, дифференцированным является образ мира, человека, других явлений и предметов, то есть тем выше его когнитивная сложность [ Гав рилова, 1988). Репертуарная решетка представляет собой матрицу, ко торая заполняется либо самим испытуемым, либо экспериментатором в процессе обследования или бесе ды. Столбцу матрицы соответст вует определенная группа объектов, или, иначе, элементов. В качестве объектов могут выступать люди, предметы, понятия, отно шения, звуки, цвета - все, что интересует психодиаrноста. Строк и матрицы . представляют собой конструкты биполярные признаки, параметры, шкалы, альтернативные противоположные отношения или способы поведения. Конструкты либо задаются исследователем, либо выявляются у испытуемого с помощью специальных приемов и процедур выявления. Вводя понятие конст рукта, Келли объединяет дее функции: функцию обобщения (установления сходства) и функцию противопоставления. Он предлагает несколько определе ний понят ия «констру�т •. Одно из них: "'"7'" Конструкт - зто'некоторый п ризнак или свойство, п о которому iJ,Ja или несколько объек тов сходны между собой и, следовательно, отличны от третьего объекта или нескольких других объектов. 5.2 . 1 Метод репертуарных решето к · 1 77 НапримеJ>, , Выделение из трех предметов . •диван. кресло, стул• двух •диван и кре� .выявляет конструк.т •мягкость мебели•. КелJJИ в своих работах подчер.- . кивает биполярность конструктов. Он считает, что, утверждая что-нибудь, мы всегда одновременно что-то отрицаем. Именно биnолярность конструктов делает возможным построение репертуарной решетки. Например, север - юг - это ре ферентная ось: элементы, которые в одном контексте являются -.севером•, в дру гом становятся, -•югом•. Возможности конструкта ограничены. Они могут быть применены только к неко торым объектам. Это- нашло свое отражение в понятии -.диапазона пригодности• конструкта. Английские психологи Фраж:елла и Баннистер [Франселла, Бан нистер, 1987] счиtают правило •диапазона пригодности• отличительной чертой техники ·репертуарных решеток. Под диапазоном пригодности можно понимать область предс тавлений человека о мире, понятия которой можно соотнести с конкретной референтной осью выделяемого конструкта. Психологически осмыс ленный результат получится тол,ько в том случае, если элементы, используемые в репертуарной решетке� будут попадать в -.диапазон пригодности• конструктов испытуемого. Конструкты - не изолированные образования. Они взаимодей�твуют друг с дру гом, причем характер этого взаимодействия не случаен, а носит целостный сис темный характер. В процессе �аполн�н� репертуарной решетки испытуемый должен оценить каж дый объект по каждому конструкту или каl\ИМ-то другим образом поставить в . соответствие элементы конструктам. Определение репертуарная означает, что элементы выбираются по определен ным правилам так, чтобы они соответствовали какой-либо одной области и все вместе были связаны осмысленным образом (коmекстом) аналогично репертуа ру ролей в пьесе. Предполагается, что, изменяя репертуар элементов, можно •На страивать• мет одики на выявление конструктов разных уровней общности и от носящихся к разным системам. При переводе с английского языка термин матрица не используется, поскольку репертуарная решетка не всегда является матрицей в строгом смысле этого тер мина: в ней на пересечении строк и столбцов не обязательно стоят числа, не все гда выдерживается прямоугольный формат, строки могут быть разной длины. Второй смысл этого определения заключается в том, что в технике репертуарных решеток часто элементы задаются в виде обобщенных инструкций, репертуара ролей, на место которых каждый конкретный человек мысленно подставляет сво их знакомых людей или конкретные предметы, если в качестве элементов заданы н_азвания предм етов. По всей видимости, репертуарные решетки лучше считать специфЮiеской разно видностью структурированного интервью. Обычно мы исследуем систему конст руктов другого человека в ходе разговора с ним. В процессе беседы мы постепенно начинаем понимать, как он видит мир, что с чем связа�о, что из чего . следует, что для чего важно, а что нет, как он оценивает других людей, события и ситуации. 1 78 Глава 5 • Нов ые тенде н ци и и при кладны е �сп е кты и н же н ер_ии знани.й Решетка формализует этот процесс и дает мaтeмaти.1Jec�oe :ftбoc.lfe:J39;JIИ@ i(l�3fЙ между конструктами данного человека, позволяет более детально изучир, от� дельные подсистемы конструктов, подметить индивидуальное, специфическое в структуре и содержании мировоззрения человека. Важное положение техники репертуарных решеток: ориентация на выя�ление собственных конструктов испытуемого, а не навязывание их ему извне. Гибкость и эффективность репертуарных решеток, качество и количество полу чаемой информации делают их пригодными для решения широкого круга задач. Методики этого типа используются в различных областях практической деятель ности: в педагогике и социологии, в медицине, рекламе и дизай�е. Репертуарные решетки оказались методом, идеально приспособленным для реализации в виде диалоговых программ на компьютере, что также способствовало их широкому распространению. Достоинства и преимущества данного метода полностью рас крываются тогда, когда есть возможность, проведя исследование, быстро обрабо тать результаты и проанализировать их с тем, чтобы уже при следующей встрече с испытуемым можно было уточнить и проверить возникшие предположения, со ставить и провести репертуарную решетку другого типа, а если это необходимо, и дополнить прежнюю, I:Iзменив репертуар элементов или выборку конструктов. 5.2.2. Методы выявления конструкто в Метод ми н им ал ьного контекста Метод минимального контекста или метод триад наиболее часто используется для выявления конструктов. Элементы представляются в группах по три. Это минимальное число, которое позволяет определить сходство и различие. Испытуемому предъявляются три элемента из всего списка и предлагается на, звать какое-нибудь важное качество, по которому два из них сходны между собой и, следовательно, отличны от третьего. После того как экспериментатор запишет ответ, испытуемого просят назвать, в чем конкретно состоит отличие третьего элемента от двух других (если испытуемый не указал, какие именно два элемента были оценены как сходные между собой, то его просЯJ' сделать это). Ответ на этот вопрос и представляет собой противоположный полюс конструкта. Испь1туемо .! му предъявляется столько триад элементов, сколько сочтет нужным эксперимен татор. Специфических правил не существует. Все зависит лишь от nеличиnы вь1борки, то есть от числа конструктов, подлежащих исследованию. Прим е р 5.3 Имеется список и з названий фруктов. Берется триада •яблоко-груша-апельсин• . Рес пондент выделяет два сходных объекта - •яблоко и груша;;.; качество, определяющее сходство, - •отсутствие аллергической реакции у респондента•, отличие третьего объекта - «аллергичность;;., Так выявлен личностный конструкт «аллерrичность/от сутствие та1<овой;;.. �.-2. ,меrод репертуарных решеток 1 79 Други е метод ы выявл ени я конст рукто в Фра�с�ла и Баннистер I Франселла, Баннистер, 1987] ·описывают ме тоды, кото рые такж«1 используют триады: • последовательный метод; • метод самоидентификации; • метод ролевой персонификации. В двух последних методах в триаду включается элемент •Я сам•. Келли предложил использовать триады для выявления конструктов, посколь ку этот метод отражал его теоретические представления о том, как конструкты впервые возникают. Однако в связи с тем, что у испытуемого выявляются уже сложившиеся конструкты, не обязательно использовать непременно три элемен та. Триада не является единственным способом выявления противоположного полюса. · · . Для выявления конструктов можно использовать два элемента (выявление кон структов при помощи диад элементов) или более, чем три, как это делается в.ме тоде полного контекста [Франселла, Баннистер, 1987]. Часто используемый метод - техника лестничного спуска Хинкла: • конструкты извлекаются .ст.андартным методом; • по поводу отдельного конструкта задается вопрос .к какому полюсу данного конструкта вы бы хотели быть отнесены?•; • затем: •Почему вы предпочитаете этот полюс?•, •Что противостоит этому? •. Таким образом, получается новый конструкт, более обобщенный, чем исходный . Процесс повторяется, и выделяется иерархия конструктов. 5 . 2 . 3 . Анализ репертуарных решето к Анализ репертуарных решеток позволяет определить силу и направленность свя:зей между конструктами респондента, выявить наиболее важные и значимые пар�метры (rлубицные конструкты), лежащие в основе конкретных оценок и от ношений, построить целостную подсистему конструктов, позволяющую описы вать и предсказывать оценки и отношения человека. ' Ан ел и а .едини ч но й р е пертуа р но й реш ет ки Можно использовать форму кластерного ·анализа для группировки конструктов. Этот алгоритм структурирует конс трукты в линейный порядок, так что конст рукты, находящиеся близко в пространстве, также оказываются близки в порядке. Этот алгоритм имеет преимущество при демонс трации, так как представление просто реорганизует решетку, ;показывая соседства конструктов и элементов. Таким образом, формируются две матрицы- одна для элементов, другая для · конструктов. Кластеры определяются выбором наибольших значений в этих мат - 1 80 Глава 5 • Н овые тенденции и прикладные ас пекты инженер ии знаний рицах - то есть на�более св;Язанных составляющих матрицQ,J, - до т�х пор пока все элементы и конструкты не оказываются включенными в кластерное дерево. Программа производит иерархическую кластер �зацию системы конструктов экс перта и представляет извлеченные знания. Кроме тоrо, для каждого конструкта имеются численные значения в решетке как вектор величин, связанных с расположением элементов относительно полюсов данного конструкта. С этой точки зрения каждый конструкт может быть пред ставлен как точка в многомерном пространстве, а его плоскость определяется числом связанных с ним элементов. Естественной мерой отношений между кон структами является, следовательно, расстояние между ними в этом многомерном пространстве. Два конструкта с нулевым расстоянием между ними - это конст рукты, по отношению к которым элементы структурируются совершенно одина ково. Следовательно, можно считать, что они используются одинаково. В каком то смысле это эквива,!):ентные конструкты. Для неэквивалентных конструктов можно анализировать их пространственные отношения, определяя ряд осей как проекцию каждого конструкта на ось, наи более уд-1.r�енную от них, проекцию на вторую ось, связанную с оставшимися расстоя1-1 иями, и т. д. Это метод анализа главных компонент пространства констру1:тов. Он связан с факторным анализом семантического пространства, использованного в изучении семантического дифференциала. Метод анализа главных компонент позволяет'пре;цставить элементы и конструкты так, что меж·� ду ними могут быть выявлены взаимосвязи. Возможно построить логический анализ репертуарной решетки, используя конструкты как предикаты относи тельно элементов. Ан ализ нескольких репертуар н ых ре ш еток 'Довольно часто возникает ситуация, когда требуется сравнить несколько репер туарных. решеток. Анализ серии репертуарных решеток, заполняемых одним и тем же человеком в разные моменты времени, позволяет следить за динам�кой конструктов и оценок, строить траектории изменения состояния человека в сис теме его собственных субъект�вных шкал. Проанализируем несколько репертуарных решеток, заполняемых разными людьми. Аиализ пар системиых коиструктов используется для измерения согласия и по нимания между людьми. Для этого дsа эксперта, имею�е разные точки зрения, создают и заполняIРт решетки по общей области знаний. При этом каждый неза висимо от другого выбирает элементы, выявляет конструкты и оценивает их. За тем каждый делает две пустые копии своей решетки, оставляя элементы и конст рукты без значений их оценки. Обе эти решетки заполняются партнерами. При этом одна заполняется так, как он сам себе это представляет, а вторая так, как он представляет себе заполнение оригинальной решетки· ее автором. Сравнение пар решетЬк помогает достигнуть соглашения и понимания между дsумя людьми. Существуют 'три способа сравнения двух решеток. 1. Сцепление решеток, имеющих общие элементы, и их последующая 'обработка одним из описанных алгоритмов, как если бы они составляли одну большую 5.2. Метод репертуарных решеток 181 решетку. Таким образом, можно исследовать взаимодействие идей через про верку' СМёШаlfНЫХ кластеров КОНСТРУКТОВ ИЗ разных решеток. 2. Дщшый путь требуе� наличия двух решеток с одинаковыми именами элемен тов и конструктов и показывает расхождения между ними через измерение рас стоя �:�ия между одними и теми же именами. Результать1 показьшают согласие в понимании и выявляют различия между двумя решетками, основанными на . одинаковых именах и конструктах. 3. Данный , способ также использует две решетки с одинаковыми именами эле ментов и конструктов, находит наиболее сильно изменяющиеся элементы и конструкты и удаляет их из решетки. Таким образом, определяются базовые элементы и конструкты, которые показывают согласие и понимание. Анализ групп системных конструктов. Анализируется серия репертуарных реше ток, полученная от группы людей, использовавших одинаковые элементы. Срав нивается каждая пара и показывается «групповая сеть�, которая отражает связи сходных конструктов внутри группы. Создается решетка, отражающая конструк ты, которые понимаются большинством группы, и это служит основанием даль нейшего анализа. Каждый конструкт, неиспользованный в рамках группы, оцени вается· по силе связанности с другими конструктами. 5 . 2.4.. Автоматизированные методы Данный параграф посвящен обзору некоторых наиболее известных методов и систем приобретения знаний на основе метода репертуарных решеток, частично из работ [Осипов, 1 990; Молокова, 1 992; Осипов,1 997]. Впервые автоматизированное создание репертуарных решеток и извлечение из экспертов конструктов было реа.11изовано в системе PLANET [Gaines, Shaw, 1 984; S�aw, Woodward, 1 988]. Дальнейшим развитием системы PLANET является ин тегрированная среда KITTEN, поддерживающая ряд методов извлечения знаний. Буза Д. в системе ETS [Boose, 1985] использовал метод репертуарных решеток для выявления понятийной системы предметной области. Потомками ETS явля ются система NeoETS и интегрированная среда для извлечения экспертных зна ний AQUINAS [Boose, Bradshaw, Shema, 1 988]. Известно большое число прототипов ЭС, для создания которых использовалась ETS. Среди них: 1. Советчик по выбору инструментария для разработчиков ЭС. 2. Консультант по язь�кам программирования. 3. Анализатор геологических данных. 4. Советчик по отладке Фортран-программ. 5. Консультант по СУБД и др. Однако область применения ETS ограничена извлечением экспертньхх знаний для таких несложных задач анализа, которые не требуют для своего решения про цедурных, каузальных и стратегических знаний. 1 82 Глава 5 • Н овые тенденции и при клад н ые ас пекты · и нжен ери и з н аний ETS взаимодействует с экспертом в диалоговом режиме, интервьюируя ero и по могая анализировать создаваемую БЗ. В архитектуре ЕТS ,могут быть выделены подсистемы: извлечения элементов; выявления конструктов; построения репер туарной решетки; построения графа импликативных связей; генерации продук ционных правил; тестирования БЗ; коррекции БЗ; генерации БЗ для различных инструментальных средств создания ЭС . . В диагностической системе MORE [Кahn, Nowl;ш, McDermott, 1985} использо . ваны принципы, сходные с теми, которые лежат в основе обеих описацных выше систем. Здесь впервые использовано несколько различных стратегий интервью. Техника интервью, использованная в М ОRE, направлена на выявление. следую щих· сущностей: • гипотезы - подтверждение которых имеет своим результатом диаmоз; • симптомы - наблюдение которых приближает последующее принятие гипо тезы; • условия - некоторое множество событий, которое не является непосре:Цстве,н- , . но симптоматическим для какой-либо гипотезы, но которое может иметь диаг ностическое значение для некоторых других событий; • связи - соединение сущностей; • пути - выделенный тип связи, который соединяет гипотезы с симптомами. В соответствии с этим в системе используются следующие стратегии интервью: дифференциация гипотез, различение симптомов, симптомная обусловленность, деление пути и некоторые другие. Стратегия дифференциации гипотез направлена на поиск симптомов, которые обеспечивают более точное различие гипотез. Наиболее мощными в этом смысле являются те симптомы, которые наблюдаются при одном диагностируемом собы тии. Стратегия различения симптомов выявляет специфические характеристики симп тома, которые, с одной стороны, идентифицируют его как следствие некоторой гипотезы, с другой - противопоставляют другим. Стратегия симптомной обуслоВllенности направлена на выявление негативных симптомов, то есть симптомов, отсутствие которых имеет больший диагностичес кий вес, чем их присутствие. Стратегия деления пути обеспечивает нахождение симптоматических·событий, которые лежат на пути к уже найденному симптому. Если такой симпто� суще · ствует, то он имеет большее диагностическое значение, чем уже найденный. · В системе KШTON [Diderich, Ruhman, Мау, 1 987] (см. п. 4.6.4) дли приобретения знаний используются два источника: эксперт его знаниями; полученными практике; книжные знания, докум_енты, описания, инструкции ( эти знания хоро шо структурированы и фиксированы традиционными средствами). Для извлече ния знаний из первого источника в KRITON применена техника интервь�, ис пользующая стратегии репертуарной решетки разбиения на ступени. Стратегия разбиения на ступени направлена на выявление наследственной структуры пред- с на _.S .З.'- ')(r:�равлени е знаниями 183 метной области. Акцент делается на выявлении структуры родовых и видовых понятий (супертипов ). При этом типы, выявленные на очередном шаге работы стратегии, становятся базисом для последующего ее применения. В системе применен прием переключения стратегий: если при работе стратегии репертуарной решетки при предъявлении тройки семантически связанных поня тий эксперт не в состоянии назвать признак, отличающий два из них от третьего, система запускает стратегию разбиения на ступени и, задавая эксперту вопросы о понятиях, связанных с предыдущими отношениями •род - вид.-, предпринимает попытt<у выяснения таксономической структуры этих понятий с целью выявле ния признаков,' их различающих. ' . В России существенные результаты в применении репертуарных решеток в ин женерии знаний были получены под руководством Г. С. Осипова в рамках про екта SIMER+ MIR (см. п. 4.6.5). 5 . 3 . У пр авл ен ие знан ия ми 5.3-. 1 . Что такое «управление знаниями» Следует иметь в виду, что знаниями в контексте данного параграфа называют не только знания, но и данные по определениям в главе 1 данного учебника. Понятие •управление знаниs,ми• (КМ - Knowledge Management) появилось в се редине 90-х годов в крупных корпорациях, где проблемы обработки информа ции приобрели особую остроту и стали критическими. При этом стало очевид ным, что основным узким местом является обработка знаний, накопленных специалистами компании, так как именно знания обеспечивают преимущество перед конкуреn:тами. Часто информации в компаниях накоплено даже больше, чем они в состоянии обработать. Различные компании пытаются решать этот вопрос по-раз1юму, но при этом каждая компания стремится увеличить эффек тивность обработки знаний [Macintosh, 1997]. Ресурсы знаний различаются в зависимости от отраслей индустрии и приложе .ний, но, как правило, включают руководства, письма, новости, информацию о зак·аэчиках, сведения о конкурен\'ах и данные, накопившиеся в процессе разра- · ботки. Для применения КМ-систем используются разнообразные технологии: • электронная почта; • базы и хранилища данных (Data Wharehouse); • системы групповой поддержки; • броузеры и системы поиска; • корпоративные сети и Интернет; • экспертные системы и базы знаний; интеллектуальные системы. Традиционно проектировщики систем КМ ориентировались лишь на отдельные группы потребителей - главным образом менеджеров. Более современные _КМ системы спроектированы уже в расчете на целую организацию. 1 84 Глава 5 • Новые тенденции и при кладн ые ас пекты и нженери и з нан ий Хран ил ища да нн ых, которые работают по принципу центр ального ct<Jiaд �. был� одним из первых инструментариев КМ. Как правило, хранилища .содержат, мно голетние версии обычной БД, физически размещаемые в той же самой базе. Kor· да все данные содержатся в едином хранилище, изучение связей между отдель ными элементами может быть более плодотворным. При этом активы знаний могут находиться в различных местах: в базах данных, базах знаний, в картотечных блоках, у специалистов и могут быть рассредоточе ны по всему предприятию. Слишком часто одна часть предприятия повторяет работу другой части просто потому, что невозможно найти и использовать зна ния, находящиеся в других частях предприятия. Управление знаниями - это совокупность процессов, которые упра вляют создание м , распространением, обработкой и испол ьзование м знаний в нутри предприятия. Необходимость разработки систем КМ обусловлена следующими причинами: • работники предприятия тратят слишком много времени на поиск необходи мой информации; • опыт ведущих и наиболее квалифицированных сотрудников используется только ими самими; • ценная информация захоронена в огромном количестве документов и данных, доступ к которым затруднен; • дорогостоящие ошибки повторяются из-за недостаточной информированности и игнорирования предыдущего опыта. Важность систем КМ обусловлена также тем, что знание, которое не использует ся и не возрастает, в конечном счете становится устаревшим и бесполезным, так же, как деньги, которые сохранены без того, чтобы стать оборотным капиталом, в конечном счете теряют свою стоимость, пока не обесценятся. Напротив, знание, которое распространяется, приобретается и обменивается, генерирует новое зна· ние. 5 . 3 . 2. Упра влен и е знаниям и корпоративная памят ь Большинство обзоров концепции управления знания ( КМ) уделяет �нимание только первичной обработке корпоративной информации типа электронной по чты, программного обеспечения коллективной работы или гипертекстовых баз данных (например [Wiig, 1 996]). Они формируют существенную часть из необхо димой, но определенно не достаточной технической инфраструктуры для управ ления знаниями. Одним из новых решений по управлению знаниями является понятие корпора тивной памяти (corporate memory), которая по аналогии с человеческой памятью позволяет пользоваться предыдущим опытом и избегать повторения ошибок. Корпоративная память фи ксирует информ ацию из различных источнико в nредпри�тия и делает эту и нформацию доступной специалистам для решения производственных задач. 1 85 5. 3 . 1 Управление знан иями Корпоративная память не позволяет исчезнуть знаниям выбывающих специали стов (1ход на пенсию, увольнение и пр.). Она храни�: большце объемы данных, информации и знаний из различных источников предприятия. Они представ лены в различных формах,. таких как базы данных, документы и базы знаний (рис. 5.7). Неявные "8Нные и знания Знания в rолове данные в rолове В ыявление Извnечен111е + Формализация г----- --------- 1 &Д 1 ,--.............., : !РБД I 1 1 1 ок l ------, __,.__ &З gj i 1 1 .о : В,�с 1111 111 с: l д 1 1 1 1 ._____, ______. 1_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 1 1 Явные данные и знания Рис. 5.7. Данные и знан ия в системах корпоратив ной па мяти Введем два уровня корпоративной памяти (так называемые явные и неявные зна ния [Nonaka, Takeuchi, 1 995)). Уровень 1. Уровень материальной или явной информации - это данные и знания, . которые мor'y't быть найдены в документах организации в форме . сообщений, пи сем, статей, справочников, патентов, чертежей, видео- и аудиозаписей, про rраммноrо обеспечения и т. д. Уjювень 2. Уровень персональной или скрытой информации - это персоналыrое знание; неотрывно связанное с индивидуальным опытом. Оно может быть пере дано через прямой контакт - •с глазу на глаз.-, через процедуры извлечения зна ний · (см. главу 3). Именно скрытое знание - то практическое знание, которое яв ляется ключевым при принятии решения и управлении технологическими про цессами. В действи;ельности эти два типа информации, подобные двум сторонам одной и той же медали, одинаково важны в структуре корпоративной памяти (см. рис. 5.7). При разработке с_истем КМ можно выделить следующие этапы: 1 . НаkОПЛ;ение." 'Стихийное и бессистемное накопление информации в организа ции. 1 86 Гл ава 5 • Новые те н де н ции и п рикладн ы е аспекты ин же н ерии зн ан ий 2. Извлечение. Процесс, идентичный традиционному извлечению знаний для ЭС (см. главы 2 и 3). Это один из наиболее сложных и трудоемких этапов. От его успешности зависит дальнейшая жизнеспособность системы. 3. Структурирование. На этом этапе должны быть выделены основные понятия, выработана структура представления информации, обладающая максималь ной наглядностью, простотой измен�ния и дополнения. 4. Формализация. Представление структурированной информации в форматах машинной обработки, то есть на языках описания данных и знаний. 5. Обслуживание. Под процессом обслуживания понимается корректировка фор мализованных данных и знаний (добавление, обновление): <<Чистка�, то есть удаление устаревшей информации; фильтрация данных и знаний для поиска информации, необходимой пользователям. Если первые четыре этапа обычны для инженерии знаний, то последний являет ся специфичным для систем управления знаниями. Как уже было сказано, он распадается на три более мелких процесса: • Корректировка формализованных знаний (доt'>авление, обновление). • Удаление устаревшей информации. • Фильтрация знаний для поиска информации, необходимой по.7;1ьзователю, вы деляет компоненты данных и знаний, соответствующие требованиям конкрет ного пользователя. При помощи той же процедуры пользователь может узнать местонахождение интересующей его информации. Рассмотренная выше классификация не является единственной, но она позволя ет понять, что происходит в реальных системах управления знаниями. 5 . 3 . 3 . Системы OMIS Автоматизированные системы КМ, или Organizational Memory Information Sys tems (OMIS), предназначены для накопления и управления знаниями предприя тия [Kuehn and Abecker, 1 998]. OMIS включают работу как на уровне 1 - с явным знанием компании в форме баз данных и электронных архивов, так и на уровне 2 - со скрытым знанием, фиксируя его в некотором (более или менее формаль ном) представлении в форме экспертных систем [Wiig, 1 990] или БД. OMIS часто используют вспомогательные справоЧ'Ные системы, так называемые hel рdеsk-приложения. Основные функции OMIS: • Сбор и систематцческая организация информации из различных источников в централизованное и структурное информационное хранилище. • Интеграция с существующими автоматизированны.ми системами [ Conklin, 1996]. На техническом уровне это означает, что корпоративная память должна быть непосредственно связана с помощью интерфейса с инструментальными 5.3 . 'УnраВ11ен ие . знаниями 1 87 · средствами, котор�е в настоящее время используются в организации·(напри мер, текстовые процессоры, электронные таблицы, системы). • Обеспечение нужной информации по запросу (пассивная фор�а) и при необхо димости (активная форма). Слишком частые ошибки - это следствие недо статочной информированности. Этого невозможно избежать с помощью пас сивной информационной системы, так как служащие часто слишком заняты, чтобы искать информацию, или просто не знщот, что нужная информация существует. Корпоративная память может напоминать служащим о полезной информации и быть компетентным партнером для совместного решения за дач. Конечная цель OMIS состоит в том, чтобы обеспечить доступ к знанию всякий раз, когда это необходимо. Чтобы обеспечить это, OMIS реализует активный под ход рас;пространения знаний, который не полагается на запросы пользователей, а автоматически обеспечивает полезное для решения задачи знание. Чтобы предот вращать информационную перегрузку, этот подход должен быть совмещен с вы сокой выборочной оценкой уместности. Законченная система должна действо вать как интел.л.ектуш�ьный помощник пользователю. Использование корпоративной памяти часто преследует более умере}'Jные цели, чем использование ЭС. Это связано с тем, что технологии обработки данных (баз данных и гипертекстовых систем) применяются гораздо шире, чем технологии систем, основанных на знаниях. OMIS сохраняют и обеспечивают выдачу по за просу нужной информации, но оставляют ее интерпретацию и оценку в специ фическом контексте задачи главным образом пользователю. С другой стороны, корпоративная память расШИJ?Яет эти технологии работой со знаниями, чтобы улучшить качество решения задач. Так OMIS включает под системы объяснений, которые позволяют непосредственно отвечать на вопросы: •Почему?• и •Почему нет?•. В простой базе данных или гипертекстовой системе пользователи должны были бы искать нужную информацию для ответа на такие вопросы непосредственно, а дЛЯ этого необходимо отфильтровать большое коли чество потенциально нужной информации, которая, однако, не будет применять ся в специфическом случае. Наконец, OMIS не только выдает информацию, но должна также быть всегда го товой воспринимать новую информацию от ее пользователей. Рисунок 5.8 представляет архитектуру для OMIS и корпоративной памяти (част ично из работы [Borghoff and Parescbl, 1 998]). Ядром системы является Информа ционное хранилище (Infomшtion Depository). Рисунок также дает представление о некоторых видах информации, которая включается в корпоративную память. Если. хранилища данных содержат в основном количественную информацию, то хранилища знаний больше ориентированы на качественный материал. КМ-сис темы генерируют системы из широкого диапазона данных, хранилищ данных, статей новостей, внешних баз, WWW-страниц. 1 88 Глава 5 • Н овые тенденции и при клад ные ас пекты и нж:е нерим - з нани й • ь о н \и терфейс n оn э �я 1 И нформационное хранмnище Данные Структура БД, м етаоnисания 11 . Знания Документы Описания документации (дескрипторы) Структура �БЗ , - понятийные сrруктурь, о е н урове нь ч ски й О тоn rи БЗ с прав илами, Фактоrрафические Документаnьные фрей мами, БД, ертежи , семантичеасимк БД, ч реля ционные БД, сетями, пра вила рефераты и т. д. справочники в ы вода Содержатеnьны й уровень И нте рфейс разра&ОN и ков Рис. 5 .8. Архитектура OMIS Программный инструментарий для OMIS включает как оригинальные разра ботки, например KARAТ [Tschaitschian, 1997], так и стандартные средства, на пример, LOTUS NOTES обеспечила один из первых инструментариев хр�ения качественно и документальной информацией. Однако сегодня в связи с бурным развитием Интернета, КМ-системы все чаще используют WеЬ-технологи_ю. 5 . 3 . 4 . Особенност и разработки OM IS Так как разработка систем корпоративной памяти - это прежде всего программ ный проект, то для нее применимы традиционные технологии разработки боль ших программных систем. В каждом программном проекте первым шагом в раз работке является анализ требований, в котором должны быть найдены ответы на следующие вопросы: • Какие задач1и должны подцерживаться? • Какая информация необходима, чтобы решить эти задачи? • Какой тип подцержки желателен пользователями? • Каков уровень затрат на разработку? • Какие изменения о�идаются в будущем? 5 .3. Уп равление знаниями 1 89 При поиске ответов на эти вопросы следует учитывать: 1 . Человеческий фактор. Основная причина неудач ранних опытных проектов OMIS заключалась в том, что разработчики игнорировали реальные потреб ности, способности и цели пользователей системы [Malsch et al., 1 993; Kuehn et al., 1994]. 2. Стоимостной анализ. Во-первых, ядро проекта должно ориентироваться на критические процессы, «страдающие:�, от недостатка информационной поддерж ки. Во-вторых не следует перегружать начальную систему слишком большим количеством услуг, которые могут быть желательны, но не обещают быстрое возвращение инвестиций. 3. Эволюция знаний. Электронная поддержка особенно ценна в областях, под вергающихся быстрым изменениям, так как на таких предприятиях трудно обеспечить доступ к оперативной современной информации. В системах ОMIS часто используют различные новые технологии обработки знаний, не имею щие пока общепринятых русскоязычнь1х терминов и связанные с получением нового знания из анализа данных, например <<открытие или разведка знаний�, (Knowledge Discovery) и «разработка данных:�, (Data Mining). Разведка зна ний представляет собой новое и быстро развивающееся направление, занима ющееся <<Нетривиальным извлечением точной, ранее неизвестной и потенци ально полезной информации из данных:�, [Piatetsky-Shapiro, Frawley, 1 99 1 ]. В методах разведки данных используются различные подходы к анализу тек ста и числовых данных, плюс специальный инструментарий статистического анализа. 4. Чувствительность к контексту для естественно-языковых запросов. 5. Система должна <<Понимать:�, контекст поступающих запросов. К примеру, она должна различать термины «размножение животных:;. и «размножение доку ментов:�>. 6. Гибкость. 7. Система должна иметь возможность обрабатывать знания в различной форме и по разным темам в контексте рабоrы данного предприятия. 8. Интеллектуальность. 9. Система должна накапливать информацюо о своих пользо1щтелях и о знани ях, которые она получает во время работы. Таким образом, со временем ее воз можность <<Продуманно:�, предоставлять пользователям знания должна совер шенствоваться. До последнего времени при разработке OMIS остается целый ряд исследователь ских вопросов [Kuehn and Abecker, 1 998]. • Проблема обобщения моделей данных, словарей понятий или тезаурусов, онто логий. Основание для объединенной эксплуатации данных, документов и фор мального знания - построение объединенных метамоделей данных и знаний. Полезны были бы процедуры автоматического порождения тезауруса из суще ствующих массивов документов. Объединенная онтология/тезаурус может использоваться, чтобы улучшить поиск, фильтрацию и маршрутизацию до кументов. 1 90 Гл а ва 5 • Н ов ы е тенден ци и и п ри кл адн ые асп е кты и нж е н ерии . зна н ий • Проблема обь.единения дощческо�о вывода· �. инфi)рмацщпшоzо nоl,Щ{а. 091>1:ЩJt::: пенная эксплуатация формальных и неформальных представлений знаний и · данных - это последовательное сближение логических методов и методов ин формационного поиска и индексации данных. • Соединение деловых процессов и управления знаниями. Окончательная цель со стоит в том, чтобы обнаруживать информацион!'lую потребность ·в течение выполнения' производственного процесса и определять уместное знание в спе цифическом контексте задачи. Первый прагматический шаг в этом направле нии описан в работе [Нinkelmann и Кieninger, 1 997], где авторы предлагают использовать информацию контекста задачи для информационной фильтра ции. Корпоративная память интегрирует знания, чтобы в решении новых задач опе реться на предварительно накопленный опыт. Таким образом, можно избегать повторения ошибок, опыт может расширяться систематически: и. информацион но-емкие процессы работы могут быть �ыполнены более эффективными спосо бами. В отличие от экспертных систем первичная цель систем OMIS - не под держка одной специфической задачи, :,\ лучшая эксплуатация. необходимого об щего ресурса - знаний. В настоящее время существует значительный интерес к КМ со стороны промыш ленных компаний, которые осознают высокий прикладной потенциал корпора тивной памяти для решения целого ряда практических задач обработки инфор мации. С другой стороны, не многие из проектов идут далее стадии прототипа, что очевидно показывает, что компании стараются избегать затрат и риска вло жения капитала в новые технологии, которые еще не нашли широкого распрост- . ранения. 5 . 4 . В изуальное проектирован ие баз знаний как инструмент познания Визуальные методы спецификации и проектирования баз знаний и разработка концептуальных стру�тур являются достаточно эффективным гносеологич�ким инструментом или инструментом познания Uonassen, 1993]. Использование ме тодов инженерии знаний в качестве дидактических инструментов и в качестве формализмов представления знаний способствует более быстрому и более полно му пониманию структуры знаний данной предметной области, что особенно ценно для новичков на стадии изучения особенностей профессиональной деятельности. Методы визуальной инженерии знаний можно широко использовать в различ ных учебных заведениях - от школ до университетов - как для уг.11ублеиия nро цесса понимания, так· и для контроля знаний. Большинство учеников и· студен тов овладевают навыками визуального структурирования в течение нескольких . . часов. 5·.4 . ·Визуальное проектирова ние баз зна ни й ка к и нструме нт по знани я · 5.4.· 1 . От ·понятийных карт к семантичес ким сетям В параграфе 3.1 было предложено определение поля знаний, которое позволяет инженеру по знаниям трактовать форму представления поля достаточно широ ко, в частности семантические сети или понятийные карты (concept maps) (см,, параграф 1 .3) являются возможной формой представления. Это означает, что сам процесс 'построения семантических сетей помоrа�т осознавать познавательные структурьi. с ПdЛ ) Комната ,'-........ . ... .... . Телевизор) Эл вктронная . ( . . . . . . . ·► техн и ка Диван Кресло ( Книrа ) Рис. 5.9 . П р имер п онятийной карты Проrраммь1 визуализации являюrея ·инструментdм; позволяющим сделать види мыми семантические сети памяти человека. Сети состоят из узлов и упорядочен ных соотношений или связей, соединяющих эти узлы. Узлы выражают понятия или предположения, а связи описывают взаимоотношения между этими узлами. Поэтому разработка семантических сетей подразумевает анализ структурных взаим�действий между отдельными понятиями предметной,области. В процессе .создания семантическ.их сетей эксперт и аналитик вынуждены анали зировать структуры .своих собственных знаний, что помогает им включать новые знания в с:rруктуры уже. имеющихся знаний. Результатом этого является более осмысленное использование приобретенных знаний. Визуалыще спецификации в форме сетей могут использоваться новичками и эк спертцми. .В КаЧКТВе инструментов ДЛЯ ОЦенi<и ИЗМеНеНИЙ, ПрОИЗОШеДШИХ В ИХ м:ыiплен�и. Если согласиться, что семантическая сеть является достаточно пол ным дредставл�нием памяти человека, то процесс обучения с этой точ,<и зрения можно ра,ссматривать как реорганизацию семантической памяти. 1 92 Глава 5 • Н овы е те нден ции и прикладные ас пекты инже нерии знани й Kozma [Kozma, 1992], один из разработчиков программы организации семанти ческой сети Learning Tool, считает, что эти средства являются инструментами познация, усиливающими и расширяющими познания человека. Разработка се мантических сетей требует от учеников: • реорганйзации знаний; • исчерпывающего описания понятий и связей между ними; • глубокой обработки знаний, что способствует лучшему з;,шоминанию и извле чению из памяти знаний, а также повышает способности применять знания в новых ситуациях; • связывания новых понятий с существующими понятиями и предс��!3Jlениями, что улучшает понимание; • пространственного изучения посредством пространственного представления понятий в изучаемой области [Fisher, Faletn, Paterson, Lipson, Thorton & Spring, 1990]. Полезность семантических сетей и карт понятий, пожалуй, лучше всего демонст рируется их связями с другими формами мышл"ения высшего порядка. Они тес но связаны с формальным обоснованием в химии [Schreiber & Abeg, 199 1 ] и спо. собностью аргументировать свои высказывания в биологии [Briscoe & LeMaster, 199 1 ; Mikulecky, 1 987]. 'Гакже было показано, что семантические сети имеют связь с выполнением исследований [Goldsmith, Johnson & Acton, 1 99 1 ] . 5.4 . 2 . &аза знаний как познавательный инструмент Когда семантическая сеть создается как прообраз базы знаний, разработчик дол жен фактически моделировать знания эксперта. Особенно ГJiубокого понимания требует разработка функциональной структуры. Определение структуры Е СЛИ-ТО области знаний вынуждает чеtко форму лировать принципы принятия решения. Нельзя считать, что просто разработка поля знаний системы обязательно приведет к получению полных функциональ ных знаний в данной области. Разработка экспертных систем стала использоваться как инструмент познания сравнительно недавно. Lippert [Lippert, 1988], который является одним из пио неров применения экспертных систем в качестве инструментов познания, ут верждает, что задания по созданию небольших базисов правил являются очень полезными для решения педагогических проблем и структурирования з.наний для учеников от шестого класса до взрослых. Изучение при этом становится более осмысленным, так как ученики оценивают не только сам процесс мышле ния, но также и результаты этого процесса, то есть полученную базу знаний. Со здание базы знаний требует от учеников умения отделять друг от друга факты, переменные и правила, относящиеся к связям между составляющими области знаний. 5 . 4 . В и зуал ьное про е ктирова н и е ба з з н аний ка к и нструмен т п о з на ния 1 93 Н апример, Lai [Lai, 1989] установил, что после того, как студенты-медики созда дут медицинскую экспертную систему, они повышают свое умение в плане арrу ментации и получают более глубокие знания по изучаемому пред!'.iету. Шесть студентов-первокурсников физического факультета, которые использовал и экс пертные системы для составления вопросов, принятия решений, формулировки правил и объяснений относительно движения частицы в соответствии с законами классической физики, получили более глубокие знания в данной области благо даря тщательной работе, связанной с кодирован и ем информа ц и и и обработкой большого матер и ала для получения ясного и связного содержания, а следователь но, и большей семантической глубины [Lippert & Finley, 1 988]. Таким образом, создание базы знаний экспертной системы способствует более глубокому усвоению знаний, а визуальная спецификация усиливает прозрач ность и наглядность представлений. Когда компьютеры используются в обучении ка1, инструмент познания, а не 1,ак контрольно-об учающие системы: (обучающие компьютеры), они расширяют воз можности автоматизи рованных обучающих систем (АОС), одновременно раз вивая мыслительные способности и знания учеников. Результатом такого со трудничества учащегося и компьютера является значительное повышение зф фективн�ти обучения. Компьютеры не моrут и не должны упр�влятБ процессом обучения. Скорее, компьютеры должны использоваться для того, чтобы помочь ученикам приобрести знания. В данном параграфе будет описываться автоматизированное рабочее место (АРМ) инженера по знаниям KEW (Knowledge Engineering Workhench) [Гаврилова, 1995; Гаври лова, Воинов, 1995- 1997] , который наряду с такими проrраммаМJ;i, как SemNet [Fisher 1 990, 1992], Learning Tool [ Kozma , 1 9.8 7], TextVision [Kommers, 1989] или Inspiration, дает возможность ученикам, экспертам или анал итикам связать между собой изучаемые ими поняти я в многомерные сети представлен и й и описать пр и роду связей между всеми входящими в сеть поня тиями. Последняя версия KEW, созданная совместно с Воиновым А. В., получила пер вую премию на выставке программных систем IV Национальной конференции по искусственному интеллекту в 1994 r. в разделе программных инструментари ев разработки интеллектуальных систем. KEW демонстрирует жизнеспособ ность технологии автоматизированного проектирования интеллектуальных сис тем (АПРИ С ) или САКЕ (Computer Aided Knowledge Engineering), впервые описанной в работе [ Га13рилова, 1 992 ] . KEW предназначен для интеллектуальной поддержки деятельности инженера по знаниям на протяжении всего жизненного цикла разработки экспертной системы, включая стадии - идентификации проблемы:, получения знаний, структурирова ния знаний, формализации, программной реализации, тестирования. Центральным блоком KEW является графический структуризатор знаний KNOST (KNOwledge STucturer): Система KNOST поддерживает последовательную графическую реализацию ОСА (см. параграф 3.4) и автоматическую компиля цию БЗ из графической специфи кации. 1 94 Глава 5 • Новые те нде нции и п ри кл адны е ас п е кт ы и нжен ери и зн а н и й Панель концептуальной структуры Нет ... _(:pe,iiн•• С�>елн•• , �},:\�<У .·::::: : ·:,·-. Рис . 5. 1 О. И нтерфе й с АРМа инже н ера п о знани ям Интерфейс KNOST состоит из трех основных частей (рис. 5. 1 0): • панель концептуальной структуры; • панель гипертекста; • панель функциональной структуры. Панель концептуальной структуры предназначена для графического структури рования знаний. Она позволяет определить понятия и обозначить связи между ними в форме концептуальной структуры Sk . В панель гипертекста можно поместить любой комментарий, связанный с объек том, определенным на панели концептуальной структуры понятий. Основное назначение панели функциональной структуры S 1 - представить на глядно в форме строк таблицы причинно - следс1:венн_ь1е и другие функционал,0- 5. 5 . П роектирование гиперм едиа БД и адапт ивных обучающи х сист е м 1 95 ные взаимосвязи между понятиями концептуальной структуры, на основании которых эксперт принимает решения. Столбцы таблицы формируются простей шей операцией drag-and-drop из понятий на панели концептуальной структуры. После того как модели S k и Sr созданы, KNOST gвтоматически компилирует базу знаний на ПРОЛОГе из созданной графической спецификации и моделирует ра боту экспертной системы. Это удобно для быстрого наглядного прототипироца ния ЭС и для отладки БЗ совместно с экспертом. 5 . 5 . П роектирование гипермедиа БД и адаптивных обучающих систем 5 . 5 . 1 . Гипертекстовые системы Первые информационные системы н а основе гипертекстовых (П) моделей по явились еще в середине 60-х [ Engelbart, 1 968], но подлинный расцвет наступил в 80-е годы после появления первых коммерческих П систем для ПЭВМ GUIDE ( 1986 r.) и HyperCard ( 1 987 r.). В настоящее время П технология явля ется стандартом de facto в области АОС и сверхбольших документальных БД [Nielsen, 1990; Агеев , 1 994] . П од гипер текстом пони м ают технол оги ю фор м иро вани я инф о р м ационны х м асс и во в в в иде асс о циати в ных сетей , эл е ментам и или узлам и кото ро й выступают фраг менты те к ста, рисун ки, диаграмм ы и пр . Навигация по таким сетям осуществляется по связям между узлами. Основные функции связей [ Conklin, 1 987] : • перейт и к новой теме; • присоединить комментарий к документу; • соединить ссылки на документ с документом, показать на экране графическую информацию (рисунок, чертеж, график, фотографию и пр.); • запустить другую программу и т. д. Учитывая широкое использование rрафовых структур в моделировании, П мо жет приобретать черты более сложных моделей, например сетей Петри, диаграмм состояний и др. В настоящее время не существует стандартизированной технологии разработки 4Хорошо структурированного• П, хотя важность коrнитивно-наrлядной и 4Про зрачнойэ- структуры П очевидна. 1 96 Гла ва 5 • Н о вые те нден ции и п ри к лад н ые ас пе кты ин женерии знаний В качестве рабочего упрощенного алгоритма составления П можно предложить следующий (в п. 5.5.3 будет представлен более сложный вариант). Инструкц.-.я по разработке гипертекстового приложения 1. Дайте название воображаемому документу, например «Учебник по ку линарии�, «Справочник абитуриента� и пр. 2. Представьте, что вся информация должна быть сгруппирована как в хо рошем учебнике, то есть в виде глав и параграфов. Основное условие для глав, параграфов и подпараграфов - сбалансированность, то есть примерно равная величина. 3. Проставьте перекрестные ссылки между понятиями внутри параграфов, придерживаясь принципа <<чем меньше - тем лучше�. 4. Добейтесь баланса аудио, видео и графической информации. 5. Предоставте возможность возвращения на шаг назад или на более высо кий уровень иерархии. 6. Отобразите иерархическое положение текущей страницы. Например, если мы находимся в подпараграфе, то необходимо вывести название текущей главы и параграфа. 7. Еще раз проверьте гипертекстовое содержание, в котором отражены все главы, параграфы и подпараграфы. Из лIQбой страницы приложения дол жен быть доступ к этому содержанию. 8. Все необходимые гипертекстовые ссылки лучше располагать не в самом тексте, а разместить их в одном месте на странице, например в конце страницы. 9. Ссылки, по которым пользователь уже заходил, должны выделяться дру гим цветом. 5 . 5 . 2 . От м ультимедиа к гипермедиа Мультим едиа ( ММ) се годн я пони мае тся как и нте г р и ров анная комп ьютерная ср еда , п о з в ол я ющая и спол ьз овать наряду с тради ци онн ым и с р едствами в заи моде йст вия чел ов е ка и ЭВ М ( алфа ви тн о-цифров ой и/или графи ческий ди спле й, принте р , кла виатура ) но в ые воз можн ости : з вук (жи вой чел о вече ски й гол ос, муз ыку и др . ) , в идеор оли ки ( цветн ые ху доже ственн ы е и до кум е н тальн ы е клип ы), озвученную мул ьти плик ацию и т. д. Когда элементы ММ объединены ·на основе сети гипертекста, можно говорить о гипермедиа (ГМ). Основной сферой применения ГМ сегодня являются автомати зированные обучающие системы (АОС) или электронные учебники. Размещение в узлах сети не только текстовой и цифровой информации, но и графиков, видео клипов, фото и музыки обогащает гипертекст и увеличивает занимательность и наглядность электронных учебников. В последние годы ММ активно внедряется 5.5. Про е кт и ро ван ие гиnерме диа БД и ада пт и в ных обучающи х с и стем 1 97 и·в интеллектуальные системы [Nielsen, 1 990], особенно в системы-консультанты, как эффективное средств о увеличения наглядности и понятности рекомендаций, выдаваемых системой. Использование анимации, звука и видео существенно об легчает усвоение учебного материала по структурированию знаний и снижает уровень коrnитийных усилий учащихся при одновременном уменьшении време ни, необходи�оrо на изучение данной проблематики. Основной предпосылкой интереса к rипермедиа-системам является фактически беспрецедентный усп ех глобальной сети Интернет и WWW-технолоrии. Другим факт о р о м появления ГМ можно считать мощный прорыв на рынке машинных н осителей информации со стороны фирм, про изводящих компакт аудиодиски (PHILIPS, SONY, NIMBUS) в виде CD-ROM (Compact Disc Read Only Memory), позволяющих хранить до 600 Мб инф о рмации , тем самым от крывая дверь для обработки BLOB (Binary Large Objects) - больших двоичных объектов, например оцифрованных видеоизображений. Тем не менее существует целый ряд проблем , с которыми сталкиваются разра ботчики ММ-систем, независимо от того, ориентированы они на Интернет-при ложения или на автономные учебники на CD-ROM: • отсутствие методологии и технологии структурир ования разнородной информации; • отсутствие единых стандартов на системы кодирования и обрабопш; • сложные аппаратные и программные решения проблем аналого-цифровых преобразований и синхронизации полнощсранноrо видео. Сейчас не существует единой методологии, а тем более технологии разработки ГМ систем, такое состояние характеризуется как •no science, rather art•, то есть •не наука, а искусство• . Однако первые подступы к созданию технологии уже сделаны [Кирмайкл, 1994; Reisman, 199 1 ] , и разработки в этой области продол жают активно развиваться. Традиционно процесс разработки ГМ включает: Фаза 1 - проектировани� и разработка структуры и отдельных фрагментов rипермедиа-приложения, включая звуковые и видеоролики, программное окружение. 1 фаза - наиболее трудоемкий по времени и человеческим ресурсам период. Эту фазу осуществляет команда, состоящая из: • менеджера; . • • • • • • ' ' . специалиста по системам обучения; эксперта предметной области; дизайнера-графика; системного аналитика; 1. сценариста; программиста. Фаза 2 зависит от тог о, на какой вариант приложения рассчитана система. 1 98 Гл а в а 5 • Н ов ы е т е нденции и при кл ад н ые ас пекты и н же н ерии зн а н ий Для Интернет-приложений разрабатываются W еЬ-страницы на языке HTM L с включением оцифрованных в специальных форматах звука, изображений, ани мации и видео. При эrом могут использоваться специальные пакеты, например Dreamwever или FrontPage. Для изготовления СD-дисков используется как НТМL-формат, так и специаль ные программные средства (authoring languages and systems), как, например Toolbook или Macromedia Director. Фаза 3 включает прототипирование CD-ROM на специальном устройстве WORM (Write Once Read Many) и его тестирование либо размещение приложения на Интернет-сайте. Фаза 4 - это тиражирование и производство готовых CD ROM. 5 . 5 . 3 . На пути к адаптивным обучающим системам Инструментом познания согласно концепции параграфа 5.4 можно считать и про- . цесс проектирования структуры гипертекста. Ранее нами [Гаврилова, 1996-99] был предложен подход, трактующий структуру (граф) гипертекста ( Г:Т) как «ске лет• поля знаний, то есть наиболее информационно-нагруженный элемент поля знаний. Именно этот граф отражает структуру знания, которую можно назвать rиперзнания. Усвоение этой структуры является важнейшим компонентом про цесса обучения. Очевидно, чем более будет конкретная сrруктура ГТ соответство вать индивидуальной когнитивной структуре, тем эффективнее будет идти про цесс обучения. Фактически это означает, что обучение и тренинг будут организо ваны не через навязывание конкретных когнитивных структур обучаемому и ломку старых представлений, а через проекцию нового знания на каркас индиви дуального опыта и наращивание уже имеющихся когнитивных структур. Та�ая адаптация к индивидуальным познавательным структурам может существенно повысить эффективность обучающих систем. Предлагаемый подход позволяет представить поле знаний предметной области в виде релевантной гиперструктуры HS, узлами которой являются концепты А, выделяемые экспертами как «опорные•, то есть принципиально значимые. Свя зи или отношения R используются для переходов между узлами. Такая трактов ка является естественным развитием моделей представления знаний типа семан тических сетей, которые на современном этапе считаются наиболее адекватными человеческой структуре памяти [Величковский, 1982; Шенк, Хантер, 1 987] . Ес тественно, что такие концептуально-когнитивные структуры отличаются резкой индивидуальностью, связанной с личностными, интеллектуальными и профес сиональными различиями носителей знаний. В некотором смысле такая �трук тура является когнитивной моделью индивида. Предлагаемый подход согласуется с концепцией мулътидеревьев [Furna, Zacks, 1994], реализующей множественное представление ПО. Модель пользователя, сформированная по этому принципу, будет отражать «модель мира• данного конкретного пользователя в виде rиперrрафа, узлы которого, в свою очередь, мо гут быть раскрыты в виде rиперструктур более низкого уровня. Фактически это 6. 5 . Прое кти рова ние г ип ермедиа БД и ада птивн ых обуча ющи х систе м 1 99 соответствует субъективным концептуальным структурам в памяти. Часто в про блематике АОС используют понятие •сценария•. Традиционно под сценарием понимается описание содержательного, логического и временного взаимодей ствия структурных единиц программы, с помощью которых реализуется автор ская цель [Бойкачев, Конева, Новик, 1 994]. Очевидно, что в rипермедиа учебных приложениях естественным представлени ем сценария является граф гипертекста. При этом важно добиваться, чтобы этот сценарий соответствовал (был релевантным) представлениям как учителей, так и учеников. Релевантная rт-структура п р едста вляет стратифи ци р о в анную се ть HS=<A , R > , отража ющую ие рархи ю по н ят ий п р едметной о бласти в фор ме , соотв етст вующей п р офессио нальн ым пред ста влениям э кс пе рто в и н е вы з ыв ающе й ко гнити в н о го дисс онанса у пол ьзо вател я . Для формирования стратифицированного множества вершин А можно исполь зовать модификацию алгоритмов объектно-структурного анализа ОСА (пара граф 3.4). Алгоритм ссОСА-гипер» 1 . Сформулировать цель и собрать от экспертов всю доступную информа ц ию. 2. Определить количество страт N, подлежащих формированию. 3. Из информации, полученной от экспертов и из литературы, выбрать все значимые основные объекты и понятия {А} и разместить их по стратам, _ сформировав опорные метаузлы ТТ структуры. 4. Детал изировать концепты, пользуясь нисходящей концепцией (topdown). 5. Образовать метапонятия по концепции (Ьottom-up) .. 6. Исключить повторы, избыточность и синонимию. 7. Обсудить понятия, не вошедшие в структуру ТТ с экспертом и включить их или исключить. 8. Выявить основные отношения {R} и спроектировать эскиз ТТ структу ры. 9. Провести обследование потенциальных пользователей с целью выявле ния их коrнитивных, представлений о данной ПО, а также формирова ния модели пользователя. 1 0. Привести в соответствие эскиз ТТ и представления пользователя. 1 1 . Сформировать ряд сценариев обхода ТТ с целью упрощения навигации и учета необходимых сценарных связей и включить их в структуру. 200 Глава 5 • Н овые тенд енции и п рикладные асп е кты инжене рии з наний Данный алгорю:м выявляет канонический или основной сценарий, альтернатив ные сценарии формируются на основании либо иного опыта преподавания, либо с учетом категории пользователей. Последовательное применение данного подхода и визуальных методов проекти рования позволило сформировать ГРАФИТ-технологию и реализовать ее в ряде программных продуктов ВИКОНТ (ВИзуальный Конструктор Онтологий), ПЕ ГАС (ПроЕктирование Гипср-Активных Схем) [Гаврилова и др., 1 998-2000] (рис. 5. 1 1 ). Графические технологии (ГРАФИТ) Эксперт в предметной области Визуальный конструктор (ВИКОНТ) \Преподаватель Програмная среда для построения активных гиперсхем (ПЕГАС) Студент Графический навигатор для обучения с помощью активных гиперсхем (ГРднr) Рис . 5. 1 1 . ГРАФ И Т-технология визуального п р оекти рова ния ГТ При разработке гипермедиа-приложений необходимо также учитывать фактор сбалансированности з вуковых и видеоузлов опорной Пструктуры, то есть аудио- и видеофрагменты должны равномерно распределяться на сети. Для это го в технологию ГРАФИТ введено понятие «раскраски1> узлов, что позволяет на глядно оценить сбалансированность сети по аудио- и видеонагрузке. Алгоритм «ОСА-гипер1> учитывает необходимость анализа не только исходной информа ции, но и навигационных возможностей: • перемещение на экран назад; • возврат к началу; • возврат к началу секции; 5.5. Прое ктирование гипермедиа БД и адаптивных обучающих систе м 1 . 20 1 • просмотр структуры; . • озвучивание экрана; • включение видео; • помощь; • перемещение на экран вперед. { Особенно ценно в реализации гр�фической навигации то, что в произвольный момент пользователь может посмотреть структуру сценария и понять, в каком месте он сейчас находится. Данный подход использован при создании П АОС в области инженерии знаний для систем дистанционного обучения (Gavrilova, Stash, Udaltsov, 1998). Системы обучения в области ИИ имеют пока небольшую историю, хотя при отсутствии учебников по данным дисциплинам эти электронные учебники особенно необхо димы. Известны лишь единичные работы в нашей стране и за рубежом - «База знаний для разработчиков ЭС�> [Молокова, Уварова, 1 992 ] и КАRТТ (Knowledge Acquisition Research and Teaching Tool) [Liebovitz, Bland, 1994]. При проектировании любой П структуры нетривиальной задачей является вы деление «опорных�> концептов - вопрос, практически не освещенный в литера туре. В работе [ Гаврилова, Червинская, 1993] представлен обзор различных ме тодов извлечения знаний, частично включающих и исследования по выявлению значимых концептов. Можно предложить использовать для этой цели методы многомерного шкалирования, позволяющие выявлять структуру индивидуаль ных ментальных пространств, анализируя попарные связи понятий предметной области (см. п. 5.1). Эти методы использовались и ранее для изучения семантических пространств памяти [Терехина, 1 988; Петренко, 1 988; Cook, 1985], однако можно использовать новый подход, ориентированный на анализ не только осей ментальных про странств с выявлением соответствующих конструктов, но и точек сгущения поня тий, называемых «аттракторами�> для выявления метапонятий или концептов. В дальнейшем эти концепты образуют узлы {А} релевантной П структуры, кото рую можно фактически трактовать как модель пользователя UM (user model): UM = {А, R}. Более широкие исследования [Voinov, Gavrilova, 1 993; Воинов, Гаврилова, 1 994] показали, что психосемантические методики (см. п. 5. 1), обогащенные новыми элементами (использование метафорических планов), могут способствовать вы явлению имплицитных структур знаний, не поддающихся выявлению другими методами. 202 · Глава 5 • Н овые тенд ен ции и при кл ад ные ас пе кты инжен ерии з нани й Использование UM как rиперструктуры в гипертекстовых АОС позволяет созда вать •гибкие• релевантные сценарии, ориентированные на когнитивные особен ности определенньiх групп пользователей. Последнее замечание можно также от нести к разработке систем rипермедиа. Очевидно, что глубокое и конструктивное изучение человеческого фактора в области computer science может существенно раздвинуть ограничения современных интеллектуальных и обучающих систем. Программный инструм�нтарий разработки с�стем, основанных на знаниях о Технологии разработки программного обеспечения - цели, принципы, парадигмы о Методологии создания и модели жизненного цикла интеллектуальных систем о Языки программирования для ИИ и языки представления знаний □ Инструментальные пакеты для ИИ □ WоrkВепсh-системы 6. 1. Технологии· разработки программного обеспечения - цели, принципы, п1;1радигмы 6. 1. 1. Основные понятия процесса разработки программного обеспечения (ПО) Как известно, технология ( от греческого технос - мастерство, логос - слово, на ука) - это наука о мастерстве. Под технологией программирования понимается (Бруке, 1979) совокупность з наний о способах и средствах достижения целей в области программного обеспечения ЭВМ, в том числе и таких, которые ранее никем не достигались. В широком смысле технология разработки ПО должна обеспечивать последова тельный подход к созданию программных систем. Наиболее очевидная цель в 204 Глава 6 • Программный инструментарий разработки систеч разработке ПО состоит в соблюдении установленных заказчиком требовс1:н�й при реализации системы. Однако у заказчика редко имеются полные и последова тельные епределения требований. Обычно и заказчик и разработчик не до конца понимают проблему, и требования совершенствуются в процессе разработки сие-. темы. Необходимо отметить и факт изменения требований в течение жизненного цикла программной системы. Изменения являются посто,янным фактором разработки ПО. Для того чтобы преодолеть их разрушающий эффект, в качестве целей технологии разработки ПО принимаются следующие четыре свойства программных систем [Ross et al., 1975]: 1. Модифицируемость. Необходимость модификации ПО обычно возникает по двум причинам: чтобы отразить в системе изменение требований или чтобы исправить ошибки,.внесенные ранее в процессе разработки. 2. Эффективность системы подразумевает, что при функционировании опти маль_ным образом используются имеющиеся в ее распоряжении ресурсы: вре мя и память. 3. Надежность системы ПО означает, что она должна предотвращать концепту альные ошибки, ошибки в проектировании и реализации, а также ошибки, воз НИl(ающие при функционировании системы. 4. Понимаемость. Последняя цель технологии ПО - nонимаемость - является мостом между конкретной проблемной областью и соответствующим решени ем. Для того чтобы система была понимаемой, она должна быть •прозрачной•.' Цели технологии разработки ПО, рассмотренные выше, не могут лишь пассивно признаваться. Наоборот, по мере выполнения работ· необходимо придерживаться определенного набора принципов, которые обесцечивают достижение этих це лей. В качестве таких принципов обычно выделяют [Ross et al., 1975; Буч, 1992) абстракцию, сокрытие информации, модульность, локализацию, единообразие, полноту и подтверждаемость. Абстракция является одним из основных средств для управления сложными сис темами ПО. Суть абстракции состоит в выделении существенных свойств с игно рированием несущественных деталей. По мере декомпозиции решения на отдель ные компоненты каждая из них становится чае1рю абстракции на соответствующем уровне. Абстрагирование применяется и к данным, и к алгоритмам. На любом уровне абстракции могут фиксироваться абстра�ные типы данных, 1,аждый из которых характеризуется множеством значений и множеством операций, приме нимых к любому объекту данного типа. · Сокрытие или упрятывание информации имеет целью сделать нещ>стущ1ыми де тали, которые могут повлиять на остальные, более существенные части системы. Упрятывание информации обычно с{(рывает реализацию объекта или операции и, таким образом, позволяет фиксировать внимание на более высоком уровне абстракции. Кроме того, сокрытие проектных решений нижнего уровн,я оберега ет стратегию принятия решений верхнего уровня от влияния деталей. 6.1. Технологии разработки программного обеспечения 205 Абстракция и сокрытие информации способствуют модифицируемости и пони маемости систем ПО. На каждом уровне абстракции допускается применение лишь определенного набора операций и делается невозможным применение лю бых операций, нарушающих логическую концепцию данного уровня, за счет чего повышается надежность программной системы. Модульность является следующим фундаментальным свойством, помогающим управлять сложностью систем ПО. Она реализуется целенаправленным конст руированием. В самом общем плане модули могут быть функциональными (про цедурно-ориентированными) или декларативными (объектно-ориентирован ными). Связность модулей определяется как мера их взаимной зависимости. В идеале должны разрабатываться слабо связанные модули. Другой мерой, при менимой к модульности, является прочность, которая определЯ€Т, насколько сильно связаны элементы внутри модуля. Локализация помогает создавать слабо связанные и весьма прочные модули. По отношению к целям технологии разработки ПО принципы модульности и лока лизации прямо способствуют достижению модифицируемости, надежности и понимаемости. Абстракция и модульность считаются наиболее важными принципами, исполь зуемыми для управления сложностью систем ПО. Но они не являются достаточ ными, потому что не гарантируют получения согласованных и правильных сис тем. Для обеспечения этих свойств необходимо привлекать принципы едино образия, полноты и подтверждае.мости. Принципы технологии разработки ПО не должны применяться случайно - не обходимо выполнять структуризацию системы определенным образом и, что са мое важное, qоскольку происходит деление системы на модули, применять со гласованные критерии декомпозиции. Можно выделить три основных подхода к разработке ПО, обеспечивающие такие критерии: нисходящее структурное про ектирование [Йордан, 1979J; проектирование, структурированное по даниым Uackson, 1975], и обьектно-ориентированное проектирование [Booch, 1986]. Нисходящее структурное проектирование определяет декомпозицию системы путем оформления каждого шага этого процесса в виде модуля. Это приводит к созданию функциональных программных модулей. Проектирование, структурированное по данным, является альтернативой нисхо дящей методологии. При этом сначала определяются структуры данных, а затем на их основе определяется структура программных модулей. Таким образом, здесь делается попытка сначала четко определить реализацию объектов, а за тем сделать их структуру видимой в функциональньiх модулях, обеспечиваю щих операции над объектами. Методы нисходящего прьектирования императивны по своей природе. Они зас тавляют концентрировать внимание на операциях, мало заботясь о проектирова нии структур данных. Методы проектирования, основанные на структурирова нии по данным, находятся как бы на другом конце спектра. Они концентрируют внимание на объектах, а операции трактуют глобальным образом. 206 Глава 6 • Программный инструментарий разработки систем В идеале разработчикам ПО хотелось бы использовать подход, позволяющий строить решения прямо в соответствии с имеющимся представлением проблемы. Кроме того, как и в естественном языке, желательна сбалансированность объек тов и операций на уровне принимаемых решений. Такой подход получил название обьектно-ориентированного [Booch, 1986]. Здесь учитывается важность трактовки объектов ПО как активных элементов, причем: каждый объект наделен своим собственным набором допустимых операций. Лег ко убедиться, что объектно-ориентированная парадигма поддерживает основные принципы технологии разработки ПО. 6.1.2. Модели процесса разработки ПО Под жизненным циклом разработки ПО традиционно понимается упоря доченная со вокупность этапов, обеспечивающих соэдание качественного прогр а ммного продукта. В общем случае в жизненный цикл разработки вк лючаются следующие стадии: техни ческое задание, эскизный проект, технический проект, рабочий проект и внедрение. В литературе существует множество нареканий на несовершенство данного раз биения [Липаев и др., 1983], но смысл его в целом достаточно ясен - борьба со сложностью процесса разработки программных продуктов за счет структуриза ции этапов и локализации на каждом из них только тех задач, которые могут и должны решаться именно здесь. Если перечисленные выше этапы укрупнить, останутся стадии проектирования, реОАизации и сопровождения. Проектирование предполагает составление формальных и/или формализова}l ных спецификаций. РеОАuзация - преобразование этих спецификаций в программный код ( автома тическое и/или автоматизированное). Сопровождение - тестирование разработанной системы, ее внедрение и последу ющую модификацию, которая, в свою очередь, может вернуть весь процесс к ста дии проектирования ,(перепроектирование). Ключевой стадией в жизненном цикле процесса разработки ПО является проек тирование. Ошибки и просчеты, допущенные здесь, - самые «дорогие•. Поэтому основные усилия в области технологии программирования направлены на авто матизацию проектирования программных комплексов. При этом базисными по нятиями являются модель программы и модель системы. Существуют различные подходы к разработке таких моделей [Миллс, 1970]. Однако с точки зрения целей настоящей книги нас будут интересовать, в первую очередь, те из них; которые имеют непосредственное продолжение в инструмен тальных средствах и интегрированных инструментальных средах. Поэтому ниже основное внимание будет уделено моделям программ, которые использу- ,1. ются в так называемых WorkBench-cиcтeмax (наиболее близким по семантике к этому термину является словосочетание «станок для производства ПО•). Одну из таких моделей предлагает W/O (Warnier/O") методология [Orr et al., 1977]. Она объединяет методологию Warnier по использованию логических 6.1. Технологии разработки программного обеспечения 207 структур данных и логических конструкций программ и систем и методолоmю DSSD (Data Structured System Development) Орра, базисом которой является аксиома о логическом соответствии между эвристической структурой программ и данных, обрабатываемых этими программами. На практике такая методология предполагает, ·что в распоряжении проектировщика системы имеется представи тельный набор процедурных шаблонов для достаточно широкого класса програм мируемых задач. В настоящее время DSSD-методолоrия •переросла• из методологии разработки программ в методологию разработки систем. При этом выделены явно уровень программирования (programming level) и системный уровень (system level). Применяются в DSSD два концептуальных представления - диаграммы входов (Entity diagrams), обеспечивающие определение системного контекста, и моди фицированные W/О-диаграммы (AssemЬly-line Diagrams), специфицирующие функциональное развитие системы [McClure, 1979]. Следующим подходом к созданию моделей программ (по идее достаточно близ ким к W/O-методолоmи) является логическое моделирование Гэйна [Cane et al., 1979]. Сам метод ориентирован на создание систем обработки данных. Логичес кая модель системы проектируется в процессе последовательного применения следующих семи этапов: описание природы предметной области с помощью диа грамм потоков данных (Data Flow Diagram); выделение первичной.модели дан ных (списка элементов данных в каждом информационном узле); проверка того, что DFD действительно отражает структуру данных, хранимых в системе; сведе ние полученной на предыдущем этапе информации в двумерные таблицы, кото рые в дальнейшем нормализуются; коррекция DFD с учетом результатов норма лизации предыдущего этапа; разбиение полученной в результате выполнения пр,едыдущих этапов модели на •процедурные единицы� (procedure units), а так же опре.деление деталей каждой процедурной единицы. После выполнения этих этапов принимается решение о необходимости прототипирования системы на целевом языке. И наконец, третьим в ряду подходов к созданию модели проектируемой про граммы является метод Йордана (Yourdon) (Yourdon et al., 1979; Yourdon, 1989). Он включает два компонента: инструментальные средства и методики. Ориенти рована методология Йордана на проектирование систем обработки данных. Под инструментальными средствами здесь понимаются различные диаграммы, ис пользуемые при описании моделей требований и моделей архитектуры проекти руемой информационной системы. Самые известные из таких диаграмм - диа граммы потоков данных DFD. Однако их недостатком является отсутствие средств описания отношений между данными и их •поведения• во времени. Вот почему в инструментальные средства метода Йордана на сегодняшний день кро ме DFD включены ЕRD-диаrраммы (Entity Relationship Diagrams) и SТD-диа rраммы (State Transition Diagrams). Методики в методе Йордана помогают перейти от бланка на бумаге и/или экран ной формы к хорошо организованной системной модели. ПервоначальнQ эти ме тодики базировались на традиционном top-down проектировании. В настоящее 208 Глава 6 • Программный инструментарий разработки систем время здесь используется метод событийного разбиения (event partitioning) .. При этом сначала создается контекстная диаграмма верхнего уровня (top level context diagram), где определяются системные ограничения и интерфейсы с внешним •миром•. Затем с помощью техники интервью формируется список событий из внешней среды, на которые система должна реаmровать. Такой подход обеспечи вает простой базис дЛЯ формирования •сырой• DFD. Несколько DFD-реакций могут быть объединены в реакцию более высокого уровня. Критерие� такого объединения является наличие узлов, связанных общими данными. По существу, событийное разбиение не что иное, как метод объектно-ориентированного проек тирования. Проблемы, возникающие при использовании метода ЕRD-диаrрамм, связаны, прежде всего, с трудностями интеграции компонентов при разработке всей систе мы. Вот почему в последнее время этот метод был обобщен за счет введения ин тегрированной базы данных. При этом ЕRD-метод трансформируется в струк турную методологию, основные этапы которой сводятся к разработке ERD (здесь выделяются как собственно сущности с их типами, так и связи, тоже с их типами); определению кардинальности (cardianality) - однозначности-много значности типов связей; преобразованию ERD по определенным правилам в со ответствующий файл и структуру БД. В процессе такого преобразовация каж дый тип сущности трансформируется в отношение, а тип связи - в особое (stand alone) отношение или объединяется с другими отношениями в зависимости от кардинальности типа связи. Разработка прикладных программ на основе сфор мированного файла и структуры базы данных является заключительным этапом в этом подходе. Последним методом, который кратко рассматривается в данном подразделе, яв ляется метод структурного проектирования (Structured Design) [Yourdon et al., 1979]. Структурное прое�тирование сделалось действительно мощным и активно используемым на практике подходом за счет того, что к моделям и методам были добавлены оценки результато1t проекn1рования. Здесь предлагаются все проект ные решения располагать в 3-мерном пространстве (содержание - сложность связность). И утверждается, что хорошими проектными решениями будут лишь те, которые при заданном содержании имеют минимальную сложность и 'макси мальную связность. По существу, этот критерий отражает уже обсуждавшиеся выше понятия абстраmруемости, модульности, сокрытия информации, связнос ти и т. п. Конкретным примером воплощения структурного подхода является сводопадная• или •каскадная• (waterfall) модель разработки систем ПО [Balzer et al., 1983]. Технология программирования уже прошла достаточно долгий путь развития, и сейчас происходит переоценка е� фундаментальных исходных посылок Первым кандидатом для такой переоценки стала традиционная точка зрения на процесс разработки ПО, как на процесс, основанный на понятии жизненного цикла. Рас тущее единодушие спеццалистов состоит в том, чтg данная точка зрения должна быть заменена та�юй, которая в большей степени соответствовала бы разработ кам, подцержив'аемым автоматизированными средами. S. 1 . Технологии разработки программно го обеспечения 209 В качестве примера смены парадигм можно отметить спиральную модель процес са разработки МО (рис. 6. 1), предложенную Боэмом [Boehm, 1986], суть которой состоит в том, что отдельные фазы процесса «прокручиваются• на постепенно повышающихся уровнях иерархии. Увеличение стоим ости Определение ситуации, аnьтернатив, оrраничений Планирование сл едующих фаз и верификация результ атов Оценка альтернатив, раэреwение рисков Разработка и верификация продукrа сп едующе rо ур овня Рис. 6 . 1 . С пиральная модель Б оэ ма / Результато.м разработки при этом становится не только программный код, но и его представление на более высоком уровне, что особенно важно в тех случаях, когда ПО эволюционизирует. Естественно, что такая модель предполагает нали чие более гиб1шх механизмов взаимодействия между потребителями и разработ чиками и соответствующих инструментальных средств. В Европе это направление ассоциируется, прежде всего, с проектированием ПО на основе объектно-ориентированных методологий, среди которых наиболее по пулярными являются технология MERISE и методология Шлайера- Мэллора (Shlaer-Mellor) [Andre. et al., 1994; Shlaer .et al., 1992). В рамках данного подхода проектирование рассматривается как процесс, проте кающий в пространстве трех измерений: «статика•- «динамика•-«алrоритмы• (рис. 6.2). Жизненный цикл при этом похож на виток в спирали Боэма, но включает другие стадии. Первая из них связана. с осью •Статика• и предполагает идентификацию и описание объектов, атрибутов и отношений, которые требуются для специфи кации проектируемой системы. Вторая стадия служит для описания поведения каждого объекта в ответ на внешние запросы и дает в качестве результата сово купность жизненных циклов всех введенных объектов. Затем проектируются ал- 21 0 Гла в а 6 • Программный инструментарий разра бот ки систем ' горитмы реализации действий, специфициров::щных на предыдущей стадии, и, наконец, на четвертой стадии осуществляется валидация спроектированной сис темы на полноту и функциональное соответствие исходной задаче. Последняя стадия можЕ:т потребовать нового витка в модели жизненного цикла. Алrоритмы Ди намика Рис. 6 . 2 . Проектирова н ие в м етодол огии Shlaer-Mellor Таким -образом, мы рассмотрели основные модели процессов разработки систем 4Традицонного» программного обеспечения и теперь переходим к анализу соот ветствующего инструментария. 6 . 1. 3 . Инструментальные средства под.цержки разработки систем ПО Технология программирования в целом и средства поддержки разработки ПО, в частности, развиваются настолько быстро, что даже простое перечисление основ ных инструментальных систем заняло бы в этой книге слишком много места. Вот почему ниже мы остановимся кратко лишь на нескольких проектах в области: тех нологии программирования, которые интересны в контексте данного издания. Любая развитая технологическая система должна поддерживать все основные этапы создания проектируемого программного комплекса. Для достижения этой цели в общей структуре типовой техиологической системы поддержки разработ ки (рис. 6.3) обычно выделяют базу данных проекта; подсистему автоматизации проектирования и программирования; подсистемы отладки, документирования и сопровождения, а также подсистему управления ходом выполнения проекта. 6. 1 . Технол огии разработки программного обеспечения 21 1 'Исходные и промежуточные спецификации програ ммы, те сты, задания и т. д. ------------------------◊ -----------------------Подсисте ма управления Подсисте ма разработки и реализа ции Подсисте м а докум ентирова ния ----------------------,-◊ ------------------------• Докуме н та ция, результаты работы подсистем, резу1:1ыаты прогонов и т. д. Рис . 6.3. Общая структура типовой технологической системы подде ржки разработки Развитые библиотечные системы поддержки разработки используются в настоя щее время во всем мире во всех сколько-нибудь серьезных программных проек тах. Но в подавляющем большинстве случаев такие системы достигли уровня удобства работы с ними квалифицированных программистов. Нас же, прежде всего, интересуют системь1 и проекты, в которых имеются тенденции к экспли цитному представлению техно.логических знаний, даже если они и не базируют ся на идеях и методах ИИ. Один из таких проектов - Gandalf [Haberman et al., 1986] - ориентирован на ав томатизированную генерацию систем разработки программного обеспечения. Исследования, выполняемые в рамках проекта Gandalf, касаются трех аспектов поддержки проектирования ПО: управление проектом, контроль версий и инкре ментное программирование, а также интеграция их в единую среду. Управление в Gandalf-cpeдe базируется на предположении, что разрабатываемый проект дол жен трактоваться как множество абстрактных типов данных, над которыми могут выполняться лишь определенные операции. Средством, реализующим данную концепцию, явилась система SDC (Software Development Control), представляю щая собой набор программ, первоначально реализованных на языке Shell в систе ме UNIX, а позднее переведенная на язык С. 21 2 Глава 6 • Программный инструментарий разработки систем Исследования в области контроля версий были начаты еще Л. Коопридером на базе проекта FAFOS [Habermann et al., 1 976], где изначально анализировались возможности создания семейства операционных систем. Была разработана нота ция для описания взаимодействия между подсистемами, для описания различ ных версий подсистем (исходного и объектного кода, документации и т. п.) и для описания действующих на этапе разработки механизмов (компиляция, редакти рование связей и т. п.). Затем был создан специальный язык lntercol как средство описания взаимосвязи и версий модулей в системе. И наконец, в систему были встроены знания о том, как конструировать систему из частей, не заставляя зани маться этим пользователя. В развитие этих работ была создана система SUCE, в рамках которой отслеживались различия между реализациями (версиями, кото рые действительно дают код для ряда спецификаций) и композициями (версия ми, определяющими новые подсистемы как группы существующих подсистем). В системе LOIPE (Language-Oriented Incremental Programming Environment) ин крементная компиляция выполняется на уровне отдельной процедуры. Достоин ством такого подхода является то, что при коррекции процедуры на уровне ло I<альных объектов или типов перекомпилируется только она. Если же меняется спецификация, то перекомпилируются и все зависящие от нее процедуры. Поль зователь:.:кий интерфейс с LОIРЕ-системой базируется на подсистеме синтакси чески-ориентированного редактирования ALOE (А Language-Oriented Editor). Целью разработки этой подсистемы было исследование возможности создания и · использования синтаксически-ориентированных редакторов в качестве базиса для сред программирования. Анализ литературы последних лет по технологии программирования показыва ет, что новой ветвью в технологии промышленной разработки и реализации сложных и значительных по объему систем программного обеспечения явля ется САSЕ-технология (Computer Aided Software Engineering) [БУТЕ, 1 990]. Первоначально САSЕ-технология появилась в проектах создания промышлен ных систем обработки данных. Это обстоятельство наложило свой отпечаток и на инструментальные средства САSЕ-технологии, где самое серьезное внимание уделялось, по крайней мере в ранних САSЕ-системах, поддержке проектирова ния информационных потоков. В настоящее время наблюдается отход от ориен тации на системы обработки данных, и инструментальные средства САSЕ-тех нолоrии становятся все более универсальными. Все средства поддержки САSЕ-технологии делятся на две большие группы: CA SE- Too/Кits и CASE- WorkBenches. Хороших русских эквивалентов этим терми нам нет. Однако первые часто называют 4инструментальными сундучками» (па кетами разработчика, технологическими пакетами), а вторые - 4станками для производства програм� (технологическими линиями). По определению [ВУТЕ, 1 990} . CASE-Too/Кit - колл е кция инте грированных програ мм ных средств, обеспечивающих аатоматическое ассистирование в ре ш ении задач одно го ти па в процесс е создания программ. 21 3 6, 1 . Технологии разработки программного обеспечения Такие пакеты используют общее «хранилище» для всей технической и управля ющей информации по проекту (репозиторий), снабжены общим интерфейсом с пользователем и унифицированным интерфейсом между отдельными инстру ментами пакета. Как правило, CASE-ToolКit концентрируются вокруг поддерж ки разработки одной фаз'ы производства программ или на одном типе приклад ных задач. Все вышесказанное справедливо и по отношению к CASE-WorkBench. Но здесь, кроме того, обеспечивается автоматизированная поддержка анализа решаемых задач по производству программного обеспечения, которая базируется на общих предположениях о процессе и технологии такой деятельности; поддерживается автоматическая передача результатов работ от одного этапа к другому, начиная со стадии проектирования и кончая отчуждением созданного программного продук та и его сопровождением. Та ким образом, · CASE- WorkBench является естественным «замы канием» технологи и разработки , реализации и сопровождения п рограммного обеспечения. В настоящее время «типовая,> система поддержки САSЕ-технологии имеет функци ональные возможности, представленные на рис. 6.4. САSЕ-средства Анализ и проектирование Обработка экранных форм и/или файлов документов Моделирование проектных решений Прототипировани Обнаружение ошибок Генерация кода из спецификаций Сопровождение и перепроектирование Программирование Тестирование Документирование Выполнение Управление проектом Документаторы Анализаторы программы Реструктуризаторы Подсистемы перепроектирования Проектировани БД и файлов Планирование Контроль Управление Отчетность Рис. 6.4. Ф ун кциональ1-1ые возможности типовой системы п одцержк и САS Е-технологии Как следует из этой Н-диаграммы, в САSЕ-среде должны поддерживаться все ос новные этапы разработки и сопровождения процессов создания программных систем, Однако уро�ень такой поддержки существенно различен. Так, например, если говорить об этапах анализа и проектирования, большинство инструмен тальных пакетов поддерживает экранные и отчетные формы, создание прототи- 21 4 Глава 6 • Пр ограммн ый инструм ентарий разработки систем пов, обнаружение ошибок, Значительная часть этих средств предназначена для ПЭВМ. Многие поддерживают таI<ие широко используемые методологии, как структурный анализ DeMarco или Gane/Sarson, структурное проектирование Yourdan/Jackson и некоторые другие. Существуют специализированные пакеты разработчиков для создания информационных систем, например AnaTool (Ad vanced Logical Software) для Macintosh; CA-Universe/Prototype (Computer Asso ciates lnternational) для ПЭВМ. Имеются САSЕ-среды и для поддержки разра ботки систем реального времени. В среде разработчиков ПО существуют две оценки данного подхода: часть из них считает, что САSЕ-технология кардинально меняет процессы разработки и эксп луатации ПО, другие отрицают это и оставляют за инструментальными сред' ствами CASE лишь функцию автоматизации рутинных работ [БУТЕ, 1 989] . Од нако анализ литературы показывает, что CASE средства все-таки «сдвигают» технологии разработки ПО с управления выполнением проектов в сторону мето да прототипизации. И этот сдвиг, на наш взгляд, чрезвычайно важная тенденция в современной технологии программирования. 6 . 2 . Методологии создания и модели жизненного цикла интеллектуальных систем В настоящее время в области разработки и реализации интеллектуальных систем сложилось следующее положение: с одной стороны, квалификация коллективов разработчиков здесь, как правило, достаточно высока, чтобы считать классичес кие положения технологии разработки ПО, обсуждавшиеся выше, естественным компонентом работы. С другой стороны, жизненно важными технологические ас пекты создания интеллектуальных систем становятся, лишь когда такие системы выходят на уровень промышленных разработок. Создание и внедрение интеллек туальных систем общения с промышленными базами данных, систем машинного перевода нового поколения, интеллектуальных систем автоматического синтеза программ и особенно экспертных систем, по существу, и выдвинуло проблему технологической поддержки разработок в области ИИ на передний план [SIG SOFT, 1 986] . На фоне вышеописанной ситуации обращает на себя внимание тот факт, что име ются только единичные примеры инструментальных систем, которые бы поддер живали некоторую четко провозглашенную технологию разработки ПО и опира лись бы на достаточно развитые системы представления знаний [Ramamoorthy et al., 1 987]. Учитывая это, в данном параграфе рассматриваются �технологичес кие аспекты и методологии создания интеллектуальных систем в свете введен ных выше понятий технологии программирования, а в следующих - инструмен тарий для разработки систем ИИ. Стиль программирования систем искусственного интеллекта существенно отли чается от стиля программирования с использованием обычных алгоритмических 6.2. Методологии создания жизненного цикла интеллектуальных систем 21 5 языков.· При этом почти каждая подобласть области ИИ характеризуется своим собственным стилем программирования, не всегда адекватным для других прило жений. В табл. 6. 1 приведены некоторые характерные отличия между обычными программными системами системами ИИ [Ramamoorthy et al., 1987] . и Табпица 6 . 1 . Отличия систем ИИ от обыч н ых п рограммных систем Характеристика программирование Тип обработки Методы Задан ие шагов решения Искомое реше н ие Уп равлен ие и да нн ые З наниs� М одифи кации Программирование в СИИ Символьная Эвристичес к ий поиск Нея вное Удовлетворител ьное Перемешан ы Неточ н ые Часты е Традиционное Числовая Алгоритм Точ ное Оптимальное Разделен ы Точ н ые Редкие Но ввиду все возрастающего использования систем ИИ в конкретных приложе ниях, к ним начинают предъявляться практически те же требоваnия, что и к тра диционным проrрам�ным комплексам и системам. В связи с этим становится весьма актуальной поддержка жизненного цикла программ в ИИ. К основным этапам в этом случае относятся инженерия требований, тестирование на прото типах и сопровождение. Как и в случае обычных программных систем, разработка системы ИИ должна начинаться с формулирования полных, непротиворечивых и однозначш,а требо ваний к ней [Basili et al., 1 984 ] . При проектировании должны использоваться принципы технологии разработки ПО - такие, например, как сокрытие инфор мации, локализация и модульность. Предполагается, что система должна проек тироваться как композиция уровней. Любой уровень должен быть чувствителен лишь к нижележащим уровням. Такое проектирование упрощает не только реа лизацию, но и тестирование. Тестирование ПО ИИ отличается от тестирования обычных систем, так как для первых характерно недетерминированное поведение вследствие использования стратегии разрешения конфликтов, зависящей от параметров периода исполне ния программы. Поэтому единственным эффективным способом тестирования систем ИИ является прототипизация. Фаза сопровождения, включающая выполнение самых различных модификаций системы, является важнейшим этапом процесса разработки любой системы, но имеет свою специфику для систем ИИ. Здесь база знаний - наиболее динамич ный компонент и меняется в течение всего жизненного цикла. Поэтому сопро вожден�е интеллектуальных систем - серьезная проблема. Но именно вопросам сопровождения уделяется мало внимания, хотя в обычном программировании имеются средства, которые могли бы быть адаптированы и для случая П0 ИИ. Это, например, системы управления версиями, системы управления конфигура цией и системь� модифицирующих запросов. . 1 21 6 Гла ва 6 • Пр?граммный инструментарий ра зработки систем • Та1шм образом, создание ПО систем, основанных на знаниях, имеет 'Как общие моменты с разработкой традиционнь1х систем ПО, так и свою специфику, кото-рая явным образом должна отражаться в соответствующих моделях жизненного цикла. В недавнем прошлом полигоном для создания и испытания таких моделей явля лись экспертные системы (ЭС). В ходе работ по созданию ЭС практически сложилась определенная технология, включающая следующие основные этапы: идентификацию, концептуализацию, формал.изацию, реал.изацию и тестирование [ Попов, 1 987; Уотерман, 1 989] . На этапе идентификации определяются задачи, подлежащие решению, выявля ются цели разработки, ресурсы, наличие экпертов, готовых и способных передать свои знания проектируемой ЭС, категории и требования б удущих пользователей. Концептуал.изация необходима для проведения содержательного анализа пред метной области, в процессе которого вьщеляются используемые понятия и их взаи• мосвязи, определяются методы решения задач, и подробно обсуждалась в преды дущих главах. На этапе формал.изации определяются способы представления всех типов знаний, специфицируются выделенные ранее ilонятия, фиксируются способы интерпре тации знаний, моделируется работа системы, и оцениваются полученные резуль таты. Этап реал.изации предполагает создание программной обстановки, в которой бу дет функционировать будущая система, и наполнение экспертом базы знаний, а на этапе тестирования эксперт и инженер по знаниям в интерактивном режиме, используя, в частности, объяснения, проверяют компетентность ЭС. В заключение на этапе тестирования проверяется пригодность ЭС для конечных пользователей. Понятно, что процесс создания ЭС не сводится к строгой последовательности выполнения вышеперечисленных этапов. В ходе разработки происходят много численные возвраты к предыдущим этапам и решения, принятые там, пересмат риваются. Все это существенно снижает общую эффективность разработки конк ретной системы и позволяет сделать вывод о том, что модель жизненного цикла, соответствующая такой технологии, имеет мало шансов на промышленное ис пользование. Это, конечно, не означает, что ЭС, разработанные в рамках такой методологии, практически бесполезны или их проектирование вообще невозможно. Обычно таким образом создаются небольшие автономно функционирующие ЭС первого поколения. Промышленная технология создания ЭС включает три фазы ( или, если быть точнее, технологии): проектирование, реал.изацию и внедрение� Жизненный цикл разработки, охватываемый этой технологией или совокупностью технологий, состоит из 6 этапов: исследование выполнимости проекта;разработка общей кон цепции ЭС; разработка и тестирование серии прототипов; разработка и испыта ние головного образца; разработка и проверка расширенных версий системы; при вязка системы к реал.ъной рабочей среде. ' 6.2. Методол огии создания жизненного цикла интеллектуальных систем 21 7 На фазе проектирования проект инициализируется, формируется группа разра бЬтчиков, определяются требования к будущей ЭС, проводятся исследования выполнимости проекта и вырабатывается общая концепция будущей системы. Остальные фазы данной технологии, по мнению [Микулич, 1990], ближе к тех нологии Уотермана (Waterman) и направлены на реализацию разработанной концепции в виде серии прототипов, последовательно приближающихся к тре буемой ЭС. Последний из прототипов и приобретает статус головного образца, который устанавливается будущим· пользователем в реальную операционную среду. Нетрудно понять, что первые два этапа промышленной технологии соответству ют этапу идентификации; следующие три - этапам концептуализации, форма лизации, реализации и тестирования. Новым и вместе с тем естественным для промышленной технологии является здесь этап привязки системы к реальной рабочей обстановке. Недостатком и той и друrой технологии ящ1яется то, что в действительности это лишь более или менее структурированный набор методических рекомендаций, к отдельным элементам которого, в лучшем случае, привязаны те или иные инст рументальные средства. И можно сказать, что сегодняшнее состояние здесь бли же к описательному, чем к естественно-научному. А это влечет за собой наличие инт�рпретаций методологических рекомендаций, которые могут быть настолько различными, что теряется сама идея технологии. Таким образом, самым важным на данном этапе является создание операциональных моделей технологии разра ботки интеллектуальных систем. И здесь, по нашему мнению, хорошим приме ром могут послужить М6дели экспертизы, уже разработанные в рамках исследо ваний по приобретению знаний. Приобретение знаний, как уже неоднократно отмечалось выше, является ключе вой задачей во всех технологиях построения систем, основанных на знаниях (СОЗ). Существует распространенный принцип, согласно которому производи тельность СОЗ находится в прямой зависимости от количества знаний, содержа щихся в системе [Feigenbaum, 1977]. Более 15 лет, с момента появления извест ной nporpaммы.ТIERESIAS. [Davis, 1984], исследователи в области ИИ рассмат рив,µот приобретение знаний как задачу переноса знаний эксперта в БЗ системы, что чрезвычайно важно для создания действующей системы. Но в настоящее время работы в области приобретения зцаний становятся важными и с точки зрения использования полученных здесь результатов для создания интеллекту альных технологий разработки самих СОЗ. Первое поколение методик для СОЗ базировалось на подходах двух типов: по этапном и прототипном. Поэтапный подход связан с представлениями о жизненном цикле [Buchanan et al., 1983; Guida et al., 1989] и соответствующей поддержке его основных стадий. В прототипном подходе первого поколения [Grover, 1983; Wielinga et al., 1988] процесс приобретения знаний может не отрабатывать все стадии, так как основ ным предположением здесь была возможность раскрытия структуры области экс пертизы на раннем этапе проектирования на основе сравнительно небольшого 21 8 Глава 6 • Программный инструментарий разработки систе м анализа. Во втором поколении СОЗ-методик признана сложность процесса при обретения знаний, преодоление которой видится· в моделировании экспертизы. В данной области были предложены такие методики, как онтологический анализ [Alexander et al., 1987], концептуальные графы Sowa [Clancey, 1 985), подходы, ос нованные на обобщенных (родовых) задачах [Chandrasekaran, 1 985], и концепту альное моделироваlfие, например КАDS-методолоrия [Breuker et al., 1 986). Ме тодики приобретения знаний обсуждаются в огромном числе работ и, в част ности, в предыдущих главах настоящей книги. Не имея места для их сколько нибудь полного анализа, сошлемся здесь лишь на обзоры [Wielinga et al., 1 988; Молокова, 1 992; Осипов, 1993] и перейдем к инструментальным средствам под держки разработки интеллектуальных систем. 6 . 3 . Языки программирования для ИИ и языки предстааления знаний Обсуждение технологических аспектов разработки сложных программных сис тем, проведенное выше, ' показьmает, что наиболее проработанным этапом здесь является реализация программных проектов. По идеям и методам этот этап близок к автоматизации программирования - одной из основных проблем использо вания средств вычислительной техники. Здесь уже в течение многих лет приме няется обширный арсенал языков программирования высокого уровня, ориен тированных на удобную и эффективную реализацию различных классов задач, а также широкий спектр трансляторов, обеспечивающих получение качественных исполнительных программ. Все шире используются на современном этапе и ме тоды автоматического синтеза программ. Уже стало обычным применение языко во-ориентированных редакторов и специализированных баз данных. И можно сказать, что в рамках технологии программирования уж� практически сформиро валась концепция окружения разработки сложных программных продуктов, ко торая и определяет инструментальные средства, доступные разработчикам. Необходимость использования средств автоматизации программирования при кладных систем, ориентированных на знания, и в частности ЭС, была осознана разработчиками этого класса программного обеспечения ЭВМ уже давно. По су ществу, средства поддержки разработки интеллектуальных систем в своем разви тии прошли основные стадии, характерные для систем автоматизации програм мирования. Оценивая данный процесс с сегодняшних позиций, можно указать в этой области две тенденции. Первая из них как бы повторяет •классический• путь развития средств автоматизации программирования: автокоды - языки высокого уровня языки сверхвысокого уровня - языки спецификаций. Условно эту тенденцию мож но назвать восходящей стратегией в области создания средств автоматизации разработки интеллектуальных систем. Вторая тенденция, нисходящая, связывает ся со специальными средствами, уже изначально ориентированными на опреде ленные классы задач и методов ИИ. В конце концов, обе эти тенденции, взаимно , 6. 3. Языки пр ограмми ровани я для ИИ и языки представлен ия знаний 21 9 обогатив друг друга, должны привести к созданию мощного и гибкого инструмен тария интеллектуального программирования. Но для настоящего этапа в этой области, по нашему мнению, характерна концентрация усилий в следующих на правлениях: 1 . Разработка систем представления знаний (СПЗ) путем прямого использоват ния широко распространенных языков обработки символьной информации и, все чаще, языков программирования общего назначения. 2. Расширение базисных языков ИИ до систем представления знаний за счет спе циализированных библиотек и пакетов. 3. Создание языков представления знаний (ЯПЗ), специально ориентированных на поддержку определенных формализмов, и реализация соответствующих трансляторов с этих языков. На начальном этапе развития ИИ языков и систем, ориентированных специально на создание прикладных систем, основанных на знаниях, не существовало. С одной стороны, в то время еще не оформился сам подход, в котором централь ное место отводилось бы изложению теории в форме программ, а с другой - сама область ИИ только зарождалась как научное направление. Немаловажным было и то, что появившиеся к тому времени универсальные языки программирования высокого уровня казались адекватным инструментом для создания любых, в том числе и интеллектуальных, систем. Однако сложность и трудоемкость разработ ки здесь настолько велики, что практически полезные интеллектуальные системы становятся недоступными для реализации. Учитывая вышесказанное, были раз работаны языки и системы обработки символьной информации, которые на не сколько десятилетий стали основным инструментом программирования интел лектуальных систем. До недавнего времени наиболее популярным базовым языком реализации сис тем ИИ вообще и ЭС, в частности, был ЛИСП [McCarthy, 1 978]. Ниже кратко рассматривается эволюция ЛИСПа, а затем обсуждаются альтернативы этому языку, существовавшие и существующие в области реализации систем, ориенти рованных на знания. Результаты этого краткого обзора суммированы в виде схе мы развития средств автоматизации программирования интеллектуальных сис тем н� рис. 6.5. Подробнее эти вопросы обсуждаются в работе [Хорошевский, 1 990а, Хорошевский, 1 990Ь]. Как извес�;но, язык ЛИСП был разработан в Стэнфордепод руководством Дж. Мак карти в начале 60-х годов и не предназначался вначале для программирования задач ИИ. Это был язык, который должен был стать следующим за ФОРТРАНом шагом на пути автоматизации программирования. По первоначальным замыслам новый язык должен был иметь средства работы с матрицами, указателями и структурами из указателей и т. п. Предполагалось, что первые реализации будут интерпретирующими, но в дальнейшем будут созданы 1 компиляторы. Как отмечает сам автор языка в обзоре [McCarthy, 1 978], к счастью, для столь амбициозного проекта не хватило средств. К тому же к моменту созда- 220 Глава 6 • Программный инстру ментарий разработки систем ния первых ЛИСП-интерпретаторов в практику работы на ЭВМ стал входить диалоговый режим, и режим интерпретации естественно вписался в общую струi<" туру диалоговой работь1. 1 990 т С++ ' Frame2 1 980 Concurrent PROLOG ____ --�cL9-�-i �--__ i Lisp-mach -' Smalltalk-V : 111 Lisp i: :t - - -- -Ceneration : - -- -- - - - - - _ _ _ , Smalltalk-80 r ·· - - . - - ·· 1 �-==--= �-:: ::.:.; �� -.F..13.!: _i · L1sp --- , ;- -Q-�- - - ,· �г-;г -KRL : Пилот 1 970 ; Pascal i I РЕТЛ/2� Simula/67 : ; ML1ps ; , г ·· - - - · - ·· , .-+---+--+-+----< Frame � 1 Qlisp ��: <р-ЯЗЫ - К-·; l-� : --·- •••• • • • • • • • • • • • • • • • • • •1 г - - - - -L - - - - - - - - - - ___ __ Maclisp lnterlisp 11 Lisp , Ceneration --т-----__ 1 : : L - - - - - - - - i . р _ ., ·· - --· - г · - . 1 : PLANNER ,____.. :! - L O B : SNO r ..,. ..:. _ _ _ _ _ _ _ _ _ _ _ .. . -: i I : �?_��--·:, ___,: ,,. . Базисн. РЕФАЛ 1 ._,..____,..._,! ,--- �-- - : PROLOG Lisp 1 .5 1 1 1 , � ----------! 1 - ,- - - - - - - - - - . _ , IPL-V 1 960 эвм Языки высокого уровня Ассемблеры Рис. 6.5. Э волюция средств представления зн а ний Примерно тогда же окончательно сформировались и принципы, пол"оженные в основу языка ЛИСП: использование единого спискового представления для 6.3. Языки программирования для И И и языки представления знаний 221 программ и данных; применение выражений для определения функций; скобоч ный синтаксис языка. Процесс разработки языка завершился GОзданием _версии ЛИСП 1.5 [McCarthy, 1978], которая на многие годы определила пути его разви тия; На протяжении всего существования языка было много попыток его усовершен ствования за счет введения дополнительных базисных примитивов и/или управ ляющих структур. Однако, как правило, все эти изменения не прививались в ка честве самостоятельных языков, так как их создатели оставались в �лисповской• парадигме, не предлагая нового взгляда на программирование. После разработки в начале 70-х годов таких мощных ЛИСП-систем, как MacLisp и Interlisp { Moon, 1 973; Teitelman, 1 974], попытки создания языков ИИ, отлич ных от лиспа, но на той же парадигме, по-видимому, сходят на нет. и дальней шее развитие языка идет, с одной стороны, по пути его стандартизации (таковы, например, Standart Lisp, Franz Lisp и Common Lisp ), а с другой - в направлении создания концептуально новых языков для представления и манипулирования знаниями, погруженных в ЛИСП-среду [Barr et al., 1 982]. К концу 80-х годов ЛИСП был реализован на всех классах ЭВМ, начиная с пер сональных компьютеров и кончая высокопроизводительными вычислительны ми системами. Новый толчок развитию ЛИСПа дало создание ЛИСП-машин, которые и в настоящее время выпускаются рядом фирм США, Японии и Запад ной Европы. Из предыдущего может сложиться впечатление, что язык Л ИСП (а вер�ее его современные диалекты) - единственный язык ИИ. В действительности,' конеч но, это не так. Уже в середине 60-х годов, то есть на этапе становления лиспа, разрабатывались языки, предлагающие другие концептуальные основы. Наибо лее важными из них в области обработки символьной информации являются, по нашему мнению, СНОБОЛ [Griswold, 1 978], разработанный в лабораториях Белла, и язык РЕФ АЛ [Турчин, 1 968], созданный в ИПМ АН СССР. Первый из них ( СНОБОЛ) - язык обработки строк, в рамках которого впервые появилась и была реализована в достаточно полной мере концепция поиска по образцу. С позиций сегодняшнего дня можно сказать, что язык СНОБОЛ был одной из первых практических реализаций развитой продукционной системы. Наиболее известная и 'интересная версия этого языка - СНОБОЛ-IV [Грисуолд и др., 1 980]. Здесь, на наш взгляд, техника заданЮI образцов и работа с ними суще ственно опередили потребности практики. Может быть именно это, а также поли тика активного внедрения ЛИСПа помешали широкому использованию языка СНОБОЛ в области ИИ. В основу языка РЕФ АЛ положено понятие рекурсивной функции, определенной на множестве произвольных символьных выражений. Базовой структурой дан ных этого языка являются списки, но не односвязные, как в ЛИ С Пе, а двунаправ ленные. Обработка символов ближе, как мы бы сказали сегодня, к продукционно му формализму. При этом активно используется концепция поиска по образцу, характерная для СНОБОЛа. Таким образом, РЕФ_АЛ вобрал в себя лучшие чер- 222 Глава 6 • П рограммный инструментарий разработки систем ты наиболее интересных языков обработки символьной информации 60-х годов. В настоящее время можно говорить о языке РЕ ФАЛ второго [Климов и др., 1 987] и даже третьего поколения. Реализован РЕФ АЛ на всех основных типах ЭВМ и активно используется для автоматизации построения трансляторов, для построе ния систем аналитических преобразований, а также, подобно ЛИСПу, в качестве инструментальной среды для. реализации языков представления знаний [Хоро шевский, 1983]. В начале 70-х годов появился еще один новый язык, способный составить конку ренцщо Л ИСПу при реализации систем, ориентированных на знания, - язык ПРОЛОГ [Clocksin et al., 1 982 ] . Он не дает новых сверхмощных средств програм мирования по сравнению с ЛИСПом, но поддерживает другую модель организа ции вычислений. Подобно тому, как ЛИСП скрыл от программиста устройство памяти ЭВМ, ПРОЛОГ позволил ему не заботиться (без необходимости) о пото ке управления в программе. ПРОЛОГ предлагает такую парадигму мышления, в рамках которой описание решаемой задачи представляется в виде слабо структу рированной совокупности отношений. Это удобно, если число отношений це слишком велико и каждое отношение описывается небольшим числом альтерна тив. В противном случае ПРОЛОГ-программа становится весьма сложной для понимания и модификации. Возникают и проблемы эффективности реализации языка, так как в общем случае механизмы вывода, встроенные в ПРОЛОГ, обеспе чивают поиск решения на основе перебора возможных альтернатив и декларатив ного возврата из тупиков. ПРОЛ О Г разработан в Марсельском университете в 197 1 г. [Colшeгauer, 1 983]. Однако популярность он стал приобретать лишь в на чале 80-х годов, когда благодаря усилиям математиков был обоснован логичес кий базис этого языка, а также в силу того, что в японском проекте вычислитель ных систем V поколения ПРОЛОГ был выбран в качестве базового для машины вывода. В настоящее�время ПРОЛОГ завоевал признание и на американском кон тиненте, хотя уступает в популярности ЛИСПу и даже специальным продукци онным языкам, широко используемым при создании ЭС. Мы рассмотрели языки общего назначения для задач ИИ. Вместе с тем в рамках развития средств автоматизации программных систем, ориентированных на зна ния, были языки, сыгравшие важную роль в эволюции основных языков ИИ. В первую очередь среди . них необходимо выделить языки, ориентированные на программирование поисковых задач. Это ПЛЭНЕР и различные его модифика ции [ Пильщиков, 1983], КОННАЙВЕР [Sussшan et а\., 1 976], а также языки, вы росшие из потребностей известной планирующей системы QA4 [ Sacerdoti et al., 1976]. Все эти языки функционируют в ЛИСП -среде и создавались I<ак расши рения базового языка. Для них, кроме свойств ЛИСПа, характерны следующие черты: представление данных в виде произвольных списковых структур; разви тые методы сопоставления образцов; поиск с возвратами и вызов процедур по об разцу. Заметим, что в конечном счете ни один из них не стал универсальным язы ком программирования ИИ. Однако выработанные здесь решения были использованы и в ЛИСПе, и в ПРОЛОГе, и в современных продукционных.язы ках. Важно и то, что языки этой группы способствовали переосмыслению самого 6.3. Языки программирования для .ИИ и язы ки представления знаний 223 понятия проrраммь1. В области ИИ это .послужило толчком к развитию объектно ориентированного программирования и разработке языков представления зна ний первого поколения. В 70-х годах в программировании вообще и программировании задач ИИ, в част ности, центр тяжести стал смещаться от процедурных к декларативным описа ниям. К этому же времени в ИИ сформировались и концепции представления знаний на основе семантических сетей и фреймов. Естественно, что появились и специальные языки программирования, ориентированные на поддержку этих кон цепций. Но из десятков, а может и сотен языков представления знаний (ЯПЗ) первого поколения лишь несколько сыграли заметную роль в про граммной поддержке систем предс.тавления знаний. Среди таких ЯПЗ явно вы деляются KRL, FRL, KL-ONE и некоторые другие [Хорошевский, 1990]. Харак терными чертами этих ЯПЗ были: двухуровневое представление данных (абст рактная модель предметной области в виде иерархии множеств понятий и конкретная модель ситуации как совокупность взаимосвязанных экземпляров этих понятий); представление связей между понятиями и закономерностей предметной области в виде присоединенных процедур; семантический подход к сопоставлению образцов и поиску по образцу. Суммируя вышесказанное, можно отметить, что на первом этапе была сформи рована значительная коллекция методов представления знаний и соответствую щих ЯПЗ. Все это способствовало формированию новой стадии исследований в области ИИ, которая характеризуется переходом от экспериментальной про граммной проверки идей и методов к созданию практически значимых инстру ментов. . В силу ограниченного объема книги мы не сможем здесь рассмотреть даже наи более распространенные языки и системы представления знаний. Поэтому ниже приведены лишь некоторые замечания относительно одного из самых распрост раненных ЯПЗ - OPS5 ( Official Production System, version 5) [B.rownston et al., 1985], который претендовал в начале 80-х годов на роль языка-стандарта в обла сти представления знаний для ЭС. OPS5 - один из многочисленных на сегодняшний день ЯПЗ для ЭС, поддержи вающих продукционный подход к представлению знаний. ОРS5-программа, в общем случае, содержит секцию деклараций, где описываются используемые объекты и определяются введенные пользователем функции, и секцию продук ций, основу которой составляют правила. ОРS5-объекты описываются с помо щью фреймов-экземпляров, прототипы которых задаются в виде определенных структур данных, опирающихся на небольшое число встроенных типов. Во вре мя исполнения программы обрабатываемые данные помещаются в. рабочую па мять, а правила - в память продукций. Модуль вывода решений в ОРS5-системе состоит из трех основных блоков: ()111ОЖдествления, где осуществляется поиск подходящих правил; в'Ыбора исполняемого правила из конфликтного множества правил и собственно исполнителя. выбранного правила. Непосредственно в OPS5 поддерживается единственная стратегия вывода решений - вывод, управляе мый целями. Вместе с тем OPS5 - достаточно гибкий язык, в котором имеются , 224 Глава 6 • Программны й инструментари й разработки с и стем явные средства не только для описания данных, но и средства определения уп равления над этими данными. Анализ формализмов представления знаний и методов вывода решений позво ляет сформулировать следующие требования к ЯПЗ: • наличие простых и вместе с тем достаточно мощных средств представления сложно структурированных и взаимосвязанных объектов; • возможность отЬбражения описаний объектов на разные виды памяти ЭВМ; • наличие гибких средств управления выводом, учитывающих необходимость структурирования правил работы решателя; • «п розрачность� системных механизмов для программиста, предполагающая возможность их доопределения и переопределения на уровне входногоязыка; • возможность эффективной реализации. Конечно, перечисленные требования во многом противоречивы. Но удачные язы ки и системы представления знаний, как правило, появляются лишь тогда, когда в рамках разумного компромисса учтены все эти требования. 6.4. Инструментальные пакеты для И И Развитые среды автоматизации программирования на базе языков символьной обработки являются необходимым технологическим уровнем систем поддержки разработки прикладных интеллектуальных систем. Как правило, такие среды покрывают (и то частично) подсистему автоматизации проектирования и про граммирования. Вот почему следующим этапом в развитии инструментальных средств стала ориентация на среды поддержки разработок интеллектуальны х систем . Анализ существующих инструментцльных систем показывает, что сначала в об ласти ИИ более активно велись работы по созданию интеллектуальных систем автоматизированного синтеза исполнительных программ. И это естественно, если иметь в виду, что инструментарий ИИ является, по существу, эволюцион ным развитием систем автоматизации программирования. При этом основная доля мощности и интеллектуальности такого инструментария связывалась не с его архитектурой, а с функциональными возможностями отдельных компонен тов той или иной технологической среды. Большое значение при разработке ин струментария для ИИ уделялось и удобству сопряжения отдельных компонен тов. Пожалуй, именно здесь были получены впечатляющие результаты и именно здесь наиболее широко использовались последние достижения теории и прак тики программирования, такие, например, как синтаксически-ориентирован ное редактирование и инкрементная компиляция. Вместе с тем подавляющее большинство современных инструментальных систем «не знают,> , что проекти рует и реализует с их помощью пользователь. И с этой точки зрения можно ска зать, что все такие системы являются не более чем «сундучками� с инструмента ми, успех использования которых определяется искусством работающего с ними мастера. Примерами подобных сред служит подавляющее большинство инстру- 6.4. И нструментальные пакеты для И И 2-2 5 ментальных пакетов и систем-оболочек для создания экспертных систем типа EXSYS [EXSYS, 1985) , GURU [MDBS, 1986] и др. [Harmon, 1987]. Однако не они определяют на сегодняшний день уровень достижений в этой области. К первому эшелону большинст�о специалистов относит системы ART [ART, 1984], КЕЕ [Florentin, 1 987) и Knowledge Craft [CARNEGIE, 1987] . Заметим, что в последнее время в класс самых мощных и развитых систем вошла и среда G2 [ САТALYST, 1993]. Все эти системы, во-первых, отличает то, что это, безусловно, интегрированные среды поддержки разработки интеллектуальных (в первую очередь, экспертных) систем. И вместе с тем для этих систем характерно не эклек тичное объединение различных полезных блоков, но тщательно сбалансирован ный их .отбор, что позволило сделать первые шаги от автоматизации програм мирования систем ИИ к технологическим системам поддержки проектирования сначала экспертных, а затем и других интеллектуальных систем. Остановимся чуть подробнее на двух системах из •большой тройки• - ART и КЕЕ, а в заключение кратко охарактеризуем систему G2. Сравнение основывает ся, главным образом, на работах [Wall et al., 1986; Richer, 1986; Gillmore et al., 1985] и на информации, полученной от дилеров этих систем. В середине 80-х годов система ART была одной из самых современных интегри рованных сред ( ИС), поддерживающих технологию проектирования систем, ос нованных на правилах. В ней существует ясное и богатое разнообразие типов пра вил. Различные типы правил элегантно вводятся с помощью мощного механизма •точек зрения• (Viewpoint). Этот механизм фактически является очень близким к системе, основанной на истинности предположений (truth maintanance system) [de Кleer, 1989], которая, по-видимому, является развитием идей KEEWorlds+ в системе КЕЕ. По существу, ART является пакетом разработчика. При этом воз можные ограничения в использовании ART вызваны не свойствами самой систе мы, а философией базового метода представления знаний. ART объединяет два главных формализма представления знаний: правила для процедурных и фреймоподобные структуры для декларативных знаний. Глав ным является формализм продукционных правил. Декла�ативные знания опи сываются через факты и схемы [schemata] и в некоторых случаях через образцы [patterns ]. Кроме факторов числовой неопределенности, которые связываются с индивидуальными фактами, в ART различаются факты, которые явно принима ются за ложные, и факты, истинность которых неизвестна. Возможно использо вание логических зависимостей, которые позволяют изменить факты позже, если обнаружится, что они1 на самом деле оказались ложными. Механизм View point допускает образование нескольких конкурирующих миров, где пробуются альтернативные решения. Схема предусматривается в ART в качестве макроформы для выражения таксо номических знаний в структурированном виде, но ни метод, ни активные значе ния или выход в базовый язык в этом декларативном представлении не допус каются. ART обеспечивает 11 системно-определенных свойств, наследование которых поддерживается системой автоматр:чески. Допускается множествен ное наследование. Однако средства задания активных значений, указания ограни- 226 Глава 6 • Программный инструментарий разработки систем чений на слот и привязки процедурных знаний к слотам здесь отсутствуют. .Та ким образом, роль компонента, основанного на фреймах, является чисто опи сательной. Ограничения и значения по умолчанию могут быть обеспечены в правилах, хотя их было бы легко устано�ить.непосредственно с помощью процедур но-ориентированноrо фреймового . формализма. Наследование, определяемое пользователем, не допускается, но тоже может быть смоделировано посред ством правил [Wall et al., 1 986). Согласно концепции фирмы Inference Corpora tion это является преимуществом, так как статическое наследование предус матривает мощную прекомпиляцию эффективного кода. Продукционные знания описываются с помощью правил пяти впдов: правила выводов, продукционные правила, гипотетические правила, правила ограниче ний и правила полаrаний. Правила вывода добавляют факты в базу знаний, в m время как продукционные правила изменяют факты в рабочей памяти (напри мер, значение атрибута объекта). Гипотетические правила позволяют в ART ис пользовать возможности формирования гипотез и представляются в следующей форме: . ЕСЛИ это случилось, ТО рассматривать это как гипотезу•. Правила ог раничений описывают ситуацию, которая никогда не может появиться при пра вильной точке зрения на действительность. Правила полаrаний используются для предположений (которые принимаются за правильные) о точках зрения (ги потезах). При подтверждении гипотезой некоторого условия она принимается за правильную, объединяется со всеми породившими ее гипотезами и становится новым корнем в древовидной структуре. Другие, несовместимые, гипотезы отбра сыщ1ются. Вызов процедур, определенных пользователем, может быть использован как в ле вых, так и в правых частях правил ART. Образцы (patterns) используются в ус ловной части правил. Они должны быть сопоставлены с фактами рабочей памя ти. Образцы могут включать переменные и логические связки, обеспечивающие сочетание фрагментов модели (И, ИЛИ, НЕ, СУЩЕСТВУЕТ, ДЛЯ ВСЕХ). ART предлагает традиционные модели вывода: •ОТ фактов к цели• и .от цели к фа1пам•. Они могут объединяться в мощный механизм истинности, основанный на предположениях, который допускает аргументацию типа ЧТО ЕСЛИ. Кроме того, в составе ART используются и классические правила типа OPS. Графическое окружение ART хорошо развито. Интерфейс ARTStudio включает в себя базу знаний с демонстрацией гипотез, утилиты отладчика запускаемых про грамм, систему подсказок, доступную в любое время, систему меню -и графичес кий пакет ARTist (ART Image Syntesis Tool ) с оконным редактором. ART предла гает редактор базы знаний, но не дает редактора схем, ·подобного внутреннему графическому редактору КЕЕ [Wall et al., 1 986; Richer, 1 986) , обсуждаемому ниже. Как указывается в работе [Gillmore et al., 1985], это может стать причиной ошибок при .глубоком• редактировании разрабатываемых баз знаний. ARTist позволяет создавать доступные правилам меню и управлять окнами поль зовательского интерфейса, а также создавать сами окна. Графические конструк ции описываются с помощью схем и ссылаются на правила. Это обеспечивает функционирование по принципу управления обращениями к данным. 6.4. Ин струментальные пакеты для ИИ 227 ART часто представляют в качестве лучшей ис ДЛЯ создания экспертных сис тем, но следует понимать, что хорошо эта среда отвечает лишь всем требованиям подхода поверхностных знаний. ;Благодаря компилятору правил система вывода в ART является быстрой по своей природе. Главные стратегии структуры управ ления поиском решений обеспечиваются, и некоторая гибкость в управлении по иском остается инженеру по' знаниям. Чисто декларативные та1<сономические фреймы языка интегрируются с системой правил, но в ART не существует дей ствительно процедурных фреймов, которые могли бы позволить объединить предметные описания с продукционными. В этом отношении объектно-ориенти рованное программирование с образцами и возможностями моделирования мог ло бы быть более полезным. Нельзя сказать, что подход, основанный на моделях, не осуществим в ART. Однако кажется, что другие ИС более эффективны для этих целей. Первые версии ART опирались на язык ЛИСП, последние реализованы непо средственно на С. Это увеличивает эффективность периода исполнения ART. Введены в новые версии и некоторые другие усов�ршенствования. Они касаются в основном выразительной силы формализма, основанного на фреймах, и увели чивают аде1<ватность ART по отношению к методу аргументации, основаl'шому 1-1а модели. Имеется информация, что в ART включен и объектно-ориенти рованный подход. Теперь рассмотрим основные свойства системы КЕЕ и типы задач, I<оторые •подходят� для �той среды. КЕЕ фактически является большим набором хоро шо интегрированных ИИ-парадиrм. Этот па1<ет включает продукционные пра вила, основанный на фреймах язык с наследованиями, логически-ориентирован ные утверждения, объектно-ориентированные парадигмы с сопутствующими сообщениями и обеспечивает доступ в базовую LISР-систему. Кроме того, КЕЕ предлагает средства для организации и объединения знаний в специфические I<омпоненты и явного структурирования процесса аргументации. Преимущества КЕЕ заключаются также в мощности и дружественности пользовательского интерфейса. Главное отличие между формализмом представления знаний КЕЕ и ART заклю чается в способе, которым эти ИС связывают фреймы и правила. КЕЕ является средой, в основе которой лежат фреймы, в то время как в ART - правила. Фрей мы в КЕЕ называются элементами (units) и вводятся в более широком смысле, чем в ART. Здесь фреймы могут иметь процедурную роль и дают возможность построения поведенческих моделей объекта и моделей экспертизы. С этой целью к слотам могут привязываться активные значения и методы. Активные значения могут выборочно активизировать системы правил. Таким образом, язык фрей мов КЕЕ позволяет представлять поведение независимых сложных компонент в рамках подхода, основанного на модели, что обеспечивает разделение знаний на проблемно-ориентированные фрагменты. При этом каждый компонент знаний может быть активирован по требованию. Описание объектов и правил в КЕЕ представляется в виде иерархий фреймов. Доступны два основных отношения: классы/подклассы и классы/примеры. Каж- 228 Глава 6 • Программный инструм е нтарий разработки систе м дый объект представляется слотами; в системе различаются индивидные ( соб ственные) и коллективные слоты. Первые используются для описания атрибутов и свойств класса, рассматриваемого в качестве объекта, а вторые описывают родо вые свойства членов класса. Слоты могут иметь различные аспекты, которые, в свою очередь, могут иметь множественные значения. На них могут накладывать ся ограничения, которые могут использоваться в качестве автоматических утилит для проверки целостности знаний. Этим КЕЕ отличается от ART, где ограниче ния могут выражаться только с помощью правил. Со слотами могут быть связаны активные значения. Формализм продукционных правил в КЕЕ тоже хорошо раз работан. Использование переменных и вызов LISР-функций допускается как в исполняемых, так и в условных частях. КЕЕ предлагает несколько методик для моделирования рассуждений. Конечно, при этом имеется базовый поисковый механизм, но КЕЕ позволяет также транс формировать неявные знания во фреймы и в решетки наследования, что дает средства для моделирования операций аргументации. КЕЕ (версия 3.0) обеспечивается системой, основанной на предположении ис тинности выполнения, называемой KEEW orld. Согласно заявлениям фирмы IntelliCorp, она обеспечивает поддержку фундаментальных методов поиска в пространстве состояний. Мощность КЕЕ проявляется при решении задач, где процесс аргументации может трансформироваться, выполняться и управляться с помощью фреймовых компонент. Решетка наследования фреймов позволяет установить несколько видов зависимостей между объектами. Система снабжена возможностями автоматического восстановления неявной информации. Утверж дается, что эта информация может быть представлена фреймами [Fikes et а!., 1985]. КЕЕ обеспечена эффективными возможностями восстановления и авто матической проверки информации. Для этой цели существует логический язык TellandAsk, который используется для определения и восстановления фактов в базе знаний КЕЕ. Пользовательский интерфейс КЕЕ очень гибкий и тщательно проработанный. Он включает мощный редактор, программу просмотра базы знаний, поясняющие сообщения и т. д. Известно, что он превосходит по мощности интерфейс ART [Wall et а!., 1986; Richer, 1986]. КЕЕ обеспечивает по.7,1ьзователя графическими средствами KEEpictures и Activelmages для построения графических представле ний. Последние могут быть привязаны к фреймовым слотам, и тогда изменение значения слота приводит к изменению «картинки,> . Следует отметить и недавнюю эволюцию системы. К Е Е 2. 1 не имел гипотети ческой системы или системы, основанной на предположении об истинности вы полнения. В КЕЕ 3.0 эти новые возможности доступны. А его открытая архите1< тура является важным фактором в процессе настройки и расширения, так как части КЕЕ написаны в самом КЕЕ. С одной стороны, это полезно для подтверж дения гибкости КЕЕ и способности к развитию. С другой - это может привести к неэффективности исполняющей системы. Дополнительно фирма IntelliCorp уже разработала пакет специализированных программ для КЕЕ. Одна из таких программ - SIMKIТ. Она спроектирована для поддержки моделирования в КЕЕ. 6.4. Инструментал ьные пакеты для И И 229 ' Таким образом, КЕЕ является развитой системой, основанной на фреймах, где хорошо сбалансированы формализмы представления как декларативных, так и процедурных знаний. Доступны в системе и методы явного управления и струк турирования процесса аргументации. Благодаря этому КЕЕ является подходя щим для решения задач в рамках подхода, основанного на модели. Важнейшими при разработке интеллектуальных прикладных систем являются вопросы формирования и отладки баз знаний. Но здесь КЕЕ, ART и многие дру гие инструментальные пакеты, к сожалению, идут по пути обычных систем авто матизации программирования. Пользователю предоставляется мощный графи ческий редактор правил, используемь1й для начального ввода продукций И коррекции их в процессе отладки, и средства графической трассировки вывода решений, которые должны позволить инженеру знаний ориентироваться во взаи модействии сотен и тысяч правил. Инструментальная среда G2 - разработка фирмы Gensym Corp. - является раз витием известной: экспертной системы реального времени PICON. По утвержде нию официального дилера этой фирмы в России Э. В. Попова, G2 является самой мощной из сред для систем реального времени среди всех инструментов данного класса. Система G2 реализована на всех основных вычислительных платформах, включая рабочие станции Sun, НР9000, RS/6000 и ПЭВМ, работающие под уп равлением Windows NТ. Возможна работа с системой в режиме клиент-сервер в сети Ethernet. Основные функциональные возможости G2 связаны с поддержкой процессов сле жения за множеством (порядка тысяч) одновременно изменяющихся параметров и обработкой изменений в режиме реального времени; проверкой нештатных си туаций на управляемых объе1сrах и принятием решений как в режиме ассистиро вания оператору, так и в автоматическом режиме. Функциональные возможнос ти системы обеспечиваются быстрым выполнением распараллеливающихся операций, доступными в режиме on-line данными, блоками темпорального выво да (включая ссылки на прошлое поведение и поведение управляемого объекта во времени, интеграцию с подсистемами динамического моделирования и проце дурными знаниями о времени), специальной техникой вывода решений в режиме реального времени (включая стандартные forward и backward рассуждения, а · так же event-driven выводы, сканирование датчиков для определения ситуаций, тре бующих немедленного вмешательства в процесс управления, механизмы фо1<уси рования на определенном подмножестве знаний с использованием метазнаний и мощной подсистемой real-time truth maintenance)'. Все это дает возможность при кладным системам, разработанным с использованием G2, поддерживать на RISС архитектурах обработку 1 000 правил/с реального уровня сложности. Указанные параметры производят серьезное впечатление, и, хотя доступной тех нической информации по системе G2 явно недостаточно для окончательных выводов о ее применимости во всем спектре заявленных приложений, можно предположить, что система G2 действительно была одной из первых инструмен тальных сред, поддерживающих разработку интегрированных интеллектуальных систем. 230 Глава 6 • Программный инструме нтарий разработки систем В заключение настоящего параграфа остановимся на первых попытках интел лектуализации инструментальных средств. Следует сразу сказать, что здесь дос таточно четко просматриваются два направления: снизу (применение методов ИИ для разработки программного обеспечения) и сверху (переход к системам поддержки разработки баз знаний, основывающихся, в свою очередь, на метазна ниях). Результаты, полученные с использованием методов ИИ в различных областях человеческой деятельности, привели разработчиков МО к идее использования интеллектуальных систем в программировании. Проект «Ассистент программи ста>> в Массачусетском технологическом институте и проект « Пси�> в Стэнфорд ском университете были первыми шагами в этом направлении [Waters, 1985; Green, 1977]. В этих проектах предпринимались попытки промоделировать зна ния программиста, используемые для понимания, проектирования, реализации и сопровождения ПО. Предполагалось, что эти знания могут быть использованы, например, экспертной системой для частичной автоматизации процесса разра ботки ПО, однако существенных результатов в этой части, по-видимому, получе но не было. Методы ИИ могут значительно увеличить мощность существующих инструмен тальных средств и в области разработки, оценки и проверки требований. Дей ствительно, часто пользователь не знает тех возможностей и особенностей, кото рые он хотел бы иметь от программной системы, и процесс разработки требований напоминает процесс приобретения знаний. Понятно, что при этом соответствую щие инструментальные средства могут использоваться при формировании пользователем своих требований. Вот почему ниже приводится краткий обзор средств приобретения знаний и сопровождения баз знаний, дополняющий анало гичный материал предыдущих глав, но с акцентом на инструментальных компо нентах. Исторически впервые автоматическое извлечение из экспертов конструктов и создание репертуарных решеток, необходимых для построения поля знаний [Гав рилова и др., 1988], было реализовано в системе PLANET [Shaw, 1982; Shaw et al., 1984]. Ряд алгоритмов и программ PLANET был впоследствии использован при создании системы ETS [Boose, 1985а; Boose, 1985Ь; Boose, 1985с; Boose, 1986], обеспечивающей не только автоматическое создание репертуарной решетки, но и преобразование ее в традиционные для ЭС формы представления БЗ. Потомками ETS являются система NeoETS [Boose et al., 1986] и интегрированная среда для извлечения экспертных знаний AQUINAS [Boose et al., 1987] . Дальнейшим раз витием системы PLANET является интегрированная среда KIТTEN [Gaines et al., 1986; Gaines et al., 1987), поддерживающая ряд методов извлечения знаний. Перечисленные выше системы поддержки процессов приобретения знаний, как правило, ориентированы на отдельные фазы всего технологического цикла. Од ной из методологий, ориентированных на «интегрированные;,, средства поддержки разработки, справедливо считается KADS, рассмотренная в параграфе_ 4.5. В этой системе сделана, пожалуй, первая попытка объединения достижений «клас сической;,, технологии программирования и методов ИИ. В дальнейшем эта 6.5. WоrkВепсh-сист емы 23 1 тенденция стала проявляться все более определенно, и лидерство, в конечном счете, перешло I< инструментальным системам нового поколения, основное отJ.Iи чие которых состоит в том, что они опираются на знания о технолоr:ии проекти рования, реализации и сопровождения интеллектуальных систем. В настоящее время попытки создания таких инструментальных систем наблюдаются в WorkBench, рассматриваемых ниже. 6. 5. WorkBench-cиcтeмы Си стемы т и па WorkBench в контексте автомат изации про·гра мм и рования - .это и нтег рированные и нструментальные с истемы, поддержива ю щи е весь ц икл с оздан и я и с о провожден и я п рограмм. К основным характеристикам WorkBench-cиcтeм относятся: 1 . Использование определенной технологии проектирования на протяжении всего жизненного цикла целевого продукта. 2. Вертикальная интеграция инструментальных средств, обеспечивающая связи и совместимость по данным между различными инструментами, используе мыми на разных стадиях создания целевой системы. 3. Горизонтальная интеграция моделей и методов, используемых на одной и той _ же стадии проектирования. 4. Сбалансированность инструментария, то есть отсутствие дублирующих компонентов, «необходимость и достаточность• каждого инструмента. Одна из систем данного типа разрабатывалась в рамках проекта VIТ AL [VIТAL, 1990) . Отдельные стадии методологии поддерживаются здесь следующими сред ствами: анализ - подсистемой КАТ (Knowledge Acquisition ToolКit); проеr<ти рование - подсистемой FTDT ( Functional and Technical Design Tool); кодирова ние знаний - языком представления знаний; проверка и верификация - V & VT (Validation and Verification Tool) ; поддержка и отладка - VT (Visualization Tool). WorkBench VITAL - тесно связанная с методологией система, пригодная для промышленного применения. Обеспечивается это средствами трансформации баз знаний в процедурное представление и развитыми средствами визуализации для поддержки навигации по большим базам знаний. В целом проект VITAL был достаточно амбициозным по своим целям и задачам, но, учитывая финансирование его в рамках европейской научной программы ESPRIT и задел основных исvолнителей, вполне реальным. Проект VIT AL, если так можно сказать, определил философию разработки WorkBench-cиcтeм. Ниже, в качестве примеров, рассматриваются две Work Bench-cиcтeмы, KEATS [Motta et al., 1988) и Shelly [Bouchet et al., 1 989), где эта философия нашла некоторое реальное воплощение. 232 Глава 6 • П рограммный инструментарий разработки систем Система KEATS (Knowledge Engineer's Assistant); [Motta et al., 1988; Motta et al., 1 989} первоначально представляла собой набор инструментов, созданных для по мощи инженерам знаний в проведении анализа предметных знаний и разработки концептуальной модели ПО (вот тут говорится про предметную область! ! !). В первой версии системы, называемой KEATS-1 [Motta et al., 1 988], были реали зованы редактор текстов CREF (Cross Reference Editing Facility) и графический редактор GIS (Graphical lnterface System), а также фрейм-ориентированный язык описания знаний KDL (Knowledge Description Language) и интерпретатор про дукционных правил COPS (Context Oriented Production System). Редактор текстов CREF помогает инженерам знаний провести анализ докумен тов, имеющих текстовую форму, и допускает установление связей между фраг ментами типа «ссылается•, «обобщает•, «заменяет•, «предшествует•. Графический редактор GIS позволяет инженеру знаний быстро построить пред ставление концептуальней модели ПО (то же самое). Элементами графического представления могут быть как фрагменты, выделенные посредством компонента CREF, так и произвольные объекты исследуемой ПО (то же самое). Различаются два вида графических элементов: классы (изображаются овалом) и примеры (изображаются прямоугольником). Разные типы отношений между элементами показываются разными стрелками. В КЕАTS- 1 такое графическое представление автоматически транслируется в текст на языке KDL. Поддерживается и обратное отображение. В работе [Motta et al., 1 989) были проанализированы ограничения CREF и GIS как инструментальных средств приобретения знаний. Анализ текстовых доку ментов в CREF и построение концептуальной модели ПО (то же самое), поддер живаемое G IS, являются хотя и разными, но тесно связанными видами деятель ности. Но поскольку в КЕАTS-1 они обеспечиваются разными программными системами и автоматического интерфейса между ними нет, то построение кон цептуальной модели, элементами которой были бы сущности, выделенные в про цессе анализа, требует от инженера по знаниям дополнительных усилий. Поэто му естественно иметь такую инструментальную поддержку, которая позволяла бы инженеру знаний строить концептуальную модель, исходя из информации, со держащейся в текстовых документах. Требуемая инструментальная поддержка была реализована в пdдсистеме ACQUIST системы KEATS-2 [Motta et al., 1989). Рассмотрим функциональные возможности ACQUIST подр9бнее. Выделение фрагментов здесь реализуется посредством указания (с помощью мыши) на область текста и задания имени понятия, релевантного отмеченному тексту. Име на понятий высвечены в виде элементов меню на том же экране, что и анализиру емый текст. Нескольким фрагментам может быть поставлено в соответствие одно и то же понятие. Понятия могут быть заранее' перечислены инженером знаний или генерироваться непосредственно в процессе анализа текста. В последнем слу чае возможно «заводитм имена понятий вручную либо воспользоваться лекси ческим анализатором. 6.5. WоrkВепсh-системы 233 В ACQUIST лексический анализ может выполняться над множеством указанных пользователем текстов. Имеется возможность задать фильтр для отсеивания слов, не представляющих интереса, который реализуется как обычный текстовый файл, где перечислен ы такие «неинтересные,> слова. На понятиях может быть за дана иерархическая структура. Пользователь ACQUIST может объединить в одну группу близкие с его точки зрения понятия и дать название этой группе. Группы понятий, в свою очередь, могут быть подвергнуты дальнейшему обобще нию. ACQUIST позволяет связывать фрагменты, понятия, группы с помощью встро енных связей и связей, определенных самим пользователем. Для того чтобы ин женер знаний имел целостное представление о той структуре, которую он, уста навливая связи, создает, в ACQUIST имеется возможность построить «карту>> текущей структуры. Для одного и того же множества понятий, групп и фрагмен тов может быть построено много карт, каждая из которых соответствует некото рому <,взгляду>> на отношения между элементами. Пользователь им·еет возмож ность не только просмотреть графическое представление, но и непосредственно манипулировать его элементами. В частности, можно определять связи, переме щать графические объекты и подструктуры и т. п. Сохраняемые версии результатов анализа называются здесь теориями. ACQUIST позволяет одновременно загрузить нескою,ко теорий и при необходимости пере ключаться от одной теории к другой. По желанию пользователя различные тео рии могут б ыть слиты. ACQUIST со:щан с испою,зованием методологии объект но-ориентированного программирования: фрагменты, понятия и группы реали зованы как объекты. Новая версия системы КЕАTS, которая была развитием предыдущей, разработа на в лаборатории когнитологии Открытого университета Великобритании и финансировалась British Telecom. Corp. По определению авторов, КЕАTS - про граммное окружение, поддерживающее построение систем, основанных на знани ях. Основное назначение -- поддержка разработки ЭС на критических стадиях приобретение и кодирование знаний, отладка БЗ [Motta et al., 1989]. Данная система поддерживает не только отдельные методы моделирования, но и обеспечивает интегрированную программную поддержку взаимосвязанных мо делей знаний. Основные компоненты KEATS: A CQUIST - средство фрагмен тирования текстовых источников :шаний, которое позволяет разбить текст или протокол беседы с экспертом на множество взаимосвязанных, аннотирован ных фрагментов (гипертекст) и создать концепты (понятия); FLIK - фреймово ориентированный язык представления знаний; GIS - графический интерфейс, используемый как для создания гипертекстов и концептуальных моделей с по мощью ACQU IST, так и для проектирования фреймовых систем на основе языка FLIK; ERI - базисный интерпретатор правил, обеспечивающий прямой и об ратный вывод по продукциям; TRI - визуализирующий интерпретатор правил, демонстрирующий трассу выполнения продукций в виде мозаичной таблицы, а 234 Глава 6 • П ро граммный и нструментарий разработки с истем также графически отражающий активные правила, фреймы и 1<:онфликтное мно жество; Tahles - интерфейс манипулирования таблицами, который может ис пользоваться вместе со всеми моделями знаний, поддерживаемыми в KEATS; CS - язык описания и распостранения ограничений; TMS - немонотонная сис тема сопровождения истинности, тесно связанная с ERI, FLIK и CS, а также TMV - графичесr<:ий интерфейс ,подсистемы TMS, обеспечивающий визуализа цию на И/ИЛИ дереве значения истинности или :Ложности заключений в зави симости от посылок. В системе КЕАTS концептуальные модели могут создаваться с помощью методов �сверху-вниз� и �снизу-вверх�. Первый подход используется при четко опре деленной задаче и наличии специфической модели в ПО (то же самое), например в задачах диагностики. Специфическая моде:11ь может быть сразу же отражена в виде таблиц и концептуальных моделей и имплантирована в будущую ЭС с помо щью GIS и Tahles. Когда приобретение знаний основывается не на четr<:о опреде ленной модели ПО, а, например, на протоколе опроса эксперта, используется вто рой подход. Текстовые данные анализируются и фрагментируются с помощью ACQUIST, и выделяются концепты. Созданная модель затем визуализируется с помощью GIS. Интеллектуальная система Shelly [Bouchet et al., 1989] является представителем следующего поr<0ления программной поддержки КАDS-методологии. Она спо собна не только обеспечивать выполнение работ, предусматриваемых методоло гией, но и советовать инженеру знаний, когда и как выполнять ту или иную рабо ту, а также объяснять, почему это необходимо. Система Shelly разрабатывалась как интегрированная программная среда, поддерживающая весь процесс созда ния ЭС, если он осуществляется в соответствии с КАDS-методологией. И про цесс разработки самой системы Shelly является примером практического ее при менения. Согласно КАDS-методолоrии, рассмотренной в п. 4.5, необходимо провести анализ четырех тиnов знаний, относящихся соответственно к уровням стратегий, задач, выводов и предметной области. К уровню стратегий относятся знания, обеспечи вающие гибкость разрабатываемой системы, ее способность решать разнообраз ные проблемы, выбирая или формируя подходящие стратегии. Для системы Shelly такими проблемами являются: управление деятельностью инженера зна ний, разрабатывающего прикладную ЭС; слежение за процессом разработки ЭС; выдача советов, подсказок, объяснений по требованию пользователя. Знания стратегического уровня, необходимые для решения этих проблем, пред ставляют собой набор правил, задающих условия начала и завершения каждого вида работы, предусмотренной КАDS-методологией. Иерархия видов работ, а также описания тех работ, выполнение которых поддерживается Shelly, состав ляют знания уровня задач. К уровню выводов относятся знания о rсонкретных действиях, с помощью rюторых может быть выполнена та или иная работа. Уро вень предметной области составляют описания тех объектов, над которыми мо гут выполняться действия, относящиеся к уровню выводов. При этом различа- 6.5. WоrkВ епсh-системы 235 ются объекты, используемые в КАDS-методологии ( « понятие�,, , «метакласс• и т. п.), объекты, обусловленные программной реализацией методологии ( «фраг менн , <<связь• и т. п.), и объекты, обусловленные природой интерфейса ( «OI<HO!>, «текст�,, и т. п.). Основное проектное решение при создании систем ы Shelly состоит в том, что каждому виду деятельности здесь соответствует свое инструментальное средство AST (Activity Support Tool). Центральным модулем в Shelly является управляющий модул ь « Advice & Gui dancei,, . Он предназначе н для информирования пользователя о текущем состоя нии р азработки его прикладной ЭС; обеспеч ивает ответы на конкретные вопросы пользователя; рекомендует пользовател ю дальнейшие действия и активирует со-_ ответствующий модуль AST; предупреждает пользователя о нарушении им КАDS-методологии. Модуль «Advice & Guidance• может функцио нировать в двух режимах, различа ющихся степенью сложности. Первый, простой режим, «локального совета�,, , ак тивируется посредством явного запроса, поступившего от пользователя. Во вто ром режиме пользователь может получить рекомендации относительно того, как наиболее эффективно работать с Shelly. Система будет постоянно следить за дея тельностью пользов ателя и при необходимости предупредит его и объяснит, по ч ему рекомендуется выполнять ту или иную работу. Рабо ч ую память Shelly составляют база знаний, базы данных о разрабоп<ах Э С и база внешних форм. В базе знаний хранятся описания объектов КАDS-методо логии и соответствующих видов деятельности. Каждый вид деятель но ст и пред ставлен фреймом со следующим набором слотов Пример 6 . 1 <текст> цель: <текст> когда: <текст> <текст> как: вход: <объект КАDS-методологии> выход: <объект КАDS-методологии> связа11 с: <вид деятельности> поддерживается: AST описание: Кроме того, в базе знаний имеется набор правил, позволяющих управлять про цессом разработки прикладной Э С. При мер 6 . 2 ЕСЛИ <деятельность!> п о проекту Х = «завершена�,, И <деятельность2> по проекту Х = «завершена�,, ТО возможно начать <деятельностьЗ> по проекту Х. 236 Глава 6 • П рограммный инструмента ри й разработки систем В базах данных о разработках ЭС представлены примеры объектов КАDS-мето дологии, построенные на конкретном предметном материале, а т,акже информа ция о текущем статусе каждого вида деятельности ( •завершена•, •начата•, .«не начата•). Понятно, что фрагментарный обзор WorkBench-cиcтeм, приведенный выuiе, не дает полного представления обо всех их функциональных возможностях. Одна ко для нас важна, прежде всего, тенденция развития инструментальных средств поддержки разработки интеллектуальных систем, состоящая в том, что уже име ются положительные примеры WоrkВеnсh-инструментария, ориентированного на весь жизненный цикл создания систем, основанных на знаниях. П ример разработки систем ы , основаннои на знаниях □ П роду кци онно-фре й м о в ы й ЯПЗ PILOT/2 □ Психодиагности ка - п р и мер п ред мет ной о бл асти для п о ст роен ия э ксп ертных систем □ Раз р аботка и ре али за ци я психодиа гно стич е с ко й ЭС «Cattell» 7. 1 . П родукци онно - ф р е й м о вый Я ПЗ PI LOT/2 В любом языке программирования можно выдел ить три составляющие: декла ративную (описания данных), процедурную ( правила преобразования данных) и инференциальную (правила управления компонентами процедурной, а иногда и декларативной составляю щих). Не исключение в этом смысле и языки пред ставления знаний, но их специфика в том, что описан и я здесь в основном струк турные, а данные могут быть активными за счет присоединенных процедур, обес печивающих <!:Вычисление• их значений; правила преобразования данных ориен тированы скорее на то, чтобы явно специфицировать, что должно быть получено, не концентрируя без необходимости внимание программиста на том, как дости гается результат. Но самое большое отличие ЯПЗ от других языков в инферен циальной компоненте, которая реализует некоторую (чаще всего в,строенную) f стратегию поиска решения. Такой подход предполагает, что при выполнении Я ПЗ-проrрамм всегда существует •арбитр• , функцией которого является оцен ка -«текущей ситуации• и выбор пути движения от нее к целевой. В разных ЯПЗ имеются различные средства определения декларативной, проце дурной и инференциалъной составляющих. Отличия же здесь связаны, в первую очередь, с использованием того или иного подхода к представлению знаний. В качестве примера развитых средств продукционно-фреймового программиро вания баз знаний ниже обсуждается Я П З PILOT/2, разработанный в рамках про екта PiES WorkBench [Кhoroshevsky, 1 994Ь] . Его специ фика в том, что здесь вве- 238 Глава 7 • Пример разработки систем ы , основанной на знаниях · дены явно достаточно мо щные средства прогр аммирования и нференпиальной составляющей и выразительные описания образцов, а также удобны й и открытый для расширения набор операторов преобр азования данных в основной и внешней п амяти. \ 7 . 1 . 1 . Структура ПИЛОТ-программ и управление выводом В общем сл учае РILОТ-проrрамма содержит две основные (декларативная и про цедурная) и две вспомогательные (включение файлов и переопределение стро1,) компоненты. Декларативная часть состоит из эл ементов, специфицирующих пе ременные, прототипы фунrщий и/или процедур, а также необходимые базы зн а ний . Продукционная часть состоит из секций, которые, в свою очередь, содержат продукции. Инференциальная составляющая присутствует в ЯПЗ PI LOT/2 не я вным образом в виде встроенного <<арбитра;,,, алгоритм работы rюторого описы вается ниже, и, кроме того, определяется средствами настро й к и и перепрограмми рования такого �арбитра;,, . Разбиение н а секции и правил а и специальные услов ия в виде секционных и пра виловых р азрешений необходимы дл я того, что'бы обеспечить многоуровневое управление выполнением РILОТ-программ. Как известно [Форсай т, 1987), <<ар битр:�> продукционной системы функционирует следующим образом: сначала для всех продукций проверяются- условия применимости и из тех продукций, для ко торых эти условия истинны , формируется конфликтное множество. Из этого множества по определенному критерию выбирается исполняемая проду кция; она реал изуется (то есть отрабатывается ее правая часть) , и цикл управления работой · •арбитра• повторяется, пока конфл иктное множество на некотором шаге не ста нет пустым (тогда работа продукционной системы завершается естественным об разом) или функционирование не будет прервано явным образом, например с помощью специального действия из прав�й части исполняемой продукции (в этом случае работа продукционной системы завершается принудительно). Понятно, что работа такого •арб итра;,, имеет смысл лишь в тех случаях, когда про дукций немного (десятки), а в конфликтном множестве продукций мало (едини цы). В противном случае функционирование системы неэффективно и требуют ся специальные алгоритмы, чтобы •арбитр• не тратил все время толы,о на себя. К настоящему времени разработаны и опробованы на практике различнь_уе стра тегии увеличения эффе ктивности работы •арбитра • [de Кleer, 1 989 ) , которые используются и в данном случае. Но не менее важно иметь гибкие средства описа ния этих стратегий с уровня входного языка. Тогда пользовател ь, в зависи мости от требований его задачи, сможет отказаться от стандартных стратегий и описать свою собственную, которая адекватна его конкретному случаю. Для описан ия страте ги й управления выводом решений в ЯПЗ PILOT/2 служ ат секционное и правиловое разрешения. Каждое из них является последовательно стью фильтров, с помощью которых формируется и/или изменяется конфл юп ное множество продукций. Для понимания того, как пользоваться этими фил ьт- 7 . 1 . Продукцио нно-фреймо в ы й ЯПЗ PIL0T/2 239 рами, необходимо знать стратегию встроенного •арбитра• PI LOT/2. Поэтому ниже приводится алгоритм его работы,. специфицирующий схему, представлен ную на рис. 7. 1. Апrоритм работы встроенноrо «арбитра» ЯПЗ PI LOT/2 wh i l e ( уровень-О ! = NULL ) { « выбра ть и з « повестки -дня» секцию для вы п ол нения » ; « сформирова ть на уровне- 1 мн- во п равил этой секции» ; « выполнить фил ьт р ацию мн- в а правил на уровне- 1 по фла гу активна/ не.а ктивна» ; « выполнить фил ьтрацию мн-ва оста вшихся правил на основании выч исления истинности секционно го разрешения » ; « сформирова ть на уровне-2 множество активных п равил » ; f o r ( каждо го п ра вила на уровне-2 ) { « вычислить з начение истиннос у и левой части » ; i f ( з начение и стинности правила == TRUE ) «добавить п равило в конфл . мн-во на уровне-3 » ; фил ьтрацию мн - ва оставшихся на уровне - 3 п р авил н а основании выч исления истинности п равиловых р аз решений » ; « сформирова ть на уровне-4 множество готовых к выполнению п равил » ; i f ( на уровне-4 осталось одно прав ило « в ыполнить данное п равило» ; else { « выполнить случайный выбор исполняемо го правила и з множества правил на уро вне - 4 » ; « выполнить данное п равило» : « выполнить Приведенный алгоритм прозрачен и не н уждается в особых комментариях. Заме тим лишь, что фильтр •активна/неактивна• реализован как встроенная проверка флагов активности продукций текущей секции. Первоначально (при запуске сек ции) •арбитр1-> считает, что все продукции секции активны, но в процессе вы полнения их состояние может измениться за счет применения соответствующих действий. Фильтр секционного разрешения тоже программируется с уровня входного языка. В результате применения этих двух фильтров формируется мно жество продукций, которые принципиально могут войти в конфликтное множе ство. Этап фильтрации продукций по истинности левых частей - традиционный, 240 Гл а ва 7 • П ри ме р ра зра ботки си стем ы , основ а нной на знаниях в результате получается традиционное конфликтное множество (правда, уже усе- --· ченное за счет предыдущих двух фильтров). На этом множестве в ЯПЗ PILOT/2 может быть организовано дополнительное управление за счет программируемых правиловых разрешений. Если все усечения не привели к однозначному выбору исполняемой продукции, она выбирается случайным образом и цикл работы �ар битра�> повторяется. Sectlon Main Si Уровень О Уровень 1 Rule RЗ Rule R1 On/Off фильтр Section-Sel фильтр Уровень 2 Conditionl Фильтр истинности левых частей продукций Уровень З Rule-Sel фильтр Уровень 4 Фильтр «Реш к в» Уровень 5 Рис. 7. 1 . Встроен ный «арбитр� PILOT/2 Точек •влияния• на работу •арбитра• PILOT/2 всего четыре: активность/неак тивность продукций; секционное разрешение; истинность левых частей продук ций; правиловое разрешение. Существует и пятая точка - алгоритм случайного выбора, но она инженеру по знаниям недоступна. Секционные и правиловые разрешения суть последовательность операторов if-then-else и действий разрешения. При этом сами услови� секционного и пра виловоrо разрешений - логические формулы в базисе И-ИЛИ-НЕ с общепри нятым старшинством операций. А специфика ЯПЗ PILOT/2 состоит в том, как определяются элементарные разрешения. Семантика действий разрешений (при условии, что через КМ обозначено конфликтное множество) - следующая: 7. 1 . Продукционно -фр еймовый ЯПЗ PILOT/2 set (R1, R2, ... , Rk) КМ = Rt, R2, ..., Rk insert (Rt, R2, ... , Rk) КМ н - КМс + Rt + R2 + ... + Rk remove (Rt, R2, ... , Rk) КМн = КМс - Rt - R2 - ... - Rk removeall КМ = пустое множество break Прерывает выполнение оставшихся элементов секционного или правиловоrо разрешения 24 1 Семантика элементарных секционных (продукционных) разрешений -. опреде ляется правилами вида: 1. Элементарное секционное разрешение active(R1,R2, ... ,Rk) истинно, если все продукции Rt , R2, ... , Rk имеют включенные флаги активности. 2. Элементарное секционное (продукционное) разрешение used(R1,R2, ... ,Rk) ис тинно, если все продукции Rt, R2; ..., Rk применялись ранее. 3. Элементарное продукционное· разрешение ready( R1,R2,... ,Rk) истинно, если все продукции R1, R2, ..., Rk готовы к выполнению, что, в свою очередь, спр� ведливо, если их левые части (условия) истинны. Понятно, что практически все элементарные разрешения работают с именами продукций, так что проверка соответствующих условий выполняется •арбит ром• достаточно быстро. И этих средств (в подавляющем большинстве случаев) достаточно для существенного увеличения гибкости управления продукцион ной системой и сохранения в то же время приемлемой эффективности ее работы. Вместе с тем в ЯПЗ PILOT/2 инженеру по знаниям предоставлена возможность управления работой продукционной системы и на основе анализа базы знаний. Нужно лишь понимать, что это управление •дорогое•, так что пользоваться им следует лишь в тех случаях, когда соответствующие условия невозможно (или нецелесообразно) проверять в левых частях продукций. 7. 1. 2. Декларативное представление данных и знаний Декларативная часть РILОТ-проrраммы состоит из элементов, специфицирую щих типы данных, прототипы функций и/или процедур, переменные, а также не обходимые базы знаний. Спецификация типов - мощное средство конструирован:ия новых типов данных, которые поддерживаются системой автоматически на основании базовых типов. В ЯПЗ PILOT/2 фиксированы следующие базовые типы: int, float, char, string, имя -фрейма, prototype, frame, /ипс, proc. Без учета спецификации ограничения это дает почти те же возможности, что и спецификация typedef в языках С и С++. Однако в ЯПЗ PILOT/2 существуют и множественные типы, симметричные по отношению к базовым, а также усечение вновь вводимых типов с помощью orpa- -- 242 Глава 7 • Прим е р разр�ботки системы, основанной на· з нан иях ничений. Последние задают в б�rtce И-ИЛI1�НЕ оrраJ{ичения, которым должRЫ удовлетворять значения соответствующего типа. Так, например, спецификация Child 1s_a Age rest r_b y ( >О && < 1 2 ) ; вводит подтип типа Age, значения которого должны быть положительными целы ми в интервале [ О, 1 2] . Спецификации Pe rsons is_a { f rame } ; F r iends 1s_a Persons rest r_b y ( >= { Петр , Иван } ) ; определяют, что элементами типа Friends являются элементь1 типа Persons, вклю чающие в себя, по крайней мере, два указанных явно элемента. Обработка сложно структурированных данных во внешней памяти является от личительным свойством всех ЯПЗ. Но помимо этого нужны и •обычные�, пе ременные. Вот почему в ЯПЗ PILOT/2 введены регистры и стеки. Семантика регистров такая же, как у простых переменных традиционных языков програм мирования. Иначе обстоит дело со стеками. Для явной спецификации поведения стеков в ЯПЗ PILOT/2 введены префиксы и постфиксы, которые являются од номестными операторами, аналогичными по синтаксису унарным операторам ( ++) и (--) современных языков программирования. Семантика их зафиксиро вана в табл. 7 . 1 . Одна и та же переменная, в зависимости от наличия или отсут ствия префикса (постфикса), трактуется либо как регистр, либо I<ак сте1<. Для выделения имен переменных в текстах РILОТ-проrрамм им предшествует сим вол c$i,. Таблица 7. 1 . Семантика переменных в я зыке PI LOT/2 Стековые переменные GЕТ-переменные Слева Справа РUТ-переменные Взять с сохранением Взять без сохранения Добааить новое значение > >> << < << >> Заменить верхушку на новое значение > < Ядром декларативного представления данных и знаний в ЯПЗ PILOT/2 является спецификация баз - временных и постоянных. Все базы в ЯПЗ PILOT/2 фрей мовые и поддерживаются на этапе выполнения продукционных программ специа лизированным пакетом FRAME/2 [Sherstnew et al., 1994]. Спецификация временной базы предполагает, что определенные здесь фреймы имеют •время жизни�, , совпадающее с периодом выполнения РILОТ-проrрам мы, а ее имя - встроено в систему и не может быть изменено. Типичный пример определения временной базы - следующий: base = { специфи кац и я-фрейма , . . . , специфи к а ци я -фрейма } ; Иначе обстоит дело с постоянными базами. Их �время жизни�, никак не связано с конкретной РILОТ-проrраммой, а имена выбирает сам пользователь. Та1<Ие базы 243 7. 1 . Продук ционно-фреймовый Я ПЗ PILOT/2 могут создаваться и/или использоваться в данной РILОТ-программе. Примера ми определения постоянных баз могут быть следующие спецификаци:11: base system = { фрейм- 1 , . . . , фрейм -N } : exte rn base pe rson = { фрейм- 1 , фрейм- 2 , фрейм -3 } ; base new ; base ( а 1 , а2 , . . . aN ) = { фрейм - 1 , фрейм-2, . . . , фрейм-L } ; И в случае временных, и в случае постоянных баз основным элементом определе ния является спецификация фрейма: специфи кация -фрейма : : = 1 1 специфи кация - прототи па 1 1 1 1 с п ецифика ц и я - экземпляра 1 1 [ имя-фрейма i s_a p rotot yp e спецификация - п рототи па : : = емона } } { { ; декла ра ция -слота } } ] { { ; специфи каци я -д специфи кация -экзем пляра 1 1 is_a имя-фрейма 1 1 имя - фрейма 1 1 ( имя-фрейма { { , имя-фрейма } } ) 1 1 { { ; сп е цифи ка ция-д емо на } } { { ; специфи кация -слота } } ] специфи каци я-слота : : = 1 1 1 1 имя - слота 1 1 1 1 ( имя - слота { { , и мя-слота } } ) 1 1 without имя-сло т а { { , имя-слота } } 1 1 декларация-слота 11 11 = з начение 11 11 11 11 декларация -слота : : = 1 1 имя -слота 1 1 тип 1 1 ( имя -слота { { , имя-слота } } ) 11 { { ; д о п олн и тел ьная-специфи кация } } д о п о лни те л ьная- специфи кация специфи кация -демона - 1 1 специфи каци я - демона 11 1 1 с пецифи кация - умолчания 1 1 спец ификация-о грани ч ения 11 11 1 1 1 f _ad d e d 1 1 им я -демона ( ) 1 1 if_d elete d 11 1 1 if_chan g ed 11 специфи к ация -умол ч ания : : = b y_d efault з начени е специфи кация -о граничения : : = rest r_Ьу специфи катор Из этих определений следует, что ЯПЗ PILOT/2 является сильно типизирован ным языком и, следовательно, обеспечивает строгую проверку правильности ис- 244 Глава 7 • Пример разработки системы, основанной на знаниях пользования типов на этапе трансляции. Такой подход повышает надежность проектирования продукционных программ и увеличивает их эффективность. Теперь рассмотрим примеры спецификации фреймов. Первый из них - специ фикация прототипа вида: [ Pe rson 1s_a p rototype ; Name st ring , 1 f _changed ask_why ( ) int , rest г_Ьу >= о ; Age st ring , rest r_by ( ==«male» 1 1 ==«female» ) , Sex by_defaul t «male» Child ren { f rame } ) ; Из этого описания следует, что у фрейма Person, заданного как корневой прото тип, имеются четыре слота с именами Name, Age, Sex и Children. Каждый слот мо жет иметь значение определенного типа. Значениями слотов Name и Sex могут быть строки, слота Age - число, а слота Children - множество ссылок на другие фреймы. Кроме обязательной спецификации типа слот может иметь дополни тельную спецификацию. Так, чтобы ПОI<азать, что значение слота � должно быть не неньше О, а слот Sex может принимать только два значения, -«male� или -«female�, использована дополнительная спецификация restr_by. Конструкция, следующая за этим ключевым словом, называется специфиr.атором и представ ляет собой логическое выражение особого вида. Другая дополнительная специ фикация, by_default, определяет значение слота по умолчанию. Например, если в экземпляре фрейма Person не будет указано конкретное значение слота Sex, оно будет равно .«male�. Кроме этих дополнительных спецификаций имеются в ЯПЗ PILOT/2 и специ фикации демонов. Они определяют присоединенные процедуры, которые .«запус каются� при добавлении (if_added), удалении (if_deleted) или изменении значе ний (if_changed). Любой фрейм может стать прототипом для других фреймов: [ Jo h n 1s_a Pe rson ; if_deleted bu ry( ) ; Name = « J o h n s o n » Age = 3 2 C h i l d ren = { A n n , Tom } ] ; [ Магу 1s_a Pe rson ; without Age Name = «Smi r nova» Sex = « femal e » ; C h i l d ren = empt y ] ; Приведенные выше фреймы John и Mary - экземпляры фрейма Person. Их сло ты получают конкретные значения. Фрейм-экземпляр может не иметь некото рых слотов своего прототипа (имена таких слотов перечисляются после ключе вого слова without) и может иметь дополнительные слоты, специфицируемые так же, как и в прототипе. 245 7. 1 . Продук ци онно-фрей мовый Я П З PILOT/2 7 . 1. 3 . П роцедур ны е средств а языка При обсуждении примеров спецификаций фреймов мы пользовались интуи тивным пониманием значения. Спецификация этого понятия в ЯПЗ PILOT/2 следующая. Значения могут быть простыми (единичными) и множественными. Множественные значения - списки простых значений одного типа, заключен ные в фигурные скобки. В качестве простых значений в PILOT/2 выступают вы ражения. Введение префиксов и постфиксов к именам переменных является первым шагом на пути определения выражений. Но в ЯПЗ PILOT/2 есть и более мощные сред ства этого типа. Здесь испо.1,1ьзуются традиционный набор арифметических опе раций и общепринятое их старшинство, а специфика ЯПЗ на уровне первичного выражения: перв-арифм : : = 11 11 11 11 11 11 11 ч исл о GET - переменная VАR -переме нная - перв-ар ифм вызов-фун кц ии ( арифметиче ское ) слот-фрейм а 1 1 1 1 1 1 1 1 1 1 1 1 1 1 вызов-фун кци и : : = имя-фун кции ( значение { { , значение } } ) Первые шесть вариантов вполне традиционны, а последний имеет следующее оп ределение: слот-фрейма : : = [ имя-фрейма : имя-слота ] Учитывая вышесказанное, следующие примеры суть правильно построенные вы ражения ЯПЗ PILOT/2: пустое выр ажен ие АSСП-симво л char « qwe rty» st ring стро ка Pe rson имя - фрейма f rame $NameF rame VАR- переменная f rame $AgeVa lue> GЕТ- переменная int 1 0 * ( $va r1 + 2 ** 4 арифметич еское int слот-фрейма int [ John : Age ] bool my_func ( «event s . kb» ; [ Even t Vаluе ] ) вызов-функции Теперь вернемся к основному средству построения конфликтного множества к условиям. Напомним, что в ЯПЗ PILOT/2 две точки, где, согласно синтаксису языка, возможно использование условий: конструкция if в секционны х и прави ловых разрешениях и левые части продукционны х правил. И в том и в другом случае инженер по знаниям может сформулировать произвольную условную empt y l l a lt 246 Глава 7 • Пример разработки системы, основанной на знаниях конструкцию в базисе И - ИЛ И - Н Е с общепризнанным старшинством логичес ких операций. Кроме того, на уровне первичных условий возможно использова ние отношений и образцов. Образцы являются наиболее важной и мощной конструкцией языка PILOT/2, так как они позволяют находить и фиксировать интересующую инженера по зна ниям ситуацию в базе знаний. По синтаксису образец похож на слот-фрейма, но у него существенно большие возможности и другая семантика. Образец - это пре дикат на базе знаний, принимающий значения <<истюш�> или <,ложь�> , тогда каr< слот-фрейма возвращает значение конкретного слота конкретного фрейма. Обра зец определяет некий шаблон, которому могут удовлетворять фреймы из базы знаний. Образец состоит из синтаксического обрамления «?[ ... ] i> и. тела. Тело представляет собой шаблон фрейма, которому, быть может, предшествует конст рукция <,захвата�> результатов отождествления в переменную, и список слотов образцов, который может быть пустым. Каждый слот-образец также имеет шаб лон слота в качестве базы отождествления и, быть может, конструкцию «захвата� результатов. Таким образом, тело определяет структуру, которую должны иметь фреймы базы знаний, чтобы успешно сопоставиться с образцом. Шаблон фрейма определяет множество фреймов базы, на которых будет происходить отождеств ление. Это множество может состоять из единственного фрейма ( при этом указы· вается имя фрейма или его отрицание); всей базы (тогда шаблоном фрейма явля ется символ « * i, ); фрейма (фреймов), имена которых хранятся в переменных типа VAR или GET, а также фиксироваться с помощью конструкции явного задания множества, образованного из элементов и стандартных теоретико-множествен ных операций one_of (пересечение); all_of ( объединение); - (вычитание). Пус той префикс соответствует операции one_of. При этом семантика операции one_of - «первый из сопоставленных,>. Операция «вычитание�> может использо ваться только с именами фреймов, заданными явно. Результаты успешных сопо ставлений могут запоминаться в переменных с помощью операции присваивания (в случае префикса one_of или его отсутствия запоминается результат первого успешного сопоставления, а в случае префикса all_of -' результаты всех успеш ных сопоставлений). Шаблон слота практически тот же, что и шаблон фрейма. Однако для слотов есть еще один способ у1<азания объединения - перечисление нужных слотов через разделитель «;'->. Отличие шаблона слота от шаблона фрей ма в том, что здесь добавляется значение-образец. Как и в предыдущих случаях, найденные значения могут «захватываться�> в переменные. Шаблон значения мо жет фиксировать 1 что оно произвольно, но существует (в этом случае использует ся символ « * i> , либо определить возможные значения более точно с помощью эле ментов (значение-первичного-спецификатора) и логических операций в базисе И-ИЛИ. Заметим, что отрицание здесь не требу�тся, так как его функцию берет на себя отношение « ! = « в первичном-спецификатор.а. Спецификаторы задают декларативно ограничения на значения. Синтаксис спецификаторов следую щий: специфи катор : : = тер м -специфи кат ора { { 1 1 те р м-спецификато р а } } !ер м - спецификато р а - пе рв и чн ое -спе цификато ра { { && пер ви чн ое - с пецифи катора } } 247 7 . 1 . Продукцио нно- фре ймов ы й ЯПЗ PI LOT/2 пер в и ч но е- с пе цифи к атора : : = 1 1 э на ч ение-первичн - сп е циф икато ра 1 1 11 11 < < = 11 11 11 1 1 1 1 -- 1 1 1 1 1 1 != 1 1 1 1 1 1 >= 1 1 11 11 11 > 1 1 ( с пе ци фи ка т ор 11 11 11 11 11 11 э на че ни е - пер ви ч н - сп е цифи ка то ра 11 1 1 з нач е ние 1 1 1 1 VА� - переменная 1 1 1 1 1 1 1 1 п ус т о 1 1 1 1 one_f rom 1 1 1 1 G E - переменная 1 1 1 1 11 1 1 1 1 all_f rom 1 1 Знаки отношений имеют стандартную семантику для чисел и семантику сравне ния АSСI-кодов для, символов и строк В тех случаях, когда значение в первич ном-спецификатора является множеством, все знаки отношений имеют следую щую интерпретацию: • < - строгое включение множества значений спецификатора во множество значений слота; • <= - нестрогое включение множества значений спецификатора во множество значений слота; • ·== - совпадение множества значений спецификатора с множеством значений слота; • 1= - несовпадение множества значений спецификатора с множеством значе ний слота; • >= - нестрогое покрытие множества значений спецификатора множеством значений слота; • > - строгое покрытие множества значений спецификатора множеством значений слота. Дополнительно к этому значение-первичного-спецификатора может быть VАR или GЕ:r-переменной, которым предшествует префикс one_from (один из эле ментов в переменной должен быть использован); all_from (все элементы пере менной должны быть использованы). Пустой префикс соответствует операции one_from. Возможности образцов лучше рассмотреть на примерах. Пусть в текущей базе имеются следующие фреймы, причем порядоI< их расположения в базе такой, как описано ниже: [ F1 is_a p rototype ; [ F2 1s_a F 1 ; [ FЗ is_a F1 ; S 1 i nt , by_default 8 S2 = " х ·· ] ; S 1 =0 ] ; S2 сhаг ] ; 248 Глава 7 • Пример разработки систе мы, осно ванной на знани ях Имеются также переменные $V 1 ( типа frame) и $V2 (типа char ), которые до при менения каждого из образцов содержат следующие значения: $V1 = : F1 : F2 : FЗ : $V2 = : ' а' : ' Ь' : Примеры образцов с их значениями и значениями переменных $V1 и $V2 после применения этих обра;щов к описанной базе представлены ниже. N/N 1 2 3 4 5 6 ба 7 8 О б р а зец Рез ул ьта т ?[F : S] false t ru e ? [ F1 : S2] t ru e ? [ F2 : S 1 { == 8 } ] t rue ? [ »$V1 = all_o f * : S 1 { ==8 } ] t rue ?[ * : S2 { == « $V2 } ] ? [ o ne_of $V1 >> : S 1 { == o n e_f rom { 1 , 0 } } ] t ru e ? [ one_of $V1 » : S 1 { == all_f rom { 1 , 0 } } ] false t ru e ? [ $V 1 « : S 1 { ==8 } ; > $V2=S 2 ] t rue ?[* : *] Образцы 1 и 2 представляют собой запросы на наличие в базе соответствующих слотов-фреймов. Поскольку [F:S] в базе нет, а [ F 1 :S2] - есть, значения образцов 1 и 2 соответственно false и true. Образец 3 более избирателен, он проверяет базу на наличие в ней фрейма F2 со слотом S 1 , имеющим значение 8. Такой фрейм в оп ределенной нами базе имеется (вспомним, что фрейм-экземпляр наследует слоты своего прототипа) , поэтому значение образца - true. Образец 4 ищет все (all_of) фреймы со слотами S 1 , равными 8, записывая при этом их имена в переменную $V 1 . Префикс этой переменной п редписывает заносить в нее значения слева с сохранением. В образце 5 значение слота S2 берется из переменной $V2 ( слева без сохранения), причем имя фрейма может быть любым (*). Но фрейм со слотом S2 = "а" базе один (F2). Ключевое слово one_of в образце 6, явно указывающее на поиск только первого подходящего фрейма, - не обязательно, такая стратегия подразумевается по умолчанию. Для успешного сопоставления с этим образцом фрейм FЗ, имя которого взято справа без сохранения из переменной $V 1 , должен иметь слот S 1, значением которого может быть одно из ( one_from) чисел: 1 или О. Условие соблюдается, и значение образца - true. Вместо one_from может быть указано all_from (образец ба) , в этом случае значением слота должно быть все множество { 1 ,0}. Образец 7 показывает, что можно проверять значения несколь ких слотов сразу. Семантика его следующая: найти первый фрейм со слотами S 1 = 8 и S2; если такой фрейм будет найден, записать его имя в переменную $V 1 справа, протолкнув верхушку стека справа, а значение слота S2 - в переменную $V2 слева, без сохранения значения в верхушке стека. С помощью образца 8 про веряется, есть ли вообще в текущей базе какие-нибудь фреймы. в Таким образом, мы обсудили конструкции Я П З PILOT/2 , которые могут пот ребоваться при формировании левых частей п родукционных правил. Все они предназначены для выделения в БЗ системы интересующих нас ситуаций. Такое выделение не самоцель, а средство для преобразования та1<их ситуаций для полу чения решений. Сами преобразования описываются в основном, в правых частях продукционных правил ЯПЗ-проrраммы и сводятся к выполнению определен ных действий над БЗ и/или значениями переменных. 249 7. 1 . П родукци онно- фреймовый ЯПЗ PILOT/2 В ЯПЗ PILOT/2 все действия делятся на стандартные (системные) и нестандарт ные (пользовательские). Все они могут использоваться не только в правы х час тях продукционных правил, но и в аннотациях, что позволяет реализовывать в ЯПЗ PILOT/2 развитые модели объяснений [Clancey, 1983]. Синтаксис нестан дартны х действий определяется специфш<ацией прототипов процедур, рассмот ренной выше, и синтаксисом обращений к процедурам, а семантика и реализа ция - целиком в руках пользователя ЯПЗ PILOT/2. Классификация стандартных действий проста. Это обработка переменных, обра ботка базы знаний, процедурное управление и ввод/вывод. Как указывалось выше, в ЯПЗ PILOT/2 имеются три вида переменных (V AR, GET, PUT). С учетом этого: обработка- переменных : := 1 1 о пе ратор- п рисваиван ия 1 1 1 1 PUSH-one paтop 1 1 Р О Р- оператор 1 1 C LEAR-one paтop 11 11 11 опе р ато р- п рисваивания : : = 1 1 VАR- пе р е менная 1 1 = значение р PUT еменная пе 11 11 Примерами присваиванця значений переменным могут служить кон-струкции вида: $va r1 =<$a+$ b ; >$va r2=[ F rameName : S lotName ] * $va r 1 ; $va r3« =empty ; Заметим, что с помощью присваивания можно реализовать и •проталкивание• сте�а, например, так: >>$va r2 = empty; $va r3<< = ; или даже так $va r«; Однако более общим будет действие вида push ( left , $va r2 , $va r3 ) ; push ( right , $va r2 , $va r3 ) ; так как здесь с помощью одного действия можно обработать несколько стеков, причем одно и то же имя может многократно повторяться в качестве параметра. В этом случае в соответствующем стеке появится несколько пустых позиций уровней. Выталкивание значений из стеков производится аналогичным образом. Для очистки стеков следует испQльзовать стандартное действие CLEAR. При этом не важно, с какой стороны (слева или справа) начнет очищаться сте1<. Присваивания и операторы обработки стеков, рассмотренные выше, конечно, важны, но не они составляют суть обрабоn<и данных в языках представления зна ний. В дополнение к этому, а вернее, в первую очередь, здесь должны быть сред ства изменения базы знаний, текущее состояние которой и определяет, какие ре шения уже были приняты и что будет проис�одить дальше. 250 Гл ава 7 • При мер раз работки систем ы , о с но ва нно й н а зна н и я х Выше уже обсуждалась конструкция образца ЯПЗ PILOT/2, которая использу ется для выделения интересующих инженера по знаниям ситуаций. Почти та же конструкция применяеiГСЯ и для преобразования ситуаций. Действительно, для выполнения любого преобразования в конечном счете нужно найти некоторую ситуацию и либо удал ить ее, либо скорректировать соответствующим образом. Для полноты нужны и средства формирования новых ситуа ций. Все эти дей ствия выполняются в ЯПЗ PILOT/2 с помощью конструкции обработка-базы знаний, которую для краткости и преемственности с языком П ИЛ ОТ [Хоро шевский и др., 1 990] будем также называть манипулятором. Итак, манипулятор, или обработка базы знаний, - это удаление фреймов, создание фреймов, замена фреймов или коррекция фрейма. Операции удаления, создания и замены фреймов в текущей базе знаний манипу лируют с фреймами как с целыми и неделимыми единицами. При этом благодаря использованию образцов можно за одно обращение к соответствующему манипу лятору провести множественные изменения в базе знаний: ?[ • : • ] \ ]; [ ? [ • : • { ==« обработан» } ] \ ] ; [ ? [ » $ De l e t e d F rameNames=all_of • : • { ==« обработан» } ] \ ] ; Создание новых фреймов в ЯПЗ PILOT/2 для пользователя языка тоже простая операция. Здесь нужно дать определение нового фрейма или совокупности фрей мов аналогично тому, как это делалось в рамках декл аративной компоненты ЯПЗ PILOT/2: [ \ [ F rame 1 : S l ot 1 1 = «Mothe r » ; S l ot 1 2 = « Fathe r » ; S l ot 1 3 = « Ch i l d re n » ; S l ot 1 4 = 2 1 ] ; [ F r ame2 S l o t 2 1 = empty ] ; [ F rameЗ : ] Замена одних фреймов на другие - не что иное, как объединение уже рассмотрен ных конструкций удаления и вставки: [ ? [ • : • ] \ [ F rame : S l o t = « End Of J ob» ] ] Так в ЯПЗ PILOT/2 осуществляется коррекция баз знаний на уровне отдельных . единиц-фреймов. Вместе с тем часто требуется скорректировать некоторый фрейм или группу фреймов более <,тонким� способом. Например, это может быть изменение значений некоторых слотов определенных фреймов, удаление ,ше нужных� слотов и/или добавление новых слотов в уже существующие фреймы. Все эти манипуляции с базой знаний осуществляются в ЯПЗ PILOT/2 на уровне конструкции коррекция-фрейма. Примеры использования манипуляторов в слу чае коррекции базы знаний на уровне отдел ьных фреймов и/или групп фреймов приводятся ниже: [ * : \ S1 int ] К первому фрейму в базе знаний добав ить слот с им енем S 1 . 7 . 1 . П родук ци онно- фре ймо вы й ЯПЗ PILOT/2 Во всех фреймах , имеющих слот с именем , хранящимся в $del , удалить этот слот . [ all_of * : S 1 =+1 ] - Во всех фреймах , и меющих слот S 1 , изменить значение последне го , увелич ив е го на 1 . 25 1 [ all_of * : $del\ ] При обсуждении общей структуры управления РП,ОТ-программой были введе ны мощные, но «дорогие>> средства управления выводом. Вместе с тем инженер по знаниям иногда может быть уверен, что надо выполнить определенную про дукцию или секцию ; он может знать, что определенные продукции пока не нуж ны, но зато необходимо включить в рассмотрение другие продукции. Наконец, иногда требуется осуществить принудительное завер шение ·работы РILОТ-про граммы. Все такие действия в ЯПЗ P ILOT/2 объединены в группу действий про цедурного управления на уровне управление-активностью-правил, управлениеактивностью-секций, вызов-секции или выход. Фильтр «активности/неактивности» продукций - первый из используемых <<ар битром>> . Поэтому, явно активируя или деактивируя некоторые из продукций , можнр существенно сократить его работу и увеличить производител ьность всей продукционной системы. В случае секций фильтр активности, конечно, не столь эффективен, но у инженера по знаниям появляется возможность более точной структуризации правил продукционной системы и за счет этого увеличения эф фективности ее функционирования. Одними из уже упоминав шихся действий являются переключения флагов актив ности продукций (rule_on/rule_off), с помощью которых можно устанавливать их как в текущей, так и любой другой секции. Возможно манипулирование флага ми сразу всех продукций одной секции (section_on/section_off). Особым действием_ является вызов ( iпvoke) секции. В результате его выполнения текущая активная секция «проталкивается>> в управляющий стек, а ее место на следующем шаге занимает вызываемая секция. Так как за вызовом секции могут следовать другие действия (в частности, другие вызовы), после полной отработки этого вызова «арбитр» на некотором ш аге, минуя формирование КМ и выбор из него продукции, возвращается к применению данной продукции, причем в той ее части, которая непосредственно следует за вызовом. Выполнение действия exit прер ывает работу «арбитра» и таким образом завер шает работу продукционной системы. В качестве <<побочного>> эффекта это дей ствие позволяет передать во вне шнюю среду информацию о том, как завершилась РILОТ-программа. По «умолчанию» выход происходит с нулевым кодом воз врата. Мы рассмотрели обработку переменных и баз знаний, а также действия, связан ные с управлением выщ>лнением РILОТ-программ.· Вместе с тем понятно, что сколько-нибудь сложные задачи требуют удобного ввода/вывода. Вот почему в ЯПЗ PILOT/2 включена совокупность стандартных действий, поддерживаю щих ввод/вывод информации. При этом основное внимание уделяется действи ям по работе с базами знаний. Что же касается средств работы с файлами, то в ЯПЗ PILOT/2 используется лишь последовательный доступ и простые формат ные преобразования, а также специализированный обмен с экраном на уровне 252 Глава 7 • Пример разработки систем ы , основанной на знаниях сообщений и вопрос-ответных цепочек [Khoroshevsky, 1 994] . Все более развитые средства этого типа, которые моrу т потребоваться пользователю, должны под ключаться на уровне нестандартных действий. Выше мы обсудили основные аспекты представления знаний на базе Я П З PI LOT/2. Примеры его использования будут рассматриваться в следующих пара графах данной главы. 7 . 2 . Психодиагностика - пример предметной области для построения экспертных систем В настоящем параграфе tшисывается пример использования тех теоретических знаний, которые, как надеются авторы, уже усвоены читателем этой книги. Для конкретности мы взяли в качестве предметной области проектирования и реализации экспертных систе м область психодиагностики. И на. этом примере попытаемся вместе с читателем пройти по пути разработки реализации соот ветству ющей экспертной системы - одной из спектра реализованных на основе методов и средств, рассматриваемых в данной книге. и 7 � 2. 1 . Особенности предметной области Современная психодиагностика предоставляет практикующим психологам ши рокий спектр методик, тестов и опросников для диагностирования и прогноза личностных особенностей человека и позволяет получать развернутое психоло гическое заключение ( 4Портрет• испытуемого). Такие заключения моrут ис пользоваться специалистами, желающими оценить свои способности и, возмож но, изменить род своей деятельности в соответствии с рекомендациями; пре подавателями, занятыми обуч ением и переобучением специалистов - с целью выбора адекватных методов и средств обучения; руководителями орrаниэаций, подбираю щими работоспособные коллективы и/или анализирующими деятель ность малых коллективов; сотрудниками органов управления трудовыми ресур сами и бирж труда и т. д. Можно использовать результаты и · для стимулирова ния личностного роста испыту емых, а также для профилактики психологи ческих срывов и повышения адаптивных свойств человека в условиях стресса. Таким образом , сама предметная область психодиагностики и профориентации является значимой и представляет интерес для создания соответствующих сис тем автоматизации. Важно и то, что тиражировать в компьютерных системах имеет смысл ли ш ь опыт ведущих специалистов в этой области, которые"как пра вило, заняты и не моrут обеспечить все потребности общества в соответствую щих консультациях. Современное состояние автоматизации психодиагностики и профконсульти рования характеризуется наличием достаточно большого числа отдельных про грамм, автоматизирующих стадию предъявления тестов и дешифрацию резуль- 7 .2. Пс и ходиагностика - для пост роения экспе ртных систем 253 татов-по ключу. На выходе такие системы, как правило, выдают числовой вектор результатов либо шаблонные заготовки интерпретации этих векторов, не отра жающие индивидуальных особенностей ,испытуемых. Такое положение связано с объективной сложностью индивидуальных психологических эа1<лючений, по лучение которых требует привлечения профессиональных экспертов, способных и готовых поделиться своим опытом и мастерством. Следует отметить, что психодиагностика является классичес1<0й предметной об ластью для разработки систем, основанных на знаниях. И именно эдесь методоло гия и технология создания экспертных систем могут принести значительный эф фект. Оставшаяся часть главы построена следую щим образом: сначала ·кратко обсужда ется сама проблематика психодиагностики и профконсультирования, затем ста вится задача разработки интеллектуальной системы � Ориентир• и перечисляют ся основные требования к этой системе. В заключение рассматриваются вопросы разработки и реализации одной из ЭС, входящих в состав системы �ориентир•. 7 . 2. 2. Бата ре я психодиа гностич еских ЭС «Ори ентир» Представления человека о себе и система его ценностей могут быть выявлены с помощью различных психологических методов, однако возможность влиять на их формирование в ·ситуации консультации очень ограничена. Обычно особен ности психики исследуются в трех направлениях - анализ перцептивных осо бенностей, исследование интеллекта и личностных особенностей. Факторов, вли яющих на построение рекомендаций, так много , что для того, чтобы прийти к какому-либо заключению (например, о выборе профессии), необходимо провес ти полное психологическое обследование с целью получения психологичес � го обеспечить сопоставление его психологи портрета испытуемого, ческих черт и требований, которые предъявляет желаемая сфера деятельности, и сообщить ему полученные результаты. При этом под результатами имеется в виду не однозначная короткая и�,формация о том, подходит ли избранная профессия человеку. Испытуемому необходимо сообщить его психологический портрет, какие перспективы открывают перед ни м его психологические черты в плане выбора деятельности, и о том, как они сочетаются с его планами на буду щее. Для этого, очевидно, нужно использовать не один тест, а сбалансированную систему тестов. Содержательные классификации тестов - это, в пе�ую очередь, классифика ции по ·психическим функциям, и, практически, они совпадают с классификаци ей способностей по тому же. основанию. С этой точки зрения тесты делятся на сенсомоторные ; перцептивные ; тесты на особенности внимания ; мнестические ( особенности памяти) ; тесты на интеллектуальный уровень и интеллектуальные особенности ; личностные тесты. Каждый из этих классов тестов может быть, в свою очередь, разделен на подклассы в зависимости от конкретной особенности им измеряемой [Анастаэи, 1 982]. 254 Глава 7 • Пример разработки системы , о сно ванно й на знаниях По стимульному материалу т�сты делятся на вербал ьные и невербальные. По сути, компьютеризация никак не связана с этой характеристикой методики. Но зрительное изображение, сл ожное по форме и/или цвету, может, привести к труд ностям 1<ак на этапе компьютеризации методики, так и при тиражировании ее н а разные; типы ЭВМ и, в частности, дисплеев. Личностные тесты направлены на выявление присущих человеку личностных черт, осознаваемых и бессознательных особенностей и проблем. Многие из них (например, прожективные) относятся к объективным нестандартизованным тес там. Но с точки зрения компьютерного тестирования способностей гораздо боль ший интерес представляют личностные опросники, особенно опросники, охваты вающие широкий круг личностных черт и особенностей личности. К наиболее широко используемым личностным опросникам (в том числе и в нашей стране) относятся Миннесотский мультифазный личностный опросник (MMPI), 1 6-фак торный тест Кеттелла, опросник УСК (уровень субъективного контроля), опросник Айзенка и некоторые другие. Количество тестов, используемых в конкретной работе для психодиагности1ш, может быть различным. Возможно, для диагностики одной, узконаправленной способности :8 некоторых случаях можно ограничиться и одним тестом. Однако почти всегда широта и значимость диагностической задачи заставляют использо вать тест, позволяющий определить сразу несколько показателей, или батарею (многофакторных) тестов. Учитывая вышесказанное, в рамках проекта • Ориентир>>, выполнявшегося сов местно специалистами из ВЦ РАН (Москва) и С ПбГТУ (Санкт-Петербург) в се редине 90-х годов и связанного с созданием программных средств, обеспечиваю щих фующионирование соответствующей интеллектуальной интерактивной среды, была разработана и реализована батарея ЭС, работающих на получение следующих общих результатов: 1. Психологическая диагностика основных свойств личности, мотивации, интел ·яекта, темперамента с получением психологического закл ючения в виде тек ста на естественном языке. 2. Прогнозирование профессионал ьной успешности в различных видах деятель ности с учетом возраста, пола и психологических особенностей испытуемых. 3. Вьщача рекомендаций по созданию научных, творческих, учебных и производ ственных малых l<аллективов на основе диагностики ролевой и психологичес кой совместимости отдельных членов коллектива. 4. Профессиональный подбор и отбор специалистов для переподготовI<И в рам ках специального заказа. 5. Изучение психологических особенностей испытуемых с целью выбора наибо лее подходящих методдв обученй:я, средств адаптации, индивидуального под хода, способствую щих профессионал ьному и личностному росту. Отличительные особенности проекта были связаны с тем, что здесь в рамках еди ной интеллектуальной системы объединялись результаты , получаемые от отдель ных диагностических ЭС различной модальности. Реализация прое1сrа осуществ лялась в среде Windows с использованием методов объектно-ориентированного проектирования и программирования, а базисом послужила технология разра1 ботки систем, основанных на знаниях. 255 7 .2. Психоди агности ка - для постр ое ния экспе ртных систем Разработка батареи экспертных систем « Ориентир� предполагала, что здесь чет ко различается несколько задач. В рамках первой из них система должна обеспе чить создание, коррекцию и сопровождение базы испытуемых, включая защиту от несанкционированного доступа к данным и знаниям. Вторая задача � управле ние вызовом и функционирован ием отдельных локал1>ных ЭС, составляющих исполнительные блоки общей батареи. Последняя задача связывалась с функцио нированием экспертной системы « Профи,> , которая работает с базами знаний локальных ЭС. Учитывая вышесказанное, И-диаграмма БЭС « Ориентир� может быть описана схемой, представленной на рис. 7.2. БЭС «Ориентир» Тесты База ЭС Cattell Новая ЭC Aysenk Открыть ЭС Lusher Закрыть ЭС Профи Сохранить Объяснения Помощь Сохранить как... Выход Рис. 7 .2. Н -диаграмма БЭС «Ориенти р» Здесь базовыми, обслуживающими все локальные ЭС, «задействованные� в об щей системе, являются опции База и Тесты. Первая из них обеспечивает форми рование и сопровождение баз данных и знаний испытуемых, а вторая - вызов локальных экспертных систем. Экранная форма основного цикла работы БЭС « Ориентир,> представлена на рис. 7.3. Рис. 7 .3. Экранная фо рма основного цикла работы БЭС «Ориентир» 256 Глава 7 • П ри м ер ра з ра ботки систе м ы , осн о ванн о й на знани ях 7 . 3 . Раз р абот ка и ре ализация п сиходиагност ич е ской ЭС «Cattell» Одной из подсистем БЭС �ориентир� является психодиагностическая ЭС •Cat tell•, в рамках которой, в частности, выполняется тестирование испытуемых по тесту Кеттелла. Как известно, тест Кеттелла измеряет 16 личностны х черт, характеризующих эмоциональную, социальную и интеллектуальную сферы испытуемого. Шкалы теста сведены в табл. 7.2. Таблица 7 . 2 . Шкалы теста Кепелла и и х интерпретация Шкала Характеристики полюсов wкаnы А Легкость эмоциональн ых контактов - эмоциональная отстраненность С Интегрированность поведения, эмоциональная устойчивость э моциональная неустойчивость В Способность к логическому мышлению Е Доминантность - подчиняемость G Глубокая усвоенность социальных норм и правил - отсутствие внут ренней необходимости соответствовать в своих п оступках социальным нормам F Н L М N О 01 02 QЗ Q4 Легкость, эмоциональность поведения - серьезность, ограниченность эмоциональных проявлений Настойчивость, решительность в достижении цели - робость, ранимость Чувствительность, «витание в облаках» - трезвость, р еалистичность Подозрительность - доверчивость Индивидуалистичность, развитое воображение - склонность применяться к коллективу, прагматичность Склонность следовать вос п итанным формам поведения неnосредственность поведения Готовность к самообвинению , п ессимистичность - уверенн.ость в себе , оптимистичность Потребность в переменах, новшествах - консерватизм Ориентация на собственные Мнения , взгляды ориентация на мнения и взгляды окружаю щих Высокий сознательный контроль поведения - н изкий сознательный контроль поведения Энергичность, высокий уровень нап ряжения - Расслабленность, низкий уровень нап ряжения Тест существует в нескольких формах. В данном проекте использовалась форма А. 7 . 3 . 1 . Архитектура системы и ее база знаний Анализ предметной области и требований, предъявляемых к си�теме •Cattell� специалистами по социальной психологии, с одной стороны, и условиями работы 7.3. Разработка и реали зация психодиагностичес ко й ЭС «Cattell» 257 ее в рамках общей системы • Ориентир • , с другой, позволил специфицировать архитектуру и функциональные возможности этой ЭС И-диаграммой, предстщз ленной на рис. 7.4. Собственное меню системы • Cattell• располагается в виде дополнительных опций основного меню. Работа всех ф у нкциональных мод улей в ЭС • Cattell• базируется на знаниях о •мире• испытуемых, соответствующей методики психологического тестирова ния и правилах анализа его результатов. Знания об испытуемом содержатся в об щей БЗ системы • Ориентир• , а знания о самом тесте - в БЗ ЭС • Cattell• . В об щую базу знаний добавляется лишь та информация, которая описывает результаты тестирования. ЭС «Cattell» Уровен ь Исп ытуемый. Результаты Экспе рт Ан кетирование По воп роснику По табn ице Создание Редактирова нив Объяснения Анализ знаний На уровне п равил П рофиnирование Коnичественное {сыры е бамы) Из расчета Портретирова ние Не вербализова нное Ве рбализованное По табnице Качественное . (семантические стэны) Из расчета По wкалам На уровне объе ктов Рет роспектива Помощь Рис. 7 .4. Н -диаг рамма ЭС •Cattell• Основные знания о тесте . cattell• представляются совокупностью фреймов-эк земпляров, формир уемых с использованием следующих прототипов: [ cattell i s_a p rot otype ; a_status i n t ; a n keta f rame ; n_stat u s i n t ; n_p r f l f rame ; [ po rt ret i s_a p rototype ; n ot_ve r b f rame ; ve r b f rame ] ; 258 Глава 7 • П р имер раз работки с истемы, о а н о ван ной н а зна н иях s_st a t u s i n t ; s.:_p r f l f rame ; p_status i n t ; p'O rt ret f rame ] : [ ve r b i s_a p rotot ype ; [ n ot_ve rb i s_a p r ototype ; o rd e r o rde r { st r i ng } ; { st r i ng } ; Ь 1 { st r i ng } ; b 1 _va l n { i nt } ; Ь 1 _val s { st ri n g } ; Ь 1 , Ь1 t x t { st r i ng } : Ь2 { s t r i n g } ; b2_va ln { i nt } ; b2_va l s { st r i ng } ; Ь 2 , b2_t x t { st r i n g } ; ЬЗ { st r i n g } ; bЗ_valn { i nt } ; b3_va l s { st r i ng } ; b3_txt { st r i n g } ; Ь4 { st r i ng } ; b4_va l n { i n t } ; b4_va l s { st r i ng } ] ; b4 , b4_txt { s t r i ng } ] ; ьз , n_p rfl is_a p rototype ; А, В , С, Е, F , G, Н, I , L, М, N , О , 0 1 , 02 , 03 , 04 int ] ; М, N , О , 01 , 02 , 03 , 04 s t r i ng ] ; s_p r f l i s_a p rot otype ; А, В, С, Е, F, G, Н, I, L, [ a n keta i s_a p r otot ype ; an s 1 , a n s 2 , a n s З , . . . , a n s 1 87 st r i ng ] ; Кроме того, в БЗ ЭС « Cattell� содержится совокупность фреймов-экземпляров, поддерживающих технологические знания о том, как осуществляется переход от ответов в анкете испытуемого к «сырым баллам� в числовом профиле, а от него к семантическому профилю и затем I< невербализованному и вербализованному портретам. 7 . 3 . 2 . Общен и е с пользо в ателем и оп р ос исп ытуем ы х Как следует из И-диаграммы, представленной на рис. 7.4, подопции Cattell-мeню различны для режима « Испытуемый� и р ежима «Эксперт�. Активация первого режима приводит к последовательному выполнению проце дур диалогового анкетирования испытуемого, подсчета «сырых баллов� по каж дому из 16 кеттелловских факторов и фор мирования на этой основе числового, а затем и семантического профиля испытуемого. Весь диалог в рамках этой опции ведется на языке, близком к естественному. При этом лингвистический процес сор для анализа ответов исп ытуемого, конечно, не используется, а «взаимопони мание� обеспечивается тем, что инициатива во всех диалогах здесь всегда у сис темы. Таким образом, она всегда «знает� , каков должен быть ответ испытуемого в данной точке и в случае ошибки «добивается• правильного ответа с помощ ь ю переспросов и подсказок. 7.3. Раз работ ка и реал и зация пс и ходиагностической ЭС «Cattell» 259 Единс твенной точкой перехвата инициат ивы от сис темы к пользователю явля ется вызов •помощи•, к ко торой можно обрат иться нажатием функциощLЛыюй· клавиши F1 или через соответствующую опцию в меню. При этом на э1<ране по является специал ьное окно , где высвечивается соот ветст вующая кон тексту обра щения к •помощи• информация. О т сутсвие на э т ом у ровне объяснений - не случайно. Испы туемый не должен • понимать•, почему (как) получен его лично стный пор трет . В противном случае он будет осознанно или подсознательно от сту пат ь о т •ес т ес т венных• для себя о т ве т ов на вопросы анке т ы и в конеч ном счет е •научится• получать желаемый, а не дейс т в ит ел ьный личност ный порт ре т . Про тивоположная ситуация в опции • Эксперт •. Во-первых, на этом уровне все выводы системы должны (по желанию экперта) сопровождат ься объяснениями и обоснованиями и во-вторых, у психолога должны быть средст ва анализа зна ний сист емы и данных по конкретному испытуемому . Защит а о т несанr<циони рованного доступа к данным и знаниям обеспечивается всей системой • Ориен тир•, если база помечена как личная ( ее • владельцем• указан с т атус PRIV АТЕ). Опции режима • Экспер т • перечислены в И-диаграмме на рис. 7.4. Анализ дан ных и знаний сис темы, а т акже объяснения вынесены на уровен ь основного меню и активирую тся из соответст вующих опций. Ввиду неболь шой компь Ю'Герной подготовки психологов-экспертов в данном ре жиме диалог в подавляю щем бол ьшинстве случаев идет на уровне меню и/или семан тически значимых клави ш. Кроме того, в любой точке, где требуется реак ция пол ьзователя, он может вместо ответа обратиться к блоку •помощь• уже об су.ждав ш�мся выше способом. Из приведенной выше И-диаграммы ЭС • Cattell• следует , чт о опрос испытуемых может осущест вляться двумя способами: на основе от ветов на ЕЯ-формулировки вопросов теста и путем заполнения табл:иц. Первый вариант удобен при индиви дуальном тест ировании, а второй - при массовом вводе результатов анкетирова ния, предварительно зафиксированных на бум ажных носителях. Но и в том и в другом случае результатом работы блока анкетирования является фрейм-э1<земпляр прото типа •anketa• , приведенного выше. 7. З . З . В ывод портрето в и генерац и я и х текстовы � предста в лен ий Для удобст ва работы психолога-экспер та результаты профилирования выдают ся в специал ьное окно в виде графика, на оси абсцисс которого указаны факторы, а на оси ординат - •сырые баллы•, набранные испы туемым по каждому из фак т оров. Сущест вует в системе и возможнос ть табличной визуализации числового профиля. Несколько иначе визуализируется результат построения качест венно го профиля испы туемог0. Здесь психологу-эксперту выдает ся 1 6 семан т ических шкал,(по числу факторов), на каждой из котор ых отмечается числовое значение соответст вующего факт ора. 260 Гла ва 7 • Пр имер разработки системы , основ анно й на знаниях Процедуры обработки данных анкетирОJщния в рамках предыдущих опций бази руютq� на знаниях. Но знания эти доведены до алгоритмов, реализаци,я которых в виде продукционной сцстемы нецелесообразна. Поэтому в ЭС •Cattell• все такие процедуры реализуются на языке С++, а затем подключаются в нужных точках. Вместе с тем сам� технологические знания представлены эксплицитно совокуп ностью следующих фреймов прототипов и экземпляров: [ a_n_t Ы i s_a p rototype ; f_A { f rame } ; /• ответы по фактору А с весами •/ f_B { f rame } ; /• ответы по фактору В с весами •/ ················................··································.................''''..... f_Q4 { f rame } ; /• ответы~ по фактору 04 с весами • / ] ; a_n_elem is_a p r ototype ; ans_dsc st ring ; /• имя фрейма-экземпляра ответа на анкету * / · weight_a , weight_b , wei ght_c int ; /• веса ответа тиnа «а» , «б» и «с» [ answe r is_a p rototype ; p rt_name , exm_name , s l ot_name st ring ] ; [ ank_numb is_a a_n_t Ы ; f _ д= { q_З , q_4 , q _26 , q_27 , q_51 , q_52 , q_76 , q_ 1 0 1 , q_ 1 26 , q_ 1 51 , q_ 1 76 } ; f_B= { q_28 , q_53 , q _54 , q_77 , q_78 , q_1 02 , . . . q_1 52 , q_1 53 , q_1 77 , q_1 7 8 } ; f_04= { q_25 , q _4 9 , q_50 , q_74 , q_75 , q_99 , q_1 00, . . . q_1 50, q_1 74 , q_1 7 5 } ] ; [ q _З i s_a a_n_elem ; ans_dsc = «ans_OOЗ» ; weight _a = 2 ; weight_b = 1 ; we ight_c = о ] ; [ ans_OOЗ i s_a answe r ; p rt_name = «anketa» ; exm_name= «an keta 0037» ; s l ot_name= « ansЗ» ] ; Запускаются процедуры получения числового и семан�ическоrо профилей испы туемого как демоны при выборе соответствующих опций в меню ЭС •Cattell•. 7:3. Разработка и реали заци я психоди агностич еско й · ЭС «Cattell» 261 В 'опции •портретирование• осуществлйется психологическая интерпретация полученньiх на предыдущих этапах профилей: иёпыtуемоrо с цел:ью посtроения его словесного личностного портрета. Здесь уровень а:лrорйтмизации знаний пси холоrа-эк<;перта существенно иной. Разные школы психологов несколько по-раз ному оценивают роль и вес разных факторов, приписывают им различные тексrt> вые отображения: Поэтому реализация вывода словесного портрета испытуемого в ЭС •Cattell• базируется на проду1щионно-фреймовом формализме. Собствен но вербализация портрета - нисходящая ( от цели), а подготовка его структури рованного невербализованноrо описания - восходящая (от данных). Наиболее сложным и интересным я вляется этап вывода невербализованноrо портрета, реализованный в виде продукционной системы, предложенной: в рабо те [Гаврилова и др., 1992]. Правила этой системы служат для выявления и устра нения противоречий двух типов. Первый связан, в конечном счете, с анализом ответов на определенные вопросы анк�ты и позволяет фиксировать сцтуации, когда построение сколько-нибудь достоверного личностнQrо портрета на осно вании имеющихся данных нецелесообразно. Возникновение таких ситуаций · обычно связывается либо с невнимательным заполнением анкеты испытуемым, либо с попыткой преднамеренного искажения результатов тестирования: за счет противоречивых ответов на дублирующиеся по семантике вопросы теста. И в том и в другом случае анкета помечается как •плохая• и из дальнейшей обработ ки исключается. Второй тип противоречий связан с выявлением и устранением контекстной зависимости и доминирования значений разных факторов, что по зволяет получить более •гладкий• личностный портрет. Но и в том и в другом случае исходными данными для работы продукционной системы являются числовой и сема�tтический профили испытуемого, прототи пы которых (n_prfl и s_prfl) приведены выше. Примеры словесных формулиро вок правил разрешения противоречий выглядят следующим образом: Если значение фактора «F» в семантическом профиле испытуемого «Очень Низкий» , а значение фактора «03» - «Низкий» , то фактор «03» поглощается фактором «F» . Если значения факторов «0 1» и «02» в семантическом профиле испытуемого «Очень Высокий» , то . \ для принятия решения о поглощении нужно сравнить значения этих факторов в числовом профиле испы туемого . Кандидатом на поглощение будет тот фактор, у которого числовое зна чение меньше . На уровне ЯПЗ PILOT/2, обсуждавшегося выше, описание этих правил транс формируется: во фраrмеltт продукционной программы вида: 7 . 3 . Раз работка и реализация психоди а гностической ЭС ocCattell» 263 Н= { « Не имеет навы ка решения ло гических задач , довольно медлен}!о обучается новым понятиям . » } : СР= { « Имеет определенные навыки в решении ло гических задач . » } ; В= { «Умеет абстрактно мыслить, хорошо решает логические задачи , довол ьно быстро обучается новым понятиям . » } ; ОВ= { «Умеет аб с трактно мыслить, · очень хорошо решает логические задачи , быстро обучается новым понятиям . » } ; [ 04 is_a facto r ; ОН= { « В настоящий момент самоуспокоен, расслаблен , не напряжен . » } ; Н= { « В настоящий момент находитс я в спокойном расслабленном состоянии . » } ; СР= ; В= { « В настоящий . момент человеку присуще высокое рабочее напряжение , с об ранность , энергичность. » } : ОВ= { «В настоящий момент человек нап ряжен , собран и даже нескол ько « взвинчен» . » } ; Учитывая то, что генерация текстовых представлений портретов осуществляется в ЭС •Cattell• на уровне целых предложений и групп предложений, здесь исполь зуется простая продукционная система со следующими правилами: sect 1on PORTREТ -GEN removeal l ; i f ( ? [ $cu r r_port : $cu r r_not_ve rb = not_ve rb ] && ? [ $cu r r_po rt : $cu r r_ve rb = ve rb ] && ? [ $cu r r_not_ve rb : $ c u r r_o rde r = al l_of o rde r $cu r r_b1 al l_of Ь 1 ; $cu r r_b2 = all_of Ь2; $cu r r ЬЗ = all_of ЬЗ ; $cu r r _Ь4 = al l_of Ь4 ] ) inse rt ( СОРУ ) ; rule СОРУ = = > [ $cu r r_ve rb orde r ] = $cu r r_orde r ; Ь 1 ] = $cu r r_b1 ; [ $cu r r_ve rb Ь2 ] = $cu r r_b2 ; [ $cu r r_ve rb [ $c u r r_ve rb ЬЗ ] = $cu r r_b3 ; [ $cu r r_v� rb Ь4 ] = $cu r r_b4; rule_off ( COPY ) ; invoke ( B1 ) ; invoke ( B2 ) ; invoke ( BЗ ) ; invoke { В4 ) ; 26 4 Глава 7 • Пример разработки .системы, основанной на з наниях ssction В 1 i f ( ? [ $cu r r_not_ve rb $cu r r_b 1 _val s = all_of b 1 _vals ] ) ; rule А : : <$cu r r_b1 -- « Д » ==> «$cu r r _Ь 1 ; $cu r r_t xt = al l_of [ А : <<$cu r r_b1 _val s ] ; [ $cu r r _ve rb . : .b1_txt:J = $cu r r _txt ; clea r, ( $cu r r _t xt ) ; rule Е : : <$cu r r_b1 == « Е » = = > «$cu r r _Ь 1 ; $cu r r_t xt = al l_of [ Е : «$cu r r_b1 _vals ] ; [ $cu r r_ve r b : b1_txt ] = $cu r r_t�t ; clea r ( $cu r r_txt ) : rule N : : <Scu r r _ь1 "'= « N » ==> «$cu гг _Ь 1 ; $cu r r_txt = al l_of [ N : <<$c u r r_b1 _val s ] ; [ $c u r r_ve rb : b 1 _txt ] = $cu r r_txt ; clea r ( $cu r r _txt ) ; sect ion В4 if ( ?[ $cu r r_not_ve rb : $cu r r_b4_val s = al l_of b4_vals ] ) ; rule В : : <$cu r r _Ь4 = = « В» ==> «$cu r r _Ь4 ; $cu r r_txt = all_of [ В : <<$c u r r_b4_val s ) ; [ $c u r r_ve rb : b4_txt ] = $cu r r_txt ; clea r ( $c u r r_txt ) ; rule 01 : : <$cu r r _Ь4 == «01 » . . ==> «$cu r r _Ь4 ; 7.3. Разр аботка и реа лизация психодиагностической ЭС «Cattell» $cu r r_txt = all_of [ 01 265 <<$cu r r_b4_val s ] ; [ $cu r r_ve r b : b4_txt ] = $cu r r_txt ; c lea r ( $cu r r_t xt ) ; Результатом работы этой продукционной программы является фрейм-экземпляр прототипа verb, слоты order и Ь1-Ь4 которого содержат ту же информацию, что и в невербальном портрете, а слоты Ь1_txt-Ь4_txt - собственн? текстовое пред ставление портрета испытуемого. 7 . 3 . 4 . Помощь и объяснения в ЭС «Cattell» Помощь в Э С � Cattell,,. обеспечивается стандартным гипертекстовым Help. В на шем случае топиками и подтопиками такого гипертекста являются общее описа ние системы и подсказки для работы внутри блоков системы. Последние, в свою очередь, делятся на описания действий пользователя в рамках ввода и/или редак тирования анкет испытуемых и их числовых (семантических) профилей и полу чения вербальных портретов. Во всех случаях акцент в текстах помощи делается на описании доступных пользователю способов получения нужных ему результа тов. Объясн�ния в ЭС �cattell,,. строятся на основе модели [Clancey, 1983; Khoro shevsky, 1 985] . При этом система поддерживает два типа запросов: общие и спе циальные. Последние, в свою очередь, делятся на запросы типа �почему•, �как" и �что•. Модель объяснений опирается не на трассу вывода решения, а на клю чевые темы, связанные с функционированием системы. Таких тем - три: вер бальный портрет испытуемого, его профиль и заполненная анкета. Типичные примеры запросов на объяснения - следующие: Случай общих запросов При построении данного портрета были неинтерпретируемые факторw ? Сколько противоречий было при построении данного портрета? Какие факторw при построении данного портрета не интерпретировались ? Как р�решались противоречия при построении данного портрета ? и т. п, Случай специальных запросов Почему ·в портрете испwтуемого присутствует фраза � ... » ? Как в профиле испытуемого получено значение фактора � ... »? и т . д. Для устранения непониманий все запросы на объяснения после анализа перефра зируются и выдаются эксперту в виде эхо-вопросов. И только в случае, если его �устраивает" интерпретация запроса, данная системой, происходит формирова ние текста объяснения. Так, например, эхо-запрос для последнего из общих во просов - Вас интересуют правила поглощения противоречивых факторов в дан ном портрете?, а для последнего из специальных вопросов - Вы хотели бы узнать, каким образом сформировано значение фактора � ... » = � ... »? 266 Глава 7 • Пример разработки системы, основанной на знаниях Примеры объясняющих текстов для тех же запросов, к которым приl!едены эхо вопросы системы - следующие: Фактор « ..... = « ..... поглощен фактором « ..... = « ..... , так как на шкале «ОН-Н-СРВ-ОВ,,. значение « ..... выражено «сильнее" значения « ...... Общая формула, которая является ключом теста, выглядит следующим образом: F _ v a lu e ( fa c to r ) = L qc fa ctor от вет ( q ) * вес - от вет а ( q ) ; Для фактора « ..... она трансформируется в формулу: F_value ( « ..... ) = ответ ( qЗ)*вес-ответа ( qЗ) + ... + ответ ( q 176)*вес-ответа ( q 1 76); С учетом ответов испытуемого эта формула приводится к выражению вида: F_value ( « ... '-') = 2 + ... + 2 = « ..... Таким образом сформировано значение фактора « ..... = « ...... Как следует из приведенных примеров, объяснения в ЭС «Cattell,,. достаточно подробные и позволяют получить психологу-эксперту практически всю инте ресующую его информацию. Понятно, что поддержка объяснений такого уровня существенно сложнее, чем выдача аннотаций к трассе вывода решения и требует своей базы знаний ( согласованной с предметной БЗ) и своей программы вывода. Основные моменты построения этих компонентов и рассматриваются ниже. В целом подсистема объяснения системы «Cattell,,. строится по «полной,,. схеме: прием запроса от пользователя; анализ запроса; генерация эхо-вопроса; прием подтверждения на системную интерпретацию запроса и вывод собственно текста объяснения. Формирование запросов на объяснения осуществляется на основе меню, в корне вых опциях которого находятся темы объяснений, а на листьях - ЕЯ-шаблоны конкретных вопросов. В зависимости от типа запроса он может сопровождаться параметрами, которые выбираются пользователем непосредственно из портрета или профиля испытуемого. Система, <<зная,> описание текущего испытуемого, до полняет запрос пользователя и формирует структуру вида « т ема» « т и п -запроса» « имя объясняемого фрейма-экземпля р а» « контекст» ) , которая, по существу, является внутренним представлением запроса на объясне ние. Таким образом, удается избежать построения Л-процессора для анализа за прос ов и вместе с тем обеспечить естественное общение. Анализ внутреннего представления осуществляется параллельно с генерацией эхо-вопроса. При этом сама внутренняя структура является управляющей це почкой, которая задает поверхностную структуру эхо-вопроса. Фрагмент соот ветствующего множества АТN показан на рис. 7.5. 7.3. Разработка и реализация психодиагностической ЭС «cattell• 267 PUSH F-NAМE тsт т 'что система пока не может об1.яснитьl' САТ ' 1 ' Т · имел и сь л и в профиле nытуемQl'О факторы, которые· тsт тsт т ·не ДВ/111 при построении портрета нмкакой вер6альной ооствеnяющей?' т 'что система пока не может объяснить!' т_______________----� РОР � ,___тs__т_____ � ·данная тама пока системе �едостуnна.· Рис. 7.5. Фрагмент АТN-представления анализатQра запросов и ге нератора эхо-вопросов В результате анализа запросов на объяснения и генерации эхо-вопросов, а таюке уточнений, которые отражают процесс согласования мнений системы и пользова теля, в базе знаний ПОЭС (подсистемы объяснений ЭС) •Cattell• формируется окончательная редакция запроса - фрейм-экземпляр следующего прототипа: [ expl_request i s_a p rototype ; rq_team f rame ; rq_type i nt ; rq_c ont ext { st r i ng } : expl_f r f rame : expl_s1 { st r i ng } : expl_fun st r i ng ; echo_txt { st r i ng } ; expl_txt { st ring } ] ; В начальный момент вывода текста объяснения в этом экземпляре заполнены слоты rq_team (тема объяснен ия из БЗ П О Э С ) ; rq_type (тип запроса, - WHY, HOW или W H AT, - сформированный анализатором); rq._context (параметры запроса, если они требуются) и echo_txt (поверхностное представле1iие •согла сованного• эхо-вопроса). Слоты expl_fr (объясняемый фрейм-экземпляр из предметной БЗ теста); expl_sl ( объясняемые слоты объясняемого фрейма-экземп ляра) и expl_fun (имя процедуры вывода текста объяснения) заполняются самой ПОЭС. Значение слота expl_txt представляет результат работы. Собственная БЗ ПОЭС - статическая и содержит совокупность поддерживае мых моделей объяснени � , определяемых как экземпляры следующих основных прототипов: [ explain i s_a p r ototype ; expl_fnc st r i ng ; exp l_knw expl_slt { st ri ng } ; f rame ] : 268 Гла ва 7 • При мер раз работки системы, осно ван но й на знаниях [ v_expl is а p rototype ; why_slt { st r i ng } ; how_slt { st r i ng } ; what_slt { st ri ng } ; why ( f rame ) ; how ( f rame ) ; what ( f rame ) ] ; p_expl i s_a p rototype ; why { f rame } ; h ow { f rame } ] ; c_expl is_a p rototype ; none f rame ; cont ra f rame ] ; [ wh i s_a p rototype ; path { f rame } ; p rocess st r i ng ] ; path i s_a p rototype ; type i nt ; nm_f rame st ring ; nm_slot { st ring } ] ; rule i s_a p rototype ; r _fact { st r i ng } : r _part { s t r i ng } ] : В н аш е м случ а е это м н ож е ств о экземпл я р ов предста в ляется с ледующими ф р еймами : [ po rt is_a expla i n ; expl_slt = { « Ь 1 » , «Ь2» , « Ь3 » , «Ь4» } ; expl_fnc = «po rt ret » ; expl_knw = po rt ret ] ; [ p rfl is_a explai n ; expl_slt expl_fnc = • p rofile» ; expl_knw = p rofile ] ; [ comn i s_a explai n ; expl_sl t = { } ; expl_ fnc =«com_que» ; expl_knw =common ] ; Анализ их показывает, что в ЭС �cattell» поддерживаются модели .объяснения всех групп интерпретируемых в вербальном портрете факторов, всех факторов в профиле испытуемого и модели общих запросов. 7.3. Разработка и реализа ция психоди агностической ЭС «Cattell» 269 Так, например, знания, необходимые для объяснения вербального портрета конк ретизируются фреймом-экземпляром portret, где заданы ссылки на объясняемые тексты ( •Ы_txt .. , •b2_txt .. , •ЪЗ_tхt.. , •Ь4_txt,,.) и способы доступа к релевантной информации из предметной БЗ теста (wh 1 , wh2, whЗ, wh4): [ port ret : v_expl ; why_slt = { « b 1 _t xt » , why = { wh1 , wh 2 , whЗ , how_sl t = { « b 1 _txt» , how = { wh1 , wh2 , whЗ , what_slt = { « b 1 _t xt » , what = { wh 1 , wh2 , whЗ , «b2_txt » , « bЗ_txt » , « b4_t xt » } ; wh4 } ; « b2_txt » , « bЗ_txt » , « b4_txt» } ; wh4 } : « b 2_txt » , « bЗ_txt » , « b4_t xt » } ; wh4 } ] ; При такой модели процессор объяснений интерпретирует последовательно опи сания экземпляров типа wh, где описываются пути, ведущие от запроса на объяс нение к тем данным, которые и составляют внутреннее представление ответа. Наиболее сложной является модель объяснения поглощения факторов, активи руемая подмножеством общих вопросов. В этом случае ПОЭС должна иметь в своей БЗ модели всех правил поглощения и объяснять рассуждения машины вывода •Cattell ... Для конкретности дальнейшего обсуждения_ предположим, что обрабатывается запрос вида •Как разрешались противоречия при построении данного портрета ?» и пользователь согласился с интерпретацией системы, спе цифицированной в эхо-вопросе •Вас интересуют правила поглощения противо речивых факторов в данном портрете ?» Пусть также, для определенности, един ственным поглощенным фактором при выводе вербального портрета был фактор А. Для этого .фактора в модели существуют два правила объяснения поглощения, соответствующие очень низкому (ОН) и очень высокому (ОВ) значению этого фактора в семантическом профиле испытуемого: [ АОВ i s_a r u l e ; [ АОН i s_a r u l e ; r_fact = { « Е» , « L» } ; r_fact == { « Е » , « L» } ; » r_pa rt = { « EOB» , « LOB » } ] : r_pa rt = { « EOH» , LOH» } ] ; Однако реально поглощение фактора А наблюдается лишь тогда, когда значения факторов Е и L тоже О Н или ОВ. Понятно, что в такой ситуации подсистема объяснения должна сравнивать не семантические профили по вышеуказанным факторам, а их числовые профили. Учитывая вышесказанное, продукционная система вывода объяснения поглощений содержит 98 правил, аналогичных пра вилам для фактора А: section EXPL-COLLAPSE-A removeal l ; i f ( [ $cu r r_s�p rf l : А ] == [ $cur r_s_prf l : Е ] ) { if ( [ $cu r r_s_ p r f l : А ] == «ОН» ) i nsert ( AOH-COLLAPSED - E ) ; 270 Гла ва 7 • При мер ра зработки системы , основанно й на знаниях [ $cu r r_s_p r f l А ] == « О В » ) inse rt ( AOB -CO LLAPSED- E ) ; b reak } ; i f ( [ $cu r r_s_p rfl : А ] == [ $cu r r_s_prfl : L ] ) { i f ( [ $cu r r_s_prfl А ] «ОН» ) inse rt ( AOH-CO L LAPSED- L ) ; i f ( [ $cu r r_s_p rfl А ] �= «ОВ» inse rt ( AOB-COLLAPSED- L ) ; b reak } ; if rule AOH-COLLAPSED-E ? [ $cu r r_n_p r f l : $cu r r_A = А ] ) && ( ? [ $cu r r_n_p rfl : $cu r r_E = Е ] ) && ( $cu r r_A <= SGu r r_E) ==> [ expl_ re quest_OO1 : expl_txt ] = { «Фактор А = « , $cu r r_A» , « ( ОН ) п оглощен » , «фа ктором Е = " , $cu г r _Е , « ( О Н ) , т . к . ч исловое» , « значен ие Е выражено сил ьнее значения А . » } ] ; rule AOB -CO LLAPSED- L ? [ $cu r r_n_prfl : $cu r r_A = А ] ) && ( ? [ $cu r r_n_p rfl : $cu r r_L = L ] ) && ( $cu r r_A <= $cu r r_L) == > [ expl_ request_OO1 : expl_txt ] = { «Фа ктор А = " , $cu r r_A> > , « ( OВ ) по г л ощен » «фактором L = " , $cu r r _Е , « ( OВ ) , т . к . ч исловое» , « значение L выражено сил ьнее значения А . » } ] ; Таким образом, осуществляется генерация объяснений в ЭС �cattell ... В данной версии каждый запрос на объяснение приводит к генерации одного и того же эк земпляра прототипа expl_request. Однако нетрудно модифицировать обсуж давшуюся продукционную программу так, чтобы в БЗ объяснений сохранялась история работы с ней пользователя. В таком случае БЗ объяснений может ис пользоваться для обучения специалистов интерпретации результатов по тесту Кеттелла. Выше описаны основные проектные решения, использованные при создании психодиагностической ЭС �cattell ... Однако читателям должно быть ясно, что эти решения являются достаточно общимй и характерными не только для дан ной экспертной системы, но и для большинства ЭС диагностики. П редставлен ие дан н ых и знан ий в И нтернете о Язык HTML и представление знаний о Онтологии и онтологические системы о Системы и средства представления онтологических знаний 8 . 1 . Язык HTM L и п редста вл ен и е з н а н и й 8. 1 . 1 . Историческая справка О чевидно , что для представления информации в среде Интернет нужен был язык, который бы был «понимаем� всеми компьютерами в сети и вместе с тем обеспечи вал бы достаточ ные выразительн ые средства для удобного описания разных типов документов. Таким языком публикаций для WWW и стал HTML ( Hyper Text Markup Language) [WAI, 1999]: Этот язык предоставляет авторам Интернет публикаций средства: • представления документов, включающих заголовки, тексты, таблицы, списки, «картинки� и т. п. элементы; • осуществления навигации по отдельным документам и множеству документов путем использования гиперссылок; • конструирования диалоговых форм для взаимодействия с удаленными серви сами, доступными в сети, а также: • включения в документы вычисляемых форм (spread-sheets), видео и звука, равно как и разнообразных приложений. HTML - «авторский� язык Первая его версия была разработана Т. Бернерс-Ли (Tim Berners-Lee) из Европейского Центра ядерных исследований (CERN). Ак тивно поддерживался этот язык I<омпанией NCSA, где был реализован один из первых WеЬ-броузеров - Mosaic. Победное шествие HTML по Интернету все 90-е годы объясняется, в первую очередь, взрывным ростом Web и потребностя ми в единообразном представлении информации. За это время ЯЗЫI< претерпел 2'72 Глава 8 • Представл е ние данных и знаний в Интер нете существенные изменения. И уже к середине 90-х годов произошл а стандартиз а ция его версий, которая стала куриров аться междун ародными организ ациями. Версия HTML 2.0 (ноябрь 1 995 r.) был а разработан а под эгидой Internet Engi neering Task Force ( IETF) для фиксации уже сложившейся практики использо в ания этого язык а до 1 994 r. включительно [Berners-Lee et al., 1 995]. В версиях HTML+ ( 1 993 r.) и HTML 3.0 ( 1 995 r.) описательн ы е возможJюсти языка были существенно расширены. Практика использования новых конструкций усилия ми World Wide Web Consortium's (W3C) HTML Working Group был а з афикси ров ан а в HTML 3.2 (янв арь 1 997 r.) [ Raggett, 1 997] . В н астоящее время н а иболее развитой является версия языка HTML 4.0 [ HTML 4, 1998], в которой представ лены новые возможности апп аратуры и требован�я производителей программ ного обеспечения броузеров, а также пожел ания Интернет- авторов. 8. 1 . 2. HTM L - язык гипертекстовой разметки Интернет-документов Целью настоящей гл авы в целом и данного параграфа в частности, безусловно, не является описание язы ка HTML или изложение при емов создания Интернет-до кументов с использов а нием этого язык а . Для этого в н астоящее время имеется достаточное число книг, пособий и Интернет-сайтов, в том числе и русскоязыч ных (н апример, http://www.citforum.ru/). Вместе с тем для обсуждения возмож ностей HTML по представлению в Интернет зн аний, а не данных основн ы е поня тия этого язык а н ам потребуются. Вот почему ниже приводится краткое опис ание структуры НТМL-текстов и некоторых основных конструкций самого язы.ка .. HTML - язык разметки Интернет-документов с помощью специальных конст рукций, н азыв аемых тегами (tag) . Для выделения тегов в НТМL-текстах эти конструкции берутся в угловые скобки. Р азличают теги •открытия• р азмечае мого фрагмента (они задаются ключ евым словом и, быть может, множеством до пустимых п араметров) и теги е го •з акрытия• (такие теги суть то же ключ евое слово, которому предшествует символ «/• ). В отличие от н ач альных конеч н ые теги п араметров не имеют. Некоторые из н ач альных тегов не имеют п арных ко нечных. Регистр, в котором представлены кл ючевые слов а тегов и их п араметров, роли не играет. Пож�уй, этими соглашениями и исчерпыв аIОтся основн ы е пра вила , которым следуют все специфик а ции язык а HTML. Отметим лишь, что полное и строгое его опис ание базируется н а специальной системе специфика ции языков разметки SGML [Goldfarb, 1 99 1 ] , одним из примеров использов ания которой и является HTML. Общая структура НТМL-документа может быть представлен а сл едующим фор м атом: < ! DОСТУРЕ НТМL PUBLIC " -//WЗC//DTD HTML 4 . 0//EN " " htt p : //www . w3 . o rg/ТR/REC-html40/st rict . dtd " > <HTML> <HEAD> ; 8 . 1 . Язык HTML и представление знаний 273 <ТIТ�Е>Наименова н ие документа</ТIТLЕ� <МЕТА name=keywo rds •соntеnt=" Представление знаний , Мул ьтиагентные системы " > </HEAD> <BODY> Собственно текст документа </BODY> </HTM L> Как следует из приведенного формата, комментарий < ! DОСТУРЕ . . . > фиксирует текущее состояние спецификации версии языка HTML. Кроме тоrо,, в НТМL-до кументе выделяются две основные структурные единицы - �голова• документа (между те,r ами < H EAQ> и </HEAD>) и его �тело• . . . (между тегами <BODY> .и </BODY>). . .. . Один из элементов головы документа - это заголовок ...,.. произвольный текст меж ду тегами <TITLE> и </ТITLE>. Не менее, а быть может и более важным элементом головы документа является тег <МЕТА . . : >. В приведенном. выше примере этот тег с помощью параметров name и content фиксирует значfние первого атрибута как keywords, а второго - как ключевые слова •Представление знаний• и •Мульти аrентные сист,емы•. Этот и некоторые другие теги типа <МЕТА . . . > ориентирова ны на аннотирование Интернет-документов и, кроме того, су щественно облегча ют задачу индексирования их, например, с помощью сетевых роботов. Собственно содержание документа находится в теле. Как правило, оно состоит из последовательности структурных единиц, базисными среди которых являются заголовки разного уровня (текст, заключенный между тегами <Hi> и </Hi>) и па раграфы - текст между тегами <Р> и </Р>. По существу, это минимальные сред ства форматирования Интернет-документов. Естественно, что в HTML, особенно в его последней версии HTML 4.0, такие средства\значительно богаче. Здесь и всевозможные выравнивания, и табуляция, и несколько типов списков, и т. д. Но более важн � ми базовыми I(онструкциями языка HTML, которые, собственно, и дают основание nвести в его название термин •гипертекст•, являются якоря (anchors). Синтаксически эти конструкции представлены тегами <А> и </А> с атрибут ами NАМЕ и HREF. Собственно якорем является конструкция вида <А NАМЕ= " Метка " >текст</А>, которая обеспечивает уникальное (в пределах документа) имя нач ала определен ного фрагмента НТМL-текста. При этом текст, заключенный между тегами <А> и </А>, как правило, задает семантически знач имое наименование заголовка. Для ссылок на помеченные таким образом части Интернет-документа использу ются конструкции <А НRЕF=" #Метка" >текст</А> или <А HREF=" URL" >тeкcт</A>. 274 Глава 8 • Представление данных и знаний в Интернете Первая из них задает локальную ссылку на часть документа, начинающуюся с указаьцюй метки. Вторая - глобальную ссылку на документ в сети, однозначно идентифицируемый с помощью URL ( Unified Resource Locator). По существу, URL - э то Интернет-адрес: имя домена, ут очненное названием протокола и собственное имя документа, включая путь I< нему в пределах данн ого домена. В качестве примера U~RL можно привести следу ющую ссылку вида http://www. anywhere.ru/anywhat.html. Использование в Интернет-публикациях ссылок позволяет организовать логи ческое структурирование информации и обеспечивает удобную и единообразную навигацию как в пределах одного документа, так и в целом по множеству доку ментов, которьtе, по мнению автора данного НТМL-текста, связаны между собой. В ажными конструкциями HTML, особенно в ero последней версии, являются также таблицы с богатыми возможностями задания многоуровневых заголовков и формы, с помощью которых в язык введены средства обеспеч ения диалога с ч и тателями Интернет-документов. Базисными конструкциями форм являются ре дактируемые текстовые поля, элементы выбора, кнопки и т. п. Примеры форматов спецификации таблиц и форм приведены ниже. <TAB LE> <TR> <TD> Столбец- 1 , строка- 1 </ТD> <TD> Столбец- 1 , строка-2 </TD> </TR> </TABLE> <FORM METHOD= " РОSТ" ...> <Р> Вы можете ввести в поле одну стро к у : <INPUT NAME= " ent ry· > </Р> <Р> Для обработки резул ьтатов в вода нажмите кноп ку : <IN PUT TYPE=" submit" VАLUЕ=" Принять запрос" > </Р> </FORM> Заметим, что именно на уровне форм в HTML появились возможности ввода ин формации в ·просматриsаемый документ и ее обработки с помощью специальных программ, выполняемых на сервере. В последних версиях языка эта идея получи ла дальнейшее развитиё и в настоящее время присоединенные процедуры могут быть подключены к НТМL-документу не только в формах, но и в других 1<0нст рукциях, а их выполнение может осуществляться как на сервере, так и на клиенте. 8. 1 . Язык HTM L и представ л ение знаний 275 Следуl()щей - важной конструкцией , которая по я вилась уже в версии языка HTML 2.0, являются кадры ( frames) . Часто их называют также рамками или фреймами. С использованием кадров стало возможным разделить документ на ч асти и представлять их в отдельных, правда н еперекрывающихся , областя х эк рана. По существу, с кадрами в язык HTML были введены в оrраниченном объе ме средства представления информации, характерные для много оконных при ложений. Экранная форма с примером структуризации документа с помощью кадров приведена на рис. 8. 1 . .Рис. 8 . 1 . Испо льзование кадров для структ уризации Интернет-до кумента На наш взгляд, конце пция кадров получ ила естественное развитие в конструк циях HTML 4.0, названных слоями (layers). Основными достоинствами слоев явля ются возможность их •привязки• по месту на экране, динамическое •всплы вание• и ссхл опывание• слоев, а также их перекрытие. Кроме слоев в HTML 4.0 появились и другие конструкции, расширяющие воз можности разметки Интерн ет-документов, среди которых следует отметить ин тернационализацию (использование стандарта ISO/IEC: 1 0646 в качестве базо вого множества допустимых символов, а такжt! появление специальных тегов, фиксирующих кодировку' документа); более четкое разделение между структу рой документа и его представлением за счет таблиц стилей (style sheets); скрип ты (scripts), поддерживающи е, в ч астности, создание динамических страниц; но вый механизм интеграции текстовых и графических ссылок, исполняемый на 1 276 Глава 8 • Представ ле н ие данных и знан ий в Интернете стороне клиента (client-side image map mechanism) и, безусловно, стандартиза цию ·механизма подключения к НТМL-документам базисных медиаобъектов и приложений (embedding generic media objects and applications). Справедливости ради следует отметить, что интерпретация некоторых конструк ций последних версий языка HTML разными броузерами различна. Однако, как представляется, это не принципиальные, а технологические трудности совмести мости программных продуктов разных фирм, в первую очередь Microsoft и Net- .. scape. В целом же можно констатировать, что текущая версия языка HTML является мощным средством разметки Интернет-документов. Но ориентирован этот язык скорее на •разм етку визумизации•, чем на семантическую разметку, доступную для восприятия не только читателями-людьми, но и программами (в первую оче редь, аrентами, функционирующими в среде Интернет, которые обсуждаются в следующей rлаве настоящей книги). И тем не менее некоторые, правда ограни ченные, в9зможности для представления знаний имеются в этом языке и сейчас. Вот почему в следующем подраздел е данного параграфа эти вопросы обсужда ются поi.робнее. 8. 1. 3 . Возможности представления знаний на базе языка HTM L Выш� были рассмотрены основные конструкции HTML. Теперь обсудим, каким образом они могут быть исп_ользованы для семантической разметки ИН1:ернетдокументов и насколько это вообще возможно и эффективно. Для этого выделим те конструкции языка, которые могут быть полезными для решения данной задачи. Очевидно, что к их числу, прежде всего, относятся теги типа <TITLE>, <МЕТА . . . > и <А . . . > . Первый важен для фиксации семантики всего НТМL-документа, так как текст, заключенный между тегами <TITLE> и </ТITLE>, чаще всего отражает его назначе ние и/или содержание. Теги типа < М ЕТА . . . >, по существу, вводят имена атрибутов и их значения с помо щью параметров name= « . . . » и content::::« . . . » , а ссылки и якоря фиксируют отноше ния между частями одного документа и/или отдельными документами. Но если теги типа <МЕТА . . . > явно вводят семантику значений атрибутов, одина ково интерпретируемых броузерами за счет ключевых слов (например, keywords, author и др.), которые могут быть значениями параметра name, то теги типа <А . . . > лишь фиксируют факт наличия отношения между ссылкой и ее якорем. В некото рых случаях этому отношению можно •приписать• имя SeeAlso, в других - lsa, ConsistOf, PartOf или иное подходящее имя, но в целом семантика данной конст рукции имплицитна, а встроенная интерпретация ее связана лишь с переходом по ссылке и визуализацией начала соответствующего фрагмента документа или за грузкой нового документа для просмотра. ! 277 8 . 1 . Яз ы к HTML и представление знаний Из других конструкций H,T ML полезными для последующей обработки на пред мет эксплицитного представления семантнки соответствующих частей докумен та могут быть заголовки разделов и п одразделов (тексты между тегами <Hi> н </Hi> ), списки, таблицы и другие элементы языка. Но в целом можно отметить, что выделение значимых для семантической интер претацни конструкций является экспертной задач ей, решаемой каждый раз авто ром соответствующей Интернет-публикации по-своему. Правда, уже существуют определенные стереотипы, особенно заметные на коммерческих сайтах. Так, на пример, при анализе сайтов Интернет-магазинов, проведенном Н. В. Майкеви ч, было зафиксировано, что каталоги товаров в настоящее время в больш инстве слу чаев представляются таблицами и/или списками либо «зашиты� в чувствител ь ные для щелчr<а мышью графич еские образы. Аналогичная ситуация характерна и для индексов на сайтах машин поиска. Для примера на рис. 8.2 приведена экранная форма известного электронного ма газина , функционирующего в сети по адресу http://amazon.com/. 1J дl1\dzon соп1 SoJtw,.re / Ope1-atm9 Syste1J,s L U 1 1l1�es / Ope1at1ng S�slems • Mtcrosoft lnternet E нplorer f.lf;I CJ http:)IWYN-1. мntizon. com/el(ec)oЬidos/tg/slores/ЬJOWse/-/softw.are/229653/1 02-99832.77-1 375343 8rowse Operating Systems • в�оs • DC•S • L..nнx & U1illt • Macin.t•)sli \Niг,(IOW$ 2000 J.s He1•e l - Trying to decide whether to upgrade to Wmdows 2000? Se, w!,at othet�P••'1:•!o .are 211.Ш or get exr�rt rt'cNrunenQativ11s from ош- editonal staff � Ощ· Тор Selleп; Upd1>ted D1>lly Рис . 8.2. Экранная форма секции «Электроника» магазина Amazon .com Фрагмент соответствующего НТМL-текста представлен ниже: <html> < head> < t i t le> Amazon . сот : E lect гоп ics/Softwa re/Ope rat i n g Systems 278 Глава 8 • Представление дан ных и знаний в Интернете </t itle> </head> <body . . . > <tаЫе . . . > <t r> <td col s pan = 2 bgcolor = #EEEECC> <font . . . >B rowse <B>Ope rating Systems</B></font> </td> </t r> <t r> <td bgcolor = " FFFFFF" valign = "top" width =50%> <u l > < l i><a h ref=/exec/obidos/tg/elect ronics/ . . . > 00S</a> < l i ><a h ref=/exec/obidos/tg/elect ronics/ . . . > Lin u x & Uni x</a> < l i ><a h ref=/exec/obidos/tg/elect ronics/ . . . > Macintosh </a> </u l> </td> <td val ig n = "top" width=50%> <ul> < l i ><a h ref=/exec/obidos/tg/elec� ronics . . . > Mic rosoft Wi ndows</a> < l i ><a h ref=/exec/obidos/tg/elect ron ics/ . . . > 0S2</a> </ul> </td> </t r> · </ tа Ы е> Как следует из сравнения экранной формы ( см. рис. 8.2) и приведенного НТМL текста, каталог товаров организован в виде таблицы (тег <tаЫе> ), в ячейках ко торой (тег <td>) с помощью конструкции списка (тег <li>) перечислены продук ты (в данном случае это операционные системы DOS, Linux & Unix, Macintosh, Microsoft Windows и 0S2). Собственно описания этих проду1сrов и их характе ристики заданы в виде · ссылок на отдельные документы (теги <а href=/exec/ obldos/tg/electronics . . . >). При этом из анализа НТМL-текста следует, что его се мантически значимые характеристики могут быть «закопаны• достаточно глу боко. И более того, разбросаны по разным частям одного документа и даже раз ным документам. Все вышесказанное существенно затрудняет семантический анализ Интернет-документов, независимо от того, выполняется ли он людьми экспертами или специальными программами. Решение проблемы семантического анализа Интернет-документов в настоящее время связывается с использованием двух подходов. В рам1<ах первого из них 8 . 1 . Язык HTML и представле ние знаний 279 предполагается , что семантическая разметка НТМL-текста выполняется вруч ную (или полуавтоматШJески, с применением соответствующих инструменталь ных средств) его автором на основе специальных метатеrов. По существу, ре зультатом такой разметки является семантическая сеть, отражающая знания, представленные в документе. Второй подход связан с автоматическим и/или по луавтоматическим преобразованием исходного текста в спецшщьное семанти ческое представление, как правило, в онтологию или ее фрагмент. Подробнее э ти подходы обсуждаются ниже. Но и в том и в другом случае для выполнения указанных преобразований целесообразно конвертирование НТМL текстов в более удобное для дальне йшей обработки представление. Для иллюст рации возможностей применения к решению этой задачи средств представления знаний, описанных в предыдущих главах, рассмотрим интеллектуал ьный НТМL конвертор [Maikevich et al. , 1 998] . Для со �<ращения объема материала обсудим подмножество языка HTML, которое может быть задано следующими ВNF-определениями: НТМ L-текст : : = <HTML> HEAD BODY </HTML> HEAD : : = ПТLЕ { H EAD } 1 • • • ТITLE : : = < TIТL E> строка </TIТLE> BODY : : = <BODY> HTM L- BODY </BODY> HTML- BODY : : = PARAGRAPH { HTM L- BODY } H EADER { HTML-BODY } 1 LIST { HTM L-BODY } 1 • • • H EADER : : = <Н1> ТЕХТ </Н1> 1 <Н2> ТЕХТ </Н2> 1 PARAGRAPH : : = <Р> ТЕХТ </Р> LIST : : = <UL> LIST-ATOM { LIST-ATOM } </UL> 1 <OL> LIST-ATOM { LIST-ATOM } </OL> <MENU> LIST-ATOM { LIST-ATOM } </MENU> 1 • • • ANCHOR : : = <А HREF= LINK > ТЕХТ </А> 1 <А NAME= метка > ТЕХТ </А> = ТЕХТ : : ... LIST -АТОМ : : = ... LINK : : = ... Некоторые из синтаксических диаграмм, соответствующих приведенным выше правилам, представлены на рис. 8.3 и 8.4. Как следует из приведенных правил и диаграмм, с теоретической точки зрения HTML - это простой язык программирования с контекстно-свободной грамма тикой . Нетрудно показать, что для анализа НТМL-текстов можно использо вать, например, нисходящие распознаватели, реализуемые на базе метода рекур- 280 Гла ва 8 • Представление данных и знаний в Интернете сивноrо спуска. При этом возможны разные подходы. Ниже для этого использу" ется продукционно-фреймовый формализм представления знаний и показыва ется, как на этой основе может быть разработан интеллектуальный НТМL-кон• вертор. ТЕХТ </DL> <DL> ТЕХТ <MENU> LIST-ATOM Рис. 8.3. Синтаксическая диаграмма понятия HTML Htt :1/ Dir Ft :/1 J Mailto: � User Рис . 8.4. Синтаксическая диаграмма понятия LINK Прежде всего зададим регулярное отображение каждого правила спецификации НТМL-конструкций в соответствующий объект базы знаний на уровне фрейма прототипа. Система таких прототипов даст нам описание языка, а множество 281 8. 1 . Язык HTML и представление знаний фреймов-экземпляров - специ ф и кацию конкретных и с интакс ически прав иль ных НТМL-текстов. Основные правила такого отображен ия следующ и е: • каждому концепту из левой части ВNF-определения постав им в соответств и е и мя фрейма-прототи па; • альте рнат и вам из правой части ВNF-определен ия при этом должны соответствовать и мена слотов этого фрейма; • для концептов-нетерминалов соответствующи й слот должен и меть ти п fr.ame; • для концептов-терм и налов соответствующи е слот ы будут , как правило, и меть ти пы питЬ ил и string-, • рекурсия в ВNF-определени ях заменяется и тераци ей, а соот ветст вующ и е слоты становятся множественным и . При менен ие сформул ированных выше прав и л к ВNF-определен иям языка HTML при води т нас к следующему множеству фреймов-прототи пов: i f _added HTM L ( ) ; [ html i s_a p rototype , H EAD f rame , rest r_by head ; BODY f r ame , rest r _Ьу body ]; i f _add ed H EAD ( ) ; [ head i s_a p rototype , BODY { f rame } , rest r_by o n e_of { t i t l e , _ } [ title is_a p rototype , BODY s t r i n g ]; i f_added ТITLE ( ) ; ]; [ body is_a p r ototype , i f_added BODY { ) ; SENТ { f rame } , rest r_by one_of { heade r , pa rag raph , l i st , ... } ]; [ heade r is_a p r ototype ; BODY f r ame , rest r _ Ьу text ] ; [h1 i s_a heade r , i f_added H 1 ( ) l; ... [ h6 i s_a heade r , i f_added Н 6 ( ) ] ; [ pa rag raph i s_a p r ototyp e , i f_added PARAGRAPH ( } ; BODY f rame , rest г _Ьу text ]; [ l ist i s_a p rotot ype ; ATOM { f rame } , i f_added L I ( ) ]; [ text is_a p r ototype ; ATOM { f rame } , rest r_by one_of { b r , h r , image , an c ho r , ... , l ine } [ Ьг i s_a p r ot otype ; i f _added BR ( ) ]; ]; i s_a p rot otype ; i f_added H R ( ) [ image i s_a p rot otype ; i f_added IMG ( ) ; SRC f rame , rest r _Ьу l i n k ]; [hr [ anc ho r i s_a p rotot ype ; BODY f rame , r est r _Ьу text ] ; ]; Глава 8 • Представление данных и знаний в Интернете 282 [ l i n k is_a p rototype ; URL f rame , rest r_by one_of { htt p , ftp, ... } MAI L f rame , rest r _Ьу mail ]; [ u rl is_a l i n k ; w i t hout_slot MAI L ] ; [ http i s_a u r l , i f_added НТТР ( ) ; SERVER st r i ng ; { s t r i ng } ; DIR FI LEst ring ] ; [ ft p i s_a u rl , if_added FTP ( ) ; SERVER st ring ; { st r i ng } ; DIR F I L E st ri ng ] ; ]; Тепёрь, в соответствии с приведенными фреймами-прототипами и синтаксичес кими диаграммами, можно специфицировать процедурную часть конвертора как систему демонов, присоединенных к фреймам и/или их слотам. Для примера ниже приводится спецификация одного из таких демонов на языке .Jаvа [Нортон и др., 1998] : puЫic class HTML extends F rameP rototype { H EAD h ead nul l ; BODY body = null ; St ring keywo rd ; puЫic void HTML ( St ring name ) supe r ( name ) ; keywo rd = getToken ( ) ; if ( keywo rd . compa reTo ( " <HTM L> " ) == О ) head new HEAD ( getNewName ( ) ) ; body = new BODY ( getNewName ( ) ) ; }; 1 keywo rd = getToken ( ) ; i f ( keywo rd . compa reTo ( "" </HTM L> ·· ) О ) ret u rn ; По существу, такой демон не что иное, как конструктор класса HTML, а запуск конвертора осуществляется с помощью оператора создания нового объекта этого класса: HTML c u r rPage = new HTML ( get_new_name ( ) ) ; При этом будут рекурсивно вызываться конструкторы других классов ( на верх нем уровне это HEAD и BODY), что, в ко� ечном счете, приведет к построению 283 8. 1 . Я з ы к HTML и представление знаний множества фреймов-э1<земпляров, представляющих анализируемую НТМL-стра ницу (currPage). Понятно, что в общем случае такой подход дает нам средства синтаксически-ори ентированного конвертирования НТМL-текста во фреймовое представление. Но получение полезной для дальнейшей работы базы знаний предполагает его даль нейшую семантическую интерпретацию и построение в конечном счете семанти ческой сети, отражающей смысл исходного Интернет-документа. Д ля примера, фрагменты такой семаитичес1<ой сети для НТМL-текста описания секц ии сЭлектроника»- магазина Amazon.com , обсуждавшегося выше, приведены на рис. 8.5. Electronics& Soflware DVD&Video Welcome . � Music F SeeAlso ' , Soflware DOS OS2 /exec/oЫdos/suЬst/electronics/soflware/home.html/002-08031 57-3369046 Рис. 8.5. Фрагмент семантической сети для секции «Электроника» магази н а Amazon.com 284 Глава 8 • Представление данных и знаний в Интернете По сути дела, эта семантическая сеть представляет фрагмент онтологии предмет ной области «Электронная коммерция•, которая может быть базiiсом для· ·р е-· шения разнообразных практических задач. Так, например, с ее помощью могут решаться задачи поиска определенны х товаров по запросу пользователя, осуще-· ствляться маркетинговый анализ запросов и т. п. Во всех этих и многих других случаях онтологии играют ключевую роль как один из перспективных подходов I< представлению знаний в среде Интернет. Вместе с тем, несмотря на важность понятия онтологии для теории и практики современны х ·интеллектуальных систем, общепринятого понимания· этого тер мина нет, . хотя различные определения, предложенные разными авторами й на учными коллективами [Gruber, 1 99 1 ; Guarino, 1 996; Fridman et al., 1997], ра спространяются и медленно конвергируют. Поэтому в следующем параграфе обсуждается само понятие онтологии и вводится соответствующая система мо делей [Maikevich et al., 1999], затем приводится классификация онтологий, по лезная для последующего сравнения известных в этой области проектов. В за1�лючительных разделах главы обсуждаются примеры онтологий и специальные системы аннотирования Интернет-ресурсов на основе онтологий. 8 . 2 . Он то логии и онтол о гичес кие сист емы 8 . 2 . 1 . Основные определения Онтология (от др.-греч. онтос - сущее, логос - учение, понятие) - термин, опре деляющий учение о бытии, о сущем, в отличие от гносеологии - учения о позна нии. Уже у Х. Вольфа ( 1679- 1 754), автора самого термина «онтология�, учение о бытии было отделено от учения о . познании. Введен же термин в философскую литературу немецким философом Р. Гоклениусом ( 1 547- 1 628). При этом онтоло гия являлась частью метафизики, наукой самосюятельной, независимой и не свя занной с логикой, с «практической философией»-, с науками о природе. Ее пред мет составляет изучение абстрактны х и общих философских категорий, таких как бытие, субстанция, причина, действие, явление и т. д., а сама: онтология как наука претендовала на полное объяснение причин всех явлений [Розенталь и др., 1951]. Понятно, что такое определение мало пригодно для практического использова ния, но дает отправную точку для дальнейшей конкретизации и. обсуждения с точки зрения целей настоящего издания. В этом смысле интереснее определение онтологии, предложенное в рамках разработки системы стандартов на мульти агентные системы международным сообществом· FIРА (Foundation for Intelli gent Physical Agents). В работе [FIPA, 1998] утверждается, что В фи ло с офск ом смысл е можно ссыл аться н а онтологию ка к н а оп ределе нную систему ка те гори й, явля ющихся следстви ем оп ределенного взгляда н а м ир . 8.2 .. Онтол огии и онтологические системы При этом сама система категорий не зависит от конкретного языка: онтология Аристотеля всегда одна и та же, независимо от языка, использова �оrо для .е.е._опи сания.. С другой точки зрения, более близкой к понятиям, связанным с ИИ, онтология это формально представленные на базе концептуализации знания. Концептуали зация, �ак уже обсуждалось выше, предполагает описание множества объектов и понятий, знаний о них и связей между ними. Таким образом, Онтологией [Grµber, 1 993) называется эксnлицитная спецификация ко нцеn туал1,1зации. Фо рмально о нтол о гия со сто ит из термин о в, о рганиз о ванных в таксо н омию, их о преде лени й и атрибуто в, а также связанных с ними акси о м и правил вывода. Часто набор предположений, составляющих онтологию, имеет форму логичес кой теории первого порядка, где термины словаря являются именами унарных и бинарных предикатов, называемых соответственно концептами и отношениями. В простейшем случае онтология описывает только иерархию концептов, связан ных отношениями категоризации. В более сложных случаях в нее добавляются подходящие аксиомы для выражения других отношений между концептами и для того, чтобы ограничить их предполагаемую интерпретацию. Учитывая вы шесказанное, онтология представляет собой базу знащ�:й, описывающую �факты, которые предполагаются всегда истинными в рамках определенного сообщества на основе общепринятого смысла используемого словаря. Еще более конкретно понятие онтологии в· известном проекте ·ontolingua [Far quhar et al., 1996], который активно ведется в Стэнфордском университете. Здесь предполагается, что Онтолоrи�:, - это зксnлицитн ая сп ецификация о пределенной темы. Такой подход предполагает формальное и декларативное представление некото рой темы, которое включает словарь (или список констант) для отсылки к тер минам предметной области, ограничения целостности на термины, логические утверждения, которые ограничивают интерпретацию терминов и то, как они со относятся друг с другом. Резюмируя вышесказанное, можно констатировать, что в настоящее время пони мание термина «онтология► различно, в зависимости от контекста и целей его ис пользования. В работе [ Guarino, et al., 1995а] дано достаточно содержательное и интересное обе:уждение этих вопросов, которое сводится в конечном счете к тому, что здесь выделяются следующие аспекты интерпретации этого термина: 1. Онтология как философская дисциплина. 2. Онтология как неформальная конце�туальная система. 3. Онтология как формальный взrля.д на семантику. 4. Онтология как спецификация «концептуализации►. 286 Глава 8 • Представление данных и знаний в Интернете 5. Онтология как предсчшление концептуальной системы через логическую тео рию, характеризуемую: • специальными формальными свойствами или • только ее назначением. 6. Онтология как словарь, используемый логической теорией. 7. Онтология как (метауровневая) спецификация логической теории. Следует отметить, что первая интерпретация радикально отличается от осталь ных и связана, как предлагают авторы вышеуказанной работы, с тем, что здесь мы говорим об Онтологии (с большой буквы) и имеем в виду философскую дис циплину, изучающую, согласно Аристотелю, природу и организацию сущего. В этом смысле Онтология пытается ответить на вопрос: « Что есть сущее?» или, в другой формулировке, на вопрос: « Какие свойства являются общими для всего сущего?» Когда же мы говорим об онтологии (с маленькой буквы), то ссылаемся на объект, природа которого может быть различной, в зависимости от выбора между интерпретациями 2-7. Согласно второй интерпретации онтология явля ется концептуальной системой, которую мы можем предполагать в качестве ба зиса определенной БЗ. Согласно интерпретации 3 онтология, на основе которой построена БЗ, выражается в терминах подходящих формальных структур на се мантическом уровне. Таким образом, эти две интерпретации рассматривают он тологию как концептуальную <<семантическую» сущность, неважно, формаль ную или неформальную, в то время как интерпретации 5-7 трактуют онтологию как специальный «синтаксический» объект. Оставшаяся, четвертая интерпрета ция, которая была предложена Грубером [Gruber, 1993] в качестве определения онтологии для использования в рамках ИИ-сообщества, - одна из наиболее про блематичных, так как точный смысл ее зависит от понимания терминов «специ фикация>> и <<концептуализация». И вместе с тем именно это определение чаще всего и используется в настоящее время в работах по проектированию и исследо ванию онтологий. Для определенности дальнейшего изложения мы будем считать, что Он тологии - это БЗ спе циального тиnа, которые могут «читатьс я» и пониматься, отчуж даться от разработчика и/или физически разделяться их пользователями . При этом онтологический инжиниринг - ветвь инженерии знаний, использую щий Онтологию (с большой буквы) для построения онтологий (с маленькой буквы). Понятно, что любая онтология имеет под собой концептуализацию, но одна концептуализация может быть основой разных онтологий, и две разные БЗ могут отражать одну онтологию. 8 . 2 . 2 . Модели онтологии и онтологической системы Выше уже отмечалось, что понятие онтологии предполагает определение и ис пользование взаимосвязанной и взаимосогласованной совокупности трех компо- 8.2. Онт ол огии и онтологические системы 287 нент: тщ<сономии терминов, определений терминов и правил их обработки. Учи тывая это, введем следующее определение -понятия модели онтологии: Под формальной моделью он толо гии О будем понимать упоря до ченную тройку вида: О = <Х, 9t, Ф> , где Х 9t Ф конечное множество концептов ( поняти й, терм инов ) п редметной области , кото рую представляет онтол огия О ; конечное множество отношений между концептами ( понятиями, термин ами) заданной предметной обл аст и ; конечное множество функций и нтерпретации ( аксиоматизация ) , з аданных на концептах и/или отношениях онтологи и О. Заметим, что естественным ограничением, накладываемым на множество Х, яв ляется его конечность и непустота. Иначе обстоит дело с компонентами Ф и 9t в определении онтологии О. Понятно, что и в этом случае Ф и 9t должны быть ко нечными множествами. Рассмотрим, однако, граничные случаи, связанные с их пустотой. Пусть 9t = 0 и Ф= 0. Тогда онтология О трансформируется в простой словарь: О = V = <Х, {}, {} > . Такая вырожденная онтология может быть поле:ща для спецификации, попол нения и поддержки словарей ПО, но онтологии-словари имеют ограниченное ис пользование, поскольку не вводят эксплицитно смысла терминов. Хотя в не которых случаях, когда используемые термины принадлежат очень узкому (например, техническому) словарю и их смыслы уже заранее хорошо согласова ны в пределах определенного (например, научного) сообщества, такие онтологии применяются на практике. Известными примерами онтологий этого типа явля ются инде1<:сы машин поиска информации в сети Интернет. Иная ситуация в случае использования терминов обычного естественного языка или в тех случаях, когда общаются программные агенты. В этом случае необ ходимо характеризовать предполагаемый смысл элементов словаря с помощью подходящей аксиоматизации, цель использования которой - в исключении не желательных моделей и в том, чтобы интерпретация была единой для всех учас тников общения. Другой вариант соответствует случаю 9t = 0, но Ф =1= 0. Тогда каждому элементу множества терминов из Х может быть поставлена в соответствие функция интер претации f из Ф. Формально это утверждение может быть записано следующим образом. Пусть причем Х 1 n X2 = 0, где Х 1 - множество интерпретируемых терминов; Х2 - множество интерпретирующих терминов. 288 Тогда такие что Глава 8 • Представление данных и знаний в И нтернете 3 ( х е Х1, у i·, у. � , ..• , уk е . Х2) , rдe f & Ф. Пустота пересечения множеств Х1 и Х2 ис1<Лючает циклические интерпретации, а введение в _рассмотрение функции k аргументов призвано обеспечить более пол ную интерпретащ,:ю. Вид отображения f из Ф определяет выразительную мощ ность и практическую полезность этого вида онтологии. Так, если предположить, что функция интерпретации задается оператором присваивания значений ( Х1 : = Х2 , где Х 1 - имя интерпретации Х2 ) , то онтология трансформируется в пассивный словарь VP: О = v, = < Х1 u Х2 , {}, {: = } > . Такой словарь пассивен, так ка1< все определения терминов из Х1 берутся из уже существующего и фиксиро�анноrо множества Х2.• Практическая ценность его выше, чем простого словаря, но явно недостаточна, например, для представления знаний в задачах обработки информации в Интернете в силу динамического характера этой среды. Для того чтобы учесть последнее обстоятельство, предположим, что часть интер претирующих терминов из множества Х2 задается процедурно, а не декларативно. Смысл таких терминов 4ВЫЧисляется• каждый раз при их интерпретации. Ценность такого словаря для задач обработки информации в среде Интернет выше, чем у предыдущей модели, но все еще недостаточна, так ка1< интерпретиру емые элементы из Х 1 никак не связаны между собой и, следовательно, играют лишь роль ключей в хода в онтологию. Для представления модели онтологии, которая нужна для решения задач обра ботки информации в Интернете, очевидно, требуется отказаться от предположе ния 9t = 0. Итак, предположим, что множество отношений на концептах онтологии не пусто, и рассмотрим возможные варианты его формирования. Для этого введем в рассмотрение специальный подкласс онтологий - простую таксономию следующим образом: О "" Т' = < Х , {is_a}, {} >. Под таксономи ческой структурой буде м понимать иерархическую систему пон я ти й , свя занных между собой отношением 1s_a ( «быть элементом класса»). Отношение is_a имеет фиксированную заранее семантику и позволяет орrанизо вывать структуру понятий онтологии в виде дерева. Такой подход имеет свои преимущества и недостатки, но в'общем случае является адекватным и удобным для представления иерархии понятий. 289 8':2. -.онтологии .и он тологические с истемы Результаты анализа частных случаев модели онтологии приведены в таблице 8. 1 . Табnица е: 1 . Кла9сификация моделей онтологии Комnонентw · модели 9t = 0 Ф- 0 Ф орм альное оnределение Пояснение <Х, {}, {}> Словарь по · 9t • 0 w0 Пассивный словарь ПО < Х1 < Х1 v < Х , is_a}, {} > Активный слова рь ПО Таксономия п онятий ПО (Х2· V Pz. ), {}, Ф > Далее можно обобщить частные случаи модели онтологии таким образом, чтобы обеспечить возможность: • представления множества концептов Х в виде сетевой структуры; • использования достаточно богатого множества отношений 9t, включающего не только таксономические отношения, но и отношения, отражающие специ фику конкретной предметной области, а также средства расширения множе ства 9t; • использования декларативных и процедурных интерпретаций и отношений, включая возможность определения новых интерпретаций. Тогда можно ввести в рассмотрение модель расширяемой онтологии и исследовать ее свойства. Однако, учитывая техническую направленность данной книги, мы не будем делать этого здесь, а желающих познакомиться с такой моделью отсылаем tc работе [Maikevich et al., 1999] . Как показано в этой работе, модель расширяемой онтологии является достаточно мощной для спецификации процессов формиро вания пространств знаний в среде- Интернет. Вмесrе с тем и эта модель является неполной в силу своей пассивности даже там, где определены соответствующие процедурные интерпретации и введены специальные функции пополнения оито лоrии. Ведь единственной точкой управления активностью в такой модели явля ется запрос на интерпретацию определенного концепта. Этот запрос выполняется всегда одинаково и ицициирует запуск соответствующей процедуры. А собствен но вывод ответа на запрос и/или поиск необходимой для этого информации оста ется вне модели и должен реализовываться другими средствами. . Учитывая вышесказанное, а также необходимость эксплицитцой спецификации процессов функционирования онтологии, введем в рассмотре;ние понятие онто логической системы Под формальной моделью онтологиче ской системы 0 где О r, :tо будемnонимать триnлет видв: = <o -. {o -J . E "" >, meta - нт л о о огия верхнего уровня (метаонтология); d&t } - мн жеств nредметных нт л и нт л гий задач предмет (О о о огий о о о о о ной области; f 0 Е ""' - модель машины выводв, ассоцииров анн ой с он тологической систем ой r, • 290 Глава 8 • Представление данных и знан и й в Интернете Использование системы онтологий и специальной машины вывода позволяет ре шать в такой модели различные задачи. Расширяя систему моделей {О d&t}, можно учитывать предпочтения пользователя, а изменяя модель машины вывода, вво дить специал и зированные критерии релевантности получаемой в процессе поис ка информации и формировать специальные репозитории накопленных данных, а также пополнять при необходимости используемые онтологии. В модели t имеются три онтологические компоненты: • метаонтолоп1я; • предметная онтология; • онтология задач. Как указывалось выше, метаонтология оперирует общими концептами и отно шениями, которые не зависят от конкретной предметной области. Концептами метауровня являются общие понятия, такие как «объект;,,, «свойство>> , «значе ние,> и т. д. Тогда на уровне метаонтологии мы получаем интенсиональное опи сание свойств пр·едметной онтологии и онтологии задач. Онтология метауровня является статической, что дает возможность обеспечить здесь эффективный вы вод. содержит понятия, опис ы вающ и е конкретную Предметная онтология Q предметную область, отношения, семантически значимые для данной предмет ной области, и множество интерпретаций этих понятий и отношений (деклара тивных и процедурных). Понятия предметной области специфичны в каждой прикладной онтологии, но отношения - более универсальны. Поэтому в каче стве базиса обычно выделяют такие отношения модели предметной онтологии, как ртt_оf, kind_of, contained_in, member_of, see_also и некоторые другие. Отношение pmt_of определено на множестве концептов, является отношением принадлежности и показывает, что концепт может быть частью других концеп тов. Оно является отношением типа «часть-целое;,, и по свойствам близко к от ношению is_a и может быть задано соответствующими аксиомами. Аналогич ным образом можно ввести и другие отношения типа «часть-целое;,,. Иначе обстоит дело с отношением see_a/so. Оно обладает другой семантикой и другими свойствами. Поэтому целесообразно вводить его не декларативно, а процедурно, подобно тому, каI< это делается при определении новых типов в язы ках программирования, где поддерживаются абстрактные типы данных; domain Х see_also У : see_also membe r_of Relation { i f ( ( Х is_a Notion ) & ( У is_a N otion ) & ( Х see_also У ) ) if (Ope ration con nected_with Х ) Ope rat ion connected_with У }; Заметим, что и отношение see_also «не вполне;,, транзитивно. Действительно, ' если предположить, что (Х1 see_also Х2) & (Х2 see_also ХЗ), то можно считать, что (Х 1 see_also ХЗ). Однако по мере увеличения длины цепочки объектов, свя- 29 1 8.2. Онтоло ги и и онтол огическ и е систем ы занных данным оt:ношением, справедливость транзитивного переноса свойства connected_with падает. Поэтому в случае отношения see_also мы имеем, дело не с отношением частичноrо порядка (ка�,, например, в случае отношения is_a), а с отношением толерантности. Однако для простоты это ограничение может быть перенесено из. определения отношения в функцию его интерпретации. Анализ различных предметных областей показывает, что введенный выше набор отношений является достаточным для начального описания соответствующих онтолоrи_й. Понятно, что этот базис является открытым и может пополняться в зависимости от предметной области и целей, стоящих перед прикладной систе мой, в которой такая онтология используется. Онтология задач в качестве понятий содержит типы решаемых задач, а отноше ния этой онтологии, как правило, специфицируют декомпозицию задач на подза дачи. Вместе с тем, если прикладной системой решается единственный тип задач (например, задачи поиска релевантной запросу информации), то онтология задач может в данном слу:чае описываться словарной моделью, рассмотренной выше. Таким образом, модель онтологической системы позволяет описывать необхо димые для, ее функционироцания онтологии разных уровней. Взаимосвязь между онтологиями показана на рис. 8.6. Метаонтолоrия . . 1 -----•'""._. , 1 Онтология задач Онтология ПО Рис. 8.6. Взаимосвязь между онтологиями онтологической системы Машина вывода онтологичес1юй системы в общем случае может опираться на се тевое представление онтологий всех уровней. При этом ее функционирование будет связано: • с активацией понятий ·и/или отношений, фиксирующих решаемую задачу (описание исходной ситуации); • определением целевого состояния (ситуации); • выводом на сети, заключающемся в том, что от узлов исходной ситуации рас пространяются волны ,активации, использующие свойства отношений, с ними связанных. J\ритерием остановки процесса является достижение целевой си туации или длительности исполнения (time-out). , . превьпuение ,, . . . , 292 Гла ва 8 • Предста вл е н ие да н ных и знан ий в Интер нете 8. 2. 3. МетодОЛОГИИ ·СОздания и ссжизненнь1и1.tикn» онтологий Как уже отмечалось выше, разработчики систем, основанных на знаниях, сталки ваются с проблемой .«узкого горлышка• приобретения знаний. Ана,лоrичная про блема существует и при создании онтологий. Но, в отличие от разработчиков интеллектуальных систем, создателей онтолоrIJЙ �дут и дополнитещ,ные про блемы, связанные с отсутствием: сколько-нибудь общих вериф�цированнь1х ме тодологий, определяющих, какие .«процедуры• дол�ны 13ыполнят:ься в процессе разработки и на каких стадиях разработки онтологий они должны выполняться. настоящее время существует лишь несколько предметно-независимых методо логий, ориентированных на построение онтологий [Gruninger et al., 1995; Ushold, et al., 1996; Fernandez et al., 1997]. Следует сразу отметить, что эти подходы и методологии базируются на следую щих принципах проектирования и реализации онтологий, предложенных Грубе ром [Gruber, 1993]: 1. Ясность (Clarity) - онтол�rия должна эффективно передавать смысл вве денных термино в . Определения должны быть объективными, хотя моти вация введения терминов может определяться ситуацией или требования ми вычисл ительной эффективности. Для объективизации определений должен использоваться четко фиксированный формализм, при это� целесообразно задава1ь определения в виде логических аксиом. . . 2. Соlllасованность (t'Qhеrепсе) - означает, ч;о по крайней мере все определения должны быть логически непротиворечивы, а все · утверждения, выводимые в . . . . онтологии, не. должны противоречить акси.омам. 3. Расширяемость (Extendibllity) - онтология должна быт.ъ спроектирована так, чтобы обеспечивать использование разделяем,ы х словарей терминов, допуска ющих возможность монотонного расширения и/или специализации без необ ходимости ревизии уже существующих понятий. . 4 . Минимум влияния кодирования (Minimal encoding blas) - концептуализация, ле жащая в основе создаваемой. онтологии, должца быть специфицирована на уровне представления, а не символьного кодирования. Этот принцип связан с тем, что агенты, разделяI<>щие онтологию, могут б�ть реали�ованы в разцич ных системах представления знаний. 5. Минимум онmол()гuческих обязаmе]lьрпв (Minimal ontological commitment) - он тология должна содер)f(ать :rоль�о на1:1более сущеtтвен�ые предположения о моделируемом ·мире; чтобы оставлять свободу расширения и специализации. Отсюда следует, что онтологии базируются на •р�абых:• теориях, так как цель их создания и использования сQстоит, прежде всего, в том, чтобы «rовориrь� о предметной области, в отличие от БЗ, которые �оrут содержать знания, необ ходимые для решения задач и/или ответов на вопросы:. Методологию и •�зненный цикл• создания онтолощ.й обсудим на примере под хода METHONTOLOGY, разработанного Гомез-Перезом (Gomez-Perez) с колле- ц в , 8.2. Онтологии и о нтологические с истемы 293 rами, в рамках которого реализуются принципы Грубер� ,а ·так�е разрцбоtащэ программное окружение спецификации QН'J'Одоrий ODE. (Pntpl9gy Design Envi· ;, · · · ' · · · ronment) [Blazquez et al., 1998]. В рамках этого подхода выделяются следующие процедуры в •жизненном цик ле• создания онтологии: управление проектом, собственно разработка и поддерж ка разработки. Процедуры управления проектом включают планирование, контроль и гарантии качества. Планирование определяет, какие задачи должны быть выполнены, как они организуются, как много времени и какие ресурсы нужны для их выполнения. Контроль гарантирует, что запланированные задачи выполнены и именно так, как это предполагалось. Гарантии качества нужны для того, чтобы быть уверенным в том, что компоненты и продукт в целом находятся на заданном уровне. Собственно разработка включает спецификацию, концептуализацию, формали зацию и реализацию. Спецификация определяет цели создания онтологии, ее предполагаемое использование и потенциальных пользователей. Концептуали зация обеспечивает структурирование предметных знаний в виде значимой экс плицитной модели. Формализация трансформирует концептуальную модель в формальную или •вычислител�ную• . Наконец, в процессе реализации вычисли тельная модель программируется на соответствующем ЯЗJ,IКе представления зна ний. Процедуры поддерЖIСИ включают действия, выполняемые одновременно с разра боткой, без которых онтология не может быть построена. Они представлены про цедурами приобретения знаний, оценки, интеграции, документирования · и управ ления конфигурациями. Приобретение знаний аккумулирует знания в заданной предметной области. Оценка дает технические решения по оценке онтологии, со ответствующего программного обеспечения и документации как в процессе вы полнения каждой фазы, так и между фазами. Интеграция требуется, когда стро ится новая онтология с использованием уже существующих. Документирование дает детальную, понятную и исчерпывающую информацию о каждой фазе м: про дуКте в целом. Управление конфигурациями необходимо для архивации всех вер сий документации, программного обеспечения и кода онтологии, а также для кон троля за изменениями. Общая схема •жизненного цикла• создания онтологий в рамках подхода MET·· HONТOLOGY представлена на рис. 8.7. Заметим, что процесс построения онтологии здесь распадается на серию подпро цессов по созданию промежуточных пред·с тавлений. При этом выполнение от дельных подпроцессов не последовательное (в смысле •водопадной• модели жиз ненного цикла� обсуждавшейся в предыдущей главе), а определяется полнотой и точностью уже накопленных знаний. Однако, как показывает опыт, сначала стро ится глоссарий терминов ( Gl ossary of Terms), затем деревья классификации концептов (Concept Classificat i on Trees) и диаграммы бинарных отношени� (Binary Relations Diagrams). И только после этого - осталь�ы.е промежуточнЬ!е представления. 294 Глава 8 • Представление данных и знаний в Интернете Концептуализация Построение mоссария терминов Построение деревьев классификации концептов Концептуализация , соответствующая каждому классификационному дереву, состоит в построении: Таблицы бинарных отношений Таблицы атрибутов класса Таблицы логических аксиом / Таблицы констант Таблицы экземпляров Рис. 8. 7. «Жизненный цикл» создания онтологий в рамках подхода MEТHONТOLOGY Для иллюстрации результатов, получаемых на разных этапах создания онтоло гий в рамках подхода METHONTOLOGY, будем предполагать, следуя работе [ Вlazquez et al., 1 998], что предметной областью разработки является сообщество специалистов по приобретению знаний, работающих в контексте инициативы (КА) 2 [ Benj aшins et al., 1 998]. Согласно обсуждаемой методологии. сначала здесь строится глоссарий терми нов, включающий все термины ( концепты и их экземпляры, атрибуты, действия и т. п.), важные для предметной области, и их естественно-языковые описания. Фрагмент такого глоссария представлен в табл. 8.2. Таблица 8.2. Фра гмент глоссария Термин Описание термина Researcher «Он\она является членом Academic Staff, может быть членом иссл едовательской груп п ы и коо п е рироваться с другими ис;следова телями» · Academic Staff «Он\она может быть лектором или исследователем. Одна из воз можных обязанностей - руководство аспира нтами• 295 8,2. •О нтологии и онтологические системы Термин Описание термина Nicola Guarino «Он является исследователем CNR National Research Council. Его исследования свя заны с онтоло гиями . Он работает по проекту OntoSeek• Weight «Вес человека. Изме р яется в килограммах• «• • • • • • • • • • •••••••••• • • • • • • • • • • •••••••••••••••••••• ••••••••» Когда глоссарий термщюв достигает « существенного• объема, строятся деревья классификации концептов. Как правило, при этом используются отношения- ти па subclass-of и не1<0торые другие таксономические отношения. Таким образом, идентифицируются основные таксономии предметной области, а каждая таксо номия, согласно рассматриваемой методологии, дает в конечном счете qнтоло rию. В рам1<ах инициативы (КА)2 идент.ифицировано нес1<0лько та1,сономий, ос новные из которых people, puЬlications, events, organizations и research topics. Фраrменты некоторых из них представлены на рис. 8.8. People Employee Academic-Staff Lecturer Researcher PuЫlcation Article Article-ln-Book Conference-Paper Project Development-Project Software-Project Research-Project Book Joumal IEEE-Expert Student PhD-Student Рис. В.В. Фрагменты таксономий, выделяемых в рамках инициативы (КА) 2 Следующим шагом является построение «Ad hoc• диаграмм бинарных отноше ний, целью создания которых является фиксация отношений между концептами одной или разных -онтологий. Заметим, что в дальнейшем эти диаграммы могут послужить исходным материалом для интеrрации разных онтологий. Пример одной из таких диаграмм приведен на рис. 8.9. Head-of-Group Secretary-of Secretary Cooperate-with Head-of Project Employee Works-on Project Employs Member-of Organiza�on Affiliation Researcher Research-lnterest Research-Topic Рис . 8.9. Фрагмент ди_а гра м мы бинар н ых отношений, выделяемых в рамках инициативы ( КА) 2 296 Глава 8 • П р едставление данных и знаний в Инте р нете После построения представлений, фиксированных выше, для каждого дерева классификации. концептов строятся: 1 . Словарь концептов (Concept Dictionary), содержащий все концепты предмет ной области, экземпляры таких концептов, атрибуты экземпляров концептов, отношения, источником которых является концепт, а также (опционально) си нонимы и акронимы концепта. Фрагмент такого словаря представлен в табл. 8.3. 2. Таблица бинарных отношений (ТаЫе of Binary Relations) для каждого «Ad hoc� отношения, исходный концепт которого содержится в классификационном де реве. Для каждого отношения фиксируется его имя, имена концепта-источни ка и целевого концепта, инверсное отношение и т. п. характеристики. Пример двух таблиц этшо типа представлен в табл. 8.4, 8.5. 3. Табрица атрибутов экземпляра (Instance Attribute ТаЬlе) для каждого эюемп ляра из словаря концептов. Основные характеристики здесь следующие: имя атрибута, тип значения, единица измерения, точность, диапазон изменения, значение «по умолчанию�, атрибуты, которые моrут быть выведены с исполь зованием данного, формула или правило для вывода атрибута и др. Пример описания атрибутов экземпляра W eight показан в табл. 8.6. 4. Таблица атрибутов класса (Class Attribute ТаЬlе) для каждого класса и�1 слова ря концептов с аналогичными характеристиками.. 5. Таблица логических аксиом (Logical Axioms ТаЫе), в которой даются опреде ления концептщз через всегда истинные логические выражения. Определение каждой аксиомы включает ее имя, естественно-языковое описание, концепт, к которому аксиома относится, атрибуты, используемые в аксиоме, логическое выражение, фо.р мально описывающее аксиому, и др. Пример описания аксио мы приведен в табл. 8.7. 6. Таблица констант (Constants ТаЬlе), где для каждой константы указывается ее имя, естественно-языковое описание, тип значения, само значение, единица и�1мерения, атрибуты, которые могут быть выведены с использованием данной константы, и т. п. 7. Таблица формулы (Formula ТаЬlе) для каждой формулы, включенной в таб лицу атрибутов экземпляра. Каждая таблица этого типа, помимо собственно формулы, должна специфицировать ее имя, атрибут, выводимый с помощью этой формулы, естественно-языковое описание, точность, ограничения, при ко торых возможно использовать формулу, и др. 8. Деревья классификации атрибутов (Attribute Classification Trees), которые гра фически показывают соответствующие атрибуты и константы, используемые для вывода значения корневqго атрибута и формулы, применяемые для этого. По сути дела, эти деревья используются для проверки того, что все атрибуты, представленные в формуле, имеют описания и ни один из атрибутов не пропу щен. 9. Таблица экземпляров (Instance ТаЫе) для каждого входа в словарь концептов. Здесь специфицируется имя экземпляра, его атрибуты и их значения. Пример фрагмента таблицы экземпляров представлен в табл. 8.8. 297 8.2. Он тологии и онтоло гические системы таблица 8.3. Фрагмент словаря концептов Имя концепта Атрибуты аuеммяра Экаеммяр S upervlses Academlc-Staff Has-PubUcations Age First- Name Last-Name Photo Weight Editor-of Person Researcher Cooperates-with Research-lnterest MemЬer-of-Research-Group Gomez-Perez Таблица 8 . 4 . Ф рагмент описания отношения Employs Имя отношения Employs Исходный концепт Organization Кардинальность Целостный концепт ( 1 , n) Employee Математические свойства Инверсные отношения Affiliatlon Ссылки Таблица 8.5. Фрагмент описания отношения Affillation Имя отношения Affiliation Исходный концепт Employee Кардинальность Целостный конце пт ( 1 , n) Organization Математические саойства Инверсные отношения Employs Ссыпки Таблица 8.6 . Фрагмент оnисания атрибутов экземпляра Weight И мя атрибута экэемnляра Weight Тип значения Mass-Quantlty Единица измерения Kilogram Точность 0 .00 1 Диапазон (0, 200] Значение •По умолчанию• Кардиналы-юсть Выводится из атрибута экземпляра Выводится из атрибута класса Выводится из констант Формула · Отноwе ние (1 , 1 ) 298 Таблица Глава 8 • Представление данных и знан ий в Инrерн.ете в. 7 . Фрагмент оп исания аксиомы The-Head-Of-Project-Wor�s-ln·Тhe-Project Имя аксиомы The -Head•Of- Project-Works-ln �Тhe-Project Описание «Работн ик, явл яющийся руководителем проекта, работает в проекте» Кон цепт Employee Ссылочные атрибуты Переменные Определение Е, Р , Forall (Е. Р) Employs ( Е) and Head -Of-Project (Е, Р) � Works-At-Project ( Е, Р) Таблица В.В. Фрагмент таблицы экземпляров Э кзе мпл яр Атрибут Значение Gomez-Perez Ful\ Name First Name Last Name E-Mail «Asuncion Gomez-Perez» «Asuncion" «Gomez-Perez» «asun@fi. upm.es» Как поrсазывает анализ приведенных выше процедур, выполняемых при создании онтологий в подходе MEТHONTOLOGY, все они хорошо коррелируют с теми стадиями, которые выделены и используются при построении баз знаний. И это не случайное совпадение, а закономерность, связанная с тем, что онтология - это, по существу, БЗ специального вида. Поэтому, ка1< и в случае построения баз зна ний, здесь используется концепция быстрого прототипирования, а специфю<а проявляется в тех 1юш<ретных процессах, которые реализуют рассмотренные выше процедуры. При этом: • планирование выполняется до начала собственно разработки; • контроль и гарантии качества осущt)С�Вляются в процессе разработки;· • большая часть операций по на1<оплению знаний и их оценке выполняется на стадии I<онцептуализации для того, чтобы предотвратить распространение ошибок на фазу реализации; • интеграция не должна рассматриваться как интеграция на стадии. реализации. Напротив, она выполняется в процессе разработки. 8 . 2 . 4 . Примеры о н т ологий В настоящее время исследования в области онтологий и онтолоrичес,ких систем являются •Горячими точками� не только в ИИ, но и в работах по интеллектуали зации информационного поиска, в первую очередь, в среде Интернет; в работах по мультиаrентным системам; в прое1<rах пь автомати_ческому •извлечению• Зf(а1шй из текстов на естественном языке; в проектах, ведущихся в смежных 6бJ,Iас тях. 8.2. Он:т�лоrии и он тологические системы 299 При этом разные авторы вводят различные типизации онтологий [Gruber, 1 995; Guarino, 1996], суммируя которые можно выделить классификации по: • степени зависимости от конкретной задачи или предметной области; • уровню детализации аксиоматизации; • -«природе• предметной области и т. д. Дополнительно к этим измерениям можно ввести и IUiасснфикации, связанные с разработкой, реализацией и сопровождением онтологий, но та1<:ая типизация бо лее уместна при обсуждении вопросов реализации онтологических систем. По степени зависимости от конкретной задачи или предметной области обычно различают: • онтологии верхнего уровня; • онтологии, ориентированные на предметную область; • онтологии, ориентированные на 1юнкретную задачу; • прикладные онтологии. Онтологии верхнего уровня описывают очень общие концепты, та�ше ка1<: про странство, время, материя, объект, событие, действие и т. д., которые независимы от конкретной проблемы или области. Поэтому представляется разумным, по крайней мере в теории, унифицировать их для больших сообществ пользовате лей. Примером такой общей онтолоrиии является СУС® [Lenat, 1995]. Одноименный проект - СУС® - ориентирован на создание мультиконтекстной базы знаний и специальной машины вывода, разрабатываемой Cycorp. Основная цель этого ги гантского прое1<:та - построить базу знаний всех общих понятий (начиная с та1сих, как время, сущность и т. д.), включающую семантическую структуру терми нов, связей между ними и аксиом. Предполагается, что такая база знаний может быть доступна разнообразным программным средствам, работающим со знания ми, и будет играть роль базы -«начальных знаний•. В онтологии, по некоторым данным, уже представлены 106 концептов и 105 аксиом. Для представления зна ний в рамках этого прое�та разработан специальный язык CYCL. Другим примером онтологии верхнего уровня является онтология системы Gene railized Upper Model [Braetman et al., 1994], ориентированная на поддерж1су про цессов обработки естественного языка: анrлийс1соrо, немецкого и итальянс1юrо. Уровень абстра1щии этой онтологии находится между лексическими и концепту альными знаниями, что определяется требованиями упрощения интерфейсов с лингвистическими ресурсами. Модель Generalized. Upper Model вкл�чает таксо номию, организованную в виде иерархии концептов (около 250 понятий) и от дельной иерархии связей. Фрагмент системы понятий этой онтологии приведен на рис. 8. 1 0. В целом же можно констатировать, что, несмотря на отдельные успехи, создание достаточно общих онтологий верхнего уровня представляет собой очень серьез ную задачу, которая еще не имеет удовлетворительного решения. 3 00 Глава 8 • П р едставление данных и знаний в Инте р нете Um-thing Sequence Expanding& Sequence Saying&Sensing Participant Рис. 8 . 1 О. Фрагме нт систе мы понятий онтологии Generalized Uрр ег Model Предметные онтологии и онтологии задач описывают, соответственно, словарь, связанный с предметной областью (медицина, коммерция и т. д.) или с конкрет ной задачей или деятельностью (диагностика, продажи и т. п.) за счет специали зации терминов, введенных в онтологии верхнего уровня. Примерами онтологий, ориентированных на определенную предметную область и конкретную задачу, являются TOVE и Plinius соответственно [TOVE, 1999; Van der Vet et al., 1994]. О нтология в с цстеме TOVE (Toronto Virtual Enterprise Project) [TOVE, 1999] предметно ориентироnана на представление модели корпорации. Основная цель ее разработки - отвечать на вопросы пользователей по реинжинирингу бизнес процессов, извлекая эксплицитно представленные в онтологии знания. При этом система может проводить дедуктивный вывод ответов. В онтологии нет средств для интеграции с другими онтологиями. Формально онтология описывается с помощью фреймов. Таксономия понятий онтологии TOVE представлена на рис. 8. 1 1 . Прикладные онтологии описывают концепты, зависящие как от конкретной предметной области, так и от задач, которые в них решаются. Концепты в таких онтологиях часто соответствуют ролям, которые играют объекты в предметной области в процессе, выполнения определенной деятельности. Пример такой он тологии - онтология системы Plinius [Van der Vet et al., 1 994], предназначенная для полуавтоматического извлечения знаний из текстов в области химии. В от личие от других, упомянутых выше онтологий, здесь нет явной таксономии понятий. Вместо этого определено несколько множеств атомарных концептов, таких как, например, химический элемент, целое число и т. п., и правила конст- 8.3: Системы и средства представления онтоло гических знаний 301 руирования остальных концептов. В онтолоr и и описано около 1 50 концептов и 6 правил. Фо рмально онтология Pliпius тоже оп.исывается с помощью фреймов. Organization-Entity Organlzation-lndivldual Employea Organization-Group Contractor Department Рис. 8. 1 1 . Фрагме_нт таксономии понятий онтологии.ТОVЕ Как показывает анализ работ в этой области, научными сообществами и колекти вами создаются онтологии разных типов, но в целом в настоящее время наиболее активно разрабатываются и используются на практике предметные онтологии. Вместе с тем, независимо от типа онтологии, для их представления и использова ния требуются tпеци альные алгоритмические средства, к обсуждению которых мы и переходим в - следующем параграфе. 8 . Э . Системы и средства предстаliп�ния онтологических ·знаний 8.3 . 1 . Основные подходы В настоящее время во всем мире исследоваnия цо пространствам знан и й в среде Интернет [Khoroshevsky, 1 998] ведутся широким фронтом. И одним и з ключевых аспекТ9в в таких исследованиях являются алгоритмические и программные сред ства представления онтологических знаний и работы с онтологиями. В качестве примеров исследовательских проектов по данiiой темат и ке можно указать Co-operative 1nformation Gathering Project из лаборатор и и Расriределен ноrо ИИ универси;ета Мас-сачусет; проект экстрактирования знаний из rипер• текстов на основе использования методов мащинноrо обучеm1я, выполняемоrо в университете Карнеrи ' Мэллон; работы Knowledge Technology Group лаборато рии Sun Mictosy-stems по технологии обработки знаний (проект •Precision Con tent Retrieval� ), целью которого являеrся построение концептуальной таксона- 302 Глава 8 • Представление данных и знаний в Интернете мии фраз, выделяемых из индеI<сированных материалов; и мноrие другйе [ Lesser et al., 1998; Lнke et al., 1996; Woods et al., 1 999] . Общей цел�,ю практически всех таких проектов является разработка новых подходов к построению пространств знаний и средств работы с ними, tде бы обеспечивались: • использование семантики для управления процессом ответа на запросы; • возможность построения ответов с хорошо определенной семантикой и про� стым с1шта1<сисом, которые могли бы быть <,поняты» I1 обработаны программ ными агентами или другими программными средствами; • возможность гомогенного доступа к информации, которая физически распределена и гетерогенно представлена в Интернете; • получение информации, которая явно не присутствует среди фактов, полученных из сети. но может быть выведена из других фактов и базовых знаний. Впечатляющая коллекция ссылок на такие проекты представлена в Интернете по адресу l1ttp://www.tzi.org/grp/iЗ/, но наиболее интересными с точки зрения темы данного раздела, по-видимому, являются иниц«атив.а ( КА) 2 [Benjamins et al;, 1 998 ] и проект SHOE [Hefliн et al., 1 998] , которые и обсуждаются ниже. 8 . 3 . 2. И нициатива (КА) 2 и инструментарий Ontobroker Аннотация знаний в рамках инициативы (КА) 2 Аннотация знаний сообществом приобретения знаний (Knowledge Annotation Initiatine of the Knowledge Acquisition Community) - так расшифровывается аббре виатура (КА) 2 • Целью работ по этому международному проекту является, в ко нечном счете, интеллектуальный поиск в среде Интернет и автоматическое на1щпление новых знаний. В рамках инициативы ( КА) 2 выделяются три основных направления исследований: • онтологический инжиниринг ( ontological engineering); • аннотация WеЬ�страниц; • запросы к информации на WеЬ·страницах и вывод ответов на базе онтологических знаний. Онтологический инжиниринг - одно из основных направлений, в рамках кото рого предполагается, что сообщество (КА) 2 должно создать свою собственную и достаточно общую систему онтологий на основе использования средств Onto lingнa [ Farqнhar et al., 1 996] . В настоящее время уже разработщю воесем ь онтоло гий, которые могут рассматриваться 1<ак разделы общей онтологии - онтоло гия организации (organization oнtology), проекта (project ontology), личности (person ontology), направления исследований (research-topic ontЬ\ogy), публика ций (pнЫication ontology), событий (event ontology), исследовательских про1 8.Э. Си сте мы и средства п редставле ни я о н тологических з н аний 303 д'уктов (resea,rch-product ontology) и исследовательских групп (research-group ontology). При этом разработка примеров онтологий осуществля.ется и упраВ:Ля ется участнцками проекта - так называемы м и провайдер-а гентами ( �provider agents» ), а размещают ся эти онтологии на их WеЬ-страницах . Та1ше страницы аннотируются с использованием нового типа НТМL-те гов (ONTO), информа• ция в пределах которых обрабатывается специальной 1юмпонентой, работающей на основе онтологий, - системой Ontocrawler. рамках этой I<ОМПОНенты, в за висимости от �богатства» используемой онтологии, может вь1водиться новая информация, релевантная запросам, но не присутствующая явно на W еЬ-стра ницах в сети Интернет. в Сама система Ontocrawler разрабатывается в рамках отдельно го прое1<Та инициа тивы ( КА) 2 - проекта Ontobroker [Fensel et al., 1 998] , который, собственно, и интересен с точки зрения обсуждения средств представления и обработки онто ло г ических знаний. Средства спецификации онтологий в проекте Ontobroker В Ontobroker имеются три основные подсистемы: интерфейс формулирования запросов (query interface), машина вывода ответов (inference engine) и собствен но машина доступа к Интернет-ресурсам - •червяк• ( Webcrawler), используе мы й для накопления требуемых знаний из этой среды. Для спецификации онтологий разработан специальный язык представления зна ний. Подмножество этого языка сл ужит и для формулировки запросов, а язык аннотирования - для •обогащения • WеЬ-до1<ументов онтоло гичес1юй информа цией . Все эти компоненты и обсуждаются ниже. Форм8JIИ3м запросов Формализм запросов ориентирован на фреймовое представление онтологий, в рамках которого, как и обычно, определены понятия экземпляров, классов, атри бутов и значений. Схема O:C[A->>V] означает, что объект О является экземпляром класса С с ат рибутом А, имеющим значение ,V. Важно, что в каждой позиции такой схемы мо гут исп ользоваться не толькс;> константы, но и переменные или выраж7ния. Для примера, запрос вида FORALL R <- R : Res�a rche r предполагает поиск всех о�ъек:rов, являющихся экземплярами класса Researchei:. Если предположить, что идентификатором объекта служит URL домашней стра ницы специалиста, в качестве результата по этому запросу будет выдан список соответствующих Интернет-ссылок Понятно, что ЭТQ простейший запрос. Обычно же в зщ�росе определяется поиско вый образ объектов, обладаюших определенными свойствами. Tar<, если н еоб х о димо найти всех специалистов по фамилии Иванов и при этом выдать в качестве 304 . Гла ва 8 • Пр едстаВЛ!ЭНИе дан ных и �наний в Интернет е результата их имена и электронные адреса" то приведекнwй выше аапрос М0Жно модифицировать следующим образом: . FORALL Obj , FN , ЕМ < 1 ' b bj; : Resea rche r [ fi rstName � »FN ; lastName- .» " Ивaнoв " ; email-»EM ] . В качестве ответа при этом могут быть получены значения переменных: Obj = htt p : //www . anywhere; ru/� ivanov/ FN = И в ан Е м · = mailto : i vaaov@anywhere. r u · Имеются в языке Ontobroker и средства вывода значен и й свойств. Так, некоторые из атрибутов объекта могут задавать отношения, с:войства коюрых известны машине вывода. Для примера, в запросе вида FORALL O bj , CP <O bj : Resea rche r [ lastName -» " И в a н o в " ; . cooperatesWith - »CP ] , атрибут cooperatesWith является - отношением, обладающим свойством симмет ричности. Это означает, что даже если у объекта, описывающего специалиста по фамилии Иванов, свойства cooperatesWith нет, Ontobroker выведет�его, если в онтологии представлен объект; описыi:J'ающий другоr6 специалиста, который имеет такое свойство со значением •Иванов•. В рассматриваемом языке представления онтологических знаний присутствуют и другие правила вывода значений атрибутов, эксплицитно не представленных в WеЬ -документах. При этом понятно, что язык запросрв Ont6broker может ис пользоваться и для формирования репозиториев с информацией, удовлетворяю щей заданным ограничениям . И более того, с помощью запросов можно получать и метаинформацию: запрос вида FORALL Att , Т <- Resea rche r [ Att=>>T] вернет в качестве- результата имена всех атрибутов класса Researcher и связанных с ним классов. В самой системе Ontobroker поддерживаются два типа интерфейсов при формиi. ровании запросов - текстовый (дл·я экспертов) и графический (для пользовате лей). Первый из них предполагает, что запросы формулируются непосредственно во входном языке описания онтологий. Понятно, что при этом знание синтаксиса языка Ontobroker и знакомство с онтолоmей, для которой запрос формулирует ся, должны у эксперта присутствовать. Проблема знания синтаксиса решается в данном случае, как, впрочем, и в - боль шинстве других инструментальных средств нового поколения, за счет диалогов, управляемых систе�ой (system-driven dialogue). Пользователю выдается соответ- 8:3. Системы и средства nредставления онтологv�ческих з нан ий SO& сrвующая панель; где. могут быть определены (путем выбора из меню) компонен ты запроса и связки между ними. Такой подход- обеспечивает си нтаксичесtсуЮ корректность и одн означ н ость интерпретации запроса. Сложнее преодолеть разрыв в знани ях эксперта и польз ователя, особенно нович ка, об используемой онтологии. Ведь для правильной формулировки запроса не обходимо знать , по крайней мере, какие концепты в онтолоrии присутствуют и какие атрибуты имеются у концептов. Поэтому все системы представлени я онто логических знаний предоставляют своим пользователям средства виуализации онтологий и навигации по онтологии. В Ontobroker для визуализации онтологий и спользуется подход, основан н ый на идеях гиперболической геометр и и ( HyperЬolic Geometry) (Lamping et al., 1 995]. В случае обсуждаемой системы эти идеи реализуются следующим образом: класс, интересующи й пользователя в данный момент, представляется сбольцшм шаром•, а классы, с ним непоср едстве нно связанные, - •маленькими шарами• и располагаются по границе круга, сочерчивающеrо• соответствующий слой. Ис пользуя данный интерфейс, и эксперт и пользователь могут легко и эффекmвно включать в свой запрос нужные концепты и и х атрибуты, а система Ontobroker переведет их в текстовое представление автоматически. Реализован интерфейс онтологий Ontobr.oker как Jаv�апплет, что обеспечивает работу с WеЬ-броузе рами на любых платформах, где поддержи вается Jаvа-технолоrия. Формап·иэм nредставпения и машина вывода Как уж е отмечалось выш е, онтология о пределяется через концепты (классы), связанные отношен иями, атрибуты и аксиомы. И адекватный язык прещ:::тавле ния должен обеспечить удобные средства для описания всех перечисленных компонентов. В Ontol,jfoker базисом представления являются так называемые ·· логики фреймов ( Frame-Logic) [Кifer et al., 1 995). Базисными 15онструкциями в данном подходе являются: • П одклассы ( S ubclassing) - запись С1 : : С2 означает, что класс С1 является подклассом С2. • Экземпляры Onstance of) - запись О : С означает, что О является экземпля ром класса С. • Декларации атрибут� (Attribute Declaration) - з апись Ct [A=>>C2] означа ет, что для экземпляра класса С1 определе н атрибут А, значен и ем которого дол�ен быть экзе мпляр С2. • Значения атрибутов (Attribute Value) - зап и сь O[A->>V] означает, что эк земпляр О имеет атрибут А со значением V. • Часть-целое ( Part-of) - запись 01 <: 02 оз начает, что 01 является частью 02. • Отношения (Relations) - предикаты вида р(а1 , ... ,а2) могут использоваться, как и в обычных логи ческих формализмах, но с тем расширением, что в каче стве аргументов здесь могут выступать не только термы, и выражения. н·о 306. Глава 6 • Представление .данных и знаний в И,1;1тернет�. Из базисных констру�ц�й стр9ятся брл;е е с,ложные - фа кты (fa�ts), цра1ЩJ1 а. ( r.u les) 1 •двойные• правИJtа (dоuЫе rules) и запросы (queries). Зацро.сы уже о.б�ужда лись _выше. Фа�ты, по сути, являются элементарными выражениями, Правила, как и обычно, имеют левую и правую части, причем лева.я часть ( здесь она называется сголовой• ) является конъюнкцией элементарных выражений, а правая ( стело• ) -- сложна.я формула, термами которой· являются -элементарные выражения, связанные обыч ными предикатными символами типа implies: -> , implied Ьу: <-, equivalent: <->, AND, OR и NOT. Отличие между обычными и •двойными�> правилами в симметричности последних. Важное достоинство формализма - возможность использования переменных в сrолове• правил (с квантором FORALL) или в его •теле• (с кванторами FORALL EXISTS) .' Пример фрагмента онтологии в формализме Ontobroker, адаптиров·а нны й из работы [ Fensel et al. , 1 998] , приводится ниже. и· Опред еления атрибуто в P e r so n [ f i rstN ame =>> STRING ; last Name =>> STRING ; eMa i l => > STRING ; puЬl icat ion =>> P u Ы i cation ) . Employee [ af f i l i at i o n = » O rgan izat ion ; . . . ] . Re sea rc h e r [ resea rc h i n t e rest =>> Resea rchTopic ; mem be rOf =» Resea rchG rou p ; coope rat esWit h. =» Resea rch e r ] . P u Ы i cat ion [ a u t ho r =>> Pe rson ; t i t l e =>> STRING ; уеа r =» NUMBER ; abst ract = » STRING ] . Пр авила FORALL Pe rso n 1 , Pe rson2 Pe rson 1 : Rese a rc h e r [ coope ratesWith -» P e r so n 2 ] <Person2 : Resea rche r [ coope ratesWi t h .-» Pe r so n 1 ] . FORALL Pe rson 1 , P u Ы icat i o n 1 PuЫ icat i o n 1 : P u Ы ication [ a u t ho r ->> Pe rson 1 ] <-> P e r s o n 1 : Pe rson [ pu Ы ication -» P uЫ ication 1 ] . По-видимому, в пояснениях здесь нуждаются только правила. Первое из них фиксирует симметрич ность отношения cooperatesWith . Второе утверждает, что если конкретная личность (экземпляр класса Person) имеет публикацию, то по следняя имеет автора, который тоже является экземпляром класса Person, и об ратно. В·. З·. Си стемы и с редства предста вл ени я о н тол ог ичес ких знан ий 307 Машина вывода Ontobroker состоит из двух основных компонентов: транслятора с расширенного язь1:ка представления в ограниченный и собственно вычислителя выражений ограниченного языка, который является обычным языком логическо го программирования. , Аннотация WеЬ-страниц онтол оrическоА инфор м аци ей Пос1<олы<у-, как уже отмеча.ilось выше, WеЬ-иtiформация чаще всего представле на на языке HTM L, в рщках проекта Ontobroker разработано простое его расши рение для аннотации WеЬ-страниц . Основная идея этого расширения состоит в следующем: в �зь1к HTM L. добавлено несколько релевантных для решения по� ставленных заµач тегов, использование которых позволяет Ontobroker ин терпретировать аннотированные фрагменты НТМ L- текста как факты языка представления онтологических знаний. При этом WеЬ-страницы остаются при емлемыми для стандартных броузеров типа Netscape Navigator или MS Explorer; В язык введены три эпистемолоrически различных ·примитива: • Идентификация объекта, который может быть определен как экземпляр определенного класса, с помощью URL. • Установка значения атрибута ·объекта. • Определение отношений между объектами. Все примитивы синтаксически расширяют тег <а . . . > языка HTML. Tai<, напри мер, если специалист Иванов захочет определить себя как объект обсуждавшей ся выше онтологии, он может на своей домашней странице ввести конструкцию вида: <а o n t o = ·· ' " h t t p : //www . a n ywhe re . ruГ i va n ov;·· : Resea rch e r '" > </а> Теперь для объекта Иванов класса Researcher можно ввести атрибут email и его значение с помощью следующей конструкции: <а ont o = '" " h t t-p : //www . anywhe re . ruГ ivanov/ "' [ e ma i l = " mailto : ivanov@anywh e re . r u '" ] "" > </а> Аналогичным образом вводятся и отношения: <а on t o = '" R E L ( Obj 1 , Obj 2 , ОЬj З , . . . , O bj n ) '" > . . . </а> Имеются в языке и средства, которые обеспечивают уменьшение сложности ан нотирования: напр имер, возможности именования •длинных• конструкций и последующего использования этих имен . • f При таком подходе Ontocrawler - компонент системы O ntobroker � простой СGl -скрип:r, который периодически проверяет аннотированные страницы на Web. Для поиска таких страниц он обращается к и ндексным страницам провай деров, которые зарегистрированы в рамках инициативы (КА) 2 . 308 Глава 8 • Представление данных и знаний в И нтернете_ а.э.з_. f'lроект SHOE 1 i ' • '• - сп,цификаци.я 011топ9tиi и и нструментарии .: ,•. ,, : • 1 j , ' . . ). ':...,. . : . 1 1 ; • : • •• • • �' : .; • , • • �� , • Общая хар�ктеристика проекта Проект SHOE (Simple HTML Ontology Extensions) ориентирован иа решение про блемы добав,/Iения к WеЬ-страницам семантической информации и соотнесения ее с онтолрrиями соответствующих предметных областей. Предполаrается, что, использ уя �ту информацию, поисковые системы смоrут о(>еспечивать боле е реле вантны е ответы на .запросы, чем это возможно сейчас на базе использования ма шин поиска, функционирующих в Интернете. Для поддержки процессов аннотирования в рамках µрое:кта SHOE разрабатыва ется спе циальный набор инструментальных средств (suite of tools), а осново й цх является язык Интернет-совместимо:�;о представлен11Я знаний, который, собствен но, и дал название всему прое:кту. В настоя•цее время в проекте SHOE выделены следующие rлавные направления исследовани й : • Разра,5 отка множества п овторно используемых онтолоrий ( reusaЫe ontolo gies) для ко нцептов, которые наиболее час·тотны для W еЬ�р есурсов. • Создание средств проектирования онтолоrий - аннотаторов знаний ( Knowledge Annotator), которые бы упростили этот процесс. Предполаrается также, что в SНОЕ-инструментарий будет включена <1:Неслож ная� обработка естественного яз�1ка (lightwei ght natural language processing te chniques), которая обеспечит представление пользователям аннотаций до1<умен тов. Спецификации онтологий и инструментарий SHOE В данном подразделе мы сосредоточимся не столько на самих онтолоrиях, разра батываемых рамках прое кта S H O E [Luke et al., 1_996], сколько на языке пред ставления онтологических знаний и средствах подде ржки процессов проектиро вания онтологий. в Формализм представления и машина вывода Следует сразу от�етить, что SHOE по своей идее близок к уже обсуждавшейся выше инициативе ( КА) 2 • Но концепция языка представления знаний здесь дру гая, хотя и она лежит в русле расширения HTML специальными тегами. А основ ное отличие языка SHOE в том, что здесь, по существу, предлагается <1:пол н омасш табное� расширение HTML. Для этого S H O E вводит в НТ_М L-стандарт следую щ ие новые теги для сп е ц ификации онтологий : ONTO LOGY, USE ONTO LOGY, DEF-.CATEGORY, DEF� R ELATIO N , b EF�ARG., D EF- R ENAM E, D EF- CO N STANT, DEF-ТYPE, DEF- I N FERENCE, I N F-I F, I N F-TH EN , COMPARISO N , CATEGORY, RELATIO N , ARG и некоторые другие. Для аннотирования НТМL-документов ис- 8.3. Систем ы и средства пр едставления онтологических знан ий 309 пользуется частьJ1з уже перечисленных тегов и, кром е того, вводятся новые, на· пример I NSfANCE. И наконец, в SHOE вводится метатеr вида < М ЕТА HТТP EQUIV = . . . ">. Для определенности в рамках спецификации языка SHOE предполагается, что онтология представляется в виде is_a и е рархии ·классов/категорий, множества атомарных отношений между категориями и множества правил вывода в форме простых клауз Хорна. Термами языка являются термы HTML и дополнительно к этому понятия Cate gory (Class), Data (причем с типами STRING, NUMBER , DATE, TRUTH ) , Element, ln stance, lnstance Кеу" Name, Ontology, Relation (Re/ati,onship), Rule и некоторые дру гие. Декларации онтологий задаются внутри тела НТМL-документа и не могут п ере крываться с другими тегами HTML. В одном документе может быть определе но несколько онтологий, но такие определения тоже не может перекрываться или быть вложенными. Общая схема определения онтологии следующая: <ONTOLOGY I D= ·· идентификатор- онтолоrии·· VERSION= ·· версия·· [ BACKWARD- COMPAТI B LE-WIТH= ·· список-версий" ] [ DESCRI PТION=·· тeкcт"" ] [ DЕСLАRАТОRS=" список-деклар. -экземпляров" ] > с об с тв е нн о -д е кл а р аци я - о н толо гии </ONTOLOGY> Для указания тorq, что данная онтология расширяет друrую, уже существующую, используется специальный тег: 11 • <USE- ONTO LOGY ID=·· идентификатор-онтолоrии" VERSION=" версия ·· PREFIX= "" префикс" [ UR L= "" URL ·• ] > Внутри опр едел ения онтологии могут специфицироваться новые категории, для чего используется специальный тег вида: <DEF-CATEGORY NAME=" имя-ка теrории·· [ ISA= " список-родительских-ка те rорий"' ] [ D ESCRI PТIO N= " тeкcт" ] [ SНОRТ= "текст" ] > Аналогичный подход применяется и для определения отношений: <DE F - R E LAТION NAME= ·· имя -отношения " [ DESCRI PТION=·· тeкcт" ] [ S НОRТ= " текст"' ] > с пи с о к-а р гуме н то в </DEF- R E LAТI ON> Возможно определение тех же понятий и с помощью тега ONТDEF с парамет рами. 31 0 Глава 8 • Представление данн ых и знаний в И нтернете Одним из важнейших компонентов определения онто.1щrии �вляются правила вьпnща. В SHOE такие -правила •похожи• на XopнoвcKUf!' l(Jlayзы по сути, но от личаются от них по форме: <DEF-IN FERENCE [ DESCRIPТION= . . тeкcт.. ] > <INF- I F> те л о </I N F - I F> <INF-THEN> г о л о ва </I NF-THEN> </DEF- IN FERENCE> Для примера, ниже обсуждается фрагмент определения онтологии в формализме S HOE, коррелирующий с уже обсуждавшимся фрагментом определения.-анало rичной онтологии в формализме Ontobroker. Пусть нас интересуют исследователи, .имеющие в Интернете свои домашние стра ницы. Для работы: с такими страницами можно воспользоваться уже существую ще й в р амк,ах S H O E онтологией общих понятий (organization-ontology ver sion 2 . 1 ) по адресу http://www.ont.org/orgont.html. Однако предположим для определенности, что существующую онтологию необходимо расширить понятия� ми Person и Organization. Тогда спецификация фрагмента новой онтологии (Ho mePageOntology) может быть представлена в формализме SHOE следующим об разом: <ONTOLOGY I D=··нomePageOntol ogy" VERSION= .. 1. О .. > <ONTO LOGY- EXTENDS " o rganiza tion-on tology" VERSION = ··2. 1 " PREFIX="org·· U R L= .. h t tp://www. ont . otg/orgon t . html " > <ONTDEF CATEGORY=" Person" ISд=-- org. Thi ng .. > <ONTDEF RE LAТION= .. l astName" ARGS= .. Person STRING.. > <ONTDEF RELAТION=" fi rstName" ARGS= .. Person STRING:'> <ONTDEF RELAПON="marri edTo" ARGS= " Person Person . . > ' <ONTDEF R ELAТION= .. employee .. ARGS= .. org. Organiza ti on Pe rson " > ----................................ . </ONTO LOGY> Аннотация WеЬ-документов на базе онтологий Аннотация НТМ L-документов в S H O E осуществляется также с использованием тегов . В частности, для этого служат тern USE-ONTOLOGY, INSTANCE, CATEGORY, RELATION. Последние три тега имеют следующие форматы: <INSTANCE К Е У= " зна чение-ключа"· [ DELEGATE-ТО= " список-примеров .. ] > ... </INSTANCE> <CATEGORY NАМЕ= " nрефикс . ка тегория .. [ FОR= " ключ" ] > <RELAТION NAME= " префикс . отношение" >сnис о к-а р гу м е нто в </RELAТION> Для поиска и обработки домашних страниц с помощью специфицированной вы ше онтологии необходимо, чтобы: авторы Wе�-публикаций, сами ( или на основе инструментария SHOE) проаннотировали свои документы. 8.3; Системы и средства представления онтологи ческих знаний 31 1 Так, например, фрагмент аннотации персональной страницы исследователя Ива· · · : ;, нова в формализме SHOE выгл:ядит tледующим ,образом: <BODY> <МЕТА HПP.- EOUIV= ·· Ins tance" CONTE NT= " h t tp : //www. anywhere. ruГi vanov" > <USE- ONTOLOGY " HomePageOn tol ogy" VERSION= " 7 . 0" PREFIX= "ou r " U R L= " h t tp : //www. on t . o rg/HomePageOn tol ogy. h tml " > <CATEGORY " our. Pe rson" > <RE LAТION " ou r . fi rs tName" ТО=" Ivan" > < R E LAТION " our. l as tName" TO=" Ivanov" > <RELAТION " our. ma rr1 edTo" TO= " h t tp : //www. s omewhere . ru;·мa r1 ya " > <R ELAТION • " ou r . empl oyee" FROM= " h t tp : //www. cca s . ru " > </BODY> Анализ приведенного НТМL-текста показывает, что даже в таком, казалось бы, простом случае задача аннотации W еЬ-документа достаточно сложна. Ситуация становится еще более сложной при аннотировании реальных НТМL-документов. Во-первых, уже выбор объектов текста, подлежащих аннотированию, не три виален, особенно если WеЬ-документ представляет объекты реального мира. Во вторых, гиперссылки часто фиксируют лишь наличие определенных отношений между объектами, но ·не их семантш<у. И наконец можно, конечно, аннотировать каждую именную группу в естественно-языковом представлении НТМL-страни цы, но для реальных документов это слишком трудоемкая задача, которая к тому же чревата большим количеством ошибок Поэтому в рамках проекта SHOE для автоматизации процессов аннотирования WеЬ-документов разработана спе ц иальная система Knowledg e Annotator [КА, 1999 ], одна из экранных форм 1<оторой представлена на рис. 8. 12. Рис. 8 . 1 2 . Экранная форма системы Knowledge Annotator 312 Глава 8 • Представление данных и знани й в И нтернете Основными информационными блоками в приведенной выше экранной форме являются экземпляры (instances), онтологии (ontologies) и утверждения (claims). Пользователь может добавлять, редактировать и/или удалять любой из элемен тов этих блоков. При создании новых объектов пользователю выдаются соответ ствующие подсказки в виде, например, списка доступных онтологий, описанных в них категорий, отношений и т. п. Для визуализации знаний, содержащихся в обрабатываемом документе, Know ledge Annotator использует различные методы, начиная с аннотированного НТМL-текста и заканчивая описаниями утверждений на естественном (англий ском) языке. Кроме того, система осуществляет проверку корректности действий пользователя и транслирует его выборы в синтаксически правильные конструк ции SHOE. Фор м али зм запросов В настоящее время существуют различные примеры языков запросов к докумен там, проаннотированным на основе формализмов SHOE, рассмотренных выше. Так, в университете Мэрилэнд (University of Maryland at College Park) разрабо тан робот Expos, который обрабатывает SНОЕ-документы и добавляет их в свою базу знаний, испол ьзуя систему представления знаний PARKA [Stoffel et al., 1997]. Пример РАRКА-запроса для поиска домашних страниц может быть специфици рован следующим образом: ( q ue ry ! " ( : and ( # ! i nstanceOf ?Х # ! Pe rson ) ( # ! i nstanceOf ?У # ! Pe rson ) ( # ! i nstanceOf ?Z # ! O rgan ization ) ( # ! lastName ?Х " Ivanov" ) ( # ! last Name ?У "Ivanova ·· ) ( #! employee ? Z ? Х ) ( # ! employee ? Z ? У ) ( # ! ma r r iedTo ? Х ?У ) ( # ! i nvolvedi n ?Z " РФФИ-проекты" ) ) ) По существу, это достаточно простой SQL-зaпpoc, расширенный за счет исполь зования понятий онтологии, переменных и ограниченных по мощности образцов. Оценивая формализм представления онтологических знаний SHOE и поддержку процессов аннотирования WеЬ-ресурсов в этом проекте в целом, можно конста тировать, что это достаточно мощная система методов и средств, которая вместе с тем сложнее для пользователя, чем Ontobroker. 8 . 3 . 4 . Другие подходы и тенденции В заключение настоящего параграфа необходимо, хотя бы в общих чертах, рассмотреть усилия World Wide Web Consortium (WЗС) по созданию и внедрению средств маркировки Интернет-ресурсов. До недавнего времени в распоряжении Интернет-авторов для этого почти исклю чительно использовался уже обсуждавшийся выше язык HTML. Однако с точки 8.3. Системы и средства представления онтологических знани й 313 зрения семантической разметки Интернет-документов этот язык обладает рядом недостатков, основными среди которых являются следующие [Johnson, 1999]: • жесткая ориентация на визуализацию; • единственцая -гточка зрения» на данные; • нерасширяемость; • весьма ограниченные средства спецификации семантической структуры документов. Справедливости ради следует заметить, что еще в конце 60-х годов в рамках ис следований по представлению документов компанией I BM был разработан язык SGML (Standard Generalized Markup Language), который лишен многих из пере численных недостатков. К середине 80-х годов этот язык стал стандартом для многих промышленных компаний и правительственных учреждений США, но, по мнению специалистов рабочей группы SGML WЗС [Bosak, 1997], он слишком сложен для широкого использования Интернет-авторами. Вот почему в рамках WЗС, начиная с 1996 года, предпринимаются усилия по разработке средств раз метки документов, сравнимых по мощности с SGML, а по простоте использова ния - с HTML. И среди работ данного направления в первую очередь следует отметить язык XML ( eXtensiЫe Markup Language) [XML, 1998]. В языке XML -гсняты� многие ограничения HTML, язык разметки стал суще ственно мощнее. И одновременно ХМL-тексты остаются понятными для всех, кто работал с языком HTML. Отличительные свойства XML и в том, что здесь фикси руется стандарт на определение синтаксиса и единообразные средства введения в языки разметки (Markup Language) новых тегов. А это, в свою очередь, позволяет конструировать на основе XML новые языки маркировки WеЬ-документов и, кроме того, обеспечивает возможность различным приложениям (и, в частности, программным агентам) -гпонимать» и обрабатывать ХМL-документы. Каждый ХМL-документ обладает определенной логической и физической струк турой. Физически это композиция элементов, называемых единицами (entities), которые могут быть связаны взаимными ссылками. Логически документ состоит из деклараций, единиц, комментариев, собственно текстов и инструкций обработ ки, причем каждая конструкция XML маркируется специальными тегами явным образом. Все теги XML - парные, а конструкции могут быть вложены друг в дру га, образуя правильно построенное дерево. Так, например, конструкция < ltem Attribute 1 =«Value 1 »> </ltеm>' определяет единицу с именем ltem и списком пар ат рибут-значение, который в нашем случае представлен единственным атрибутом с именем Attribute 1 , имеющим значение -гValue 1 ». Для иллюстрации возможностей этого языка рассмотрим содержательный при мер ХМL-документа, описывающего домашнюю страницу исследователя Ивано ва. <?xml version= · 1 . o н ? > <Homepage> <Nаmе>Домашня я стран и ца Ива н о ва</Nаmе> 31 4 Глава 8 • Предста вление данны х и _знаний в И нтернете < Pe rson> < fi rstName>Ivan</fi rstName > <lastName> Ivanov</lastName > <ma r riedTo Homepage=" http : //www . anywhe re . ru " > Ma riya Ivanova</ma r riedTo> <employee Homepage=" htt p : //www . ccas . ru " > CCAS of Russia</employee> <puЫ ications> <book title= " Fi rst Book"/> <book title=" Second Book " / > </pu Ьl icat ions> </Pe rson> </Homepage> Этот ХМL-документ структурирован существенно лучше, чем был бы аналогич ный ему НТМL-текст, но пока не имеет 4смысла•, так как из него не следует, как интерпретируются единицы типа Person, puЫications, book и т. п. Для решения этого вопроса используется специальная спецификация определения типа доку� мента DTD (document type definition). По сути дела, это грамматика языка раз мет�<и, в рамках которой определяются, какие элементы могут присутствовать в документе, какие атрибуты они имеют и как элементы соотносятся друг с другом. Понятно, что для стандарта XML такие спецификации уже разработаны самими авторами языка, но в- нашем. случае используется специальньiй его диалект, и по тому именно мы должны специфицировать DTD нашего документа. Такая спе цификация может быть следующей: < ! ELEM ENT Homepage ( Name , Pe rson ) > < ! ELEM ENT Name ( # PCDATA ) > < ! E LEM ENT Pe rson ( f i rst Name , lastName , ma r r iedTo? , employee? , puЫ ications? , Homepage? ) > < ! ATTLIST Pe rson Homepage xml : l i n k CDATA> < ! ELEM ENT fi rstName, ( #PCDATA ) > < ! ,E LEM ENT lastName. ( # PCDATA ) > < ! ELEMENT ma r riedTo ( Pe rson ) > < ! ELEMENT empl oyee ( o rgan ization ) > < ! ATTLIST o rgan ization Homepage xml : l i n k CDATA> < ! ELEMENT p u Ы i cat ion s ( book• , раре г • , repo rt • ) > < ! ATTLIST boo k t itle CDATA #REOUIRED , coautho r Pe rson , puЫishe r CDATA , уеа г CDATA ) > < ! ELEMENT раре г ( t itle , coautho r • , j ou rnal , уеа г , vol? , n umbe r? ) > < ! ELEMENT repo rt ( t itle , coautho r • , o rganizat ion , уеа г ) > 8.3. Системы и средства п редставлени я онтолог ических зн ани й 31 5 Как следует из приведенного описания, в DTD специфицировано <t<сведение,> конструкций нашего ХМL-документа к стандартным ХМL-конструкциям, пони маемым броузерами нового поколения. В настоящее время уже разработаны DTD для различных предметных областей, я каждая такая спецификация, по сути дела, определяет новый язык разметки. Известным примером развития DTD для спецификации общих ресурсов являет ся RDF (Resource Description Framework) [RDF, 1999] , разрабатываемый WЗС. Этот формат может использоваться для добавления в документы метаинформа ции, которая, в частности, может быть представлением семантики документа. Использование собственных диалектов XML является важным шагом на пути формирования пространств знаний в сети Интернет. Но, по сути дела, это лишь первый шаг в этом направлении. Действительно, какие средства дае,т язык XML для представления знаний? Очевидно, что это, в первую очередь, средства специ фикации декларативной компоненты развитых систем представления знаний. И то в ограниченном объеме. Ка1<им же образом авторы этого языка и его расши рений предполагают подключение процедур обработки ХМL-кnнструкций? На сегодняшний день в предложениях WЗС явно прослеживается лишь одна иде�: поскольку ХМL-документы не что иное, как портабельные данные, а язык Jаvа имеет портабельный код, следует их использовать совместно. Для этого предла гаются специальные интерфейсы, например SAX (Simple АР! /01· XML), которые уже сейчас могут поддерживать многие Jаvа-анализаторы. Основная идея здесь достаточно проста - анализатор просматривает узлы дерева документа из ХМL файла и вызывает соответствующие методы, определенные пользователем. Для тогсj чтобы этот механизм работал, программист должен создать класс, реализу ющий соответствующий интерфейс. Методы этого класса будут вызываться вся кий раз, когда на входе распознавателя появляется нужная конструкция (тег, входная строка и т. п.). Собственно обработка информации при этом целиком в руках программиста, а среда лишь цоддерживает общее функционирование и об работку исключительных ситуаций. Такой подход имеет много общего и с подходом Ontobroker, и с подходом SHOE. Авторы обоих этих проектов активно приветствуют усилия WЗС, но вместе с тем отмечают, что в предложениях соответствующих рабочих групп еще много недо статков. В первую очередь - это отсутствие стандартов на интелл:ектуальную об работку ХМL-конструкций, сравнительно небольшой практический опыт семан тической разметки Интернет-документов и достаточно ограниченные средства логической обработки, используемые при этом. Вот почему, как показывает анализ литературы и Интернет-ресурсов по данной тематике, в настоящее время: • эффективная обработка информации на WеЬ связывается, в первую очередь, с использованием ИН-технологий; • основные подходы в этой области ориентированы на решение проблемы из влечения из WеЬ-ресурсов эксплицитных знаний на основе семантического маркирования таких ресурсов; 31 6 Гла в а 8 • Представление данны х и знани й в Интернете • во всех исследовательских и многих коммерческих проектах данного направ ления активно используются (или, по крайней мере, декларируется использо вание) агентно-ориентированные вычисления и технологии. Учитывая вышесказанное, в следующей главе обсуждаются мультиаrентные сис темы и системы интеллектуальных агентов. И нтеллектуаль:н ы е И нте рн ет те хнол о гии о П ро граммны е агенты и мул ьтиаге нтны е систем ы о П рое кт ир о ван ие и ре али з ация аге нто в и мул ьтиаге нтных сист ем о И нформ а ци онн ы й п о ис к в с реде Интер н ет 9 . 1 . Программные агенты и мультиагентные систем ы 9 . 1 . 1 . Историческая справка Проблематика интеллектуальных агентов и мультиагентных систем ( МАС) име ет уже почти 40-летнюю историю [ Городецкий и др., 1998; Тарасов, 1 998] и сфор мировалась на основе результатов, полученных в рамках работ по распределенно. му искусственному интеллекту ( DAI), распределенному решению задач ( DPS) и .параллельному искусственному интеллекту (PAI) [Demazeau et al., 1990; Пэра нек, 199 1 ; Rasmussen et al., 1 99 1 ] . Но, пожалуй, лишь в последнее 1 0-летие она выделилась в самостоятельную область исследований и приложений и все больше претендует на одну из ведущих ролей в рамках интеллектуальных инфор мационных технологий. Спектр работ по данной тематике весьма широк, интег рирует достижения в области компьютерных сетей и открытых систем, искусст венного интеллекта и информационных технологий и ряда других исследований, а результаты уже сегодня позволяют говорить о новом качестве получаемых ре шений. Понятно, что в рамках данного издания мы не сможем даже обозреть все направ ления и результаты в области МАС. Поэтому далее сконцентрируемся лишь на . тех разделах, которые имеют непосредственное отношение к теме настоящей книги. С учетом сделанных замечаний и с· позиций сегодняшнего дня все иссле дования в этой области можно выделить в две основные фазы: первая охватывает период с 1977 г. по настоящее время, а вторая - с начала 1 990 r. по настоящее время. 318 Гла ва 9 • Интелле ктуальн ы е Интер н ет-те хн оло гии Работы первого периода концентрировались на исследован.н и так называемых 4смышленых.• • (smаrt} агентов, которые были начаты в ко:нце 1 970-х годов и продолжаются все 1980-е годы вплоть до наших дней. Первоначально эти работы были сосредоточены на анализе принципов взаимодействия между агентами, на декомпозиции решаемых задач на подзадачи и распределении полученных задач между отдельными агентами, координации и кооперации агецтов, разрешении конфликтов путем переговоров и т. п. Цель таких работ -. анализ, спецификация, проектирование и реа,лиэация систем агентов. На этом же уровне р.Ктивно велись работы по теории, архитектурам и. ЯЗЫI<ам для программной реализации агентов. Примерно с 1990 г. стало ясно, что программные агенты могут использоваться в широком спектре применений. Однако потенциал агентных технологий, по-ви димому, стал в значительной мере осознан не только разработчикам,и,. но и ицвес торами после известного отчета консультативной фирмы Ov'um [Ovum, 1994'] , к�порая предсказала, что сектор рынка для программных агентов в США и Евро пе вырастет, по крайней мере, до $3,9 billion к 2000 г. в противовес 1995 г., когда он оценивался в $476 million. В настоящее время множество исследовательских лабораторий, университетов, фир� и промышленных организаций работают в этой области, и список их посто янно расширяется. Он в1<л19чает мало известные имена и небольшие колле1пи вы, уже признанные исследовательские .центры и организации (например, уни верситет Карнеrи Мэллон (C MU) и фирма General Magic), а также огромные транснациональные компании (такие как Apple, АТ&Т, ВТ, Daimler-Benz, DEC, НР, I ВМ, Lotus, Microsoft, Oracle, Sharp и др.). , Областями практического ис пользования агентных технологий являются управление информационными по то1<ами (workflow management) и сетями (network management), управление воз душным движением (air-traffic control), информационный поиск· (information retrieval), электронная коммерция (e-commerce), обучение (education), электрон ные библиотеки (digital libraries) и многие-многие другие приложения. Существу_ет несколько причин, по�ему необ:,юдимы и полезны программные агенты, МАС и, более общо, агентные технологии. Основная из них в том, что агенты автономны и могут выполняться в фоновом (background) режиме от лица пользователя, nри решении разных задач, наиболеt: важными из которых являют ся сбор информации, ее фильтрация и использование для принятия решений. Таким образом, основная идея программных агентов - делегирование полномо чий. Для того чтобы реализовать эту идею, агент должен иметь возможность взаи модейст�ия со своим владельцем или пользователем для получения соответ ствующих· заданий и возвращения полученных результатов, ориентироваться в среде своего выполнения и принимать решения, необходимые для выполнения поставле.нных перед ним :lмач. К построению аrентно 0 ориентированных систем можно указать два подхода: реа лизация единственного автономного агента или разработка муль'l'иагентной сис темы. Автономный агент взаимодействует только с пользователем и реализует весь спектр функциональных возможностей, необходимых в рамк,ах аrентно-ори- 9. 1 . П рог раммные агенты и мул ьтиа�:-ентные систем ы 31 9 ентироваиной программы. В противовес этому МАС являются программно-вы числителъиыми комплексами, rде взаимодействуют различные агенты для.реше ния задач, котор:ые трудны или недоступны в силу своей сложно сти для одного агента. Часто такие мультиагентные системы называют агентствами (agencies), в рамках которых агенты общаются, кооперируются и договариваются между со бой для поиска решения поставленной перед ними задачи. Агентные технологии обычно предполагают использование определенных типо логий агентов и их моделей, архитектур МАС и опираются на соответствующие агентные библиотеки и средства поддержки разработки разных тиriов мульти агентных систем. 9 .1 . 2 . Ос н ов н ы е понятия Существует несколько подходов к определению понятий в данно й предметной области. По-видимому, одним из наиболее последовательных в этом вопро�е является международная ассоциация FIPA (Foundation for I ntelligent Physical Agents), каждый документ которой содержит тол1ювый словарь терминов, реле вантных данному документу [FIPA, 1998]. И вместе с тем практически во всех работах, где даются, например, определения понятия агента и ето базисных свойств, общим местом стало замечание об отсутствии единого мнения по этому поводу [Franklin et al., 1 996; Belgrave, 1996; Nwana, 1996]. Фактически, используя' понятие <ltareнт• , каждый автор или сообщество определйют своего агента с кон кретным набором свойств в зависимости от целей разработки, решаемых задач, техники реализации и т. п. критериев. Как следствие, в рамках данного направле ния появилось множество типов агентов, например: автономные агенты, мобиль ные агенты, персональные ассистенты, интеллектуальные агенты, социальные агенты и т. д. [Nwana, 1996], а вместо единственного определения базового аген та - множество определений производных типов. Учитывая вышесказанное, понятие агента целесообразно трактовать как мета имя и.пи класс, который включает множество подклассов. Ряд определений аген тов, даннь1х разными исследователями, представлен в работе [Franklin et al., 1996]. В настоящем издании будем придерживаться следующей концепции по этому поводу. Агент - это annapi,п-,aя или программная сущность , способная де й ств о вать в интересах достижения целей, поста вленных пе ред ним в ладельцем и/или пользов ателем [Wool drldge et al . , 1 995) . Таким образом, в рамках МАС-парадиrмы программные агенты рассматривают ся как автономные компоненты, действующие от лица пользователя. В настоящее время существует несколько классификаций агентов [Nwana, 1996], одна из которых. представлена в табл. 9. 1 . Гла ва 9 • Инте лл е ктуал ьные Интернет -технол о ги и Таблица 9. 1 . Классифи кация агентов Просn,ае СМwwпеные (8Rlart) Иитеп- Действитеп"мо + + 11ектуап1tМые (lntelllgent) (truly) имт-,11�, 11ектуап�.нwе Автономное выполнение + + + + + Слежение за окружением + + + + + + + + + Взаимодействие с другими агентами и/или п ользователями Способность использования абстракций Способность использ ования предметных знаний Возможность адап,:и в ного поведения дnя достижения целей Обучение из окружения Толерантность к ошибкам и/или неверным Входным сигналам Real-tlme и сп олнение ЕЯ-взаимодеi,\ствие + + + + + + + Как следует из приведенной таблицы, собственно целесообразное поведение по является только на уровне интеллектуальных агентов (Пономарева и др., 1999; Хорошевский, 1 999]. И это не случайно, так как для него необходимо не только наличие целей функционирования, но и возможность использования достаточно сложных знаний о среде, партнерах и о себе. С точки зрения целей настоящей книги, наибольший интерес представляют интеллектуальные и действительно интеллектуальные (см. табл . 9. 1 ) агенты. Понятно, что все характеристики бо лее спростых• типов агентов при этом наследуются. Иногда агентов определяют через свойства, которыми они должны обладать. Учитывая то, что нас в данной книге, в первую очередь, интересуют интеллекту альные агенты, приведем типовой список свойств, которыми такие агенты должны обладать [Wooldridge et al., 1 995; FIPA, 1 998]: • автономность (autonomy, autonomious functioning) - способность функцио нировать без вмешательства со стороны своего владельца и осуществлять кон троль внутреннего состояния и своих действий; • социальное поведение (social abllity, social behaviour) - возможность взаимо действия и коммуникации с другими агентами; • реактивность (reactivity) - адекватное восприятие среды и соответствующие реакции на ее изменения; • активность (pro-activity) - способность генерировать цели и действовать ра циональным образом для их достижения; 9 . 1 . Программ ные агенты и мул ьтиагентные системы 321 • базовые знания (basic knowledge) - знания агента о себе, окружающей среде, включая других агентов, которые не меняются_ в рамках жизненного ци1<Ла агента; • убеждения (beliefs) - переменная часть базовых знаний, которые могут ме няться во времени, хотя агент может об этом не знать и продолжать их исполь зовать для своих целей; • цели (goals) - совокупность состояний, на достижение которых направле но текущее поведение агента; • желания ( desires) - состояния и/или ситуации, достижение которых дл� аген та важно; • обязательства (commitments) - задачи, которые берет на себя агент по просьбе и/или поручению других агентов; • намерения (inteвtions) - то, что агент должен делать в .силу своих обязательств и/или желаний. Иногда в этот же перечень добавляются и такие свойства, как рациональность (retionality), правдивость (veracity), благожелательность (benevolence), а также мобильность (mobllity), хотя последнее характерно не только для интеллекту альных агентов. , В зависимости от концепции, выбранной для организации МАС, обычно выде ляются три базовых класса архитектур [Wray et al., 1994; Wooldridge et. al., 1995; Nwana, 1996] : • архите1пуры, которые базируются на принципах и методах работы со знания ми (deliberative agent architectures); • архитектуры, основанные на поведенческих моделях типа •стимул-реа1щия• (reactive agent architectures); • гибридные архитектуры (hybrid architectures). Наиболее •трудными• терминологичес1<И в этой триаде являются архите1<туры первого типа. Прямая калька - делиберативные архитектуры - неудобна для русскоязычного произношения и не имеет нужной семантической окраски для русскоязычного читателя. Сам термин был введен в работе (Genesereth et al., 1987] при обсуждении архитектур агентов. Архитектуру или агентов, которые испол.ьзуют только точное представление картины мира в символьной форме, а решения при этом ( например, о дейст виях) принимаются на основе формальн ых рассуждений и использования методов сравнения по образцу, принято определять как делиберативные. Таким образом, в данном случае мы имеем дело с •разумными• агентами и архи тектурами, имеющими в качестве основы проектирования и реализации модели, методы и средства ис1<усственного интелле1па. В работе [Тарасов, 1998] таких агентов предлагается называть когнитивными, что не вполне правильно, так как при этом неявно предполагается, что �рассуждающие• агенты познают мир, в ко тором они функционируют. Нам представляется, что для русского языка более 322 Глава 9 • И нтеллектуальные Интернет-техноло г ии удобным и аде1<ватным были бы термины •агент, базирующийся на знаниях• или •интеллектуальный агент•, а также •архитектура интеллектуальных агентов•. Именно этих терминов мы и будем придерживаться в данном издании. Первона чально идея интеллектуальных агентов связывалась пр_;:1ктически полносrью с классической логической парадигмой ИИ. Однако по мере развития исследова ний в этой области стало ясно, что такие •ментальные• свойства агентов, как, на пример, убеждения, желания, намерения, обязательства по отношению к другим агентам и т. п., невыразимы в терминах исчисления предикатов первого порядка. Поэтому для представления знаний агентов в рамках данной архитектуры были использованы специальные расширения соо:rветствующих логических исчисле ний [Поспелов, 1998), а также разработаны новые архитектуры, в частности архи тектуры типа BDI (Belief-Desire-lntention). Один из конкретных примеров архи тектуры этого класса обсуждается ниже. Принципы реактивной архитектуры возникли как альтернативный подход к ар хитектуре интеллектуальных агентов. Идея реактивных агентов впервые возник ла в работах Брукса, выдвинувшего тезис, что интеллектуальное поведение может быть реализовано без с�мвольного представления знаний, принятого в класси ческом ИИ [Brooks, 1991). Таким образом (Connah, 1994): Реактивными н аз ываютс я аге нты и архит е ктуры , где н ет экс плицитно п р едставле нной модел и м ира , а функцион ирование отдельных аге нтов и все й си сте м ы осуществляе тс я по п рав ил ам т ип а с итуа ци�-де йств ие. Пр и этом под ситуа цие й пон имаетс я пот ен циальн о сложная ком би на ция внутре нн их и вне шн их состо яний. Вообще го�эоря, данный подход ведет свое начало с работ по планированию пове дения роботов, которые активно велись в И И в 70-х годах. Простым примером реализации реактивных архитектур в этом контексте можно считать системы, где реакции агентов на внешние события генерируются соответствующими конечны ми автоматами. Широко известным примером системы с реактивной архитекту рой является планирующая система STRIPS [Fikes et al., 1971 ], где использовался логический подход, расширенный за счет ассоциированных с действиями пред условий и пост-условий. Позже в рамках реактивных архитектур были разрабо:.. тапы и другие системы, но, как правило, они не могли справиться с задачами ре ального уровня сложности. Учитывая вышесказанное, многие исследователи считают, что ни первый, ни вто рой подходы не дают оптимального результата при разработке агентов и МАС [Wray et al., 1994). Поэтому попытки их объединения предпринимаются постоян но и уже привели 1< появлению разнообразных гибридных архитектур. По сути дела, именно гибридные архитектуры и используются в настоящее время во всех, сколько-нибудь значимых проектах и системах. Мы рассмотрели основные подходы 1< разработке мультиагентных систем. Архи-. тектуры МАС и их характеристики, широко используемые в настоящее время, представлены в табл. 9.2. 9 .2. Про е кти р ова н ие и р еализация аге нтов и мультиаге нтн ых систем 323 Таблица 9 . 2 . Архитек�ры МАС и их характеристики АрХИТ0Кl)'ра Представлени е знаний Модель м ира Р еш а тель Ин теллектуальная Символьное Исчисление Логический Реактивная Автоматное Гр аф Автомат Ги б ридная Смешанное Гибридная М ашина вывода Организация МАС на принципах ИИ имеет преимущества с точки зрения удоб ства использования методов и средств символьного представления ::�наний, разра ботанных в рамках искусственного интеллекта. Но в то же время создание точ ной · и полной модели представления мира, процессов и механи::�мов рассуждения в нем представляют здесь существенные трудности, уже неоднократно обсуждав шиеся в данной книге в связи с рассмотрением вопросо в приобретения ::�наний. Реактивный подход позволяет наилучшим образом испол�,эовать множество дос таточно простых образцов поведения для реакции агента на определенные стиму лы для конкретно й предметной области. Однако применение этого подхода ог раничивается необходимостью полного ситуативногQ анализа всех во::�можных активностей агентов. Недостатки гибридных архитектур связаны с <<непринципиальным>> проектиро ванием МАС со всеми вытекающими отсюда последствиями. Так, например, многие гибридные архитектуры слишком специфичны дл я приложений, под ко торые они разрабатываются. Но несмотря на указанные недостатки, гибридные архитектуры по::�воляют гибко комбинировать возможности всех подходов. Вот почему в последнее время явно прослеживается тенденция разработки и исполь зования именно гибридных МАС-архитектур и систем агентов [Slornan, 1 996]. 9 . 2 . Проектирование и реализация агентов и мультиагентных систем 9 . 2 . 1 . Общие вопросы п роектирования агентов и МАС Идеи програм мных агентов вообще и интеллектуальных агентов, в частности, привлекательны, так как позволяют людям делегировать им свои полномочия по решению сложных задач. Однако разработка МАС и действительно интеллекту альных агентов тр�бует специальных знаний и является сложной ресурсоем:кой задачей . Ведь программные агенты - новый класс систем программного обеспе чения ( ПО), которое действует от лица пользователя. Они являются мощной аб стракцией для <�визуализации� и структурирования сложного. Но если процеду ры, функции, методы и классы - известные абстракции, которые разработчики · ПО используют ежедневно, то программные агенты - это принципиально новая парадигма, неизвестная большинству из них даже сегодня. 324 Г л ава 9 • Инте лле ктуал ь ные И нте рнет - технологии Вместе с тем развитие и внедрение программных агентов было бы, по-видимому, невозможно без пр.едыдущего опыта разработки и практического освоения 1сон цепции открытых систем [Орлих, 1997], которые характеризуются свойствами: • расширяемости/масштабируемости (возможность изменения набора составляющих системы); • мобильности/переносимости ( простота переноса программной системы на разные аппаратно-программные платформы); • интероперабельности (способность к взаимодействию с другими системами); • дружелюбности к пользователю/легкой управляемости. Одним из результатов внедрения концепции открытых систем в практику стало распространение архитектуры 4КЛиент-сервер• [Орлик, 1997). В настоящее вре мя выделяются следующие модели клиент-серверного взаимодействия: • 4Толстый клиент - тонкий сервер•. Наиболее часто встречающийся вариант реализации архитектуры клиент-сервер. Серверная часть реализует только доступ к ресурсам, а основная часть приложения находится на клиенте. • •Тонкий клиент - толстый сервер•. Модель, акn1вно используемая в связи с распространением Интернет-технологий и, в первую очередь, WеЬ-броузеров. В этом случае клиентское приложение обеспечивает реализацию интерфейса, а сервер объединяет остальные части приложений. При создании МАС мoryr с успехом использоваться обе модели, хотя в настоя щее время чаще применяется вторая. Но независимо от используемой модели средства разр�ботки и исполнения распределенных приложений, которыми, I<aI< правило, являются МАС, опираются на статический подход (позволяют переда вать только данные приложений) или динамический подход (обеспечивают воз можности передачи исполняемого кода). При динамическом подходе МАС-приложения используют парадигму мобиль ных агентов. Мобиль ные агенты - это пр о грамм ы , которы е могут п ерем ещат ьс я по с е ти , нап рим е р п о W#W. О н и покида ют клие нтс к и й ко м пьюте р и п е реме ща ются на удаленн ый се рв е р для выпол нени я с воих де й ствий , п осле ч е го в озв р аща ются обр атно . Часть исследователей считают, что мобильные агенты обеспечивают более про грессивный метод работы в сетевых приложениях. Другие авторы отмечают, что мобильные агенты привнос.s,:т опасность с точки зрения обеспечения секретности информации и загруженности сети [Chess et. al. 1995). Понятно, что одни и те же функциональные возможности в большинстве случаев могут быть реализованы как посредством мобильных, так и статических агентов. Использование мобильных агентов может быть целесообразным, если они: • уменьшают время и стоимость передачи данных (например, при больших объемах данных вместо передачи всей необработанной информации по сети на хост-источник посылается агент, 1соторый выбирает только необходимую информацию и передает ее пользователю); 9.2. Проекти рование и реализация �гентов и мультиагентных систем 325 • позволяют преодолеть ограничение локальнь1х ресурсов (например, если воз можности процессора и объем памяти клиентского компьютера малы, то, мо_. жет быть, целесообразнее использование мобильных агентов, выполняющих вычисления на сервере); • облегчают координацию (например, запросы к удаленным серверам выпол няются мобильными агентами как отдельные задачи, а потому не нуждаются в координации); • позволяют выполнять асинхронные вычисления (например, запустив агента, можно пере1<лючиться на другое приложение и даже отсоединиться от сети, а результат будет доставлен агентом адресату после выполнения задания). Мобильные агенты являются перспективными для МАС, но в настоящее время нет единых стандартов и х разработки и все еще остается нерешенным ряд про блем, таких как легальные способы перемещения агентов по сети, верификация агентов (в частности, защита от передаваемы х по сети вирусов), соблюдение агентами прав частной собственности и сохранение конфиденциальности ин формации, которой они обладают, перенаселение сети агентами, а также совмес тимость кода агента и программно-аппаратных средств сетевой машины, где он исполняется [Wayner, 1995]. В настоящее время наиболее известными технологиями реализации статических и динамических распределенных приложений являются программирование со I<етов, вызов удаленных процедур - RPC (Remote Procedure Call), DCOM (Mic rosoft Distributed Component Object Model), Java RMI Uava Remote Metlюd In vocation) и CO RBA (Common Object Request Broker Architecture) [Maurer et al., 1998]. Вместе с тем с точкй'зрения разработки и реализации МАС наиболее важными, по-видимому, являются последние три - DCOM, Java RMI и CORBA [Gopalan, 1999]. Модель Microsoft DCOM является объектной моделью, которая поддерживается Windows 95, Windows NT, Sun Solaris, Digital UNIX, IВМ MVS и др. Основная ее ценность - в предоставлении возможностей интеграции приложений, реализо ванных в разных системах программирования. Java RМl-приложения обычно состоят из клиента и сервера. При этом на сервере создаются некоторые объекты, которые можно передавать по сети, либо методы их определяются как доступные для вызова удаленными приложениями, а на клиенте реализуются приложения, пользующиеся удаленными объектами. Отли чительной чертой RMI является возможность передачи в сети не только методов, но и самих объектов, что обеспечивает в коне<шом счете реализацию мобильных агентов. СОRВА является частью ОМА (Object Management Architecture), разработанной для стандартизации архитектуры и интерфейсов взаимодействия объектно-ори ентированных приложений. Интерфейсы между СОRВА-объектами определя ются через специальный язык IDL (lnterface Definition Language), который явля ется языком описания интерфейсов. Сами интерфейсы могут при этом быть реализованы на любых других языках программирования и присоединены к 326 Гл ав а 9 • Инте ллектуа л ьные И нтернет - техн ологии СО RВА-приложениям. В рамках стандартов предполагается, что С О RВА-объек ты могут коммуницировать с D С О М-объектами через специальные CORBA DCOM мосты (Bridges). Технологии Java RMI и CORBA являются, по-видимому, на сегодняшний день самыми гибкими и эффективными средствами реализации распределенных при ложений [Gopalan, 1999]. Эти технологии очень бли:�ки по своим характеристи кам. Основным преимуществом СО RBA является интерфейс 1D L, унифицирую щий средства коммуникации между приложениями и интероперабельность с другими приложениями. С другой стороны, Java RMI является более гибким и мощным средством создания распределенных приложений на платформе Java, включая возможность реализации мобильных приложений. В настоящее время еще не вполне ясно, какая из этих концепций « победит» в борьбе за мультиагентные системы. Вмешаться в этот процесс может и модель DCOM, активно «продвигаемая» компанией Microsoft. Но анализ существую щих реали:�аций МАС показывает, что пока более распространенным здесь явля ется подход jаvа RMI. Выше кратко обсуждались вопросы стратегии программного обеспечения распре деленных приложений. Если же вернуться к проблематике МАС, то все про граммные средства для их разработки и реализации на современном этапе можно ра:�делить на два больших класса: МАС-библиотеки и МАС-среды. Впечатляю щий списо1< сайтов, 1:rде представлена информация о том и другом программном обеспечении, как из коммерческих , так и из исследовательски х организаций, представлен в Интернет по адресу http://www.reticular.com/ Оставляя в стороне вопросы проектирования и реализации МАС-библиотек, ко торые, конечно, являются базисом для создания мультиагентных приложений, но выходят :ia рамки данного издания, в оставшейся части настоящего параграфа мы сосредоточимся на обсуждении инструментария для построения МАС. При этом нас будут интересовать, в первую очередь, модели, методы и средства под держки процессов проектирования агентов и мультиагентных систем. Одним из удачных примеров систем данного класса является, на наш взгляд, ин струментарий AgentBuilder компании Reticular Systems, Inc. [AgentBuildeг, 1999] одного и:� лидеров в этой области, к обсуждению которого мы и переходим. 9 . 2 . 2 . Инструментарий AgentBuilder Инструментарий для построения МАС компании Reticular Systems, Inc. состоит и:� двух компонентов: средств разработки (development tools) и окружения перио да исполнения (run-time execution environment). Первый компонент ориентиро ван на поддержку процессов анализа предметной области создаваемой МАС и проектирование агентов с задщшым поведением. Второй - обеспечивает эффек тивную среду для выполнения агентно-ориентированных программ'. И тот и дру гой , компоненты реализованы на языке Java, что позволяет им работать на всех платформах, где установлена Java-cpeдa. Агентные программы, проектируемые в рамках AgentBuilder, тоже являются Jаvа-программами и могут исполняться на любом компьютере, где установлена виртуальная Jаvа-машина JVM Qava virtual rnachine). 9 .2. Проектирование и реализация агентов и м ультиагентн ы х систем 327 Общая схема nроцесса проектирования и реализации аrентно-ориентированных приложений на основе AgentBuilder ToolКit представлена на рис. 9.1. Этот инструментарий имеет средства для организации и предметной области со здаваемой МАС, средства спецификации архитектуры агенства и поведения аген тов, а также средства отладки аrентных приложений и наблюдения за поведением созданных агентов. Модель •жизненного цикла• аr�нтов, разрабатываемых в рамках AgentBuilder, представлена на рис. 9.2 . Как следует из данной схемы, стандартный «жизненный цикл� агента включает следующие основные шаги: • обработка новых сообщений; • определение, какие правила поведения применимы в текущей ситуации; • выполнение действий, специфицированных этими правилами; • обновление ментальной модели в соответствии с заданными правилами; • планирование. Собственно ментальные модели (начальная и текущая) включают описания ис ходных (текущих) намерений, полаганий, обязательств и возможностей, а также спецификации правил поведения. Формирование проекта Анализ предметной обnасти Спецификация онтологии Выбор архитектуры агентства Спецификация поведения аrента Библиотека интерфейсов пользоватеnя Бибnиотека действий аrента Спецификация агента Аrентная проrрамма Модуль периода исполнения Соэдание агентного приложения Интеnлектуальное аrентное приложение Рис. 9. 1 . Технол огическая схема процесса разраб отк и агентно-ори ентированных приложений на базе AgeпtBuilder ToolKit 328 Глава 9 • И нтелл е ктуаль н ы е И нтернет-техн ол о г им Дацная модель получила нaзвaниe -Reticular Agent Mental Model ( RAMM) и яв ляется раз в итием модели Шохама (Shoham) [Shoham, 1993], где все действия вы полняются только как результат определенных обязательств. В рамках RAMM эта идея расширена до уровня общих правил поведения; которые определяют причину действия агента в каждой точке его функционирования. При этом пра вила поведения фиксируют м ножество возможных •откл иков� агента на те кущее состояние среды так,- как это предписьщ�ется полаrаниями. Для спецификации поведения агентов в системе AgentBuilder используется спе циальный объектно-ориентированный язык RADL ( Reticular, Agent Definition Language ). Правила поведения в этом языке могут рассматриваться ка1< конструк ции вида WHEN-IF-THEN. WНЕN-часть правила адресована новым событиям, возникающим в окружении агента и включает новые сообщения, полученные от других агентов. IF-часть сравнивает текущую ментальную модель с условиями применимости правила. Образцы в IF-части работают на намерениях, nолаrанщ�:х, обязатель с'I'вах и возможностях, определенных в ментальной модели. Начальная ментальная модель Обработка новых сообще ний Входн ы е сообщения Определение применимых правил поведения Ментальная модел ь Выпоnнение действий Внешнее окружение Об новление ментально й модел и �---- - Планирование Рис . 9.2. М одел ь «жи зненно го цикла• агента в системе AgentBuilder ТНЕ�-часть определяет действия в ответ на текущие события и состояния мен тальной модели и внешнего окружения. Они могут включать обновление мен тальной модели, коммуникативные и внутренние действия. -- 9.2. П роектирован ие и реали зация .агентов и мультиагентных сист ем 329 Общий . формат правил поведения следующий: NAM E имя правила WH EN Message Condition ( s ) I F Mental Conditio n ( s ) THEN P r ivate Act ion ( s ) ; Mental Change( s ) ; Message Act ion ( s ) Для иллюстрации возможностей этого языка рассмотрим пример правила •дви жение-Вперед-На-Зеленый-Свет• из предметной области • Управление автомо билем•, взятый из руководства пользователя [AgentBuilder, 1999). NAM E " G reenl ight Move Fo rwa rd Rule" WH EN ? KQMLMessage . Perfo rmat ive EQUALS TELL ? KQM LMessage . Send e r EQUALS · stoplig ht -agent " ? KQMLMess&g e . Content EQUALS St r i ng ? KQMLMessage . Ontology EQUALS " Stopl i g h t " IF ? KQM LMessage . Content EQUALS " stoplight-g reen· ? KQM LMes sage . Stat us EQUALS " stoppedAtRed light " cu r rentMotion . Content EOUALS " stopl ight-g reen· cu r rent locat ion EQUALS next i nte rsection NOT( c u r rent location EOUALS dest i nat ion ) FOR_iL L ( ? Blocked i nte rsect ion , NOT( ? Bloc kedlntersect ion . Locat io n EQUALS cu r rent locat ion ) ) THEN 00 ( Go ( t raffi cSpeed ) ) 00 ( $next inte rsect ion = getNext i nte rsect i o n ( cu r rent location , c u r rentMotion . Oi rection ) ) ASSERT ( S EТ_VALUE_OF cu r rentMotion . Status ТО moving ) ASSERT ( SET_VALUE_OF nexti nte rsection ТО $nexti nte rsect ion ) SEND ( pe rfo rmative = REPLY , receive r = " stoplight-agen t " , content = ·acknowledged " . i n - reply-to = ? KQ� LMessage . Reply-with ) Как следует из данного примера, в языке RADL активно используются образцы, имеются достаточно развитые средства работы с переменными и представитель ный набор действий, включающий формирование перформативов языка KQML [Labrou et а!., 1997). Структуры данных, на которых •работает• данный язык, яв ляются, по существу, фреймами, а сами правила - суть продукции специального вида. Язык поддержан на инструментальном уровне системой специальных язы ково-ориентированных редакторов. Спецификация поведения агентов и их ментальных моделей составляет специ альный файл ( agent definition file), который используется совместно с классами и методами из библиотеки действий агентов и библиотеки интерфейсов. Этот файл интерпретируется в рамках компонента Reticular's Run-Time Agent Engine, являющегося частью окружения периода исполнения AgentBuilder. 330 Гл ава 9 • Интелле ктуа л ьн ые И нте рнет -техноло гии Оценивая подход к спецификации моделей поведения агеmов, используемый В· AgentBuilder, можно констатировать, что в целом это tерьезная система представ ления и манипулирования знаниями, ориентированная на описание моделей типа RAMM. Вместе с тем в данной модели отсутствуют средства эксплицитного управления выводом, которые могли бы существенно увеличить фующиональ ную мощность языка. Нет в модели и средств явной фиксации состояния агента, отличных от флагов и/или значений переменных. Не вполне ясно и то, 1<а1< в спе цификации моделей поведения могут быть учтены разные, но одновременно сосу ществующие •линии поведения•, что характерно для действительно иmеллекту альных агентов. Не вполне обоснованным представляется и использование режи ма интерпретации для реализации поведения агентов. Но в целом можно еще раз отметить, что инструментарий AgentBuilder является современным и мощным средством проектирования и реализации МАС. 9 .2. З . Система Bee-gent Инструментарий AgentBuilder, обсуждавшийся выше, базируется на 1<0нцепции среды разработки, принятой в технологии программирования. Отличный от это го подход применяется в системе Bee-gent [Bee-gent, 1999]. Здесь для проектиро вания и реализации МАС используется специальная МАС-библиотека, реализо ванная на языке Java, а собственно технология, на наш взгляд, представлена методологией спецификации поведения агентов распределенной системы. При этом в систтеме Bee-gent используется множество базовых агентов ( generic agents), среди которых можно выделить упаковщики (agent wrappers) и медиато ры (mediation agents). Поведение всей системы, направленное на достижение определенных целей, ба· зируется на спецификации --tбесед• (message exchanges) через протоколы взаимо действия (interaction protocols). Такие протоколы представляются специальными графами (рис. 9.3), основными понятиями которых являются состояния (states) и переходь,: (transitions). При этом переходы, по сути дела, лишь специфицируют смещение 4фокуса• в следую щее состояние с помощью специальных правил перехода, а ядро формализма со ставляют состояния. Именно здесь проверяются предусловия перемещения в сле дующее состояние и в случае их удовлетворения выполняются действия, в основе 1<0торых обмен Х:МL/ACL сообщениями. Возможны правила, результатом вы полнения которых является выбор следующего состояния из множества подходя щих. Как и обычно в таких случаях, в качестве базиса сообщений де1<ларируется ис пользование теории речевых актов [Austin, 1965; Searle, 1985]. Однако в случае Bee-gent для этого используется специальный язык ACL, разработанный на осно ве KQML [Labrou et al., 1997]. Интересно здесь то, что логическая структура АСL выражений представляется в формализме XML [XML, 1998]. Поэтому язык опи сания поведения агентов в Bee-gent называется XML/ACL. Основное отличие его от, например, языка RADL в том, что в XML/ACL введены перформативы пред ставления намерений (intentions), а также средства спецификации потоков раз- 9 .2. Проекти рование и реализация агентов и мультиагентных систем 33 1 вертывания беседы ( conversation flows ). Вместе с тем в языке специфю<ации по ведения агентов системы Bee-gent нет правил, определяющих, в каких случаях ка1ше перформативы должны использоваться. И, следовательно, нет типовых сценариев диалогов. Пример перформатива в фор мализме XML/ ACL приведен ниже: < ! DOCTYPE req uest SYSTEM " request . dtd " > < request> <sende r>Med iation Agent</sender> < rece ive r>Agent Wrappe r</receive r> <content> <action>act 1 < /act ion> <acto r>Agent Wrapper</actor> <a rgs>nu l l </a rgs> </content> <p rotocol>Reques t - i n fo rm</p rotocol> < reply-wi t h > MSG- ID : 1 </reply-wi t h > <ontol ogy>defa u l t </ontol ogy> </ req uest> Рис . 9 . 3 . Общая структур а протоколов в заи модействия в системе Bee-gent 332 Глава 9 � Интеллектуальные Инте р н ет-техн ол оги111 Как следует из данного примера, для спецификации перформативов использует ся система специальных тегЬв, ч:rо хорошо коррелирует с предложениями FIP А по созданию языка SKDL ( Structured Knowledge Description Language) [SKDL, 1 998] . Вместе с тем реализация поведения агентов лежит на специальной систе меJаvа-классов и практически никак fle связана с внешним представлением пер формативов в языке XML/ACL. Для иллюстрации подхода }3ee-gent к описанию поведения агентов рассмотрим модельную задачу брокера [Bee-gent, 1 999] , обслуживающего потенциального покупателя, который находит продавца определенного товара, обсуждает с ним цены и информирует покупателя о возможных вариантах покупки. Контрактная сеть верхнего уровня для данной задачи представлена на рис. 9.4. Рис . 9 . 4 . Контр а ктная с еть в ерхн ег о уров н я для задач и брокера С точ1<и зрения системы представления знаний AgentBuilder, она наиболее близ ка I< спецификации агентства (Agency). Однако в данном случае, по нашему мне нию, в контрактной сети Bee-gent более детально специфицируются не толы<0 типы взаимодействий между агентами агентстве, но и их реализация. Собственно специфю<ацию поведения агентов в системе Bee-gent можно проил люстрировать на примере протокола взаимодействия для продавца, показанного на рис. 9.5 Та�ая спецификация достаточно прозрачна и в дополнительных комментариях не нуждается. Поэтому, на наш взгляд, интересцее рассмотреть, I<aI< реализуется поведение агента в формализме системы Bee-gent. в 9 .2. Проектирование и реали заци я а гентов и м ультиагентных систем 333 Qrш: Sorry, Refuse, Propose, Рис . 9.5. Граф протокол а взаимодей стви я для поведения продавца Собственно инициация агента здесь осуществляется стандарным для Jаvа-при ложений образом: im p o rt c om . toshiba . beege nt . • ; impo rt com . tosh i ba . beege n t . xml . • ; �mpo rt c om . toshi ba . beege n t . u t i l . • ; puЬlic class AW2 extends Ag e n tW rappe r puЫic stati c void m a i n ( St r i n g [ ] a rgv ) th rows Exc e p t i o n { AW2 aw = new AW2 ( ) ; n aw . setName ( bidd e r " ) ; aw . p r i n t log ( t rue ) ; aw . setPasswo rd ( "' kawamu r a " ) ; aw . a d d Pu Ы i c I PStates ( ) ; aw . s ta r t I P ( ) ; Каждое состояние в протоколе взаимодействия является экземпляром класса AwrlPState, фрагмент описания которого приведен ниже. 334 Гла ва 9 • И нтел ле ктуал ьные И н тернет-техно ло гии class Aw rI PState1 extends Aw rIPState { Awr I PStateS1 ( ) { $Upe r ( " INIТ" ) ; puЫic void action ( ) XmlAcl ха = n ull ; ..... . . . .. . . . . . . . . 1 . . . while ( wa itXML ( О ) ) { ха = getXML ( ) ; pe, r f = xa . getТag2Val u e ( " pe r fo rmative " ) ; sende r = xa . getTag2Val u e ( " sende r " ) ; act ion = xa . g etTag2Val ue ( " ac t i on " ) ; i f ( pe r f . equals ( " c fp " ) ) b reak; } // Send XM L/AC L int rand • = new 1 Random ( System . cu r rentTimeMi l l is ( ) ) . next i n t ( ) ; i n t d ice = Math . abs ( rand ) % 3 ; switch ( dice ) { case О : // gene rate Refuse pe rf o r mat ive setPostcond ( . . INIТ" ) ; b reak; defau l t : setPostcond ( " I NIТ" ) ; ret u rn ; if } ! se ndXML ( ха ) Debug . p r i n t log ( getMyname ( ) , " Fa iled to send XML/ACL" ) ;. } Наиболее интересны и важны здесь •петля• ожидания сообщений и оператор switch, в теле которого собственно и специфицируется поведение как последова тельность действий, направленных в данном случае на формирование соответ ствующего перформатива. Анализ этого фрагмента и других примеров реализации поведения агентов в си стеме Bee-gent позволяет сделать следующие выводы. Агентная библиотека фир мы Toshiba является достаточно развитой и отвечает основным требованиям к компонентам программного обеспечения данного класса. П ерформативы XML/ ACL более высокого, по сравнению с KQML, уровня. Для спецификации прото колов взаимодействия предлагается использовать язык программирования, а не представления знаний. На уровне техно:71огии имеется достаточно четкая струк тура представления поведения аге нтов. Учитывая то, что языком реализации поведения в данном случае является Java, система Bee-gent ориентирована на компиляцию программ, а не интерпретацию спецификаций, 1сак это происходит в случае системы AgentBuilder. 9 . 3 . И нфо р ма ционный поис к в с реде И нтернет 335 Выше мы обсудили два подхода I< разработке и реализации МАС, которые отра• жают разные концы спектра инструментов, используемых в этой области. Суммируя все вышесказанное, можно отметить, что в настоящее время в работах по созданию инструментария явно фиксируется тенденция использования мето дов и средств И И, ориентированных на поддержку процессов проектирования программных агентов и МАС в целом. При этом задача построения технологий нового поколения для создания МАС может быть решена на основе совместного использования опыта разработчиков МАС и методологий обработки знаний, заимствованных из ИИ [Guarino et al., 1995Ь]. Для этого прежде всего необходимо адаптировать методы и средства проектирования и реализации прикладных интеллектуальных систем в новую проблемную область: разработку мультиагентных систем нового поколения. Очевидно, что спецификация процесса разработки МАС на основе методов про ектирования баз знаний в такой технологии предполагает: • эксплицитное представление в БЗ архитектуры проектируемой МАС; • явную спецификацию архитектуры отдельных типов агентов, •задействован· ных• в рамках проектируемой МАС; • описание в виде специальных баз знаний модели ( схемы) всех знаний, необхо димых каждому агенту для реализации поставленных перед ним целей; • анализ используемых в настоящее время при реализации МАС систем классов и соответствующих программных библиотек с целью явной спецификации с0ответствия между элементами архитектуры проектируемой МАС и ее компо нентами и программными единицами, реализующими их; • формальную спецификацию (на уровне соответствующей системы представ ления и манипулирования знаниями) специальной машины вывода (решате ля), целью которой является переход от спецификации МАС к ее реализации. Учитывая вышесказанное, можно констатировать, что процесс разработки МАС при этом хорошо коррелирует с соответствующим процессом создания сложных программных систем, но отличается дополнительными фазами, связанными с наличием независимых компонентов (агентов), взаимодействующих с пользова телем и друг с другом. По существу, при таком подходе мы получаем специализированную экспертную систему, предметной областью которой является автоматизация проектирования и реализации определенного класса мультиагентных систем. Создание та1<ой ме тодологии разработки МАС обсуждается, например, в работе [Iglesias et. all, 1996], где приводится, в частности, спецификация процесса разработки МАС на базе CommonKADS. 9 . 3 . Инф орма ци он н ы й п о ис к в с реде И нтернет По-видимому, не будет большим преувеличением утверждение _о том, что конец ХХ века - это время новых информационных технологий, •живущих• в гло- 336 Глава 9 • И нтеллектуальные Интерне т-технологии бальных и локальных сетях, наиболее яр1шми представителями которых явля ются Интернет и интранет. В настоящее время уже ни у кого нет сомнений в том, что Интернет является de facto всемирным хранилищем информации практи чески по всем аспектам жизни человечества. Так же как и то, что эффективный доступ к этой информации в связи с экспоненциальным ростом объема Интер нет-ресурсов становится все более сложным и трудоемким [Cowie et al., 1996]. И не столько с технической точки зрения, с1<олько с точки зрения поиска и ана. лиза информации. С другой стороны, как уже отмечалось в предыдущем параграфе, важнейшими из областей практического использования аrентных технологий являются сбор ин формации, ее фильтрация и использование для принятия решений. Учитывая вышесказанное, цель данного параграфа в обсуждении проблем пред ставления и обработки информации в сети Интернет на основе использования парадигмы мноrоаrентных систем, а та�<же обзор уже существующих в этой обла сти приложений. Авторы отдают себе отчет, что при этом за рамками такого обсуждения остаются многие важнf?Iе применения аrентных технологий, но вынуждены ограничиться данной тематикой в силу ограничений на объем данного издания и время его под готовки. / 9 . 3 . 1. Ма шины поиска Пространство WWW уже сегодня содержит огромное количество НТМL-до1<у ментов, причем не только тексты, но и графику, видео, звук и т. д. Гиперте1<сто вые связи между WеЬ-документами и/или их частями отражают отношения между отдельными информационными фрагментами, представленными в сети. Броузеры, поддерживающие НТМL-стандарты, обеспечивают представление материалов пользователям и навигацию по ссыл1<ам для доступа к до1<ументам, распределенным по с�ти. Однако поиск информации в настоящее время поддер жан существенно слабее и в большинстве случаев базируется на использовании ключевых слов и ограниченного числа типов машин поиска. Машины поиска, по-видимому, являются в Интернете самым распространенным и доступным ресурсом для извлечения информации. При этом, 1<ак правило, ис пользуются два типа сет�вых роботов: спайдеры ( spiders) и индеI<сЫ (indexes ). Спайдеры, иногда называемые также ботами (bots, от poбoт-robots), перемеща ются по Web от сайта к сайту. Некоторые из них перемещаются от сервера к сер веру беспорядочно, другие используют приоритеты, такие, например, как посе щаемость сайта. Оказавшись на сайте, спайдер посылает отчет поис1<овой машине и продолжает индексирование. Индексы используются для ускорения поиска и сбора информации. Не1<0торые поисковые механизмы индексируют со держание страниц полностью, другие - только отдельные их части, такие, на пример, как заголовки документов. Основными характеристиками машин поиска являются язык запросов пользова теля, представление исходных и выходных документов, время индексации и пр- 337 9 . 3 . И нфо р ма цио нн ы й пои ск в с реде И нте р нет иска, объем индекса. Существенной характеристикой машин поиска является также качество представления результатов, Наиболее популярные поисковые машины в настоящее время - AltaVista (http://www.aJtavista.com и/или http: //altavista.ru), Exite (http://www.excite.com), Infoseek (http://www.infoseek. сот), ·Lycos (http://www.lycos.com), WebCrawler (http://www.webcrawler. сот), Yahool (http://www.yahoo.com) и некоторые другие. Примером полно текстовой системы поиска с учетом морфологии русского языка является с_исте ма Яndex (http://w·ww.yandex.ru). Сравнительный анализ достоинств 1'недо статков машин поиска можно найти в работе [CompTek, 2000а], а русскоязычных машин поиска - в работе [CompTek, 2000Ь]. Как правило, поисковые .машины обеспечивают интерфейс типа меню, с помо щью которого пользователь может скомпоновать запрос на поиск информации, используя ключевые слова и/или фразы и логические связки И-ИЛИ-НЕ. Боль шинство машин поиска находят огромное количество •релевантных• страниц по запросу пользователя. Каждый найденный документ обычно. ранжируется по степени его I<орреляции с запросом. Релева�тность r<аждого документа оценива ется с помощью различных технологий, например учета частоты появления на' странице ис1юмых слов. Не1юторые поисковые механизмы используют дополни тельно другие факторы, такие как частота посещения �траницы и/или близость расположения друг к другу искомых терминов. Типичную организацию машин поиска можно рассмотреть на примере системы WebCrawler (рис. 9.6), разра�танной в университете Вашингтон (Сиэтл, США). Интернет Механизм поиска Рис. 9 .6. Общая а рхитектура систем ы WebCrawler WebCrawler начинает процесс поиска новых сайтов с известных ему документов и переходит по ссыл1<ам на другие страницы. Он рассматривает сетевое простран ство как ориентированный граф и использует алгоритм обхода графа, работая в следующем цикле [Cheong, 1996]: • найти новый документ; • отметить документ как извлеченный; • расшифровать ссылки с этого документа; • проиндексировать содержание документа. Поисrювый механизм работает в двух режимах: поиск документов в реальном времени и индексирование документов. 338 Глава 9 • Интел л ектуаль ны е И нт е рн ет-техн ологи и Этим сервисом определяется, какие документы и какие типы документов нужцо найти и извлечь из сети. Звуковые файлы, картинки, двоичные файлы и т. п. не извлекаются. Ошибочно извлеченные файлы будут проигнорированы на ста дии индексирования. В режиме индексирования система строит индекс инфор мации из найденных документов, в режиме поиска - находит документы, мак симально соответствующие запросу пользователя. Агенты в системе WebCrawler отвечают за извлечение документов из сети . Для выполнения этой работы 1юисковь1й механизм находит свободного агента и пере дает ему задание на поиск. Агент приступает к работе и возвращает либо содержа ние документа, либо объяснение, почему данный документ нельзя доставить. Агенты запускаются как отдельные процессы, что позволяет изолировать основ ной процесс работы системы от ошибок и проблем с памятью. Одновременно ис пользуется до 15 агентов. В базе данных хранятся метаданные документов, связи между документами, пол нотекстовый индекс, другая служебная информация. База обновляется каждый раз, когда поступает новый документ. Для отсечения семантически незначимых слов используется стоп-словарь, словам из документа приписывается вес, рав ный частоте их появления в данном тексте, деленной на частоту появления слова в ссылках на другие документы. Такой индекс позволяет быстро находить по за данному слову ссылки на документы его содержащие. Целиком URL ( ссылки на документы в сети) не запоминаются. Вместо этого вся нужная информация по мещается в специальные объекты. Каждый объект запоминается в отдельном В дереве: документы - в одном, серверы - в другом, а ссылки - в третьем. Та�ще разделение данных позволяет быстро определить неиспользуемые или часто ис пользуемые серверы. Аналогичным образом устроены и другие машины поиска. Характеризуя их в це лом, можно отметить, что это глобальные поисковые механизмы, охватывающие до 90 % ресурсов Интернета. Они не могут настраиваться на предпочтения пользо вателя и не имеют средств анализа информации, а их сетевым роботам становится все труднее справляться с постоянным ростом ресурсов Интернета. Главной зада чей машин поиска, по сути, является индексация ресурсов глобальной сети, а так же поддержка и расширение соответствующих баз данных. Фактически в базах данных машин поиска хранится информация о том, где и что лежит в сети. Поэто му можно считать, что существующие машины поиска обеспечивают низкоуров невый сервис для клиентских поисковых программ более высокого уровня. 9 . 3 . 2 . Неспециализированные и специал изированные поисковые агенты Первым уровнем надстройки над поисковыми машинами являются, по-видимо му, неспециализированные поисковые агенты. По сути дела, эти компоненты имеются в настоящее время практически у всех машин поиска. Такие агенты, в 9 . 3 . Инфор мационный поиск в среде Интернет 339 первую очередь, обеспечивают поиск по ключевым словам и устойчивым слово сочетаниям [Delgado, 2000]. Кроме поиска они поддерживают различные и мно гочисленные сервисы, такие, например, как передача запроса пользователя сразу на множество машин поиска, настройка на личные предпочтения пользователя, формирование тематической базы данных на основе результатов поиска пользо вателя, а некоторые - и обучение агентов. Не менее важно и то, что такие системы агентов объединяют ссылки на сайты, найденные множеством машин поиска, исключая повторные и неработающие ссылки. Но ни одна из систем данного класса не в состоянии самостоятелыю отобрать полезную информацию и остав ляет это пользователю. Конечно, используя такие программы, можно уменьшить число результирующих документов, доставляемых обычными машинами поис ка. Но степень <,попадания ответа в запрос,> практически та же, что и у машин поиска. Важно и то, что неспециализированные агенты опыта по поиску в опре деленной предметной области не накапливают. А обучение, если вообще допус кается, занимает много времени. Специализированные агенты поиска, как следует уже из их названия, приспособ лены искать информацию, например, только про музыку, или только про книги, или только про котировки акций и т. д. Большинство таких агентов устроено же стко. Они «умеют1? очень хорошо работать на определенных сайтах с фиксиро ванным форматом данных. При этом даже адреса этих сайтов могут быть <,заши ТЫ1? в агента, например сайты с котировками акций на биржах мира. Системы, построенные на базе специализированных агентов, кроме поиска пре доставляют пользователям определенный пакет средств для организации и уп равления найденной информацией. Как правило, такие системы содержат набор агентов, каждый из которых ориентирован на поиск информации только по од ной теме. Они могут иметь доступ к сотням ресурсов Интернета, включая специа лизированные базы данных. Основные специализации агентов в таких систе мах в настоящее время - новости, конференции и группы по интересам, книги, программное обеспечение, электронные магазины и другая бизнес-информация, часто задаваемые вопросы и некоторые другие. Обычно пользователь здесь мо жет сфЬрмировать запрос к системе, используя естественный язык, а результаты сопровождаются аннотациями содержания найденных документов, списками ключевых слов и некоторой другой дополнител �ной информацией, облегчаю щей пользователю выделение интересующих его ресурсов. В развитых системах этого класса имеются возможности: • сохранения параметров поиска для повторного использования, а часто и пол ной «истории1? запросов пользователя; • параллельного поиска на множе�тве ресурсов Интернета; • оформления результатов- в виде отчетов (НТМL-файлов) и сохранения их в базе данных; • слежения за обновлением информационных ресурсов Интернета, в том числе с частотой, задаваемой пользователем. 340 Глава 9 • Интелле ктуальные Интернет-технологии Недостатки у специализированных агентов те же, что и у неспециализированных, но есть и серьезный плюс - четкое срабатывание на хорошо структурированных данных в известном формате. 9. 3. 3. Системы интеллектуальных поисковых агентов Сегодня в развитии систем поиска и обработки Интернет-ресурсов наметился явный сдвиг в сторону использования средств ИИ, в частности представления знаний и вывода на знаниях, интеллектуальных механизмов обучения, анализа естественно-языковых текстов и некоторых других . . Как правило, системы интеллектуального поиска разрабатываются либо в серь езных фирмах, владеющих технологиями разработки и реализации интеллекту альных агентов, либо в исследовательских лабораториях университетов. Спра ведливости ради следует заметить, что коммерческие версии таких систем часто декларируют больше, чем реализовано в действительности, а исследовательские разработки обычно существуют в виде демонстрационных версий с ограничен ными всзможностями, хотя в теоретическом плане последние интереснее. Для конкретизации дальнейшего изложения остановимся сначала более подроб но на нескольких, интересных на наш взгляд, коммерческих системах интелле1< туальноrо поиска и обработки информации в сети Интернет, а завершим обсуж дение рассмотрением нескольких исследовательских проектов в этой области, использующих онтологии. Autonomy и Webcompass - системы интеллектуального поиска и обработки информации Обсуждаемые ниже версии аrентных поисковых систем Аиtопоту [Autonomy, 1998] и Webcompass [Webcompass" 1999] созданы во второй половине 90-х годов. Цели их разработки практически одинаковые - обеспечить пользователя интег рированными средствами поиска релевантной его интересам информации в сети интернет, организация наиденных документов в рамках определенных тем, а так' же автоматизация процессов самого поиска. Вместе с тем проектные решения, принятые разработчиками, здесь существенно разные. Первое различие между этими системами в ориентации на разные категории пользователей. Система Autonomy представляет собой совокупность программных агентов для интелле1ауального поиска и обработки информации, организованных в рамках специализированной оболочки, предназначенной скорее для конечных пользо вателей, чем предмет11ых специалистов. Такая установка влечет за собой специ альную организацию интерфейсов, интуитивно понятную и прозрачную для но вичков. По сути, пользователю здесь предлагается парадигма •антропоморфного� v / 9. 3 . И н формац ион ный п оиск в среде И нтернет 341 общсющ С? всеми компонентами системы и «игровой» подход к решению доста точно сложных задач (рис. 9.7). Рис. 9. 7. Главна я пан ель с и сте мы Autonomy Система Wcbcompass архитектурно тоже состоит из агснтно-ориснтированных компонентов, поддерживающих вес основные процессы, которые должны быть реализованы в полномасштабном программном комплексе поиска и анализа ин формации. Но ориентирована эта система, ттреж,т�:е всего, на «продвинутых» пользователей, которые хотят и могут сформировать структурное описание об ласти своих интересов. Коммуникационный центр Webcompass (рис. 9.8) пред лагает пользователю парадигму многооконного· интерфейса, характерную для современных офисных приложений, и систему структурных редакторов для спе цификации предметной области, поисковых запросов и управляющей информа ции. Второе различие между системами Autonomy и Wcbcompass - в подходе к описа нию предметной области поиска. В первых версиях системы Autonomy использовалась технология нсйросстсй и специальный метод представления, разработанный для фирмы AgentWarc (так тогда называлась фирма, выпустившая рслиз системы Autonomy) коллективом Neurodynamics из Кембриджа. В основе технологии лежат методы распознава ния образов и обработки сигналов. При этом системой формируется представле ние о том, какими должны быть релевантные документы, используемые в даль нейшем на этапе поиска информации. В системе Webcompass описание предметной области основано на использовании таксономии понятий, связанных между собой отношениями типа is а, part of, has part; is а kind of и некоторь!Х других. Ограничением таIЮГО представления являет- . ся то, что между понятиями не может быть больше одного· отношения. 342 Глава 9 • И нт еллектуал ьн ые Инт ерн ет-т ехнол ог ии ;fj А sрес{к:: k.ind is Xlisp ,7; О А p-!!t oi ��icialrll:e�e l;J·♦ A spec:ioc k.ind is eмpeiliystem . 'f'· ♦ See оlю k,oic P<O<J<ommino f�1- ,0 А Ц)есk k.ind is pdt81'n rec(Щl1il;ion = �:: :�:=�:i:::::= ltJ О Has pat k. nowledge ,cpresentd:ion 1� t:::j ♦ Hм. p.мt natix� � prOC8$$W)Q . ffi· ♦ W■IIM@M,liNIМWii. ;+;- О See�:o мtual � щ♦ н "' "'" """'°' ""'_.. . ф,�:.,t, 1,::.,::, �:::>,.,.х: ';'\ :юli '�' . Ta,ic: Q•l'J Tet'111S: 5 ,',:;,,,:,,:,,,,у,:,х,:;,,,:,;,,;,;,:,;.,.ц,:;i{::,:,, ,,с;)<.;,;,:,:,!,:'\ corn.putational tinguistics cotnputationallinguist.&.cs, computм- linguistics, languagt1 dat. proce,sing DeftA.itien: thc applicetion or implem.entatюn oflingui.,tic theory Ьу computer, Ca.tвgo..,.: Oweral Рис. 9 .8 . К оммуникацион ный центр системы Webcompass Третье различие между обсуждаемыми системами состоит в используемых сред ствах спецификации запросов. В системе Autonomy запрос на поиск представляется на естественном яз_ыке. Си стема анализирует текст автоматически и извлекает из него смысловое содержа ние, которое помещается в специальный конфигурационный файл. При этом внутреннее представление запроса тоже представляется нейросетью, в узлах ко торой располагаются ключевые слова и выражения. Запрос к системе Webcompass базируется на �<прямом» использовании сформи рованного пользователем описания предметной области. Поскольку здесь такое описание представлено таксономией понятий (ключевые слова и выражения), то для формирования запроса достаточно просто промаркировать интересующие пользователя темы. На основании этих пометок система сама формирует запрос на поиск релевантной информации. Собственно поиск релевантной информации в системе Autonomy ведется с ис пользованием методов нечеткой логики. В основе поискового алгоритма лежит «Механизм динамических рассуждений» (МДР), разработанный уже упоминав шимся коллективом Neurodynamics. Базовые функции МДР - сравнение кон цептов (по входному тексту определяются ссылки на документы из заранее со ставленного списка с наиболее релевантной информацией для поИ<;ка); создание агента (формируются концепты из тренировочного текста и из других подходя щих источников для использования их агентом); стандартный поиск слов в тек сте. 9 . 3 . И нформа ционный по ис к в среде И нтернет 343 Поиск в системе Webcompass ведется на основе ключевых слов. При этом он осу ществляется сразу на 35 машинах поиска, которые задаются ·списком. Этот спи соr< можно изменять, а кроме того, добав:и;ть адреса для поиска в интранет, Usenet, FTP и Gopher ресурсах. Система проверяет каждую найденную ссылку на доступность и, анализируя найденную информацию, составляет краткое ре зюме документов, а также определяет степень соответствия сайта запросу пользователя, ранжируя найденные документы от 1 до 100. Остальные функциональные возможности рассматр�ваемых систем скорее сход ны, чем различны. Это формирование репозиториев результатов, наличие фоно вого режима поиска информации и некоторые другие. Из интересных особенностей системы Autonomy, отсутствующих в системе Web compass в явном виде, можно отметить режим обучения поисr<авых агентов. Оценивая рассмотренные выше системы и класс аrентных систем данного типа можно отметить их следующие достоинства: • возможность простой модификации используемых машин поиска; • использование словарей терминов для обработки запросов; • создание кратких аннотаций найденных документов; • � поддержка настраиваемых баз данных по темам поиска и результатам; • классифицикация результатов поиска по темам, запоминание и автоматичес кое обновление ссылок на источники; • использование результатов поиска для улучшения его качества в той же области в будущем. Недостатком таких систем является, как правило, слабая обучаемость агентов. Поэтому таrше системы являются полезными инструментами при поиске инфор мации в Интернете, но не могут сделать этот поиск полностью автоматическим и эффективным с точки зрения пользователя. Справедливости ради отметим, что в последнее время фирмы, выпускавшие сис темы Autonomy и Webcompass, рассмотренные выше, а также многие другие фир мы, работающие на рынке информационных технологий, активно используют последние наработки в этой области, полученные в исследовательских лаборато риях и проектах, связанных с проблематикой искусственного интеллекта. Учитывая вышесказанное, сейчас на авансцену развития аrентных технологий вообще и использования их при поиске информации в частности выходят про блемы представления знаний, механизмы вывода новых знаний, описание модели мира, моделирование рассуждений в рамках аrентноrо подхода. По существу, именно эти аспекты и являются ключевыми при создании интеллектуальных си стем поиска информации в сети Интернет в разных исследовательских проектах, к обсуждению которых мы и переходим. П роект системы MARRI Система MARRI [Villemin, 1999]' разработана для поиска WеЬ-страниц, релевант ных запросам в определенной предметной области. Для решения поставленных 344 Глава 9 • И нтеллектуал ьные Интернет - т ехнол ог ии задач система использует знания, представленные в виде онтологии, которая в данном случае понимается как множество концептов и связей между ними. Ба зисное предположение разработчиков состоит в том, что релевантные тексты со стоят из значимых для предметной области предложений, содержащих фрагмен ты, «сопоставимые» с онтологией предметной области. Предполагается, что одни агенты - агенты сети - для предварительного отбора ис�юльзуют стандартные машины поиска, а другие - специализированные агенты - осуществляют поверх ностный анализ полученных WеЬ-страниц, затем проверяют их на соответствие так называемому онтологическому тесту и возвращают пользователю лишь те страницы, которые успешно прошли данный тест. Суть онтологического теста состоит в следующем. Сначала осуществляется мор фологический и синтаксический анализ предложений полученного от агентов сети текста и строится его синтаксическое дерево; затем осуществляется опреде ление типа "предложения (утвердительное, отрицательное и т. п.) и тип речевого акта, который это предложение отражает. Для дальнейшего анализа выбираются только простые утвердительные предложения со структурой NP VP NP, где NP именная группа, а VP - глагольная группа. При этом неявно предполагается, что структура знаний о предметной области отражена в структуре предложений, описывающих концепты. Поэтому, если анализируемое предложение действи тельно описывает некоторый концепт, значимые для предметной области слова уже присутствуют в онтологии. С учетом всего вышесказанного, онтологический. тест выполняется следующим образом: • существительные (или, в общем случае, именные группы) отображаются на концепты онтологии, а глаголы (или, в общем случае, глагольные группы) на роли; • в глагольной группе выделяется для дальнейшей обработки основной глагол (V). Если он отсутствует в онтологии, тест возвращает «неудачу», иначе: • в левой «верхней» именной группе выделяется базисное существительное (N). Если оно отсутствует в онтологии, тест возвращает «неудачу», иначе: • . проверяется ограничение (семантическое отношение) S между N и V. При этом возможны следующие варианты: • N и V действительно связаны отношением S, которое представлено в онто логии; • в онтологии отношением S связаны существительное N' и глагол V', причем N' является подклассом N, а V' - подклассом V; • если же предыдущие два варианта не имеют места, тест возвращает «неуда чу»; • аналогичная процедура выполняется и для правой «верхней» именной группы. Таким образом, онтологический тест в случае успеха поваляет «наложить» ана лизируемый текст на онтологию предметной области. 345 9 . 3 . Информа ционный по иск в среде И нтернет Архитектурно система MARRI (рис. 9.9) является сетью специализированных агентов четырех типов: агент пользователя (User Agent), агент-брокер (Broker Agent), агент сети (Connection Agent) и аrент обработки текста (Text Processing Agent). Каждый из аrентов обладает следующими свойствами: • это автономная Jаvа-проrрамма с собственным сетевым адресом (URL); • он взаимодействует с другими агентами с помощью языка ACL (Agent Com munication Language), функционирующего над НТТР-протоколом; • агент является потребителем и поставщиком информации, в зависимости от того, с ка1шми агентами системы он общается; • он может взаимодействовать с автономными программными компонентами такими как, например, WеЬ-броузеры, анализаторы ЕЯ· или онтологические БД ; • агент обладает специальными знаниями и возможностями вывода для оп ределения того, доступна ли нужная WеЬ-страница, содержит ли она те1( стовую информацию и релевантна ли эта информация определенной пред метной области . • - с Агент � nольэователя -1 - �- .� J � БД � Lонтолоrии '� Агент-брокер URL �. 1• И нтер нет-агент ·, , ' 1 Агент обработки текста - l с: Агент-брокер НТМL-страниц .. ·� 1 1, Интернет-агент --�� ::) Лексиконj Агент обработки � текста - Рис. 9.9. Архитектура системы MARRI Интерфейсный агент (ИА) поддерживает интеллектуальное взаимодействие с пользователем. Он ассистирует при формулировке запросов и представляет ре зулътаты поиска в виде списка релевантных URL или WеЬ-страниц. Когда поль зователь выбирает интересующую его предметную область, ИА запрашивает со ответствующую онтологию из онтологической БД, а также информирует других агентов сети о том, какая онтология будет использоваться. Задачей агента сети (АС) является подключение к заданной URL WеЬ-странице, ее считывание и анализ. В силу того, что нужная страница может быть недоступна 346 Глава 9 • И нтелле ктуа льные Интернет-технолог ии или неинтересна по содержанию, АС должен •уметь• обрабатывать исключи тельные ситуации, а также анализировать собственно текст, представлен ный на считанной странице. В системе MARRI задействованы два типа агентов-брокеров: брокер URL и бро кер HTML. Первые предназначены для •сопровождения,,. списков Интернет-ад ресов, поставляемых броузером, а вторые - для запоминания полученных WеЬ страниц и распределения их между агентами обработки текста (АОТ) для дальнейшего анализа. Целью функционирования ЛОТ является семантический анализ WеЬ-страниц для проверки их релевантности на базе соответствующей онтологии. Предвари тельно эти же агенты преобразуют НТМL-текст 1с определенному структурному представлению, с которым работают морфологический и синтаксичес1шй ана лизаторы. Результат обработки текста представляется в виде синтаксического дерева, которое должно отождествиться с определенным фрагментом используе мой онтологии. С архитектурной точки зрения система MARRI, по сегодняшним меркам, явля ется почти традиционной. Ее отличительная черта - представление агентов ав тономными J аvа- проrраммами с собственными сетевыми адре�ами, что неявно предполагает их мобильность и/или распределенность по сети. Taicoe решение было бы весьма интересным, если бы не политика контроля за безопасностью сервера, которая не допускает в настоящее время регистрацир и запуск Jаvа-про rрамм, не сертифицированных на данном сервере. Прототип системы реализован на языке Java (версия 1 . 1 .3). Для тестирования его разработаны две ( очень грубых) онтологии - одна в области электронной коммерции ( около 200 элементов), а вторая - в области Интернет-безопасности клиентских приложений (около 450 элементов). Предполагается развитие этих онтологий и интеграция их с соответствующими онтологиями, уже существую щими на онтологических серверах. Прототип системы OntoSeek Разработка и реализация прототипа системы • с одержательного • доступа к WWW-pecypcaм OntoSeek - результат 2-летней работы, выполненной в коопе рации Corinto (Consorzio di Ricerca Nazionale Tecnologia Oggetti - National Re search Consortiu m for Obj ect Technology) и Ladseb-CNR (National Research Council - Institute of Systems Science and Biomedical Engineering), как части про екта по поиску и повторному использованию программных компонентов [Gua rino, et al., 1 999] . Система OntoSeek разработана для содержательного извлечения информации из доступных в режиме on-line сжелтых• страниц (yellow pages) и каталогов. В рам кµ системы совместно используются механизмы поиска по содержанию, управ ляемые соответствующей онтологией ( ontology-driven content-matching mecha nism), и достаточно мощный формализм представления. 9.3. Инфо рм аци онн ы й п о ис к в среде И нтерн ет 347 При создании OntoSeek были приняты следующие проектные решения: • испо:71ъзование ограниченного числа ЕЯ-терминов для точного описания ре сурсов на фазе кодирования; • полная «терминологическая свобода• в запросах за счет управляемого онтоло гией семантического отображения их на описания ресурсов; • интерактивное ассистирование пользователю в процессе формулировки за проса, его обобщения и/или конкретизации, а также приняты во внимание: • текущее состояние исследований в области Интернет-архитеrпур; • необходимость достижения высокой точности и приемлемой эффективно сти на больших массивах данных; • важность хорошей масштабируемости и портабельности принимаемых решений. Систе�а работает как с гомогенными, так и с гетерогенными каталогами продук тов. Понятно, что второй вариант сложнее. Поэтому в системе OntoSeek для пред ставления запросов и описания ресурсов используется модификация простых концептуальных графов Дж. Совы [Sowa, 1984] , которые обладают существенно более мощными выразительными возможностями и гибкостью по сравнению с обычно используемыми списками типа «атрибут-значение•. Для концептуаль ных графов проблема контекстного отождествления редуцируется до управляе мого онтологией поиска в графе. При этом узлы и дуги сопоставимы, если онтоло гия «показывает• , что между ними существует заданное отношение. �месте с тем, посrюльку система базируется на использовании лингвистической онтологии, узлы концептуального графа должны быть привязаны к соответствующим лекси ческим единицам, прич�м для этого должны выполняться определенные семанти ческие ограничения. На этапе планирования проекта вместо разработки собственной лингвистичес кой онтологии были проанализированы доступные Интернет-ресурсы и выбра на онтология Sensus [Knight et al., 1994], которая обладает простой таксономи ческой структурой, имеет объем около 50 ООО узлов, в основном выделенных из тезауруса WordNet [Beckwith et al., 1990], а также доступна для исследователь ских целей в свободном режиме. Функциональная структура системы OntoSeek представлена на рис. 9. 10. На фазе кодирования описание ресурсов конвертируется в концептуальный граф. Для этого «поверхностные• узлы и дуги, отмеченные пользователем, с по мощью лексического интерфейса трансформируются в смыслы, заданные в сло варе. Таким образом, «граф слов,,. транслируется в «граф смыслов•, причем каж дому понятию последнего сопоставляется соответствующий узел онтологии. После семантической валидации концептуального графа на основе использова ния онтологии он запоминается в БД. 348 Глава 9 • Интелл е ктуальные Интернет - т ехнол о г ии о о Интернет Интерфейс nользоватеnя Визуализатор ответов Менеджер запросов Кодировщик ресурсов Текстовой/графический броузер он тологий Лексический интерфейс Менеджер он тологии Онтол огия Рис. 9 . 1 О. Ф ункци ональна я с труктура системы O ntoSeek Наиболее интересным моментом этапа кодирования ресурсов в системе Onto Seek является формализм представления помеченных концептуальных графов (ПКГ), который базируется на том, что заданы словари существительных и глаго лов, а собственно П КГ определяется как связный ориентированный граф, удов летворяющий следующим синтаксическим ограничениям: • Дуги могут быть помечены только существительными из словаря (любой граф, содержащий дугу, помеченную транзитивной конструкцией вида [<URL1>man] ➔ [love) ➔ [women], может быть конвертирован в базисный ПКГ вида [<URL 1 >man] � (agent) � [love] ➔ (patient) ➔ [women]). • В общем случае узлы помечаются строками вида concept [:inst:\nce] , где con cept - с уществительное или глагол из словаря, а необязательная ссылка ins tance - управляющий идентификатор. • Для каждого графа существует в точности один узел, называемый �головой,> . Этот узел маркируется URL в угловых скобках, идентифицирующим · файл описания ресурса, который описывает данный граф, и марr<ерной строки, представляющей понятие онтологии. Понятно, что прежде, чем использовать этот граф, должна быть устранена поли семия, что может позволить однозначно отразить существующие метки в поня- 9 . Э. И нформац ионный по иск в среде И нтернет 349 тия онтологии. После выполнения этой процедуры семантическая интерпрета ция ПКГ происходит следующим образом: • каждый узел, помечщ1ный •словом• А, представляет класс э1(земпляров соот ветствующего концепта. При наличии в описании идентификатора экземпля ра узел определяет синглетон, содержащий этот экземпляр. Если А - глагол, узел фиксирует его номинализацию (например, узел с пометкой •love1> опре деляет класс событий •любить•); • I(аждая дуга с пометкой С из узла А в узел В определяет соответствующее непу стое отношение; • в целом граф с •головой• А и URL U определяют класс экземпляров А, описываемых ресурсом, помеченным U. Процесс поиска осуществляется следующим образом. Пользователь представля ет свой запрос тоже в виде концептуального графа, который после устранения лексической неоднозначности и семантической валидации передается компонен те отождествления, работающей с БД. Здесь ищутся графы, удовлетворяющие запросу и ограничениям, заданным в онтологии, после чего ответ представляется пользователю в виде НТМL-отчета. Семантика графа запроса и процедура его построения аналогичны рассмотрен ной выше процедуре кодирования ресурсов, но имеет следующие отличия: • на месте URL может быть задана переменная; •, переменными мо жет быть помечено произвольное число узлов. Так, например, запрос вида [<Х> car] ➔ (part) ➔ [radio] вернет множество URL на документы, описывающие автомобили с радиоприемни1(ами в качестве части, а запрос вида [ car] ➔ (part) ➔ [ <Х> radio] - множество URL на документы, опи сывающие радиоприемник как часть автомобиля. И более того, композиция этих запросов вида [<Х> car] ➔ (part) ➔ [<У> radio] может быть использована для получения документов обоих тиsюв. Та1шм образом, предполагается, что граф запроса Q отождествляется с графом описания ресурса R, если: • Q изоморфен подграфу графа R; • пометки графа R соответствуют пометкам графа Q; • •голова• графа R соответствует узлу, помеченному переменной в графе Q. Последнее условие необходимо, если мы хотим •сосредоточиться• на ресур сах, соответствующих запросу в точности. Реализация системы OntoSeek выполнена в парадигме •клиент-сервер�. Архи тектурным ядром ее является сервер онтологий, обеспечивающий для приложе ний интерфейсы доступа и/или манипулирования данными модели онтологии, а также поддержки БД ко�u.ептуальных графов. Заметим, что последняя может строиться и пополняться не только в интерактивном режиме, но и за счет ском пилированных описаний П КГ, представленных на языке XML. Компонента БД в системе OntoSeek выделена в отдельный блок, что позволяет легко заменить при необходимости используемую СУБД. 350 Гла ва 9 • И н теллектуаль н ые И н те рн ет-тех нол о г ии Проект начался зимой 1 996 r. - на заре эры языка Java. Поэтому прототип был реализован на языке С++. В настоящее время авторы предполаrают провести ре инжиниринr системы на основе использования новейших Интернет-технологий. Таким образом, использование онтологий для интеллектуальной работы с Интер нет-ресурсами является в настоящее время •горячей• точкой исследований и практических применений. Специалистам в этой области хорошо известны Интернет-сайты организаций и проектов, связанных с созданием и использованием онтологий, но даже у них при выборе онтологии, •подходящей• для конкретного приложения, возниr(ают опре деленные проблемы. Основные из них: отсутствие стандартного набора свойств, хараr<теризующих онтологию с точки зрения ее пользователя; уникальность ло гической структуры представления релевантной информации на каждом •онто логическом• сайте; высокая трудоемкость поиска подходящей онтологии. Учитывая вышесказанное, в заключение данного параграфа рассмотрим пример интеллектуального агента, который демонстрирует онтологический подход к поиску на Web и выбору для использования собственно онтологий. (ОNТ0) 2 - агент поиска и выбора онтологий Целью разработки интеллектуального WWW-бpoкepa выбора онтологий н а Web [Vega et al., 1 999) было решение проблемы ассистирования при выборе онтоло гий. Для этого потребовалось сформировать перечень свойств, которые позволя ют охарактеризовать онтологию с точ1ш зрения ее будущего пользователя и пред ложить единую логическую структуру соответствующих описаний; разработать специальную ссылочную онтологию (Reference Ontology), в рамках которой представлены описания существующих на Web онтологий; реализовать интел лектуального агента (ОNТ0) 2 , использующего ссылочную онтологию в качестве источника знаний для поиска онтологий, удовлетворяющих заданному множе ству ограничений. Для решения первой из перечисленных задач авторы (ONT0)2 детально проана лизировали онтологии, представленные на Web, и построили таксономию свойств, используемых для описания онтологий (табл. 9.2). Для удобства даль нейшего использования все свойства сгруппированы в категории идентифиr<а ции, описания и функциональности. Как следует из приведенной таr(сономии, идентификация дает информацию об онтологии, как таковой, ее разработчиках и дистрибьюторах; описание - общую информацию, аннотацию онтологиJI, некоторые детали проектирования и реали зации, требования r< аппаратуре и программному обесnечению, ценов:ые характе ристики и перечень применений; функциональность - представление о том, как использовать онтологию в приложениях. 9. 3 . Инф о р маци онн ы й п оис к в с реде И нте рнет 35:1 При ре шении задач\J разработки ссьmочной онтологии авторы ( ONT0)2 исполь зовали уже обсуждавшую�я в ыше технологию METHONТOLOGY и инструмен, тарий ODE [Blazquez et al., 1 998] . При этом, в соответствии с общими тенденци ями по созданию разделяемых онтологи й и, по-видимому, в силу того, что один из авторов обсуждаемой работы ( Gomez-Perez) является провай дер-агентом меж дународного проекта по построению разделяемых баз знаний [ Benjamins et al., 1998], Reference Ontology была 4:Имплантиро в ана• в онтологию Product инициа тивы (КА)2 . в I<ачестве источников знаний для построения ссылочно й онтологии была ис пользована уже обсуждавшаяся таксономия свойств , концепту альная модель ( КА) 2 и свойст ва, выделенные в рамках разработки онтологии исследовательских тем ( Research-Topic) инициативы (КА)2 • Критерии, которые применялись при имплантации ссылочной онтологии в онтологию (КА) 2 , - следующие: • · модуль ность ( онтология должна бьmа быть модулыю й, чтобы обеспечить rиб1юсть и различные варианты использования); • специализация ( концепты оnределялись та1шм образом, чтобы обеспечить их классификацию по общим свойствам и гаран тировать наследование таких свойст в); • разнообразие ( знания представлялись в онтологии таким образом, чтобы ис пользовать преимущества множественного наследов ания и облегчить добав ление новых концептов); • минимизация семантических расстояний ( аналогичные концепты группиро вались и представлялись как подклассы одного класса на базе одних и тех же примитивов) ; • максимизация связе й между таксономиями; • стандартизация имен (везде, где это было возможно, для именования отноше ний использовалась конкатенация име,н концептов, которые ими связыва лись). Ан ализ концептуальной модели (КА) 2 онтологии с точки зрения перечисленных выше критериев и ссылочной онтологии показал, что: • некоторые важ ные классы отсутствуют (например, классы Server и Languages, которые должны быть под1<лассами класса Computer-Support в онтологии Pro- �ct� • некоторые важные отношения опущены ( например, отношение Distributed-by между понятиями продукта и организации); • некоторые важные с войства не представлены (например, Research-Topic-Web pages, Type-of-Ontology и некоторые другие). 352 Гл а ва 9 • Интеллектуал ьные Интернет - технол огии Табпица 9.2. Таксономия свойств, используемых дnя описания онтологий Осноаные характеристики Иденти фикация Описание Онтологии И мя , сайт-сервер, сайт-зеркало, WеЬ-страницы, доступность FAQ , ЕЯ-описание, дата окончания разработки Разработчиков ФИО, WеЬ-страницы, e-mail , контактное лицо, телефон, факс, почтовый адрес Дистрибьюторов ФИ О, WеЬ-страницы, e-mail, контактное лицо, телефон, факс, почтовый адрес Общая информация Тип онтологии; предметная о бласть; назначение; онтологические обязательстаа; список концептов верхнего уровня; статус реализации; наличие on-line и «бумажной • документации Обзорная информация Количество концептов, представляющих классы; крличество концептов, предстааляющих экземпляры; количествоаксиом; количество отношений; количество функций ; количество классов концептов . на первом, втором и третьем уровнях; количество классов на листьях; среднее значение фактора ветвления; среднее значение фактора глубины; максимальная глубина И нформация Методология разработки; формальный уровень о проектировании методологии; подход к разработке; уровень формализации спецификации; типы источ ников з наний ; достоверность источников знаний ; техники приобретения знаний ; формализм; список онтологий, с которыми осуществлена интеграция; перечень я зыков, в рамках которых доступна онтология Функцио нальность Требования ценовые К аппаратуре; программному обеспечению цена; стоимость сопровождения; оценкахарактеристики стоимости необходимой аппаратуры; оценка стоимости необходимого программного обеспечения И спользование Количество приложений; список основных приложений Описание использованных инструментальных средств; качество документации; обучающие курсы; on-line помрщь; руководства по ивпользованию; возможность мо дульного использования; возможность добавления новых знаний Поэтому был п р оведен реинжиниринr ( КА)2 онтологии, который п озвол ил рас ширить ее новыми конце птами, отношениями и свойствам», с одной стороны, и сп ец иализировать уже представл енные знания таким образом, чтобы использо вать их для сравнения разл ичных онтологий. Дл я реал изации и нтелл ектуальных WWW-брокеров поиска онтологий была п редложена архитектура OntoAgent, п редставленная на рис. 9. 1 1 . 353 9 .3. И нфо рмационный поис к в с реде И нтернет Брокер построения модели предметной области Коллекционер онтологи ческой информации Генаратор/Транслятор Концеnтуализатор 1-- --.; экземпляров t-----.i онтологий БД MS Access WWW-бpoкep поиска модели Формирователь запросов Транслятор запросов Формирователь ответов joквsjoвмsj Машина вывода Рис. 9 . 1 1 . Архитекту ра OntoAgent В р амках h:а нной архи тектуры выделяются брокер построен ия модели предмет ной област и ( Domain Model Builder Broker) и WWW-бpoкep по и ска модел и (WWW Domain Model Retrieval Broker). Первый из н и х ориенти ров ан на форм и рование концептуал ьной структуры он тологий, которые будут в поле зрения будущей эксперти зы. Этот модуль вклю чает: • Коллекцио нер а онтологической и нформ а ци и ( Ontology Information Collec tor) - WWW- и нтерфейс, ор ие нтированный на сбор и нформации от рас пре деленных по сети агентов (программных агентов и собственно пользователей). • Концептуали затор а экземпл яров (An Instance Conceptualizer) - преобразова тель данных от WWW- и нтерфейса в экземпляр онтологии , спец и фици рованный на уровне формали зма представлени я зн ани й. • Ген ер атор а/Тр анслятора онтолог и й ( Ontology Generator/Тranslator) - ком поненты отобр ажения концептуального представлен и я онтологий н а целевые язык и реал из ации , ч то обеспеч и вает доступ к н и м из удаленных приложений. Целью второго модуля явл яется обеспе ч ен и е доступа к накопленной информа ции и представление ее н аил учши м дл я пользовател я образом. Этот модул ь вкл ю чает: • Форм и рователя запросов (А Query Builder) - компоненту построен и я запро сов с и спользов ание м слова ря брокера и при необходи мости переформулиро в ан и я и/или уточ нени я запросов пользователя. ' 354 Гл а ва 9 • Инте ллектуал ьные И нтернет-тех но логи и • Транслятор запросов (А Query Translator) - преобразователя запроса в пре� ставление, совместимое с язы1<ом реализации онтологщ1. • Машину вывода ( An Inference Engine) - блок поиска ответа на запрос. • Формирователя ответов (An Answer Builder) - компоненту, которая служит ,!.{ЛЯ представления информации, найденной машиной вывода. По сути дела, рассмотренные выше компоненты составляют технологию построе ния WWW-брокеров для поиска информации на основе онтологий. А примером ее использования является интеллектуальный (ONTO)2 агент. Его брокер пост роения модели предметной области работает со ссылочной онтологией, а входной запрос строится как соответствующая НТМL-форма. Брокер поиска ответов реа лизован в настоящее время как Jаvа-апплет и как автономное Jаvа-приложение. Результаты поиска онтологий, удовлетворяющих запросу, возвращаются пользо вателю в виде НТМ L-формы. Оценивая представленный подход в целом, можно отметить, ч'fо он хорошо кор релирует по своим идеям и целям с уже обсуждавшейся системой Ontobroker. Однако в случае ( ONTO) 2 агента для хранения формализаций онтологий исполь зуется база данных, а для поиска - стандартные средства на основе SQL. Само стоятельную ценность данного проекта представляет ссылочная онтология, кото рая может использоваться не только для целей поиска, но и для стандартизации описаний онтологий вообще. Все вышесказанное показывает, что использование агентов и особенно интеллек туальных агентов при сборе, поиске и анализе информации имеет ряд преиму ществ, основные из которых сводятся к следующему [ Pagina Н., 1 996] : • они могут обеспечить пользователю доступ ко всем Интернет-сервисам и сете _вым протоколам; • отдельный агент может быть занят одной или несколькими задачами парал лельно; • преимущества агентов в том, что они могут осуществлять поиск по заданию пользователя после его отключения от сети; • мобильность (если она присутствует) позволяет агентам искать информацию сразу на сервере, что увеличивает скорость и точность поиска, уменьшая за грузку сети ; • они могут создавать собственную базу информационных ресурсов, которая об новляется и расширяется с каждым поиском; • возможность агентов сотрудничать друг с другом позволяет использовать на копленный опыт; • агенты могут использовать модель пользователя для корректировки и уточне ния запросов; • они могут адаптироваться под предпочтения и желания пользователя и, изу чив их,. искать полезную информацию заранее; 9.3. И нформа ционный поиск в с реде Интернет 355 • агенты способны искать информацию, учитывая контекст. Они могут вывести этот контекст из запрос.а, например построив модель мира пользователя; • агенты могут искать информацию интеллектуально, например используя сло вари , тезаурусы и онтологии, а также средства вывода релевантной информа ции, не представленной явно ни в запросе, ни в найденных документах. Именно поэтому с применением и развитием агентных технологий на основе ме тодов и средств искусственного интеллекта связываются самые серьезные перс пективы перехода от пространств данных к пространствам знаний в глобальных и локальных сетях. Заключение И так, уважаемый читатель , вы з ав ершаете ч тение кн и ги по баз ам зн ан ий ин тел лектуальных с и стем . Авторы отд ают себе отчет в том, что за ее р амками остались целые конти нент ы планеты Искусств енный Интеллект , кот орые еще ждут сво их и сследователей, толкователей , методисто в и , коне ч но, ч итателей. Но дорогу оси лит идущий ... И , н аверное , и менно это , а также пониман ие, что в данный момент в н ашей стране практически нет литературы , которая не то чтобы закрыл а тему , но хотя бы заф и кс и ровала пол ученн ы е в одном из ее важнейших раздел ов резул ьта т ы, подвигло нас на работу п о н ап исани ю этой кн и ги. М ат ер и ал данного учебни ка п ок аз ы вает , ч то в н астоя щее вре мя в обл ас ти баз знаний и н телл ектуальных систем уже имеется сер ьезный теоре тич еский баз ис , существует достато ч но ши рокий с п ектр соо т ветств ующ их м етодов и те х ноло гий разработ ки . Мно ги е и з н их п оддержаны адек ватным п рогра м м н ы м и нстру ментар ием . И основн ая цел ь авт оров была в том , чтобы сдел ать э ту и нфор маци ю досто я нием читателей. Поня тно , что в с илу многих п р ичи н , в частност и огр ан и чен и й на объ ем издани я , дать п олномасшт абное и логич ески замкнутое оп и са ние теор ии , методов п роекти ро вания и средств реал и з ации б аз зн ани й, а также соот вет ству ющих с и стем , основ а нных на з н ани я х , в о д ной кн и ге п рак ти чески невозмож но. О тчасти поэтому с п и сок рек-о мендов анной л итературы у н ас з на чительно шире , чем это обыч но быв ает в учебниках. Кроме того, в с п и ске литер а туры достаточно много сс ылок на рел ев ант ные тем ати к& Интернет -ресурсы , что , по нашему мнен и ю, должно п р иви ть читателю вкус к самос то я тел ьному плава нию в океа н ах уже ( или еще) доступ ной в сет и и нформ ац ии. Вместе с т ем, авт оры н адеются , чт о читатели этой кн и ги не будут восп рини м ат ь п редставленные в ней м атери ал ы как и сти ну в п ослед ней и нс та нции , но будут о тноситься к ним творч ески , а иногд а и кр ити ческ и . Ведь не секр ет, чт о дл я п ост роени я и и с п ользовани я баз знаний, н а которых основ ываются современн ы е ин теллек туальные с и стемы , требу ются и сследовател ьс кие коллект ивы , работаю щи е вмес те дол г о и и ме ю щ ие о п ы т раз ра бо т к и такого рода с и с т ем . Дл я п олучен и я дейс т в ительно хоро ши х резуль тат ов нео б ходи м ы дорогосто я щие л юдские и м атер иал ьные ресурсы - с п ециалисты, ли цензионные и нст рум е нта р ии , документация . Кроме того , р азработ ка и х достаточ но труд оемкий (годы) и дорогосто я щи й (десятк и, если не со тни т ыс. долларов) п роцесс . Во т почему в н а ст оя щее вре м я действу ю щие и нт еллектуальные си стемы ориенти рованы в ос новном н а поддержку р абот ы п остоя нно р або тающ и х груп п п ользов ателей дл я За ключ ени е 357 достаточно специализированных задач. Следует отметить и то, что в настоящее время почти нет действительно интеллектуальных систем, удобных для работы широкого круга пользователей в сети Интернет. Таким образом, разработка теории, методов и технологий представления и ис пользования знаний остается актуальной задачей для дальнейшего развития ин теллектуальных систем. Особую актуальность, по нашему мнению, приобретают . на современном этапе развития науки и общества в ц елом Инrернет-ориентиро ванные технологии и распределенный искусственный интеллект. Уже сейчас яс но, что применение систем, основанных на знаниях, компонентом которых явля ются, например, онтологии, а реализация базируется на мультиаrентных техно логиях, должно привести к рассмотрению и использованию Всемирной паутины как организованного и структурированного пространства знаний. И в заключение, авторы надеются, что их собственный скромный вклад в методо лоrию;технолоrию и программные средства создания баз знаний, также отражен ный в данной книге, позволит молодым специалистам в области искусственного интеллекта пойти дальше по тернистому пути этой молодой науки, которой так хочется стать индустрией! Литература 1 . Агеев В . Н., 1994. Примеры гипертекстов ых и гипе рмедиа систем (обзор) // Компьютерны е технологии в в ысшем образовании: Сб. статей. М.: Изд-во МГУ. С. 225-229. 2. Аверкин А. Н., Батыршин И. 3., Блишун А. Ф., Силов В. Б., Тарасов В. Б., 1986. Неч еткие множества в моделях управления и искусственного интеллекта // Под ред. Д. А. Доспелова. М.: Наука. 3. Алахвердов В. М., 1 986. Когнитивные стили в конту рах процесса познания. Когнитивны е стили // Под ред. В. Колги. -Таллинн. С. 1 2-23. 4. Александро в Е. А., 1975. Основы теории эвристических решени й. М.: Наука. 5. Алексеева И. А., Воинов А. В., Сейсян А. Р., Эткинд А. М., 1989. Психосеман ти ч еская реконструкция картины мира подростков, употре бля в ших токси ч ес кие вещества // Сб. Конструктивная психология - ново е н аправление разв и тия психологическо й науки. Под ред. А. Г. Коп ытова. Краснояр�кий гос. ун-т. С. 36-4 1 . 6 . Алексеевская М . А., Недоступ А. В., 1988. Диагностичес кие игры в медицин ских задач ах. Вопросы кибернетики // З адачи медицинской диагностики и прогнозирования с точки зрения врача. № 1 1 2. С. 1 28- 139. 7. Амамия М., Танака Ю., 1993. Архитектура ЭВМ и ИИ. М.: Мир. 8. Анастази А., 1 982. Психологическое тестирование. Т. 1 . М. С. 96- 1 62. 9. Андриенко Г. Л., Андри е нко Н. В., 1 992. Игров ые процедуры сопоставления в инженерии знаний // Сборник трудов 111 конференции по искусств е нному интеллекту. Тверь. С. 93-96. 10. Аншаков О. М., Скворцов Д. П., Финн Д. К., 1986. Логические средства экс пертных систем типа ДСМ // Семиотика и информатика. Вып. 28. С. 5- 15. 1 1 . Апресян Ю. Д. , 1 977. Экспериментальное исследование семантики русского языка. М.: Наука. 1 2. Апресян Ю.Д., 1 974. Лекси че ская семантика. Семиотические средства языка. М.: Наука. 1 3. Арбиб М., 1 975. Алгебраи ч еская теория автоматов. М.: Статистика. 14. Аткинсон Р., 1980. Человеческая память и процесс обучения // П ер. с англ. М.: Прогресс. 1 5. Байдун В. В., Бунин А. И ., 1990. Средства представл ения и обработки знаний в системе FRL/PS // Всесоюзцая конференция по искусственному интеллекту: тез. докл. Т. 1 . Минск. С. 66-7 1 . Л и те р атур а 359 16. Бахтин М. М., 1975. Вопросы л и тературы и эстети ки : Исследовани я разных лет. М.: Художестве нная л и тература. 1 7. Белнап Н., Стил Т., 1 98 1 . Логи ка вопросов и ответов. М.: Прогресс. 1 8. Берков В. Ф., 1 972. Вопрос как форма мысл и . Минск, Изд-во БГУ. 19. Берн Э . , 1988. Игры, в которые играют люди . Люди , КQторые и грают в игры// Пер. с англ. М.: Прогресс. 20. Бойкачев К. К., Конева И. Г., Нов и к И . 3 . , 1 994. 4Сценарий • - ин струмент ви зуальной разработки компьютерных программ // Компьютерные техноло гии в высшем образовании : Сб. статей. М.: Изд-во МГУ. С. 1 67 - 1 78. 2 1 . Борисов А. Н . , Федоров И. П., Архи пов И. Ф . , 1 99 1 . Пр и обрете ние знан ий для интеллектуал ьных си стем. Р и жски й технический универси тет. 22. Бори сова Н. В., Соловьева А. А. и др., 1 988. Деловая и гра 4 Методи ка конст ру и рования делово й и гры• . М.: И ПКИР. 23 . Брунер Дж., 1 97 1 . Иссл едован и е разв и тия познавател ьной деятельности // Пер. с англ. М.: Педагоги ка. 24. Бурков В. И. и др., 1 980. Деловые и гры в пр и няти и управле нч ески х решен ий . М.: М ИСИ С. 25. Бруке Ф. П., 1 979. Как проекти руются и создаются программные комплексы. М и фически й человеко-меся ц: оч ерки по си стемному программи рован и ю. М.: Наука. 26. Буч Г., 1992. Объектно-ори енти рованное проекти рован и е с пр и мерам и пр и менен и я. М.: Конкорд. 27. Беккер Л. М., 1 976. Психич еские процессы // В 3-х томах. Т. 2 . Л.: ЛГУ . 28. Вел ич ковский Б. М. , 1 982. Современная когнитивная пси хология. М.: МГУ. 29. Вел ич ковский Б. М., Кап ица М. С., 1·9 87. Пси хологич ески е проблемы изуч е ния интеллекта // Интеллектуальные процесс ы и и х модел и рование. М.: Наука. С. 1 2 0- 1 4 1 . 30. Вертrеймер М., 1 987. Продукти вное мышлени е // Пер с нем. М.: Прогресс. 3 1 . В и нер Н., 1 958. Киб�рнети ка ил: и управление и связь в жи вотном и маш ин е. М . : Сов. ради о. 32. В и ноград Т., 1976. Программа, понимающая естественн ы й язык // Пер . с .англ. М.: М и р. 33. Во инов А., Гаври лова Т., 1 994. Инженер ия знан и й и пси хосеманти ка: Об од ном подходе к выявлен и ю глубинных знаний // Известия РАН Техн ич еская ки бернети ка. № 5. С. 5- 1 3 34. Волков А. М., Ломнев В.С., 1 989. Класс и фи кация способов извлеч ен и я опыта экспертов // Известия АН СССР. Технич еская кибернетика. № 5. С. 34-45. 35. Вольфенrаrен В. Э., Воскресенская О. В., Горбанев Ю. Г., 1 979. С1:1стема пред ставления знан и й с использовани ем семантических сетей // Вопросы кибернетики : Интеллектуальные банки данных. М.: АН СССР. С. 49-69. 360 Л итератур а 36. Гаврилова Т. А., 1 984. Представление знаний в экспер1;ной диагностической системе АВТАНТЕСТ // Изв. АН СССР. Техническая кибернетика. No 5. С. 1 65- 173. · 37. Гаврилова Т. А., 1988. Как стать инженером по знаниям // Доклад на Всесо юзной конференции по искусственному интеллекту. М.: ВИНИТИ. С. 332338. 38. Гаврилова Т. А., Минкова С. П., Карапетян Г. С., 1988. Экспертные системы для оценки качества деятельности летного состава // Тез. докладов научно практической школы-семинара «Программное обеспечение и индустриаль ная технология интеллектуализации разработки и применения ЭВМ•. - Ро стов н/Д, ВНИИПС. С. 23-25. 39. Гаврилова Т. А., Червинская К. Р;, Яшин А. М., 1988. Формирование поля знаний на примере психодиагностики // Техническая кибернетика. No 5. С. 72-85. 40. Гаврилова Т. А., 1 989. От поля знаний к базе знаний через формализацию // Статья в сб. «Представление знаний в экспертных системах•. Л.: ЛИИАН. С. 16-24. 4 1 . Гаврилова Т . А., 1989. Подготовка коллектива разработчиков экспертной си стемы // Доклад на школе-семинаре «Проблемы применения ЭС в народном хозяйстве•. Кишинев. С. 59-62. 42. Гаврилова Т. А., Тишкин А. И., Золотарев А. Ю., 1989. МИКРОЛЮШЕР: экспертная система интерпретации данных // Доклад на школе-семинаре «Проблемы применения ЭС в народном хозяйстве•. Кишинев. С. 1 7-23. 43. Гаврилова Т. А., Красовская М. Р., 1 99 1 . О концептуальном анализе знаний при разработке экспертных систем // Доклад на Всесоюзной научно-практи ческо1 конференции «l иЬридные интеллектуальные системы• . t>остов н))\. С. 1 1 0- 1 1 3. 44. Гаврилова Т. А., 1922. Спецификация знаний через структурирование: введе ние в САКЕ-технологию // Сборник трудов 111 конференции по искус ствен ному интеллекту. Т. 2. Тверь. С. 1 13-1 16. 45. Гаврилова Т. А., Червинская К. Р., 1 992. Извлечение и структурирование зна ний для экспертных систем. М.: Радио и связь. 46. Гаврилова Т. А., 1995. Объектно-структурная методология концептуального анализа знаний и технология автоматизированного проектирования баз зна ний // Труды Междунар. конф. «Знания - диалог-решение 95>> . Т. 1. Ялта. с. 9. 47.Гаврилова Т. А., Котова Е. Е., Писарев А. С., 1999. Активные схемы как инстру мент семантического анализа // Труды международного семинара «ДИАЛОГ 99•. Таруса. С. 26-27. 48. Гаврилова Т. А., Лещева И. А., 1999. ВИКОНТ: Визуальный Конструктор ОНТологий для структурирования семантической информации // Труды Первой Всероссийской научной конференц;ии «Электронные библиотеки: перспективные методы и технологии, электронные коллекцию,. СПб. С. 97-98. Литере.тура 36 1 49. - Г�к П., Гавранек Т., 1 983. Автоматическое образование гипотез: математи , ческие основы общей теории· // Пер. с англ. М.: Наука. 50. Гельфанд И. И., Розенфел�,д Б. И., Шифрин М. А. Структурная организация данных в задачах медицинской диагностики и прогнозирования // Вопросы кибернетики. Задачи медицинской диагностики и прогнозирования с точки зрения врача. М.: АН СССР. С. 5-64. 5 1 . Гиг Дж., ван., 1981. Прикладная общая теория систем // � 2-х кн. М.: Мир. 52. ГИJ:Iкул Г. П., 1989. Игровой подход к приобретению знаний и его реализация в системе КАПРИЗ // Проблемы применения экспертных систем в народ ном хозяйстве: тез. докл. респ. школы-семинара. Кишинев. С.7 1 -74. 53. Гладун В. П., 1994. Процессы формирования новых знаний. София. 54. Глушков В. М., 1964'. Введение в кибернетику. Киев: Издательство АН УССР. 55. Гордон Д., 1987. Терапевтические метафоры // Личная рукопись М. М. Кага . на. 56. Горелов И. Н., 1987. Разговор с компьютером. М.: Наука. 57. Городецкий В. И., Грушинский М. С., Хабалов АВ., 1 988. Многоаrентные си стемы (обзор) // Новости искусственноrо интеллекта. No 2. '58. Грисуолд Р., Поудж Дж., Полонски И, 1980. Язык программирования СНО БОЛ-4. М.: Мир. 59. Гусакова С. М., Финн В. К, 1987. Сходства и правдоподобный вывод // Из . вестия АН СССР. Техническая кибернети1<а. No. 5. С. 42-63. 60. Дэйвисон, 1988. Многомерное шкалирование. Ме.тоды наглядного представ ления данных. - М.: Финансы и статистика. 61. Дюран Б., Оделл П., 1 977. Кластерный анализ // Пер. с франц. М.: Статисти ка. 62. Епифанов М. Е., 1 984. Индуктивное обобщение в ассоциативных сетях // Известия АН СССР. Техническая кибернетика. No 5. С. 132-146. 63. Жинкин Н. И., 1982. Речь как проводник информации. М.: Наука. · 64. Заде Л., 1972. Лннrвистическая переменная. М.: Физматrиз. 65. Зарипов Р. Х., 1983. Машинный поиск вариантов при моделировании творческого процесса. М.: Наука. 66. Зенкин А. А., 199 1 . Основы когнитивной компьютерной графики. М.: Наука 67. Иберла К, 1980. Факторный анализ // Пер. с нем. М.: Статистика. 68. Иванов П. И., 1986. Влияние некоторых индивидуально-психолоmческих осо бен ностей на процесс обобщения // Автореферат дне. канд. психол. наук. М. 69. Ивахненко Г. И., 1 97 1 . Системы эвристической самоорганизации в техничес кой кибернетике. Киев, Технiка. 70. Йодан Э., 1979. Структурное проектирование и конструирование программ // Пер. с англ. М.: Мир. 362 Литератур а 7-1 . Каган М. С., 1988. Мир общения: проблема межсубъе.ктных отношений. М.: Политиздат. .. 72. Капица П. Л., 1 967. Приглашение к спору // Юность. - No 1 . С. 79-82. 73. Келасьев В. И., 1984. Структурная модель мышления. Л.: ЛГУ. 74. Кирсанов Б. С., Попов Э. В., 1990. Отечественные оболочки экспертных сис тем // Справочник по искусственному интеллекту. Т. 1 М.: Радио и связь. с. 369-388. 75. Климов Анд. В., Романенко С. А, 1987. Система программирования РЕФАЛ-2 для ЕС ЭВМ. Описание входного языка // Препринт ИПМ АН СССР. М. 76. Ковригин О.В., Перфильев К. Г., 1988. Гибридные средства представления знаний в системе СПЭИС // Всесоюзная конференция по искусственному интеллекту: тез. докл. Т. 2. Переславль-Залесский. С. 490-494. 77. Комаров В. Ф., 1 989. Управленческие имитационные игры. Новосибирск: На ука. 78. Коов М. И., Мацкин М. Б., Тыуrу Э.Х., 1988. Интеграция концептуальных и экспертных знаний в САПР // Известия АН СССР. Техническая кибернети ка. № 5. С. 108- 1 18. 79. Коршунов А М., Манталов В. В., 1988. Диалектика социального познания. М.: Политиздат. 80. Кузичева 3. А, 1987. Языки науки, языки логики, естественные языки // Ло гика научного познания. Актуальные проблемы. М.: Наука. С. 57-73. 81 . Кузнецов В. Е., 1989. Представление в ЭВМ неформальных процедур. М.: Наука. 82. Кук Н. М., Макдональд Дж., 1986. Формальная методология приобретения и представления экспертных знаний // ТИИЭР. Т. 74, No 1 0. С.145-155. 83. Кулюткин Ю. И., Сухобская Г. С., 1 97 1 . Индивидуальные различия 'в мысли тельной деятельности взрослых учащихся. М.: Педагогика. 84. Лазарева Т. J<., Пашинин Н. Д., 1987. Деловые имитационные игры в эксперт ных системах // Деловые игры и их программное обеспечение: тез. докл. Пу щино. с. 63-64. 85. Ларичев О. И., Мечитов А. И., Мошкович Е. И., Фуремс Е. М., 1989. Выявле ние экспертных знаний. М.: Наука. 86. Лимантов Ф. С., 197 1 . О природе вопроса // Вопрос. Мнение. Человек. Уч. записки ЛГПИ им. Герцена. Т. 497. С. 4-20. 87. Липаев В. В., Серебровский Л. А, Галаrанов П. Г. и др., 1983. Технология про ектирования комплексов программ АСУ. М.: Радио и связь. 88. Лунева О. В., Хорошилова Е. А, 1 987. Психология делового общения. М.: ВКШ при ЦК ВЛКСМ. 89. Любич Д. Л., 1 998. 1000 афоризмов. СПб:, Издательство Буковскоrо. Л и те р атура 363 90. МакалистерДж., 1 990. Искусственный интеллект и ПРОЛОГ на микроЭВМ. М.: Машиностроение. 9 1 . Мальковский М. Г., 1985. Диалог с системой искусственного интеллекта. М.: МГУ. 92. Мартынов В. В., 1977. Универсальный семантический код. Минск: Наука и техника. 93. Маслов С. Ю., 1 986. Теория дедуктивных систем и ее применение. М.: Радио и связь·. 94. Материалисты древней Греции, 1 955. Собрание текстов Гераклита, Демокрита и Эпикура.: М.: Политиздат. 95. Мельчук И. А., 1 974. Опыт теории лингвистических моделей «Смысл-Текст». Семантика, синтаксис. М.: Наука. 96. Месарович М., Такахара Я., 1 978. Общая теория систем: математические основы. М.: Мир. 97. Микулич Л. И., 1 990. Промышленная технология создания систем, основан ных на заниях // В сб.: Экспертные системы на персональных компьютерах. М.: МДНТП им. Ф. Э. Дзержинского. 98. Миллс Х., 1 970. Программирование больших систем по принципу сверху вниз // В книге: Средства отладки больших систем. М.: Статистика. 99. Минский М.: 1 979. Фреймы для представления знаний. М.: Энергия. 1 00. Мицич П. П., 1987. Как проводить деловые беседы. М.: Экономика. 10 1. Моисеев Н. Н.; 1981 . Математические задачи системного анализа. М.: Наука. 102. Молокова О. С., 1 992. Методология анализа предметных знаний // Новости искусственного интеллекта. № 3. С. 1 1-60. 103. Молокова О. С., Уварова Т. Г., 1 989. База знанийдля разработчиков экспертных систем // Тез. доклада Всесоюзного научно-технического семинара «Програм мное обеспечение новых информационных технологий». Калинин. С. 23-28. 104. Моргоев В. К., 1 988. Метод структурирования и извлечения экспертных зна ний: имитация консультаций. Человеко-машинные процедуры принятия ре шений. М.: ВНИИСИ. С. 44-57. 105. Немов Р. С., 1 984. Социально-психологический анализ эффективной деятель ности коллектива. М.: Педагогика. 106. Николов С. А. и др., 1990. Анализ состояния и тенденции развития информа тики. Проблемы создания экспертных систем // Исследовательский отчет. Под ред. С. А. Николова. София: ИIПерпроrрамма. 107. Норенков И. П., 1986. Введение в автоматизированное проектирование те х нических устройств и систем. М.: Высшая школа. 108. Нортон П., Станек У., 1998. Программирование нajava // В 2-х кн. СКПресс. 109. Ноэль Э., 1978. Массовые опросы // Пер. с нем. М.: Прогресс. 364 Л и тер атура 1 10. Обозов И. И., 1986. Психологическая культура взаимны� отнощений. М.: Знание. 1 1 1 . Окунь Я., 1 974. Факторный анализ. М.: Статистика. 1 1 2. Орехов А. И., 1985. Формирование приемов эффективного решения твор ческих задач // Автореферат дис. канд. психол. наук. М. 1 13. Орлик С., 1997. Многоуровневые модели в архитектуре клиент-сервер. http:// www.citfогнm.гн/dаtаЬаsе /osbd/glava_95.shtml. 1 14. Орловский С. А., 198 1 . Проблемы принятия решения при нечеткрй исход ной информации. М., Наука. 1 1 5. Осипов Г. С., 1988. Метод формирования и структурирования модели зна ний для одного типа предметных областей // Известия АН СССР. Техни ческая кибернетика. № 2. С. 3-1 2. 1 1 6. Осипов Г. С., 1 989. Принципы прямого приобретения знаний // Сборник трудов В1орого международного семинара «Теория и применение искусст венного интеллекта»-. Созополь. С. 56-59. 1 1 7. Осипов Г. С., 1993. Информационные технологии, основанные на знаниях // Ж. Новости искусственного интеллекта. № 1 . С. 7-4 1 . 1 1 8. Осипов Г . С . , 1997. Приобретение знаний интеллектуальными системами. М.: Наука. 1 19. Осуга С., Саэки Ю. (ред.), 1990. Приобретение знаний. М.: Мир. 120. Петренко В. Ф., 1983. Введение в экспериментальную психосемантику: ис следование форм репрезентации в обыденном сознании. М.: МГУ. 1 2 1 . Петренко В. Ф., 1988. Психосемантика сознания. М.: Издательство МГУ. 1 22. Петров А. В. ( ред.), 199 1 . Разработка САПР // В 10 кн. Т. 4. М.: Высшая школа. 1 23. Пильщиков В. Н., 1983. Язык ПЛЭНЕР. М.: Наука. 1 24. Погосян Г. А., 1985. Метод интервью и дqстоверность социологической ин формации. Ереван, АН Арм. ССР. 1 25. Пономарева С. М., Хорошевский В. Ф., 1999. Методы и модели коммуника ции в профессиональных группах и группах интеллектуальных агентов // В сб. трудов 4-го меж11.ународного семинара по прикладной семиотике, семи отическому и интеллектуальному управлению ASC/IC'99. М. 1 26. Попов Э. В., Фоминых И. Б., Кисель Е. Б., Шапот М. Д., 1996. Статические и динамические экспертные системы. М.: Финансы и статистика. 127. Попов Э. В. (ред), 1996. Динамические интеллектуальные системы в управ лении и моделировании. М.: МИФИ. 1 28. Попов Э. В., 1982. Общение с ЭВМ на естественном языке. М.: Наука. 1 29. Попов Э.В., 1987. Экспертные системы: Решение неформализованных задач в диалоге с ЭВМ. М.: Наука. 1 30. Попов Э. В :, 1988. Экспертные системы. М.: Наука. 1 3 1 . Попов q. В., 199 1 . Экспертные системы 90-х гг. Классификация, состояние, проблемы, тенденции // Новости искусственного интеллекта. № 2. С. 84- 1 О 1 . Л и tе р атура 365 132. Поспелов Д. А., 1989. Моделирование рассуждений. Опыт анализа мысли тельных актов. М.: Радио и связь. 1 33. Поспелов Д. А., 1986. Искусственный интеллект: фантазия или наука? М.: Радио и связь. 134. Поспелов Д. ';i.., 1986. Ситуационное управление: Теория и практика. М.: Наука. 135. Поспелов Д. А., 1998. Многоаrентные системы - настоящее и будущее // Информационные технологии и вычислительные системы. No 1 . 1 36. Поспелов Д . А., 1 997. Три шага н а пути к официальному признанию // Но вости искусственного интеллекта. No 1. С. 99- 1 1 5. 137. Похилько В. И., Страхов Н.Н., 1990. Система KELLY. М.: МГУ; МП • Гума нитарные технологии• (на магнитном носителе). 138. Пэранек Г. В., 199 1 . Распределенный искусственный интеллект // В кн.: Ис кусственный интеллект: применение в интегрированных производственных системах, Э. Кьюсиак (ред.). М.: Машиностроение. 139. Ребельский И. В., 1 989. Азбука умственного труда // ЭКО. No7. С. 43- 150. 140. Розенталь М., Юдин П., 1 95 1 . Краткий философский словарь. М.: Полит издат. 1 4 1 . Справочник по искусственному интеллекту в 3-х т., 1990 // Под ред. Э. В. По пова и Д. А. Поспелова. М.: Радио и связь. 142. Сагатовский В. И., 1980. Социальное проектирование // Прикладная этика и управление нравствеш1 ым воспитанием. Томск. С. 84-86. 1 43. Сергеев В. М., 1987. Когнитивные модели в исследовании мышления: струк тур и онтология знания // Интеллектуальные процессы и их моделирова ние� М.: Наука. С. 1 79- 195. 1 44. Сергеев К. А., Соколов А. Н., 1986. Логический анализ форм научного поис ка. Л.: Наука. 1 45. Сиротко-Сибирский С. А., 1 968. Смысловое содержание текста и его отра жение в ключевых словах // Автореферат дне. канд. филол. наук. Л. 146. Скрэгг Г., 1983. Семантические сети как модели памяти // Новое в зарубеж ной лингвистике. Вып. 12. М.: Радуга. С. 228-271 . 147. Сойер Б., Фостер Д., 1989. Построение экспертных систем на ПАСКАЛЕ. М.: Финансы и статистика. 148. Соколов А.Н., 1947. Психо.цоmческий анализ понимания иностранного текста // Изв. АПН РСФСР. Вып. 7. С. 163-190. 149. Соколов А. Н., 1968. Внутренняя речь и мышление. М.: Просвещение. 1 50. Соколов А. Н., 1980. Проблемы научной дискуссии. Л.: Наука. 1 5 1 . Соколов Е. Н., Вейткявичус Г. Г., 1 989. Нейроинтеллект. От нейрона к ней рокомпьютеру. М.: Наука. 1 52. Соловьев С. Ю., Соловьева Г.М., 1989. Вопросы организации баз знаний в системе ФИАКР // Экспертные системы: состояние и перспективы. Под ред. Д. А. Поспелова. М.: Наука. С. 47-54. 366 л и те ратура 153. Соссюр Ф., де, 1977. Труды по языкознанию // Пер. с франц. М.: Прогресс. 1 54. Стерлинг Л., Шапиро Э., 1990. Искусство программирования на языке ПРО ЛОГ. М.: Мир. 155. Стрельников Ю. Н., Борисов Н. А., 1997. Разработка экспертных систем сред� ствами инструментальной оболочки в среде MS Wiпdows. Тверь, ТПУ. 156. Тарасов В. Б., 1998. Агенты, многоагентные системы, виртуальные сообще ства: стратегическое направление в информатике и искусственном интеллек те // Новости искусственного интеллекта. № 2. 1 57. Таунсен11. К., Фохт Д., 199 1 . Проектирование и реализация экспертных сис тем на ПЭВМ. М.: Финансы и статистика. 1 58. Терехина А. Ю., 1986. Анализ данных методами многомерного шкалирова ния. М.: Паука. 159. Терехина А.Ю., 1 988. Представление структуры знаний методами многомер ного шкалирования. М.: ВИНИТИ. 160. Тиори Т., Фрай Дж., 1985. Проектирование структур баз данных //Пер. с англ. В 2-х кн. М.: Мир. 1 6 1 . Турчин В. Ф., 1 968. Метаалгоритмический язык // Кибернетика. № 4 . С . 45-54. 1 62. Уотермен Д., 1989. Руководство по экспертным системам // Пер. с англ. М.: Мир. 1 63. Уэно Х., Исидзука М. (ред.), 1989. Представщ�ние и использование знаний. М.: Мир. 1 64. Файн В. С., 1987. Машинное понимание естественного языка в рамках кон цепции реагирования // Интеллектуальные процессы и их моделирование. М.: Наука. С. 375-391 . 1 65. Филлмор И., 1983. Основные проблемы лексической семантики // Новое в зарубежной лингвистике. Вып. 1 2. М.: Радуга. С. 74- 1 22. 1 66. Финн В. К., 1991 . Правдоподобные рассуждения в интеллектуальных систе мах типа ДСМ // Итоги науки и техники. Серия «Информатика». Т 1 5: <,Ин теллектуальные информационные системы». ВИНИТИ. С. 54- 1 0 1 . 1 67. Фон Гумбольдт В., 1984. Избранные труды по языкознанию // Пер. с нем. М.: Прогресс. 1 68. Форсайт Ф., 1 987. Экспертные системы. Принципы работы и примеры. М.: Радио и связь. 169. Франселла Ф., Баннистер Д., 1987. Новый метод исследования личности: руководство по репертуарным личностным методикам // Пер. с англ. М.: Прогресс. 1 70. Хант Д., 1986. Искусственный интеллект. М.: Мир. 1 7 1 . Хейес-Рот и др., 1987. Построение экспертных систем // Под ред. Ф. ХейесРота, Д. Уотеl? мена, Д. Ле�ата. М.: Мир. Лит ер атура 367 172. Хорошевский В. Ф., 1 983. АТNL-машина - вопросы программной и аппа ратной реализации // В сб. трудов I Международного симпозиума И Ф ИП и ИФАК, 4-6 сентября 1983 г. Л.: С. 156- 1 74. 173. Хорошевский В. Ф., 1990а. Языковые средства программиования // В кн.: Искусственный интеллект. Книга 3. Программные и аппаратные средства. М.: Радио и Связь. С. 7- 17. 1 74. Хорошевский В. Ф., 1990Ь. Программные средства представления знаний: состояние исследований и проблемы // В кн.: Искусственный интеллект. Книга 3. Программные и аппаратные средства. - М.: Радио и Связь. С. 7282. 1 75. Хорошевский В. Ф., 1993. Управление проектами в интеллектуальной сис теме PIES Workbench // Изв. РАН Серия «Техническая кибернетика». № 5. С. 7 1 -98. 176. Хорошевский В. Ф., Щенников С. Ю., 1990. Инструментальная поддержка процессов приобретения знаний в системе ПиЭС // Изв. АН СССР. Техни ческая кибернетика. № 4. С. 206-21 5. 1 77. Хорошевский В. Ф., 1 995 и РIЕS-технология и инструментарий PIES WorkBeпch для разработки систем, основанных на знаниях, Новости Искус ственного интеллекта, № 2. С. 7 -64 178. Хорошевский В. Ф., 1999. Поведение интеллектуальных агентов: модели и методы реализации // В сб. трудов 4-го международного семинара по при кладной семиотике, семиотическому и интеллектуальному управлению ASC/ IC'99. M. 179. Хювянен Э., Сеппянен Й., 199 1 . Мир ЛИСПа // В 2-х т. М.:Мир. 180. Цейтин Г. С., 1985. Программирование на ассоциативных сетях // ЭВМ в проектировании и производстве. Вып. 2. Л.: Машиностроение. С. 1 6-48. 1 8 1. Шенк Р., 1980. Обработка концептуальной информации // Пер. с англ. М.: Энергия. 182. Шенк Р., Бирнбаум Л., Мей Дж., 1989. К интеграции семантики и прагмати ки // Новое в зарубежной лингвистике. Компьютерная лингвистика. Вып. 14. М.: Прогресс. 1 83. Шенк Р., Хантер Л., 1987. Познать механизмы мышления // Реальность и прогнозы искусственного интеллекта. М.: Мир. 184. Шешюн К., Уивер У., 1963. Математическая теория связи. М.: ИЛ. 185. Шепотов Е. Г., Шмаков Б. В., Крикун П. Д., 1985. Методы активизации мыш ления. Челябинск, ЧПИ. 1 86. Шмелев А. Г., 1 983. Введение в экспериментальную психосемантику. М.; МГУ. 1 87. Шумилина Т. В., 1973. Интервью в журналистике. М.: МГУ. 1 88. Щерба Л. В., 1 974. Языковая система и речевая деятельность. Л.: Наука. 1 89. Эшби У. Р., 1959. Введение в кибернетику. М.: ИЛ. 368 1 90. 191. · 192. 1 93. Л итература Эндрю А., 1 985. Искусственный интеллект. М.: Мир. Яшин А. М., 1990. Разработка экспертных систем. Л: ЛПИ. Adeli Н., 1994. Knowledge Engineering. McGraw-HillPuЬlishing Company, N. У. Alexander J. Н ., Freiling M.J ., Shulman S.J., Rehfuss S., Messick S.L., 1 987. Ontological analysis: an ongoing. experiment // Int. J ournal of Man-Machine Stuфes. Vol. 26. Р. 473-485. 1 94. Andre J., Delpech Р.-М., 1 994. Moving from Merise to Shlaer-Mellor // Objects in Europe. Vol. 1, No. 3. Р. 7- 1 1 . 1 95. Anjewierden А., 1987. Knowledge Acquisition Tool // AI Communications. Vol. О, No. 1 . - Р. 29-38. 1 96. ART, 1 984. ART User's Manual // Inference Systems Inc., Са. 1 97. AgentBuilder, 1 999. AgentBuilder An I ntegrated Toolkit for Constracting Intelligent Software Agents // Revision 1 .3, February 18, 1999. Reticular Systems, Inc. , 1 98. Austin J. L., 1965. How to Do Things with Words. Oxford. 1 99. Autonomy, 1 998. Autonomy Technology Whitepaper. - http://www.autonomy. com/tech/wp.html 200. Aussenac-Gilles N., Natta N., 1992. Making the Method Solving Explicit with МАС АО: the SIZYPHUS case-study in Sisyphus'92: Models of proЬlem solving. Ed. Ьу M.Linster, GMD. 20 1 . Balzer R., Cheatham Т.Е., Green С., 1983. Software Technology in the 1 990s: Using а New Paradigm // Computer J. - November. Р. 39-45. 202. Barr А., Feigenbaum Е.А., 1982. The Handoook of Artificial lntelligence // Vol. 11. - Los Altos, Califomia: Kaufmann Inc. 203. Basili V.R., Perricone В.Т., 1 984. Software Errors and Complexity: An Empirical Investigation // Communications. АСМ. - Vol. 27, No. 1 . - Р. 42-52. 204. Beckwith R., Fellbaum С., Gross D., Miller G., 1990. WordNet: А Lexical Database . Organized on Psycholinguistic Principles // ln Zemik, U. (Ed.), Using On-line Resources to Build а Lexicon. Chapter 9., Hillsdale, NJ: Erlbaum. Р. 2 1 1-231. 205. Bee-gent, 1 999. Bee-gent Home Page. - http://www2.toshiba.eo.j p/Ьeegent. 206. Belgrave М., 1996. The Unified Agent Architecture: А White Paper. - http:// www.ee.mcgill.ca/-belmarc. 207. Benjamins V. R., Fensel D., et. al., 1998. Community is Knowledge! // In КА2 , In: Proc. KAW'98, Banff, Canada. 208. Bennet J. S., 1985. А Knowledge-Based System for Acquiring the Conceptual Structure of а Diagnostic Expert System // Journal of Automated Reasoning. No. 1 . Р. 49-74. 209. Bemers- Lee Т., Connolly D., 1995. HyperText Markup Language 2.0. November. 2 10. Bertalanffy L., 1950. An Outline of General Systems Theory // British Joumal of the Philosofy of Science. Vol. 1 . Р. 134 - 1 64. ,лит ера тура 369 21 1 . Black М., 1962. Models and Metaphor. Studies in Language and Philosophy. Ithaca-London, Cornell University Press. Р. 25-47. i 1 2. Blaiquez М., Femandez М., Garcia-Pinar J. М., Gomez-Perez А., 1998. Building Ontologies at the Knowledge Level using the Ontology Design Envimoment // Knowledge Acquisition Workshop, KAW98, Banff. 213. Boehm B.W., 1986. А Spiral Model of Software Development and Enhancement // АСМ SIGSOFT Software Engineering Notes. Vol. 1 1 , No. 4. 214. Bonasso Jr., 1984. ANALYST, an Expert System for processing sensor Returns // Report MTP-83W00002, MITRE Corp. 215. Boose J.H., 1985. А Knowledge Acquisition Program for Expert Systems Based оп Personal Construct Psychology // Int. Joumal of Man-Machine Studies. Vol. 23. Р. 495-525. 2 1 6. Boose J .Н., 1985а. Personal construct theory and the transfer of human expertise // Proc. 6-th Eur. Conf. Artif. Intell. Amsterdam. Р. 51-60. 217. Boos� J. Н., 1 985Ь. А knowledge acquisition program to expert systems based oh personal construct psychology // Int. Joumal of Man-Machine,Studies. Vol. 23, No. 5. Р. 499-525. 218. BooseJ. Н., 1985с. Rapid acquisition and comblnation ofknowledge from Ш\lltiple experts jn the same domain // Proc. of 2-nd Conf. Artif. Intell. Appl. Eng. Knowledge-Based Syst. Amsterdam. Р. 461 -466. 219. Boose J. Н., 1986. ETS: а РСР - based program for building knowledge-based systems // Proc. WESTEX-86: IEEE West. Conf. Knowledge-Based Eng. And Expert Syst., Anaheim, Calif. June 24-26. Washington: D. С. 220. Boose J. Н., 1989. А research framework for knowledge acquisition echniques and tools // Proc. of 3-rd European Knowledge Acquisition for Knowledge-based Systems Workshop: ЕКАТ'89. Paris. 22 1 . Boose J. Н., 1 990. Knowledge Acquisition Tools, Methods, and Mediating Representations // In Motoda Н., Mizogochi R., Boose J., Gaines В. (Eds.) Knowledge Acquisition for Knowledge-Based Systems. IOS Press, Ohinsha Ltd., Tokyo. 222. Boose J. Н., Bradshaw J. Н., Shema D. В., 1988: Transforming repertory grids to shell-based knowledge bases using AQUINAS, а knowledge acquisition workЬench // Proceedings of the AAAI-88 Integration of Knowledge Acquisition and Performance Systems W,orkshop. St. Paul. 223. Boose J. Н., Bradshaw J. М., 1986. NEOETS: Capturing expert system knowledge in hierarchical rating grids // Proc. Expert Syst. Gov.Symp. Washington. Р. 34-45. 224. Boose J. Н., Bradshaw J. М., 1987. Expertise transfer and complex proЬlems: using. AQUINAS as а knowledge-based systems // Int. Journal of Man-Machine Studies. Vol. 26, No. 1 . Р. 3-28. 2Z5. Borghoff U ., Pareschi R . , 1 998. Information Technology for Knowledge Мanagement. - Springer-Verlag, Bln. 226. Bosak J., 1997. XML, Java, and the future of the Web // Sun Microsystems. http://sunsite.unc. edu/pub/sun-info/standards/xml/why/xmlapps.htm 370 Литература 227. Bouchet С., Brunet С., Anjewierden А., 1989. SHELLY: an integrated workbench for KBS development // Proc. of9th lnt. Workshop Expert Syst. and their Appl. France, Avignon. Vol. 1 . Р. 303-315. 228. Boulding К. L., 1 956. General Systems Theory // The Skeleton of Science. Management Science. No. 2. Р. 1 97-208. 229. Braetman J. А., Magnini В., Rinaldi F., 1 994. The Generalized Italian, German, English U pper Model // ECAI'94, Amsterdam. 230. Breuker J . А. , Wielinga B.J ., 1 989. Models of Expertise in Knowledge Acquisi tion // In Guida G., Tasso С. ( ed.) Topics in expert system design. - Amsterdaш, North-Holland. Р. 1 65-295. 23 1. Breuker J. А., Wielinga В. J ., Hayward S.A., 1 986. Structuring of knowledge-based systems development // ESPRIТ"85: Status Report of Cont. Work. North Hollaпd. Р. 77 1 -784. 232. Briscoe С. & LeMaster S. U ., 199 1 . Meaningful learning in college Ьiology through concept mapping // Americaп Biology Teacher, 53(4),, Р. 2 14-2 19. 233. Brooks R. А., 1 991 . Intelligence without Representation // Artificial lntelligence. No. 47. Р. 139- 1 59. 234. Brownston L., Farrell R., et al., 1 985. Programming Expert Systems in OPS5: Ап iпtrodнctioп to Rнle-Based Programmiпg // Addison-Wesley РuЫ. Comp. Inc. 235. Buchanan В., et al., 1983. Constrнctiпg an Expert System // Building Expert Systems. 236. БУТЕ, 1989. April. Р. 206-246. 237. БУТЕ, 1990. CASE New Approach to Software Engineering // August. 238. Caines В. R., Shaw М. L., 1 984. Cognitive and Logical foundation· of Knowledge Acqнisition // Proceedings of the 5-th Banff Knowledge Acquisition for Knowledge-Based Workshop. November. Baпff, Сапаdа. Р. 82- 1 0 1 . 239. Сапе С . , Sarson Т., 1 979. Structured System Analisis // Englewood Cliffs: Preпtice-Hall. 240. CARNEGIE, 1 987. CARNEGIE GROUP INC. // Expert Systems. Vol. 4, No. 2. 24 1 . CATALYST, 1993. - Gensym Corp., G2 // In Object-Oriented Technology on Sun Workstations. Catalyst, January. 242. Chandrasekaran В., 1985. Generic tasks in knowledge-based reasoning: expert systems at the right level of abstractioп // Proceedings of the Expert Syst. in Government. Р. 62-65. 243. Cheong Fan-Chun, 1 996. �nterпet Agents: Spiders, Waпderers, Brokers, and Bots. New Riders PuЬlishing, USA. 244. Chess D., Harrisoп С., Kersheпbaum А., 1995. MoЬile Ageпts: Are They а Good Idea? // IВМ Research Division. - http://www.research.ibm.com/iagents/paps/ moblle idea abstr.html. 245. Clancey W.J ., 1 983. The epistemology of а rule-based expert system - а framework for explaпatioп // Artificial Intelligeпce. Vol. 20. Р. 2 15-251 . Л ит ература 371 246. Clancey W.J ., 1985. Review of J.F.Sowa's Conceptual Structures // Artificial Intelligence. Р. 13- 1 28. 247. Clocksin W., Mellish С., 1982. Programming in PROLOG // Berlin, Springer Verlag. 248. Colmerauer А, 1983. PRO LOG in 1 О Figures // Proceedings of IJ CAI-83. Р. 488499. 249. CompTek, 2000а. Сравнительный анализ машин поиска по материалам жур налов • Мир пк�, .Ре Magazine/RE�, • Планета Интернет• . - http:// www.comptek.ru/arcadia/review/review.html. 250. CompTek, 2000Ь. Сравнительный анализ русскоязычных машин поиска по материалам журнала • Планета Интернет •. - http://www.comptek.ru/arcadia/ review/review_rus.html. 2 5 1 . Conklin j., 1 987. Hypertext: An Introduction and Survey // Computer. Vol. 20, No. 9. Р. 1 7-4 1 . 252. ConklinJ., 1 996. Designing organizational memory: Preserving intellectual assets in а knowledge economy // Electronic PuЬlication Ьу Corporate Memory Systems, Inc. 253. Connah D., 1994. The Design of Interacting Agents for Use in Interfaces // In Brouwer-Janse, D. & Harringdon, Т. L. (eds.); Human-Machine Communication for Educational Systems Design, NAТО ASI Series, Series F, Computer and Systems Sciences 1 29. Heidelberg: Springer Verlag. 254. Cook N. М., 1 985. Computer Programming Expertise: Vanation of Cognitive Structure : vanations of cognitive structures in FТ durso, chair, human expertise // Papers in Honor of W.Chaise, Meeting of Southern Psychological Association. Austin: ТХ. Р. 73-89. 255. Courtois Р., 1985. On Time and Space Decomposition of Complex Structures // Communinications of the АСМ. Vol. 28, No. 6. Р. 596-610. 256. Cowie J., Lehnert W.G., 1 996. Information Extraction // (:omm. АСМ. No. 39( 1 ). 257. Cullen J., Bryman А., 1 988. The knowledge acquisition bottleneck: time for reassessment // Expert Systems. Vol. 5, No. 3. 258. Davis R., 1 982. TEIRESIAS: Applications of meta-level knowledge // Knowledge based systems in Artificial Intelligence. N.Y.: McGraw-Hill. 259. Davis R., 1984. Interactive Transfer of Expertise // In: Rule-Based Expert Systems / Buchanan В. G., Shortliffe Е. Н. London, Addison-Wesley. Р. 1 7 1 -205. 260. Кleer de j., 1989. ProЬlem solving with the ATMS // Artifitial Intelligence. Vol. 28, No. 2. Р. 197-224. 26 1 . Delgado .R ., Joaquin А.• 2000. Agent-Based Information. 262. DeMarco Т., 1979. Structured Analysis and System Specification. - Englewood Cliffs, NJ: Prentice Hall. 372 Л ит ер атура 263. Demazeau У., Muller J.-P. (eds.), 1 990. Decentralized Artificial Intelligence. Amsterdam: Elsevier North-Holland, 1 990. 264. DiderichJ., Ruhman 1., Мау М., 1 987. KRITON: а knowledge acquisition tool for . expert systems // Int. Journal of Man-Machine Studies. Vol. 26, No. 1 . Р. 9-40. ' 265. Durkin J., 1998. Expert Systems: Catalog of Applications. - ICS, USA. 266. Eisenstadt М . , Domingue J., Rajan Т., Motta Е., 1 990. Visual Knowledge Engineering // IEEE Transactions оп Software Engineering. Vol. 16, No. 10. Р. 1 1 64- 1 1 77. 267. Engelbart О., 1 986. Hypertext as а New Form of Non-linear Documentation // Communication of АСМ. Vol. 3, No. 5. Р. 143- 1 55. 268. Eshelman L., 1 987. MOLE. А Knowledge Acquisition Tool That Buries Certainty Factors // lnt. Journal of Man-Machine Studies. Vol. 26, No. 1 . Р. 563-577. 2 69. EXSYS, 1 985. Exsys User Manµal // EXSYS Inc. 270. FainJ., Hayes-Roth F., Sowizral Н., Waterman D., 1 982. Programming in ROSIP an Introductionby M eans of Examples // Report N- 1 646-APRA. - Rand Co1·poration. 2 7 1 . Farq_uhar А., Fikes R . , Rice J . , 1 996. The Ontolingua S erver: А Tool for Collaborative Ontology Construction // Кnowledge Systems Laboratory, KSL96-26, September, 1 996. 272. Feigenbaum Е., 1 977. The art of artificial intelligence: themes and case studies of knowledge engineering // Proceedings of IJCAI-77. 273. Feige nbaum Е . , Buchanan В . Dendral and Meta- Dend ral // Artificial lntelligence. Vol. 1 1 , No. 1 -2. 274. Feinstein А., 1 958. Foundations of Information Theory. McGraw-hill, N. У. 275. Fensel, D., Decker S., Erdmann М., Studer R., 1998. Ontobroker: How to еnаЫе intelligent access to the WWW // In AAAI-98 Workshop on AI and lnformation Integration. Madison, WI. 2 76. Fernandez М., Gomez-Perez А., Juristo N., 1997. METHONTOLOGY: From Ontological Art Toward Ontological Engineering // Spring Symposium Series on Ontological Engineering. AAAl-97, Stanford. USA. 277. Fikes R. Kehler Т., 1 985. The role of frame-based representation in resoning // Com. АСМ. Р. 904-920. 2 78. Fikes R.E., Nillson N., 1 97 1 . STRIPS: А New Approach to the Application of Theorem Proving to ProЬlem Solving // Artificial Intelligence. Vol. 5, No. 2 . 279. Finin Т., McAdamsJ., Кleinosky Р . , 1 984. FOREST: an expert system fo r automaic Test Equipmentj/ Proceedings of the First Conference on Artificial Intelligence Applications. IEEE computer Society. Р. 689-702. ,' 280. FIPA, 1 998. Ontology Service. FIPA 98 Specification. Part 1 2. October, 1998. http://www.cset.it/fipa. 28 1 . Fisher К. М., Faletti j., Patlerson Н., Thomton R., Lipson J. & Spring, С., 1 990. Computer assisted concept mapping // Journal of College Science Teaching. No. 19 (6). Р. 347-352. ,Л�т�ратура 373 . 282, : ,f;isher. К. М,, 1,990, Sc.mantic, aetworking: New kid on the Ыосk // Journal of " Research in Science Teaching. No. 27( 10). Р. 100-1-1018. ,283. Fisher К. М., 1992. SemNet: ·А tool for personal knowledge construction // In : ' ·P;1 Komniers, D. Jonassen, & Т. Mayes (Eds.) Cognitive tools for learning. Berlin: Sprjnger Ve�lag. Р. 63-76 . . 284 .. Flprentin J. J., 1987. Software Review: КЕЕ // Expert Systems. Vol. 4, No. 2. Р. 1 18- 120.. . 285. Forgy С. L., 198 1. OPS5 User's �nual. - Pittsburg, Ра: Carnegie-Mellon University. 286. Franklin S,, Graesser А., 1996. Is it an Agent, or just а Program ?: А Taxonomy for Autonom0us Agents // Proceedings of the Third International Workshop on · Agent- Theories, Architectures, and Languages, Springer-Verlag. 287. Fridman N., Hafner, 1997. Ontology Design: А Survey and Comparative Review · . /1 AI Magazine. No. 18 (3). Р. 53-74. 288. Furna G. W., Zac·ks J., 1994. Multitrees: Enriching and Reusing Нierarchical Structure // Human Factors in Computing Systems. Conference Proceedings. Bbston, Ms. Р. 330-334 289. Gruber Т. R., 1995. Toward Principles for the Design of Ontologies Used for Knowledge Sharing // International J ournal of Human and Computer Studies. No� 43(5/6). Р. 907-928. 290. Gaines В. R., 1987. An Overview of Knowledge Acquisition and Transfer // Speci,й · issue on the 1st Knowledge Acquisition for Knoweledge-Based _Systems W orkshop. Part 3, International Journal of Man-Machine Studies, 26. Р. 453-472. 291. Gaines В. R., 1989. Second Generation Knowledge Acquisition Systems // Proceedings of the Second European Knowledge Acquisition Workshop. Vol. 17. Bonn. Р. 1-14. 292. Gaines В. R., Shaw M.L.G. , 1986. �nowledge Engineering Techniques // . Proceedings of AUTOFACT86. Detroit. Р. 79....:96. 293. Gaines В. R., Shaw М: L. G., 1987. КIТТЕN: Knowledge initiation and transfer tools for experts and novices // InternationalJoumal of Man-Machine Studies. Vol. 27, No. 3, Р. 251 -280. 294. GammackJ. G., Young R. М., 1985. Psychological Techniques for Eliciting- Expert · Knowledge -/ / Research and Development in Expert Systems. Cambridge: University Press. 295. Gane С., and Sarson,T., 1979. Structured System Analysis. - Englewood Cliffs, NJ: Prentice Hall: 296. Gavrilova Т., Chernigovskaya Т., 1999. Cognitive Aspects of Visual Knowledge Base Design // Proceedings of the Intemational Coцference PEG, Intelligent Computer and communications technology (Teaching & Leaming for the 21-st Century), Great Britain. Р. 174- 181. 297. Gavrilova Т., Kotova E.;Stash N., 1 999. Adaptive Distance Learning Course on Artificial Intelligence, ICL99, Austria. 374 Л ите ратура 298. Genesereth М. R., Fikes R. Е., 1987. Knowledge interchange format, version 3.0. Reference manual // Technical report, Logic-92 - 1 . Computer Science Dept., Stanford U niversity. http:j/www.cs.umbc. edu/ksej. 299. Gillmore J.F., Pulaski К, 1985. А survey of expert system tools // Proc. of the Second IEEE Conf. on AI Applications. Р. 498 -502. 300. Goldberg F . , Robson D . , 1 983. S MALLT ALK-80: the Language and its Implementation. Reading, Mass: Addison Wesley. 30 1 . Goldfarb С. F., 1 99 1 . The SGML Handbook. Clarendon Press. 302. Goldsmith Т. Е., Schvaneveldt R. W.�1985. ACES: Air combat Expert Simulation // Memo. In Comput. And Cogn. Sci., MCCS-85-34, Comput. Res. Lab. New Mexico: State Univ. 303. Goldsmith Т. Е, Johnson Р. J . , & Acton W. Н., 1 99 1 . Assessing structural knowledge // Journal of Educational Psychology, 83, Р. 88-96. 304. Gopalan, 1 999. А Detailed Comparison of CORBA, DCOM and Java/RMI (with specific code_ examples). - http://www.execpc. com/-gopalan/index.html. 305. Green С. А., 1 977. Summary of PSI program synthesis system // Proc. of IJ CAI77. Р. 380-38 1 . 306. Griswold R . , 1 978. А History of the SNO BOL Programming Language // SIGPLAN Notices. Vol. 1 3, No. 8. Р. 275-308. 307. Grover М., 1983. А Pragmatic Knowledge Acquisition Methodology // Proceeding of IJCAI. Р. 436-438. 308. Gruber Т. R., 199 1 . The role of common ontology in achieving sharaЫe, reusaЫe knowledge bases // In]. А. Allen, R.Fikes, and Е. Sandewell, editors, Principles of Knowledge Representation and Reasoning, I n: Proceedings of the Second International Conference. Morgan Kaufmann. Р. 60 1 -602. 309. Gruber Т. R., 1 993. А translation approach to portaЫe ontologies // Knowledge Acquisition. No. 5 (2). Р. 199-220. 3 1 0. Gruber Т., 1 989. The Acquisition of the strategic Knowledge. Academic Press. 3 1 1 . Gпшinger М., Fox М., 1 995. Methodology for the Design and Evaluation of Ontologies // Proceedings of IJCAI-95 Workshop on Basic Ontological Issues in Knowledge Sharing. 3 1 2. Guarino N., 1996. Ontologies: What Are They, and Where's The Research? // А panel held at KR'96, the Fifth I nternational Conference on Principles of Knowledge Representation and Reasoning, November 5, 1 996, Cambridge, Massachusetts. http://www-ksl.stanford.edu/KR96/Panel.html. 3 13. Guarino N., Giaretta Р., 1 995а. Ontologies and Knowledge Bases. Towards а Terminological Clarification // In: Towards Very Large Knowledge Bases. - N.J .I. Mars (ed.), IOS Press, Amsterdam. 3 14. Guarino N., Masolo С., Vetere G., 1 999. OntoSeek: Content-Based Access to the Web // IEEE INTELLIGENT SYSTEMS. - May/June 1999. 3 1 5. Guarino N., Poli R., 1995Ь. The role of ontology in the information technology // lnternational Journal of Human-Computer Studies. No. 43(5/6). Special issue on ontology. Р. 623-965. 375 Л и те р атур а 1 316. Guida G. , Tasso С., 1989. Buldung Expert Systems: From Life Cycle to development methodology // Topics in Expert Systems Design, Metodologies and Tools. Amsterdam, North Holland. Р. 3-24. 317. Haberman А. N., Notkin D., 1986. Gandalf: Software Development Environments // IEEE Trans. Software Eng. Vol. SE- 12, No. 12. Р. 1 1 17- 1127. 3 18. HaЬermann N., Flon F., Cooprider L., 1976: Modularization and Hierarchy in а Family of Operating Systems // САСМ. Vol. 19, №5. Р.266-272. 319. Harmon Р., 1987. Review in Expert Systems // Expert Systems Strategies. Vol. 3, No. 6. Р. 11- 18. 320. Hart А., 1986. Knowledge Acquisition for expert systems. London, Kogan Page. 321. Heflin j., Hendler J., Luke S., 1998. Reading Between the Lines: Using SHOE to Discover Implicit Knowledge from the Web // In AAAI-98 Workshop on AI and Information Integration. 322. Hinkelmann К: and Кieninger Th., 1997 Task-oriented web-search refinement and information filtering. DFKI GmbH. 323. HTML4, 1998. HTML 4.0 Specification, W3C Recommendation, revised on 24 April 1998. http://www.w3.org/ТR/REC-html40. 324. Jackson М., 1975. Principles of Program Design. N. У.: Academic Press. 325. Jonassen D.H., 1993. Changes in knowledge structures from building semantic net versus production rule representation of subject content. Joumal of Computer Based lnstruction, 20 (4), Р. 99- 109. 326. Jonassen D.H., Mandl Н. (Eds), 1999. Designing Hypermedia for Learning, Springer-Verlag N. У., Incorporated. · 327. Jones А., 1992. The Object Model: а Conceptual Tool 'for Structuring Software. Operating Systems. N. У.: Springer-Verlag. Р. 8. 328. Kahn G., Nowlan S., McDermott J., 1985. MORE: An Intelligent Knowledge Acquisition Tool // The proceedings, of the Ninth Joint Conference on Artificial Intelligence. - August. Los Angeles, СА. Р. 581-584. 329. Kaplan R. М:, Berry-Rogghe G., 199 1. Knowledge-based acquisitions of causal relationships in text // Knowledge Acquisition. № 3. Р.3 17-337: 330. Kelly G.A., 1955. The Psychology of Personal Constructs. - N. У.: Norton. 331. Kestely'n J., 1992. Application Watch // The Intemational Jour. Of Knowledge Engineering. Vol. 8, No. 2. Р. 123- 129. 332. Khoroshevsky V.F., Situation Control Software: From Symbol Manipulation Languages Through Knowledge Representation Systems to Semiotic Technologies, Proc. Of the 1995 ISIC Workshop, - 10 IEEE International Symposium on Intelligent Control, 127- 129 ( 1995). 333. Khoroshevsky V. F., Knowledge V.S., 1998. Data Spaces: How an Applied Semiotics to W ork on WеЬ // In: Proceedings 3rd Workshop on Applied Semiotics, National Conference with International Participation (СА1'98), Pushchino, Russia. 376 Литература 334. Khoroshevsky V. F., 1985. ATN-based Explanation Subsystems: Design and Impleшentation // Computers and Artificial Intelligence. Vol. 4 ( 1985), No. 4, Р. 289-3 11. 335. Khoroshevsky V. F., 1994. Knowledge Based Design of Intelligent Interfaces in PiES W orkBench // Proc. of the Sixth International Conference on Artificial lntelligence and lnformation- Control Systems of Robots. - Smolenice, Slovakia. September 21-25, World Scientific. Р. 159- 168. 336. Khoroshevsky V. F., 1994Ь. Knowledge Based,Design of Кnowledge Based Systems in PiES W orkBench / / Proc. of J CKBSE'94, Japan- C IS Symposium on Knowledge Based Software Engineering'94. Р. 256-261. 337. Kifer М., Lausen G., Wu J., 1995. Logical Foundations of Object-Oriented and Frame-Based Languages // Journal of the АСМ. 338. Кintsch W., 1974. The representation of meaning in memory. N. У. 339. Кitto С. М., BooseJ. Н., 1987а. Heuristics for expertise transfer: an implementation of а dialog manager for knowledge acquisition // International Journal of Man Machine Studies. Vol. 26, No. 2. Р. 183-202. 340. Кitto С. М., Boose J. Н., 1987Ь. Choosing knowledge acquisition strategies for application tasks // Proc. of WESTEX'87. Р. 96- 103. 341. Knight К., Luk S., 1994. B uilding а Large Knowledge Base for Machine · Translation, Proc. Amer. Assoc // Artificial Intelligence Conf. (AAAl-94). AAAI Press, Menlo Park, Cali[ Р. 773-778. 342. Kommers P. А. М., 1989. Texlvision. Eachede, Netherlands: University of · Twente, · Educational lnstrumentation Department. 343. Kozma R. В., 1992. Constructing knowledge with learning tool. In Р. Kommers, D. Jonassen, А Т. Mayes (Eds.), Cognitive tools for learning (Р. 23-32). Berlin: Springer-Verlag. 344. Kozma R. В., 1987. The implications of cognitive psychology for computer-based learning tools. Educational Technology, ( 11). Р. 20-24. 345. Kruskal J. В., 1964. Nonmetric multidimensional scaling: а numerical method, Psychometrika 29, Р. 115- 129. 3,4 6. Kьhn О., Abecker А., 1998. Corporate Memories for Кnowledge Management in Industrial Practice: Prospects and Challenges. 347. Kьhn О., Becker V., Lohse V. and Ph. Neumann, 1994. lntegrated Knowledge Utilization and Evolution for the Conservatiori of C orporate Know-How // ISMICK'94: Int. Symposium on the Management of Industrial and Corporate Knowledge. 348. Labrou У., Finin Т., 1997. А Proposal for а new KQML Specification // TR CS97-03. February 3, 1997. 349. Lai К. W., 1989. Acquiring expertise and cognitive skills in the process of constructing an expert system: А preliminary study. Paper presented at the annual meeting o_f the American Educational Research Association, San Francisco. СА (ERI C Document No. ED 312986). 377 л итераТУр а 350, Lamping L., Rao R., Pirolli Р. 1 995. А Focus+Context Technique Based on · Hyperbolic Geometry f()r Visualizing Large Нierarchies // In Proceedings of the АСМ SIGCHI Conference on Human Factors in Computing Systems. 35 1 . LeibowitzJ., Bland К., 1994. Using Multimedia to Help Students Learn Knowledge Acquisition // Multimedia Computing - Preparing for the 2 1 -th Century ed. · · Reisman S. - USA: Idea Group PuЫishing. Р. 537-556. · 352. Lenat, D. В,, 1995. СУС: А Large-Scale Investment in Knowledge Infrastructu re // Communications of the АСМ 38. № 1 1. http://www.cyc. сот. 353. Lesser V., Horning В., Кlassner F., Raja А., Wagner Т., Zhang S., 1998. А Next Generation Information Gathering Agent // Umass Computer Science Technical Report 1 998-72, Мау, 1 998. 354. Lippert R. C. & Finley F., 1988. Student's refinement of knowledge during the development of knowledge for expert systems // Paper presented at the annual meeting of the National Association for Research in Science Teaching, Lake of �he Olarks, МО. (ERI� Document No. ED 293872). 355. L1ppert R.C.; 1988. An expert system shell to teach proЫem solving. Teach Trends, 33(2). Р. 22-26. 356. Lowe D., Hall W.; 1999. Hypermedia and the Web: An Engineering Approach. Wiley, John & Sons, Incorporated. 357.. LU:ke s.; Spector L., Rager D., 1996. Ontology-Based Knowledge Discovery on the World-Wide Web // In: Proc. Of the Workshop on I nternet-based Information Systems, AAAl-96, Portland, Oregon. 358. Macintosh_A, 1997. Кnowledge asset management // Airing. No. (20), April. 359. Maikevich N. V., Khoroshevsky V. F., 1998. Knowledge Driven Processing of HTML-Based Information for Intellectual Spaces on Web // In: Proceedings of the Third Joint Conference on Knowledge-Based Software Engineering, Smolenice, Slovakia. ° 360; Maikevich N. V., Khoroshevsky V. F., 1 999. I ntelligent Processing of Web . Resources: Ontology-Based Approach and Multiagent Support // In: Proceedings of 1st International Workshop of Central and Eastem Europe on ·мulti-agent Systems ( CEEMAS'99). - 1 -4 June, 1 999, St.-Petersburg, Russia. 36 1 . Malsch Тh., Bachmann R, Jonas М., MillU., and Ziegler S., 1993. Expertensysteme in der Abseitsfalle? - Fallstudien aus der industriellen Praxis. edition sigma, Reiner Bohn Vetiag, Berlin. 362. Markus S., 1 987. Taking Backtracking with а Grain of SALТ // Int. J ournal of Mart•Machine Studies. Vol. 26, No. 4. Р. 383-398. 363. Masui S., McDermott J., 1983. Decision-making in Time-critical Situations // Proceedings IJКAI-83. Р. 233-235. 364. Matarozzo J.D., Wettman М., Weins AN., 1963. Interviewer influence on duration of interview speech // J. Verbal Learning and Verbal Behavior. No. ' 1 . 365. Maurer F., Dellen В., 1 998. А Concept for an Intemet-based Process-Oriented Knowledge Management Environment // Proceedings of the КАW'98, Banff, Canada. 1 378 Л ите ратур а , 366. McCarthy J., 1978. History of LISP // SIGPLAN Notices. Vol. 13(1978). Р. 217223. 367. McClure С. А., 1979. CASE Workshop // БУТЕ. - April. 368. MDBS, 1986. Guru User Manual // MDBS Inc. 369. Mesarovic M.D. (ed), 1964. Views on General Systems Theory. N. У., Wiley. 370. Mikulescky L., 1988. Development of Interactive computer programs to help students transfer basic skills to college level science and behavioural sciences cpurses. Bloominglon IN: Indiana University. 37 1. Minsky М.А., 198 1. Theory of memory // Perspectives in Cognitive Science. Norwod, N. S., АЫех. 372. Monahan j.S., Lockhead G.R., 1977. Identification of integral stimuli // Journal off Experimental Psychology. General 106. Р. 94- 1 1 О. 373. Moon D., 1973. MACLISP Reference Manual. МIТ Press, Cambridge, Mass. 374. Motta Е., Eisenstadt М., Pitman К., West М., 1988. Support for knowledge acquisition in the Knowledge Engineer"s Assistant (КЕАTS) // Expert Systems. Vol. 5. Р. 6-27. 375. Motta Е., Rajan Т., Eisenstadt М., 1989. А methodology and tool for knowledge acquisition in КЕАTS-2 // Proc. of Int. Summer Sch. Тор. Expert Syst. Des.: Methodol. and Tools. Amsterdam. Р. 297-323. 376. Motta Е., Rajan Т., Dominiguej., Eisenstadt М., 1990. Visual Knowledge Engine ering // IEEE Transactions on software engineering. Vol. 16, No. 10. Р. 151- 164. 377. Motta Е., Rajan Т., Dominiguej., Eisenstadt М., 1991. Methodological foundations of KEATS, the Knowledge Engineer's Assistant // Knowledge Acquisition. No. 3. Р. 21-47. 378. Musen М. А., Fagan L. М., Combs D. М., Shortliffe Е. N., 1987. Use of а Domain Model to Drive an lnteractive Knowledge-Editing Tool // Int. Journal of Man Machine Studies. Vol. 26, No. l. Р. 105- 121. 379. NEXPERT OBJECT, 1990 // Tutorial. Nexpert Со. 380. Nielsen j., 1990. HyperText & HyperMedia. Academ. Press Inc 38 1 . Nonaka 1. and Takeuchi 1., 1995. The Knowledge-Creating Company. N. У.: . Oxford: Oxford U niversity Press. 382. Nwana Н. S., 1996. Software Agents: An Overview // Knowledge Engineering Review. Vol. 1 1, №3. Cambridge University Press. Р. 1-40. 383. Olson J. R., Reuter Н. Н., 1987. Extracting expertise from experts: methods for knowledge acquisition // Expert systems. Vol. 4, No. 3. 384. Olton j.D., Muser М.А., Combs D.M. et al., 1987. Graphical access to medical expert systems // Methods of lnformation in Medicine. Vol. 26, No 3. 385. Orr D, Kenneth Т., 1977. Structured System Development. N. У.: Academic Press. 386. Orr D, Kenneth Т., 1977. Structured System Development. N. У.: Academic Press. 387. Ovum, 1994. Intelligent agents: the new revolution in software. Ovum. Л ите р атура 379 388. Pagina Н . , 1996. Intelligent. . Software Agents оп the I nternet. http:/ / www.hermans.org/agents/index.html. 389. Pega М., Sticklen J., Bond W., 1993. Functional Representation and Reasoning // IEEE Expert. April. Р. 65-78. 390. Peters L., 198 1. Software Design. N. У.: Yourdon Press. 391. Piatetsky-Shapiro G. and Frawley W., eds. , 199 1. Knowledge Discovery in Databases. AAAI/MIТ Press. · 392. Pospelov D.A., Basic concepts of Situational Languages and formal means of analysis and control of natural systems, Presented at the QAT Teleconference, New Mexico State University and the Army Research Office, DecemЬer 13, ( 1996). 393. Pospelov D.A., Semiotic Models in Control Systems, In. Proc. of the 1995 ISIC Workshop - the 10th IEEE International Symposium on Intelligent Control, 6� 12 ( 1995). 394. RabЬits L., Wright G., 1987. Card tricks for small players // Expei:t Systems U ser. Vol. 22, No. 11. 395. Raggett D., 1977. HTML 3.2 Reference Specification. - http://www.w3.org/ТR/ REC-html32. 396. Ramamoorthy С. V., 5hekhar S., Garg V., 1987. Software Developnient Support for AI Programs // Computer. Vol. 20, No. 1. Р. 30-40. 397. Rasmussen J., Brehmer В., Leplat J., (eds.), 1991. Distributed Decision-Making. Cognitive Models for Cooperative Work. N. Y.: J. Wiley & Sons. 398. RDF, 1999. Resource Description Framework (RDF) Data Model and Syntax // W3C Recommendation. - http://www.w3.org/TR/WD-rdf-syntax. 399. ReggiaJ. А., 1988. Representing and using medical knowledge for the neurological localization // Report TR-693, Computer Science Dept., University of Maryland. 400. Reisman S., 199 1. Developing Multimedia Applications // IEEE Computer Graphics & Applications. Р. 58-66. 401. Richer М., 1986. An evaluating of expert system development tools // Expert Systems. Р. 166- l83. 402. Ricoeur Р., 1975. La metaphore vive. - Paris, Editions du Seuil. 403. Ross D.T., Goodenough J.B., lrvine С. А., 1975. Software Engineeripg: Process, Principles and Goals // Computer. VQl. 8, No. 5. Р. 17-28. 404. Sacerdoti Е., et al., 1976. Qlisp: а Language for the Interactive Development of Complex Systems // SRI, Tech. note 120. 405. Schlenker D. А. & Abegg G. L, 199 1. Scoring student-generated concept maps in introductory college chemistry. Paper presented at the annual meeting ofNational Association for Research in Science Teaching, Lake Geneva. WI. 406. Schoucksmith G., 1978. Assessment through interviewers. Oxford. 407. Schreiber G., Breuker J., Bredeweg В., Wielinga В., 1988. Modeling in KBS Development // Proceedings of the Second European Knowledge Acquisition Workshop ( EKAW-88). Bonn. Р. 1- 15. 380 Л ите ратура 40К Schvaneveldt R. W., Durso F. Т., Dearholt D. W., 1985. Pathfinder. Scaling with network structure // MCCS-85-9. 409. Schwartz Т., 1988. Scoping //IEEE Expert,· Vol. 3, No. 1. 4 10. Scott А., Clayton J. Е., Gibson Е. L., 1994. А practical Guide to Knowledge Acquisition. Addison-Wesley РuЫ. 4· 1 1. Searle J. R., Vanderveken D., 1985: Foundations of Illocutionary Logic. � Cambridge Univ. Press: Shoham У., 1993. Agent-oriented programming // Artificial Intelligence. № 60( 1 ). 4 12. Shaw М. L., Woodward j. В., 1988. Validation of а KnowledgeSupport System // Proceedings of the 2-th Knowledge Acquisition for Кnowledge-Based W orkshop. Banff, Canada. 4 13. Shaw М., 1984. Abstraction Technique in Modern Programming Language; // IEEE Software. Vol. 1(4). 4 14. Shaw М. L. G., 1982. PLANET: some experience in creating an integrated system for repertory grid application on а microcomputers // lnternational J ournal of Man-Machine Studies. Vol. 17, No. 3. Р. 345-360. 4 15. Shaw М. L. G., Gaines В. R., 1984. Deriving the constructs underlying decision. // Fuzzy Sets and Decis. Anal, Amsterdam. Р. 335-355. 4 16. Sherstnew W.Yu., WorfolomeeW A.N., Aleshin А. Yu., 1994. FRAME/2 Application Program Interface for Frame Knowledge Bases // Proc. of J C K BSE'94, J apan- C IS Symposium on Knowledge Based Software Engineering'94. Р. 168- 170. 4 17. Shlaer S., Mellor S. , 1992. Obj ect Life Cycles: Modelling the World in States. Englewood Cliffs, NJ: У ourdon Press. 4 18. Shortliffe Е., 1976. Computer based medical consultations: MYC IN. N. У., American Elsevier. 4 19. Shortliffe Е.Н., Buchanan B.G., Feigenbaum Е.А., 1979. Кnowledge engineering for medical decision-making: а review of computer-based clinical decision aids // Proceedings of the IEEE. Vol. 67, No. 9. Р. 1207- 1224. 420. SIGSOFT, 1986. АСМ SIGSOFT Software Engineering Notes. Vol. 1 1, No. 4, August. 42 1. Sisodia R., Warkentin М., 1992; AI in business and management // РС AI. Jan/ Feb. Р. 32-34. 422. SKDL, 1998. Human Agent Interaction // FIPA98 Draft Specification: Part 8. http://www.cset.it/fipa/fipa87 13.doc 423. Slagle J. R., Gardiner О. А., Kyungsook N., 1990. Knowledge Specification on an Expert System // IEEE Expert. August. Р. 29-38. 424. Slagle J. R., Gaynor М., 1983. Expert System Consultation Control Strategy // Proceedings AAAl-83. Р. 369-272. 425. Sloman А., 1996. What sort of architecture is required for а humaц-like agent? // lnvited talk at Cognitive Modeling Workshop, AAAI-96, Portland Oregon, August 1996. Литература 38 1 426. Sowa, J., 1984. Conceptual Structures: lnformation Processing in Mind and Machine. - Addison-Wesley, Ready, Massachussets. 427. Stoffel К., Taylor М., Hendler J., 1997. Efficient Management of Very . Large Ontologies // In Proceedings of American Association for Artificial Intelligence Conference (AAAI-97). AAAI/MJT Press. 428. Sussman G.J ., McDermot D.U., 1 976. From PLANNER to C ONNIVER - А Genetic Approach // Proc. of 1 976 Joint Computer Conference. AFIPS Press. Р. 271-278. 429. Teitelman W., 197 4. INTERLISP Reference Manual // XEROX PARC. 430. Torgerson W. S., 1958. Theory and methods of scaling. N. У.: Wiley. 431. TOVE, 1999. TOVE Manual. - Department of industrial Engineering, University of Toronto. - http://www.ie/utoronto.ca/EIL/tove. 432. Tschaitschian В., AЬecker А. and Schmalhofer, 1997. А. Putting Knowledge Into · Action: Information Tuning With КАRАТ // In 10th European Workshop on Knowledge Acquisition, Modeling, and Management (ЕКАW -97). 433. Tuthill G.S., 1994. Knowledge Engineering. - ТАВ Books Inc. 434. Uschold М., Gruninger М., 1 996. ONTOLOGIES: Principles, Metho.ds and Applications, // Кnowledge Engineering Review. Vol. 1 1, No. 2. 435. Van der Vet Р.Е., Mars N.J ., Speel Р.Н., 1994. The Plinius Ontology of Ceramic Materials // ECAI'94, Amsterdam. 436. Villemin F.-Y., 1999. Ontologies-based relevant information retrieval. - http:// www.cnam.fr/f-yv. 437. VIТAL, 1990. VIТAL: А Methodology-Based WorkЬench for KBS Life Cycle Support // ESPRiT-II Project 5365. 438. Voinov А., Gavrilova Т., 1993. Knowledge Acquisition through Elicitation of Latent Cognitive Structures: Metaphor � Based Approach // Proc. of East-West International Conference on Artificial Intelligence: From Theory to P_ractice EWAIC'93. Moscow. Р. 1 13-1 19. 439. W AI, 1999. WеЬ Accessibllity Initiative (W AI) Web site. - http://www.w3.org/ WAI/ 440. Walker С. Т., Miller К.R., 1 988. - Expert Systems 1987: An Assessment of Technology and Applications. Madison. 44 1 . Wall R., Apon А. Beal J. at al., 1986. An evaluation of commercial expert system building tools // Data Knowledge Eng. Р. 279-304. 442. Watanabe S., 1969. Кnowing and Guessing. N. У.: Wiley. 443. Waters R.C., 1985. The Programmer's Apprentice: А Session with KBEmacs // Trans. Software Eng. Vol. SE- 1 1 , No. 1 1 . 444. Wayner Р., 1995. Free Agents // БУТЕ. March. Р. 105- 1 14. 445. WebCompass, 1 999. WebCompass Page. - http://www.symantec. сот/ techsupp/weЬcompass/kbase_webcompass.html. 382 , Л и те ратура 446. Wielinga В., Akkermans Н., Schreiber G., Balder J ., 1989. А Кnowledge Acquisition Per�pective on Knowledge-Level Models // Proceedings of the Fourth Knowledge Acqцisition for Кnowledge-Based Systems Workshop. - Banff, 36. Р. 1 -22. 447. Wielinga В., SchreiЬer G.,Breuker J., 1992. А Modelling.Approach to Knowledge Engineering // Кnowledge Acquisition. 4 ( 1). Special Issue. 448. Wielinga,B.J ., Bredeweg В., Breuker J. А, 1988. Кnowledge Acquisition for Expert Systems // Proceedings of АСА188. 449. Woods W. А, Bookman L. А., Houston А., Kuhns R. J., Martin Р., Green S., 1999. Linguistic Knowledge Can lmprove Information Retrieval // Knowledge Technology Group, Sun Microsystems, TR-99-83. - http://www.sun.com/ research/techrep/1999. 450. Wooldridge М., Jennings N., 1995. Intelligen� Agents: Theory and Practice // Knowledge Engineering Review. No. 10 (2). 45 1. Wray R. Ron С. et. al., 1994. А Survey of Cognitive and Agent Architecture. http:/jkrusty.eecs.umich.edu/cogarch0/ 452.· Wiig, 1990. Expert Systems: А manager's guide. Geneva: The International Labour Office of the United Nations. 453. Wiig К. , 1996. Knowledge management is no illusionl // Proc. of the First International Conference on Prattical Aspects of Кnowledge Management. Zurich, Switzerland: Swiss Informaticians Society 454. Wilks У., 1976. Parsing English 11 // Computational Semantics. Eds. У. Wilks, Е. Sharniak. N. У.: North-Holland. Р. 155- 184. 455. XML, 1998. ExtensiЪle Markup Language (XML) // W3C Recommendation. http://www.w3.org/ТR/1998/REC-xml-1998021 О. 456. Yourdon Е. Constantine L., 1979. Structured Design. - Englewood Cliffs, NJ: Yourdon Press / Prentice-Hall. 457. Yourdon Е., 1989. Modern Sructured Analys is. - Prentice-Hall Int. Ed. Т. А. Гаврилова, В. Ф. Хорошевский Базы знаний интеллектуальных систем Главный редактор В. Усманов Оrветственный редактор Е. Строганова Руководитель проекта И. Корнеев Литературный редактор Н. Дубнова Художник Н. Биржаков Иллюстрации М. Жданова Верстка М. Жданова Корректор В. Листова Лицензия ЛР № 066333 от 23.02.99. Подписано в печать 3 1 .07.00. Формат 70x l00 1/16• Усл. п. л. 30,96. Тираж 5000 экз. Заказ № 1382. Изцательство «Питер•. 1 96 1 05, Санкт-Петербург, Благодатная ул., д. 67. Оmечатано с диапозитивов в ГПП «Печатный двор• Министерства РФ по делам печати, телерадиовещания и средств массовых коммуникаций. 1 97 1 10, Санкт-Петербург, Чкаловский пр., 15.

базы знаний

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib