Загрузил lelapog229

базы знаний

реклама
'
Т. А. Гаври11ова
В. Ф. Хорошевский
(
nnTEP
"'
�·
1'.,,!
&13Ь1311НИI
ИНТЕЛЛЕКТУАЛЬНЫХ
СИСТЕМ
• студентам вузов,
изучающим вопросы
искусственного
интеллекта в рамках
соответствующих
дисциплин
• разработчикам
интеллектуальных
систем
• всем интересующимся
вопросами инженерии
знаний
Т. А. Гаврилова
В. Ф. Хорошевский
& 3Ь1311111
ИНТЕЛЛЕКТУАЛЬНЬ/Х
СИСТЕМ
Допущено Министерством образования Российской Федерации
в качестве учебного пособия для студентов вузов, обучающихся по направлениям
«Прикладная математика и информатика», «Информатика и вычислительная техника»
и специальностям «Прикладная информатика» (по областям),
«Прикладная математика и информатика»
Санкт-Петербурr
Москва• Харьков• Минск
2000
/),dЛпJ•
�J
Ф
ББК 32.973.23-018я7
УДК 681.3.016(075)
Г12
Рецензенты:
Колосов О. С., доктор технических наук. профессор, декан факультета «Автоматика и вычислительная техни­
ка» Московского энергетического института (технического университета)
Кутепов В. П., доктор технических наук, профессор, заведующий кафедрой «Прикладная математика»
Московского энергетического института (технического университета)
Кумунжиев К. В., доктор технических наук, профессор, заведующий кафедрой «Информационные системы»
Ульяновского государственного университета
Сулейманов Д. Ш., кандидат технических наук, заведующий совместной научно-исследовательской
лабораторией «Проблемы искусственного интеллекта» Академии наук Татарстана
и Казанского государственного университета
Г12
Базы знаний интеллектуальных систем/ Т. А. Гаврилова, В. Ф. Хорошевский - СПб:
Питер, 2000. - 384 с.: ил.
ISBN 5-272-00071-4
Учебник для технических вузов по входящим в различные дисциплины вопросам разработки
интеллектуальных систем - развивающейся области информатики. Актуальность предмета
определяется растущим применением инженерии знаний и системного анализа в различных
областях деятельности.
Особенностью изложения является его практическая направленность: освоения имеющегося
материала достаточно для начала самостоятельной работы над созданием интеллектуальной
системы, основанной на знаниях.
В учебнике учтена все возрастающая роль Интернета, и потому подробно рассматривается
применение инженерии знаний в Сети.
ББК 32.973.23-018я7
УДК 681.3.016(075)
\SBN 5-272-00071-4
©Т. А. Гаврилова, В. Ф. Хорошевский, 2000
© Серия, оформление. Издательский дом «Питер», 2000
Содержание
Предисловие .................................................................. 6
Об авторах .......................................................................................................... 8
От издательства ................................................................................................. 8
1 . Введение в интеллектуальные системы ........................... 9
1.1. Краткая истор ия искусственного интеллекта .............................................. 9
1.2. Основные направления исследований в области
искусст венного интеллекта ...........................................···················:······.. 15
1.3. Представление зн аний и вы вод
на знаниях ................................................................................................. 19
1.4. Нечеткие знания ........................................................................................ 31
2. Разработка систем, основанных на знаниях ................... 39
2.1. Введение в экспертные системы. Определение и структура .................... 39
2.2. Классификация систем, основанных на знаниях ....................................... 41
2.3. Коллектив разработчиков .......................................................................... 45
2.4. Технология проектирования и разработки ................................................ 49
З. Теоретические аспекты инженерии знаний ..................... 59
3.1. Поле знаний ................................ J............................................................. 59
3.2. Стратегии получения знаний ..................................................................... 67
3.3. Теоретические аспекты извлечения знаний .............................................. 71
3.4. Теоретические аспекты структурирования знаний .................................... 90
4. Технологии инженерии знаний ........ � ............................. 99
4.1. Классификация методов практического извлечения знаний ..................... 99
4.2. Коммуникативные методы ....................................................................... 102
4.3. Текстологические методы ....................................................................... 124
4.4. Простейшие методы структурирования .................................................. 131
4.5. Состояние и перспективы автоматизированного приобретения
знан ий ..................................................................................................... 137
4.6. Примеры методов и систем приобретения знаний ................................. 145
/
4
Содержани е
5. Нов1а1е тенденции и прикладные аспекты
инженерии знаний .................................................... 181
5.1. Латентные структуры знаний и психосемантика ..................................... 161
5.2. Метод репертуарных решеток·········································:··················--··· 176
5.3. Управление знаниями ............................................................................. 183
5.4. Визуальное проектирование баз знаний как инструмент познания ........ 190
5.5. Проектирование гипермедиа БД и адаптивн ых обучающих систем ........ 195
6. Проrраммный инструментарий разработки систем,
основанн1:а1х на знаниях • • • . . • • . . • • • . • • . • . • • • • • • • • • • . • • • • • • • • • . • • • • • • • 203
6.1. Технологии разработки программн ого обеспечения - цели,
принципы, парадигмы ..............................•.............................................. 203
6.2. Методологии создания и модели :жизненн ого цикла
интеллектуальных систем ....................................................................... 214
6.3. Языки программирования для ИИ и языки представления знаний .......... 218
6.4. Инструментальные пакеты для ИИ .......................................................... 224
6.5. WorkBench-cиcтeмы ....................... ,........................................................ 231
7. Пример разработки системы, основанной на знаниях •..• 237
7. 1. Проду кционно-фреймовый ЯПЗ PILOT/2 ................................................. 237
7 .2. Психодиагн остика - приме р пред метной области для построения
экспертных систем ................................................................................. 252
7.3. Разработка и реал изация психодиагностической ЭС «Cattell• ................ 256
8. Представление данных и знаний в Интернете .......•.....•. 27 1
8.1. Язык HTML и представлен ие знаний ....................................................... 271
8.2. Онтологии и он тологические системы ..................................................... 284
8.3. Системы и средства представления онтологических знаний .................. 301
9. Интеллектуальные Интернет-технолоrии ....•.....•.......... 3 1 7
9.1. Программные аген ты и мультиагентные системы ..........................._. ....... 3 17
9.2. Проектирование и реализация аген тов и мультиагентных систем .......... 323
9.3. Информационный поиск в среде Ин тернет ............................................. 335
Заключение ................................................................ 356
Литература ................................................................. 358
С любовью, учителю Д. А. Поспелову, друЗЫ1.М и близким,,
всем, кто помог созданию этой версии учебника,
и, надеемся, будет сотрудничать с нами дальше
...
/
Предисловие
Вы открываете необычный учебник - учебник, предназначенный для студентов
технических университетов и их преподавателей, для аспирантов, магистров, ба­
калавров и практиков-разработчиков. Этот учебник написан для тех, кто хочет
вступить в мир науки с интригующим названием - ИСКУССТВЕННЫЙ ИН­
ТЕЛЛЕКТ.
Несмотря на обилие книг с аналогичным названием ( см. список основной лите­
ратуры), на сегодняшний день нет вузовского учебника по предметам �интеллек­
туальные системы�, �экспертные системы�, �Базы знаний� и т. д. Тем не менее
практически все технические университеты совершенно справедливо включили
такого рода дисциплины в свои программы. Поскольку бум в этой науке при­
шелся на конец 70-х и 80-е, большинство книг на русском языке издано в эти
годы. И авторы приносят благодарность создателям первых отечественных мо­
нографий и справочников, а также переводчикам классических книг в этой обла­
сти - Д. А. Поспелову, Э. В. Попову, В. Л. Стефанюку, Г. С. Осипову и другим
пионерам, без работ которых создание этого учебника было бы невозможно.
Необычность этого учебника связана также с подчеркнутой междисциплинарно­
стью выбранного подхода, отказом от �клановости� отдельных научных школ и
направлений. Этот учебник могут читать инженеры и математики, экономисты и
биологи, программисты и медики. Он практически не требует предварительной
подготовки в данной области знаний и рассчитан на широкий круг читателей,
заинтересованных разработкой интеллектуальных систем, основанных на зна­
ниях.
Мы отказались от излишней специализации в пользу широты изложения, нам
хотелось представить горизонты этой науки, а не прокопать в ней глубокий, но
узкий туннель.
Другой особенностью учебника является его практическая направленность. Ос­
воив изложенны11 материал, студент или другой заинтересованный читатель смо­
жет самостоятельно приступить к разработке интеллектуальной системы в роли
инженера по знаниям. Акцент в учебнике сделан именно на работу со знаниями.
Фактически он ориентирован на подготовку уникальных специалистов, спрос на
которых на современном рынке высоких информационных технологий много­
кратно превышает спрос на программистов. Этих специалистов называют по-раз­
ному - системные аналитики, постановщики задач, инженеры по знаниям, инже­
неры-когнитолоrи. По англu.йски это - knowledge engineers.
Предисловие
7
Рассмотренные в учебнике вопросы представляют лишь вершину айсберга срав­
нительно молодой науки- ИНЖЕНЕРИИ ЗНАНИЙ. И, надеемся, показывают
ее новые горизонты в мире информационных технологий.
Учитывая значительное число достижений и публикаций в этой области за рубе­
жом, авторь1 сознательно будут приводить терминологию, используемую в ориги­
налах, что существенно облегчит изучение проблемь1 желающим повысить свою
квалификацию через Интернет и другие источники англоязычной информации.
Материал учебника основан на курсах лекций, прочитанных авторами для сту­
дентов Санкт-Петербургского государственного технического университета (быв­
ший Политех) и Московского физико-технического института (Технического
университета). Объем кур.са от 32 до 64 лекционных часов плюс столько же
практических занятий. По сути дела здесь в одном учебнике собрано несколько
курсов лекций, ориентированных на разные специализации и разную базовую
подготовку.. В целом же данный учебник, по опыту авторов, содержит материал
для двухгодовых курсов с общим названием •Искусственный интеллект•.
Разные категории читателей могут читать учебник по различным •сценариям•.
• Сценарий 1 - для студентов-�сачков» технических вузов перед сессией. По­
метить в оглавлении параграфы, вошедшие в список вопросов для экзамена, и
читать на максимальной скорости.
• Сценарий 2 - для студентов-отличников. Внимательно прочесть весь учебник
последовательно, затем перейти к сценарию 1.
• Сценарий 3 - для студентов-непрограммистов и всех, кто просто интересует­
ся проблемой для расширения кругозора. Главы 1, 2, 4, 9.
• Сценарий 4 - для преподавателей вузов и тех, кто хочет овладеть инженерией
знаний. Использовать учебник как готовый конспект, расширив или сократив
материал по своему усмотрению. Варианты:
• минимальный курс: параграфы 1.1-1.4, 2.1-2.4, 3.2, 3.4, 4.1-4.3, 4.4, 6.3,
8.2, 9.1;
• главы 1-2 могут составить основу вводного курса в проблематику искус­
ственного интеллекта и систем, основанных на знаниях;
• аналогичный вводный курс по тематике программных средств искусствен­
ного интеллекта может дать материал главы 6, параграфа 7.1 и, при нали­
чии времени, 9.1, 9.2;
• семестровый курс по базам знаний экспертных систем может быть прочи­
тан на основе глав 2-4, 7;
• базовый курс по инженерии знаний составляют главы 3, 4;
• наконец, главы 8, 9 дают основу для курса по тематике интеллектуальных
Интернет-технологий.
• Сценарий 5 - для системных аналитиков. Главы 3-6.
• Сценарий 6- для программистов и разработчиков. Главы 2-4, 6-9.
Материал, набранный более мелким шрифтом, носи:r иллюстративный характер.
8
Предисловие
В заключение авторы благодарят заведующую редакцией технической литера, туры издательства -.Питер• Екатерину Строганову за энергию и энтузиазм при
убеждении авторов принять решение о начале работы над учебником и поддерж­
ку в ее завершении.
В параграфе 4.6. четвертой главы использованы материалы монографии •При­
обретение знаний интеллектуальными системами•, любезно предоставленные
ее автором Г. С. Осиповым.
На подготовку материалов, представленных в параграфах 8.2 и 8.3 восьмой гла­
вы, а также в параграфах 9.1 и 9.3 девятой главы, в значительной мере повлияла
работа по мультиагентным системам и интеллектуальным Интернет-ориентиро­
ванным: системам поиска информации, проведенная Н. В. Майкевич при подго­
товке кандидатской диссертации на тему -.Исследование методов анализа Ин­
тернет-ресурсов и реализация на этой основе мультиагенtной системы поиска
информации• (ИПС РАН, Переславль-Залесский, 1999). По сути дела именно
ей один из авторов данной книги обязан своей -.миграцией• в эту новую, чрез­
вычайно интересную и перспективную область интеллектуальных информаци­
онных технологий из проблематики экспертных систем и программного обеспе­
чения систем искусственного интеллекта.
Отдельная благодарность должна быть высказана Е. Васильевой, Н. Нумеровой
и Н. Сташ, сотрудницам Института высокопроизводительных вычислений и баз
данных Миь:науки РФ, за техническую помощь при работе над рукописью, без
которой книга могла бы так и не дойти до читателей.
Главы 1-5 написаны д. т. н., проф. Гавриловой Т. А., главы 6-9- д. т. н., проф.
Хорошевским В. Ф. Предисловие и заключение- результат совместной работы
авторов, которые с надеждой на дµьнейшее сотрудничество выражают глубо­
кую признательность всем, кто помог выходу этой книги.
Об авторах
Т. А. Гаврилова - д. т. н., профессор кафедры компьютерных интеллектуальных
технологий Санкт-Петербургского государственного технического университета,
председатель Петербургского отделения Ассоциации искусственного интеллекта.
В. Ф. Хорошевский - д. т. н., профессор МФТИ, ведущий научный сотрудник вы­
числительного центра РАН, член Научного Совета Российской Ассоциации ис­
кусственного интеллекта.
От издательства
Ваши замечания, предложения, вопросы отправляйте по адресу электронной по­
чты comp@piter-press.ru (издательство -.Питер•, компьютерная редакция).
Мы будем рады узнать ваше мнение!
Подробную информацию о наших книгах вы найдете на WеЬ-сайте издательства
http://www.piter-press.ru.
Введение
в интеллектуальные
системы
о Краткая история искусственного интеллекта
о Основные направления исследований в области искусственного
интеллекта
о Представление знаний и вывод на знаниях
о Нечеткие знания
о Прикладные интеллектуальные системы
1 . 1 . Краткая история искусственного
интеллекта
1 . 1 . 1 . Предыстория
Идея создания искусственного подобия человека для решения сложных задач и
моделирования человеческого разума витала в воздухе еще в древнейшие време­
на. Так, в древнем Египте была создана �оживающая� механическая статуя бога
Амона. У Гомера в �илиаде• бог Гефест ковал человекоподобные существа-авто­
маты. В литературе эта идея обыгрывалась многократно: от Галатеи Пигмалиона
до Буратино папы Карло. Однако родоначальником искусственного интеллекта
считается средневековый испанский философ, математик и поэт Раймонд ЛуЛJlиЙ,
который еще в XIII веке попытался создать механическую машину для решения
различных задач, на основе разработанной им всеобщей классификации понятий.
В XYIII веке Лейбниц и Декарт независимо друг от друга продолжили эту идею,
предложив универсальные языки классификации всех наук. Эти работы можно
считать первыми теоретическими работами в области искусственного интеллекта.
Окончательное рождение искусственного интеллекта как научного направления
произошло только после создания ЭВМ в 40-х годах ХХ века. В это же время Нор­
берт Винер создал свои основополагающие работы по новой науке - киберне­
тике.
10
Глав а 1 • Введение в интеллектуальные системы
Термин •искусственный интеллект• - ИИ- (AI - artificial intelligence) был
предложен в 1956 г. на семинаре с аналогичным названием в Дартсмутском
колледже (США). Семинар был посвящен разработке методов решения логи­
ческих, а не вычислительных задач. В английском языке данное словосочетание
не имеет той слегка фантастической антропоморфной окраски, которую оно при­
обрело в довольно неудачном русском переводе. Слово intelligence означает •уме­
ние рассуждать разумно•, а вовсе не •интеллект•, для которого есть термин intel­
lect.
Вскоре после признания искусственного интеллекта .отдельной областью науки
произошло разделение его на два направления: нейрокибернетика и •кибернети­
ка черного ящика•. Эти направления развиваются практически независимо, су­
щественно различаясь как в методологии, так и в технологии. И только в настоя­
щее время стали заметны тенденции к объединению этих частей вновь в единое
целое.
1 . 1 .2. Зарождение нейрокибернетики
Основную идею этого направления можно сформулировать следующим образом:
Единственный объект, способный мыслить, - это человеческий мозг. Поэтому лю­
бое �мыслящее• устройство должно каким-то образом воспроизводить его струк­
туру.
Таким образом, нейрокибернетика ориентирована на программно-аппаратное
моделирование структур, подобных структуре мозга. Физиологами давно уста­
новлено, что основой человеческого мозга является большое количество (до 1021)
связанных между собой и взаимодействующих нервных клеток - нейронов. По­
этому 'усилия нейрокибернетики были сосредоточены на создании элементов,
аналогичных нейронам, и их объединении в функционирующие системы. Эти си­
стемы принято называть нейроннь,ми сетями, или нейросетями.
Первые нейросети были созданы Розенблаттом и Мак-КШlllоком в 1956-1965 rr.
Это были попытки создать системы, моделирующие человеческий глаз и его взаи­
модействие с мозгом. Устройство, созданное ими тогда, получило название пер­
септрона (perceptron). Оно умело различать буквы алфавита, но было чувстви­
тельно к их написанию. Например, буквы А, А и А для этого устройства были
тремя разными знаками. Постепенно в 70-80 годах количество работ по этому
направлению искусственного интеллекта стало снижаться. Слишком неутеши­
тельны были первые результаты. Авторы объясняли неудачи малой памятью и
низким быстродействием существующих в то время компьютеров.
Однако в 1980-х в Японии в рамках проекта •ЭВМ V поколения• был создан
первый нейрокомпьютер, или комiiьютер VI поколения. К этому времени ограни­
чения по памяти и быстродействию были практически сняты. Появились транс­
пьютеры - параллельные компьютеры с большим количеством процессоров.
Транспьютерная технология- это только один из десятка новых подходов к ап­
паратной реализации нейросетей, которые моделируют иерархическую структу­
ру мозга человека. Основная область применения нейрокомпьютеров сегодня -
1.1. Краткая история искусственного интеллекта
11
это задачи распоэнавания образов, например идентификация объектов по резуль­
татам аэрофотосъемки из космоса.
Можно выделить 3 подхода к созданию нейросетей:
1. Аппаратный - создание специальных компьютеров, нейрочипов, плат рас­
ширения, наборов микросхем, реализующих все необх одимые алгоритмы.
2. Программный - создание программ и инструментариев, рассчитанных на
высокопроизводительные компьютеры. Сети создаются в памяти компьюте­
ра, всю работу выполняют его собственные процессоры.
3. Гибридный - комбинация первых двух. Часть вычислений выполняют спе�
циальные платы расширения (сопроцессоры), часть '- программнf?Iе сред­
ства.
Более глубокое рассмщрение этого чрезвычайно перспективного и интересного
направления исследований искусственного интеллекта выходит за рамки данной
книги. Подробнее см. работы [Соколов, Вейткявичус, 1989; Амамия, Танака, 1 993] .
1 . 1 . 3 . От кибернетики «черного ящи ка)) к И И
В основу этого подхода был положен принцип, противоположный нейрокиберне­
тике.
Не имеет значения, как устроено �мыслящее» устройство. Главное, чтобы на за­
данные входные воздействия оно реагировало так же, как человеческий мозг. Сто­
. ронники этого направления мотивировали свой подход тем, что человек не дол­
жен слепо следовать природе в своих научных и технологических поисках. Так,
например, очевиден успех колеса, которого не существует в природе, или самоле­
та, не машущего крыльями, подражая птице. К тому же пограничные науки о че­
ловеке не смогли внести существенного теоретического вклада, объясняю щего хо­
тя бы приблизительно, как протекают интеллектуальные процессы у человека,
как устроена память и как человек познает окружающий мир.
Это направление искусственного интеллекта было ориентировано на поиски ал­
горитмов решения интеллектуальных задач на существующих моделях компью­
теров. Существенный вклад в становление новой науки внесли ее «пионеры»:
Маккарти (автор первого языка программирования для задач И И - ЛИСПа) ,
Минский (автор идеи фрейма и фреймовой модели представления знаний), Нью­
элл, Саймон, Шоу, Хант и другие.
В 1 956- 1 963 rr. велись интенсивные поиски моделей и алгоритмов человеческо­
го мышления и разработка первых программ на их основе. Представители сущес­
твующих гуманитарных наук - философы, психологи, лингвисты - ни тогда, ни
сейчас не в состоянии были предложить таких алгоритмов. Тогда кибернетики
начали создавать собственные модели. Так последовательно были созданы и оп­
робованы различные подходы.
1 . В конце 50-х годов родилась модель лабиринтного поиска. Этот подход представ­
ляет задачу как некоторое пространство состояний в форме графа, и в этом
графе проводится поиск оптимального пути от входных данных к результиру-
12
Глава 1 • Введение в интеллектуальные системы
ющим. Была проделана большая работа по разработке этой модели, но для ре­
шения практических задач эта идея не нашла широкого применения. В первых
учебниках по искуссrвенному интеллекту [Хант, 1 986; Эндрю, 1 985] описаны
эти программы - они играют в игру • 15•, собирают •Ханойскую башню•, иг­
рают в шашки и шахматы.
2. Начало 60-х - это эпоха эвристического программирования. Эвристика - пра­
вило, теоретически не обоснованное, которое позволяет сократить количество
переборов в п ространстве поиска. Эвристическое программирование - разра­
ботка стратегии действий на основе известных, заранее заданных эвристик
[Александров, 1 975] .
3. В 1 963- 1 970 rr. к решению задач стали подключать методы математической
логики. Робинсон разработал метод резолюций, который позволяет автомати­
чески доказывать теоремы при наличии набора исходных аксиом. Примерно в
это же время выдающийся отечественный математик Ю. С. Маслов предложил
так называемый обратный вывод, впоследствии названный его именем, реша­
ющий аналогичную задачу другим способом [ Мас.лов, 1 983]. На основе метода
резолюций француз Ал,ьбер Кольмероэ в 1 973 г. создает язык логического про- .
граммирования Пролог. Большой резонанс имела программа •Логик -теоре­
тик•, созданная Ньюэлом, Саймоном и Шоу, которая доказывала школьные
теоремы. О днако большинство реальных задач не сводится к набору аксиом , и
человек, решая производственн�е задачи; не использует классическую логику,
поэтому логические модели при всех своих преимуществах имеют существен­
ные ограничения по классам решаемых задач.
4. История искусственного интеллекта полна драматических событий, одним из
которых стал в 1 973 r. так называемый •доклад Лайтхилла•, котррый был под­
готовлен в Великобритании по заказу Британского совета научных исследова­
ний. Известный математик Д. Лайmхuлл, никак с ИИ профессионально не свя­
занный, подготовил обзор состояния дел в области ИИ. В докладе были
признаны определенные достижения в области ИИ, однако уровень их опре­
делялся как разочаровывающий, и общая оценка·была отрицательная с пози­
ций практической значимости. Этот отчет отбросил европейских исследова­
телей примерно на 5 лет назад, так как финансирование ИИ существенно
сократилось.
5. Примерно в это же время существенный прорыв в развитии практических при­
ложений искусственного интеллекта произошел в США, когда к середИJtе
1 970-х на смену поискам универсального алгоритма мышления пришла идея
моделировать конкретные знания специалистов-экспертов. В США появились
первые коммерческие системы, основанные на знанияr, или экспертные систе­
мы (ЭС). Стал применяться новый подход к решению задач искусственного
интеллекта - представление знаний. Созданы MYCIN и DENDRAL [Shortliffe,
1 976; Buchanan, Feigenbaum, 1 978], ставшие уже классическими, две первые
экспертные системы для медицины и химии. Существенный финансовый вклад
вносит Пентагон, предлагая базировать новую программу министерства обо­
роны США (Strategic Computer Initiative - SCI) на принципах ИИ. Уже вдо- .
1 . 1 . Крат кая и стори я и скусств енного и нтеллекта
13
гонку упущенных возможностей в начале 80-х объявлена глобальная програм­
ма развития новых технологий ESPRIT (Европейский Союз), в которую вклю­
чена проблематика искусственного интеллекта.
6. В ответ на успехи США в конце 70-х в гонку включается Япония, объявив о
начале проекта машин V поколения, основанных на знаниях. Проект был рас­
считан на 10 лет и объединял лучших молодых специалистов (в возрасте
до 35 лет) крупнейших японских компьютерных корпораций. Для этих специ­
алистов был создан специально новый институт !СОТ, и они получили пол­
ную свободу действий, правда, без права публикации предварительных резуль­
татов. В резу льтате они создали достаточно громоздкий и дорогой символьный
процессор, программно реализующий ПРОЛОГо-подобный язык, не получив­
ший широкого признания. Однако положительный эффект этого проекта был
очевиден. В Японии появилась значительная группа высококвалифицирован­
ных специалистов в области И И, которая добилась существенных результатов
в различных прикладных задачах. К середине 90-х японская ассоциация ИИ
насчитывает 40 тыс. человек.
Начиная с середины • 1980-х годов, повсеместно происходит коммерциал�зация
искусственного интеллекта. Растут ежегодные капиталовложения, создаются
промышлеЙные экспертные системы. Растет интерес к самообучающимся систе­
мам. Издаются десятки научных журналов, ежегодно собираются между.народ­
ные и национальные конференции по различным направлениям ИИ.
Искусственный интеллект становится одной из наиболее перспективных и пре­
стижных областей информатики (computer science).
1 . 1 . 4 . История искусственного интеллекта
в России
В 1954 r. в МГУ начал свою работу семинар «Автоматы и мышление>> под руковод­
ством академика Ляпунова А. А. ( 1911- 1 973), одного из основателей российской ки­
бернетики. В этом семинаре принимали участие физиологи , лингвисты, психологи,
математики. Принято считать, что именно в это время родился искусственный ин­
теллект в России. Как и за рубежом, вьщелились два основных направления - ней­
рокибернетики и кибернетики «черного ящика».
В 1954-1964 rr. создаются отдельные программы и проводятся исследования в
области поиска решения логических задач. В Ленинграде (ЛОМИ - Ленинград­
ское отделение математического института им. Стеклова) создается программа
АЛПЕВ ЛОМИ, автоматически доказывающая теоремы. Она основана на ориги­
нальном обратном выводе Маслова, аналогичном методу резолюций Робинсона.
Среди наиболее значимых результатов, полученных отечественными учеными в
60-е годы, следует отметить алгоритм « Кора» М. М. Бонrарда, моделирующий
деятельность человеческого мозга при распознавании образов. Большой вклад в
становление российской школы ИИ внесли выдающиеся ученые Цетлuн М. Л.,
Пушкин В. Н., Гавршов М. А, чьи ученики и явились пионерами этой науки в Рос­
сии (например, знаменитая Гаврuловская школа).
14
Глава 1 • Введение в интеллектуальн ые системы
В 1965-1980 rr. происходит рождение нового направления - ситуационного уп­
равления (соответствует представлению знаний, в западной терминологии). Ос­
нователем этой научной школы стал проф. Поспелов Д. А. Б ыли разработаны
специальные модели представления ситуаций - представления знаний [ Поспе­
лов, 1986].
При том что отношение к новым наукам в советской России всегда было насторо­
женное, наука с таким <,вызывающим� названием тоже не избежала этой участи и
была встречена в Академии наук в штыки [Поспелов, 1997]. К счастью, даже среди
членов Академии наук СССР нашлись люди, не испугавшиеся столь необычного
словосочетания в качестве названия научного направления. Двое из них сыграли
огромную роль в борьбе за признание ИИ в нашей стране. Это были академики
А. И. Берг и Г. С. Поспелов.
Только в 197 4 году при Комитете по системному анализу при президиуме АН
СССР был создан Научный совет по проблеме << Искусственный интеллект�, его
возглавил Г. С. Поспелов, его заместителями были избраны Д. А. Поспелов и
Л. И. Микулич. В состав совета входили на разных этапах М. Г. Гаазе-Рапопорт,
Ю. И. Журавлев, Л. Т. Кузин, А. С. Нариньяни, Д. Е. Охоцимский, А. И. Поло­
винкин, О. К. Тихомиров, В. В. Чавчанидзе.
По инициативе Совета было организовано пять комплексных научных проектов,
которые были возглавлены ведущими специалистами в данной области. Проек­
ты объединяли исследования в различных коллективах страны: <,Диалог� (рабо­
ты по пониманию естественного языка, руководители А. П. Ершов, А. С. Наринь­
яни ), <,Ситуация� (ситуационное управление, Д. А. Поспелов), <,Банк� (банки
данных, Л. Т. Кузин), <,Конструктор� (поисковое конструирование, А. И. Поло­
винкин), <,Интеллект робота� (Д. Е. Охоцимский).
В 1980-1990 rr. проводятся активные исследования в области представления зна­
ний, разрабатываются языки представления знаний, экспертные системы (более
300). В Московском университете создается язык РЕФАЛ.
В 1988 r. создается АИИ - Ассоциация искусственного интеллекта. Ее членами
являются более 300 исследователей. Президентом Ассоциации единогласно из­
бирается Д. А. Поспелов, вьiдающийся ученый, чей вклад в развитие ИИ в
России трудно переоценить. Крупнейшие центры - в Москве, Петербурге, Пе­
реславле-Залесском, Новосибирске. В научный совет Ассоциации входят веду­
щие исследователи в области И И - В. П. Гладун, В. И. Городецкий, Г. С. Оси­
пов, Э. В. Попов, В. Л. Стефанюк, В. Ф. Хорошевский, В. К. Финн, Г. С. Цейтин,
А. С. Эрлих и другие ученые. В рамках Ассоциации проводится большое количе­
ство исследований, организуются школы для молодых специалистов, семинары,
симпозиумы, раз в два года собираются объединенные конференции, издается на­
учный журнал.
Уровень теоретических исследований по искусственному интеллекту в России
ничуть не ниже мирового. К сожалению, начиная с 80-х rr. на прикладных рабо­
тах начинает сказьiваться постепенное отставание в технологии. На данный мо­
мент отставание в области разработки промышленных интеллектуальных систем
составляет поряд�а 3-5 лет.
1 .2. Основные и сследования в области искусственного интеллекта
15
1 . 2 . Основн ые н аправления исследова н ий
в области искусственного интеллекта
Синтезируя десятки определений ИИ из различных источников, в �анной книге в
качестве рабочего определения можно предложить следующее.
ИскусственныR ин теллект - это одно из направлений информатики , целью которого яв­
ляется разработка аппаратно-программных средств, позволяющих пользователю-не­
программисту ставить и решать свои, традиционно считающиеся интеллектуальными за­
дачи , общаясь с ЭВМ на ограниченном подмножестве естественного языка.
Среди множества направлений искусственного интеллекта есть несколько веду­
щих, которые в настоящее время вызывают наибольший интерес у исследовате­
лей и практиков. Опишем их чуть подробнее.
1 .2. 1 . Представление знаний и разработка
систем , основанных на знаниях
(knowledge-based systems)
Это основное Itаправление в области изучения искусственного интеллекта. Оно
связано с разработкой моделей представления знаний, созданием баз знаний, об­
разующих ядро экспертных систем. В последнее время включает в себя модели и
методы извлечения и структурирования знаний и сливается с инженерией зна­
ний. Именно исследованиям в этой области посвящена данная книrа. Подробнее
см. главы 2 -5.
1 .2.2. Программное обеспечение систем И И
(software engineering for AI)
В рамках этого направления разрабатываются специальные языки д,1lЯ решения
интеллектуальных задач, в которых традиционно упор делается на преобладание
логической и символьной обработки над вычислительными процедурами. . Эти
языки ориентированы на символьную обработку информации - LISP, P R OLOG,
SMALLTALK, РЕФАЛ и др. Помимо этого создаются пакеты прикладных про­
грамм, ориентированные на промышленную разработку интеллектуальных сис­
тем, или программные инструментарии искусственного интеллекта, например
КЕЕ, ARTS, G2 [ Хейес-Рот и др., 1987; Попов, Фоминых, Кисель, Шапот, 1996].
Достаточно популярно также создание так называемых пустых экспертных сис­
тем или •оболочек• - КАРРА, EXSYS, М 1 , ЭКО и др., базы знаний которых мож­
но наполнять конкретными знаниями, создавая различные прикладные системы.
Подробно эти технологии рассмотрены в главе 6.
16
Глава 1 • Введение в и нтелле ктуальные системы
1 . 2 . З . Разработка естественно-языковых
интерфейсов и машинный перевод
( natural language processing)
Начиная с 50-х годов одной из популярных тем исследований в области ИИ я в­
ляетс я компьютерная лингвистика, и, в частности, машинный перевод (МП ).
Идея машинного перевода оказалась совсем не так проста, как казалось первым
исследователям и ' разработчикам.
Уже первая программа в области естественно-языковых ( ЕЯ) интерфейсов - пе­
реводчик с английского на русский язык - продемонстрировала неэффективность
первоначального подхода, основанного на пословном переводе. Однако еще долго
разработчики пытались создать программы на основе морфологического анали­
за. Неплодотворность такого подхода связана с очевидным фактом: человек мо­
жет перевести текст только на основе понимания его смысла и в контексте пред­
шествующей информации, или контекста. Иначе поя вля ются переводы в стиле
� мо я дорогая Маша - my expensive Masha• . В дальнейшем системы МП услож­
нялись и в настоящее врем я используется несколько более сложных моделей:
• применение так называемых �язь�ков-посредников• или языков смысла, в ре­
зультате п ро исходит дополнительная трансляция � исходный язык оригина­
ла - язык смысла - язык перевода•;
• ассоциативный поиск аналогичных фрагментов текста и их переводов в специ­
альных текстовых репозиторJ!ЯХ или базах данных;
• структурный подход, включающий последовательный анализ и синтез есте­
ственно-языковых сообщений. Традиционно такой подход предполагает на­
личие нескольких фаз анализа:
1. Морфологический анализ - анализ слов в тексте.
2 . Синтаксический анализ - разбор состава предложений и грамматических
связей между словами.
3. Семантический анализ - анализ смысла составных частей каждого предло­
жения на основе некоторой предметно-ориентированной базы знаний.
4. Прагматический анализ - анализ смысла предложений в реальном контексте на основе собственной базы знаний.
Синтез ЕЯ -сообщений включает аналогичные этапы, но несколько в другом по­
рядке. Подробнее см. работы [ Попов, 1 982; Мал ьковский, 1 985] .
1 . 2 . 4 . Интеллектуальные роботы ( robotics)
Идея создания роботов далеко не нова. Само слово <,робот• по я вилось в 20-х
годах, как производное от чешского <<робота• - тяжелой грязной работы. Его
автор - чешский писатель Карел Чапек, описавший роботов в своем рассказе
� Р.У.Р•.
1 . 2 . Основные направления в области искусственно го интемекта
17
Роботы - это эл ектротехничес кие устройства , предназначе нные для авто м ати зации че ­
ло веч еско го труда .
Можно условно выделить несколько поколений в истории создания и развития
робототехники:
1 поколение . Роботы с жесткой схемой управления. Практически все современ­
ные промышленные роботы принадлежат к первому поколению. Фактически это
программируемые манипуляторы.
11 поколение. Адаптивные роботы с сенсорными устройствами. Есть образцы та­
ких роботов, но в промышленности они пока используются мало.
111 поколение. Самоорганизующиеся или интеллектуальные роботы. Это - ко. печная цель развития робототехники. Основные нерешенные проблемы при со­
здании интеллектуальных роботов - проблема машинного зрения и адекватного
хранения и обработки трехмерной визуальной информации.
В настоящее время в мире изготавливается более 60 ООО роботов в год. Фактиче­
ски робототехника сегодня - это инженерная наука, не отвергающая технологий
ИИ, но не готовая пока к их внедрению в силу различных причин.
1 .2.5. Обучение и самообучение
(machine learning)
Активно развивающаяся область искусственного интеллекта. Включает модели,
методы и алгоритмы , ориентированные на автоматическое накопление и фор­
мирование знаний на основе анализа и обобщения данных [Гаек, Гавранек, 1983;
Гладун, 1994; Финн, 1991]. Включает обучение по примерам (или индуктивное), а
также традиционные подходы из теории распознавания образов.
В последние годы к этому направлению тесно примыкают стремительно разви­
вающиеся системы data mini ng - анализа данных и knowledge discovery - поис­
ка закономерностей в базах данных.
1 .2 . 6. Распознавание образов
(pattern recognition)
Традиционно - одно из направлений искусственного интеллекта, берущее нача­
ло у самых его истоков, но в настоящее время практически выделившееся в са­
мостоятельную науку. Ее основной подход - описание классов обьеюпов через опре­
деленные значения · эначимых признаков. Каждому объекту ставится в соот- 1
ветствие матрица признаков, по которой происходит его распознавание.
Процедура распознавания использует чаще всего специальные математические
процедуры и функции, разделяющие объекты на классы. Это направление близ­
ко к машинному обучению и тесно связано с нейрокибернетикой [Справочник
по
1990].
ии,
18
Глава 1 • В ведение в интеллектуальные системы
1 .2. 7. Новые архитектуры компьютеров (new
hardware platforms and architectures)
Самые современные процессоры сегодня основаны на традиционной последова�
тельной архитектуре фон Н еймана, используемой еще в компьютерах первых
поколений. Эта архитектура крайне неэффективна для символьной обработки.
Поэтому усилия многих научных коллективов и фирм уже десятки лет нацелены
на разработку аппаратных архитектур, предназначенных для обработки сим­
вольных u логических данных. Создаются Пролог- и Лисп-машины, компью­
теры V и VI поколений. Последние разработки посвящены компьютерам баз
данных, параллельным и векторным компьютерам [Амамия, Танака, 1 993] .
И хотя удачные промышленные решения существуют, высокая стоимость, недо­
статочное программное оснащение и аппаратная несовместимость с традицион­
ными компьютерами существенно тормозят широкое использование новых архи­
тектур.
1 .2.8. Игры и машинное творчество
Это, ставшее скорее историческим, направление связано с тем, что на заре иссле­
дований ИИ традиционно включал в себя игровые интеллектуальные задачи шахматы, шашки, го. В основе первых программ лежит один из ранних подхо­
дов - лабиринтная модель мышления плюс эвристики. Сейчас это скорее ком­
мерческое направление, так как в научном плане эти идеи считаются тупико­
выми.
Кроме того, это направление охватывает сочинение компьютером музыки [Зари­
пов, 1 983] , стихов, сказок [ Справочник по ИИ, 1 986] и даже афоризмов [Любич,
1 998] . Основным методом подобного �творчества� является метод пермутаций
(перестановок) плюс использование некоторых баз знаний и данных, содержа­
щих результаты исследований по структурам текстов, рифм, сценариям и т. п.
1 .2.9. Другие направлени я
ИИ - междисциплинарная наука, которая, как мощная река по дороге к морю,
вбирает в себя ручейки и речки смежных наук. Выше перечислены лишь те на­
правления, которые прямо или косвенно связаны с основной тематикой учебни­
ка - инженерией знаний. Стоит лишь взглянуть на основные рубрикаторы кон­
ференций п о ИИ, чтобы понять, насколько широко простирается область ис­
следований по ИИ:
• генетические алгоритмы;
• когнитивное моделирование;
• интеллектуальные интерфейсы;
• распознавание и синтез речи;
• дедуктивные модели;
1 .3. Представл е н ие з наний и в ы вод на з н ани ях
19
• мноrоаrеmные системы;
• онтологии; .
• менеджмент знаний;
• логический вывод;
• формальные модели;
,,
• мягкие вычисления и многое другое.
Конечно, невозможно в рамках одного учебника рассмотреть все многообразие
подходов и идей в области ИИ. Однако некоторые новые направления будут под­
робнее описаны главах 5, 8, 9.
в
1 . 3 . Представление зна ний и вывод
на знаниях
1 .3 . 1 . Данные и знания
При изучении интеллектуальных систем традиционно возникает вопрос - что же
такое знания и чем они отличаются от обычных данных, десятилетиями обраба­
тываемых ЭВМ. Можно предложить несколько рабочих определений, в рамках
которых это становится очевидным.
Данные - это отдельные факты , характеризующие объекты, пр оцессы и я вления пред ­
метной области, а также их свойства .
При обработке на ЭВМ данные трансформируются, условно проходя следующие
этапы:
1. D1 - данные как результат измерений и наблюдений;
2. D2 - данные на материальных носителях информации (таблицы, протоколы,
справочники);
3. DЗ - модели (структуры) данных в виде диаграмм, графиков, функций;
в
4. D4 - данные компьютере на языке описания данных;
5. D5 - базы данных на машинных носителях информации.
Знания основаны на данных, полученных эмпирическим путем. Они представля­
ют собой результат мыс.лительной деятельности человека, направленной на обоб­
щение его опыта, полученноrо в результате практической деятельности.
Знання - это закономерности предметной области (принципы , связи , законы) , получен­
ные в результате практической деятельности и профессионального о пыта, п озволяющие
специалистам ставить и решать задачи а этой области.
20
Глава
1 •
Введение в интеллектуальные системы
При обработке на ЭВМ знания трансформируются аналогично данным.
1 . Z 1 - знания в памяти человека как результат мышления;
2. Z2 - материальные носители знаний (учебники, методические пособия);
3. ZЗ - поле знаний - условное описание основных объектов предметной облас­
ти, их атрибутов и закономерностей, их связывающих;
4. Z4 - знания, описанные на языках представления знаний (продукционные язы­
ки, семантические сети, фреймы - см. далее);
5. ZS - база знаний на машинных носителях информации.
Часто используется такое определение знаний.
Знания - это хорошо структурированные данные, или данные о данных , или метаданн ые.
Существует множество способов определять понятия. Один из широко приме­
няемых !.:Пособов оqнован на идее интенсионала. Интенсионал понятия - это
опредешние его через соотнесение с понятием более высокого уровня абстрак­
ции с указанием специфических свойств. Интенсионалы формулируют знания
об объектах. Другой способ определяет понятие через соотнесение с понятиями
более низкого уровня абстракции или перечисление фактов, относящихся к оп­
ределяемому объекту. Это есть определение через данные, или экстенсионал по­
ня тия.
Пр и мер 1 . 1
Понятие сперсональный компьютер• . Его интенсионал: сПерсональный компьютер это дружественная ЭВМ, которую можно постаsить на стол и купить менее чем за
$2000-ЗООО•.
Экстенсионал этого понятия: сПерсональный компьютер - это Мае, IBM РС, Sinkler... •
Для хранения данных используются базы данных (для них характерны большой
объем и относительно небольшая удельная стоимость информации), для хра­
нения знаний - базы знаний (небольшого объема, но исключительно дорогие
информационные массивы). База знаний - основа любой интеллектуальной си'·
стемы.
Знания могут быть классифицированы по следующим категориям:
•
Поверхностные -
знания о видимых взаимосвязях между отдельными собы- .
тиями и фактами в предметной области.
• Глубинные - абстракции, аналогии, схемы, отображающие структуру и приро­
ду процессов, протекающих в предметной области. Эти знания объясняют яв­
ления и могут использоваться для прогнозирования поведения объектов.
Пр и ме р 1 .2
I;Iоверхностные знания: сЕсли нажать на кнопку звонка, раздастся звук. Если болит
голова, то следует принять аспирин•.
1 .3. Представлен ие з наний и в ы вод на з наниях
21
Глубинные знания: •Принципиальная элеюприческая схема зввонка и проводки. Знания
физиологов и врачей высокой квалификации о причинах, видах головных болей и методах
их лечения •.
Современные экспертные систем ы работают в основном с поверхностными зна­
ниями. Это связано с тем, что на данный момент нет универсальных методик, по­
зволяющих выявлять глубинные структуры знаний и работать с ними.
Кроме того, в учебниках по И И знания традиционно делят на процедурные и дек­
ларативные. Исторически первичными были процедурные знания, то есть зна­
ния, срастворенные• в алгоритмах. Они управляли данными . Для их изменения
требовалос ь изменять программы. Однако с развитием искусственного интел­
лекта приоритет данных постепенно изменялся, и все большая часть знаний со­
средоточивалась в структурах данных (таблицы, списки, абстрактные типы дан­
ных), то есть увеличивалась роль декларативных знаний.
Сегодня знания приобрели чисто декларативную форму, то есть знаниями счита­
ются предложения, записанные на языках представления знаний, приближенных
к естественному и ПОJ;И,ТНЫХ неспециалистам.
1 . 3 . 2 . М одели представления знаний
Существуют десятки моделей (или языков) представления знаний для различ­
ных предметных областей. Большинство из них может быть сведено к следую­
щим классам:
• продукционные модели;
• семантические сети;
• фреймы;
• формальные логические модели.
Пр одукци он н ая модепь
Продукц ионная модель или модель , основанная н а правилах, позаоляет представить зна­
.
ни я в виде предложени й типа «Если ( усл о вие ) , то (дейст вие ) »
Под «условием• (антецедентом) понимается некоторое предложение-образец,
по которому осуществляется поиск в базе знаний, а под «действием• (консеквен ­
том) - действия, выполняемые при успешном исходе поиска (они могут быть
промежуточными, выступающими далее как условия и терминальными или целевыми, завершающими работу системы).
Чаще всего вывод на такой базе знаний бывает прямой (от данных к поиску цели)
или обратный (от цели для ее подтверждения - к данным). Данные - это исход­
ные факты, хранящиеся в базе фактов, на основании которых запускается маши­
на вывода или интерпретатор правил, перебирающий правила из продукцион­
ной ба:,,1 знан_ий (см:. далее).
22
Глава 1 • В ведение в и нтем ектуальн ые системы
Продукционная модель чаще всего применяется в промышленных экспертных
системах. Она привлекает разработчиков своей наглядностью, высокой модуль­
ностью, легкостью внесения дополнений и изменений и простотой механизма ло­
гического вывода.
Имеется большое число программных средств, реализующих продукционный
подход (язык OPS 5; •оболочки• или •пустые• ЭС - EXSYS Professional, Карра,
ЭКСП ЕРТ; ЭКО, инструментальные системы П И Э С [ Хорошевский, 1993] и
СПЭИ С [Ковригин, Перфильев, 1988] и др.), а также промышленных ЭС на его
основе (например, ЭС, созданных средствами G2 [ Попов, 1996] ) и др.
Семантические сети
Термин семантическа.я означает •смысловая• , а сама семантика - это наука, ус­
танавливающая отношения между символами и объектами, которые они обозна­
чают, то есть наука, определяющая смысл знаков.
Семантическая сеть - это о риентированный граф , вер ш ины которого - по нятия , а ду­
ги - отношения между ними .
В качестве понятий обычно выступают абстрактные или конкретные объекты, а,.
отношения - это связи типа: •это• ( •АКО - A-Kind-Of•, •is• }, •имеет частью•
( •has part• ), •принадлежит• , «любит•. Характерной особенностью семантичес­
ких сетей является обязательное наличие трех типов отношений:
• класс - элемент класса (цветок - роза);
• свойство - значение (цвет - желтый);
• пример элемента класса (роза - чайная).
Можно предложить несколько классификаций семантических сетей, связанных с
типами отношений между понятиями.
По количеству типов отношений:
• Однородные (с единственным типом отношений) .
• Неоднородные (с различными типами отношений).
По типам отношений:
• Бинарные (в которых отношения связывают два объекта).
• N-арные (в которых есть специальные отношения, связывающие более двух
понятий).
Наиболее часто в семантических сетях используются следующие отношения:
• связи типа •часть - целое• ( «класс - подкласс•, .элемент -множество•,
и т. п.) ;
• функциональные связи ( определяемые обычно глаголами « производит•,
«влияет • . . . );
• количественные (больше, меньше, равно... );
23
1 .3. Предста вление знаний и вывод на з наниях
• пространственные (далеко от , близко от, за, под, над ... );
• временные (раньше, позже, в течение... );
• атрибутивные связи (иметь свойство, иметь значение);
• логические С!3ЯЗИ (И, ИЛИ, НЕ);
• лингвистические связи и др.
Проблема поиска решения в базе знаний типа семантической сети сводится к за­
даче поиска фрагмента сети, соответствующего некоторой подсети, отражающей
поставленный запрос к базе.
При мер 1 .3
На рис. 1 . 1 изображена семантическая сеть. В качестве вершин тут выступают понятия
•человек•, •т. Иванов• , •Волга•, савтомобиль•, свид транспорта• и сдвигатель•.
свойство
Волrа
это
имеет
частью
ЭТО
ид
транспорта
Рис. 1 . 1 . Семантическая сеть
Данная модель представления знаний была предложена американским психоло­
гом Куиллианом. Основным ее преимуществом является то, что она более других
соответствует современным представлениям об организации долговременной па­
мяти человека [Скрэгг, 1983].
Недостатком этой модели я вляется сложность организации процедуры поиска
вывода на семантической сети.
Для реализации семантических сетей существуют специальные сетевые языки,
например NET [Цейтин, 1 985], язык реализацюi систем SIMER+MIR [ Осипов,
1 997] и др. Широко известны экспертные системы, использующие семантичес­
кие сети в качестве языка представления знаний - PROSPECTOR, CASNET,
TORUS [Хейес-Рот и др. , 1 987; Durkin, 1 998] .
Фреймы
Термин фрейм (от английского frame, что означает •каркас� или •рамка� ) был
предложен Марвином Минским [Минский, 1979], одним из пионеров ИИ, в 70-е
годы для обозначения структуры знаний для восприятия пространственных
сцен. Эта модель, как и семантическая сеть, имеет глубокое психологическое обо­
снование.
1
24
Глава 1 • В ведение в и н темектуальн ые системы
Фрейм - это абстрактный образ дл я представления некоего стереотипа восприятия.
В психологии и философии известно понятие абстрактного образа. Например,
произнесение вслух слова •комната• порождает у слушающих образ комнаты:
•жилое помещение с четырьмя стенами, полом, потолком, окнами и дверью, пло­
щадью 6 -:?О м2 • . Из этого описания ничего нельзя убрать (например, убрав окна,
мы получим уже чулан, а не комнату}, но в нем есть •дырки• или •слоты• - это
незаполненные значения некоторых атрибутов - например, количество окон,
цвет стен, высота потолка, покрытие пола и др.
В теории фреймов такой образ комнаты называется фреймом комнаты; Фреймом
также называется и формализованная модель для отображения образа.
Различают фреймы-образцы, или прототипы, хранящиеся в базе знаний, и фреймы ·э1'Земnляры, которые создаются для отображения реальных фактических си­
туаций на основе поступающих данных. Модель фрейма является достаточно
универсальной, поскольку позволяет отобразить все многообразие знаний о мире
через:
• фреймы-структуры, использующиеся для обозначения объектов и понятий
(заем, залог, вексель);
• фреймы-роли (менеджер, кассир, клиент);
• фреймы-сценарии (банкротство, собрание акционеров, празднование именин);
• фреймы-ситуации (тревога, авария, рабочий режим устройства) и др.
Традиционно структура фрейма может быть представлена как список свойств:
(ИМЯ ФРЕЙМА:
(имя 1-ro слота: значение 1-ro слота),
(имя 2-ro слота: значение 2-ro слота),
(имя N-ro слота: значение N-r-o слота)).
Ту же запись можно представить в виде таблицы, дополнив ее двумя столбцами.
Т■бпица 1 . 1 . Структура фрейма
Имя слота
Зн■чение спота
Имя dlDейма
Способ nоnуч■ния
3Н8Ч8НИЯ
Присоединеннм
п--··- -··--
25
1 .3. Представлен ие з наний и вывод на з наниях
В таблице дополнительные столбцы предназначены для описания способа полу­
чения слотом его значения и возможного присоединения к тому или иному слоту
специальных процедур, что допускается в теории фреймов. В качестве значения
слота может выступать имя другого фрейма, так образуются сети фреймов.
Существует несколько способов получения слотом значений во фрейме-экзем­
пляре:
• по умолчанию от фрейма-образца (Dеfаult-значение);
• через наследование свойств от фрейма, указанного в слоте АКО;
• по формуле, указанной в слоте;
• через присоединенную процедуру;
• явно из диалога с пользователем;
• из базы данных.
Важнейшим свойством теории фреймов является заимствование из теории се­
мантических сетей - так называемое наСJlедование свойств. И во фреймах, и в се­
мантических сетях наследование происходит по АКО-связя.м (A -Кind- O/ - это).
Слот АКО указывает на фрейм более высокого уровня иерархии, откуда неявно
наследуются, то есть переносятся, значения аналогичных слотов.
Пр и мер 1 . 4
Например, в сети фреймов на рис . 1 .2 понятие •ученик• наследует свойства фреймов
«ребенок• и «человек•, которые находятся на более высоком уровне иерархии. Так, на
вопрос «любят ли ученики сладкое• следует ответ «да•, так как этим свойством облада­
ют все дети, что указано во фрейме «ребенок•. Наследование свойств может быть час­
тичным, так как возраст для учеников не наследуется из фрейма •ребенок•, поскольку
указан явно в своем собствещюм фрейме.
Человек
АКО Млекопитающее
Умеет
Мыслить
�-----,
АКО
Возраст
Рост
Любит
Человек
О-1 6 лвr
50-180 см
Сладкое
Ученик
АКО
Ребенок
Учится
В школе
Возра ст
Носит
7-1 7 лет
Форму
Рис. 1 .2. Сеть фреймов
Основным преимуществом фреймов как модели представления знаний является
то, что она отражает концептуальную основу организации памяти человека [Шенк,
Хантер, 1987], а также ее гибкость и наглядность.
26
Глава 1 • Введение в интеллектуальные системы
Специальные языки представления знаний в сетях фреймов FRL (Frame Repre­
sentation Language) [Байдун, Бунин, 1 990), KRL (Knowledge Representation Lan­
guage) ·[Уотермен, 1 989] , фреймовая 4оболочка• Карра [ Стрельников, Бори­
сов, 1 997] и другие программные средства позволяют эффективно строить про­
мышленные ЭС. Широко известны такие фрейм-ориентированные экспертные
системы, как ANALYST, МОДИС, TRISTAN, ALTERID [Ковригин, Перфильев,
1988; Николов, 1 988; Sisodia, Warkentin, 1 992].
Фо р м альные лог ичес к ие модели
Традиционно в представлении знаний выделяют формальные логические модели,
основанные на классическом исчислении предикатов 1-ro порядка, когда предмет­
ная область или задача описывается в виде набора аксиом. Мы же опустим описа­
ние этих моделей по следующим причинам. Исчисление предикатов 1-ro порядка
в промышленных экспертных системах практически не используется. Эта логи­
ческая модель применима в основном в исследовательских 4Игрушечных• систе­
мах, так как предъявляет очень высокие требования и ограничения к предметной
области.
В промышленных же экспертных системах используются различные ее модифи­
кации и расширения, изложение которых выходит за рамки этого учебника.
1 . 3 . З . Вывод н а зн аниях
Несмотря на все недостатки, наибольшее распространение получила продукци­
онная модель представления знаний. При использовании продукционной модели
база знаний состоит из набора правил. Программа, управляющая перебором пра ­
вил, называется машиной вывода.
Машина выв ода
Машина вывода (интерпретатор правил) выполняет две функции: во-первых,
просмотр существующих фактов из рабочей памяти ( базы данных) и правил из
базы знаний и добавление (по мере возможности) в рабочую память новых фак­
тов и, во-вторых, определение порядка просмотра и применения правил. Этот
механизм управляет процессом консультации, сохраняя для пользователя ин­
формацию о полученных заключениях, и запрашивает у него информацию, когда
для срабатывания очередного правила в рабочей памяти оказывается недостаточ­
но данных [Осуга, Саэки, 1990] .
В подавляющем большинстве с·истем, основанных н а знаниях, механизм вывода
представляет собой небольшую по объему программу и включает два компонен­
та - один реализует собственно вывод, другой управляет этим процессом.
Действие компонента вывода основано на применении правила, называемого
modus ponens.
Если известно, что исти нно утверждение А и существует nра,щло
в ида «е·сли А , то В», тогда утве �ждение В tакже истинно.
Правило modцs ponens.
27
1 . 3 . Представле н ие з нан и й и вывод на знаниях
Правила срабатывают, когда находятся факты, удовлетворяюЩИf их левой части:
если истинна посылка, то должно быть истинно и заключение.
Компонент вывода должен функционировать даже при недостатке информации.
Полученное р ешение может и не быть точным, однако система не должна останав­
ливаться из-за того, что отсутствует какая-либо часть входной информации.
Управляющий компонент определяет порядок применения правил и выполняет
четыре функции.
1. Сопоставление - образец правила сопоставляется с имеющимися фактами .
2. Выбор - если в конкретной ситуации может быть применено сразу несколько
правил, то из них выбирается одно, наиболее подходящее по заданному крите­
рию (разрешение конфликта).
3. Срабатывание - если образец правила при сопоставлении совпал с какими­
либо фактами из рабочей памяти, то правило срабатывает.
4. Действие - рабочая память подвергается изменению путем добавления в нее
заключения сработавшего. правила. Если в правой части правила содержится
указание на какое-либо действие, то оно выполняется (как, например, в систе­
мах обеспечения безопасности информации).
Интерпретатор п родукций работает циклически. В каждом цикле он просматри­
вает все правила, чтобы выявить те, посылки которых совпадают с известными на
данный момент фактами из рабочей памяти. После выбора правило срабатывает,
его заключение заносится в рабочую память, и затем цикл повторяется сначала.
В одном цикле может сработать только одно правило. Если несколько правил ус­
пешно сопоставлены с фактами, то интерпретатор производит выбор по опреде­
ленному кр итерию единственного правила, которое срабатывает в данном цикле.
Цикл работы интерпретатора схематически представлен на рис. 1 .3.
Сопоставление
Рабочая
память
(база да нных)
База
правил
1
1
'
Конфликтное
м ножество
Критерий
выбора
правил
Разрешение
конфликта
правило
Действие
--- --- - -- - -- - -- -- --- - -- -- - - ____ l
i - --- --- -- -- - · - -- ·1
1
1
1
Рис . 1 .3. Цикл работы и нтерпретатор а
1
Информация из рабочей памяти последовательно сопоставляется с посылками
правил для выявления успешного сопоставления-. Совокупность отобранных пра-
28
Глава 1 • В ведение в интел лектуальн ы е системы
вил составляет так_ называемое конфликтное множество. Для разрешения кон­
фликта интерпретатор имеет критерий, с помощью которого он выбирает
единственное правило, после чего оно срабатывает. Это выражается в занесе­
нии фактов, образующих заключение правила, в рабочую память или в измене­
нии критерия выбора конфликтующих правил. Если же в заключение правила
входит название какого-нибудь действия, то оно выполняется.
Работа машины вывода зависит только от состояния рабочей памяти и от состава
базы знаний. На практике обычно учитывается история работы, то есть поведе­
ние механизма вывода в предшествующих циклах. Информация о поведении ме­
ханизма вывода запоминается в памяти состояний (рис. 1.4). Обычно память со•
стояний содержит протокол системы.
И нтерпретатор
(механизм вывода)
Память СОСТОЯНИЙ 1
Данные
□.,,,, ... □
Рабочая память
(база да нных)
Об�цы
□ ....... □
0-. . . . . . □
.
Модули
(база зна ний)
Рис . 1 .4. С хема функци онирова ния и нтерпретато ра
Ст рате г ии у правления в ы во до м
От выбранного метода поиска, то есть стратегии вывода, будет зависеть порядок
применения и срабатывания правил. Процедура выбора сводится к определению
направления поиска и способа его осуществления. Процедуры, реализующие по­
иск, обычно сзашиты• в механизм вывода, поэтому в большинстве систем инже­
неры знаний не имеют к ним доступа и, следовательно, не могут в них ничего из­
менять по своему желанию.
При разработке стратегии управления выводом важно определить два вопроса:
1. Какую точку в пространстве состояний принять в качестве исходной? От вы­
бора этой точки зависит и метод осуществления поиска - в прямом или об­
ратном направлении.
2. Какими методами можно повысить эффективность поиска решения? Эти ме­
тоды определяются выбранной стратегией перебора - глубину, в ширину, по
подзадачам или иначе.
Пря мо й и о б рат ный в ы вод
При обратном порядке вывода вначале выдвигается некоторая гипотеза, а затем
механизм вывода как бы возвращается назад, переходя к фактам, пытаясь найти
29
1 . 3 . Представление з нан ий и в ывод на з наниях
те, которые подтверждают гипотезу (рис. 1.5, правая часть). Если она оказалась
правильной, то выбирается следующая гипотеза, детализирующая первую и яв­
ляющаяся по отношению к ней . подцелью. Далее отыскиваются факты, под­
тверждающие истинность подчиненной гипотезы. Вывод такого типа называется
уnравляемым целями, или управляемым консеквентами. Обратный поиск приме­
няется в тех случаях, когда цели известны и их сравнительно немного.
Прямой вывод
Обратный ВЫIК\Q
Поиск
в mубину
Поиск
в wирину
Начало
поиска
Начало
11ОМС1С8
Начаnо
ПОИС1С8
Рис. 1 .5. Стратегии вывода
В системах с прямым выводом по известным фактам отысIЩвается заключение,
которое из этих фактов следует (см. рис. 1.5, левая часть). Если такое заключение
удается найти, то оно заносится в рабочую память. Прямой вывод часто называют
выводом, управляемым данными, или выводом, управляемым антецедентами.
Существуют систеМf!I, в которых вывод основывается на сочетании упомянутых
выше методов - обратного и ограниченного прямого. Такой комбинированный
метод получил название циклического.
Пр и мер 1 .5
Имеется фрагмент базы знаний из двух правил:
П 1 . Если сотдых - летом• и счеловек - активный•, то сехатъ в горы•.
П2. Если слюбит солнце•, то сотдых летом•.
Предположим, в систему поступили факты - •человек активный• и слюбит солнце•.
ПРЯМОЙ ВЫВОД - исходя из фактических данных, получить рекомендацию.
30
Глава 1 • В ведение в интелл ектуальные сиСТ!ЭМЫ
1 -й проход.
Шаг 1. Пробуем П1, не работает (не хватает данных •отдых - летом•).
Шаг 2. Пробуем П2, работает, в базу поступает факт •отдых - летом•.
2-й проход.
Шаz З. Пробуем П1, работает, активируется цель •ехать в горы•, которая и выступает
как совет, который дает ЭС.
ОБРАТНЫЙ ВЫВОД - подтверлить выбранную цель при помощи имеющихся правил
и данных.
1 -й проход.
Шаz 1. Цель - •ехать в горы•: пробуем П1 - данных •отдых - летом• нет, они стано­
вятся новой целью и ищется правило, где цель в левой части.
Шаz 2. Цель •отдых - летом•: правило П2 подтверждает цель и активирует ее.
2-й првход.
Шаг З. Пробуем П 1 , подтверждается искомая цель.
М етоды п ои ска в глуб и ну и ши рину
В системах, база знаний которых насчитывает сотни правил, желательным явля­
ется использование стратегии управления выводом, позволяющей минимизиро­
вать время поиска решения и тем самым повысить эффективность вывода. К чис­
лу таких стратегий относятся: поиск в глубину, поиск в ширину, разбиение на
подзадачи и альфа-бета алгоритм [Таунсенд, Фохт, 199 1 ; Уэно, Исидзука, 1989;
Справочник по ИИ, 1990].
При поиске в глубину в качестве очередной подцели выбирается та, которая со­
ответствует следующему, более детальному уровню описания задачи. Например,
диагностирующая система, сделав на основе известных симптомов предположе­
ние о наличии определенного заболевания, будет продолжать запрашивать уточ­
няющие признаки и симптомы этой болезни до тех пор, пока полностью не опро­
вергнет выдвинутую гипотезу.
При поиске в ширину, напротив, система вначале проанализирует все симптомы,
находящиеся на одном уровне пространства состояний, даже если они относятся
I< разным заболеваниям, и лишь затем перейдет к симптомам следующего уровня
детальности.
Разбиение на подзадачи - подразумевает выделение подзадач, решение которых
рассматривается как достижение промежуточных целей на пути к конечной цели.
Примером, подтверждающим эффективность разбиения на подзадачи, является
поиск неисправностей в компьютере - сначала выявляется отказащпая подсисте­
ма (питание, память и т. д.), что значительно сужает пространство -п оиска. Если
удается правильно понять сущность задачи и оптимально разбить ее на систему
иерархически связанных целей-подцелей, то можно добиться того, что путь к ее
решению в пространстве поиска будет- минимален.
Альфа-бета алгоритм позволяет уменьшить пространство состояний путем уда­
ления ветвей, неперспективных для успешного поиска. Поэтому просматривают­
ся только те вершины, в которые можно попасть в результате следующего шага,
31
1. 4. Нечеткие знания
после чего неперспективные направления исключаются. Альфа-бета алгоритм
нашел широкое применение в основном в системах, ориентированных на различ­
ные игры, например в шахматных программах.
1 . 4. Нечеткие знания
При попытке формализовать человеческие знания исследователи вскоре столк­
нулись с проблемой, затруднявшей использование традиционного математиче­
ского аппарата для их описания. Существует целый класс описаний, оперирую­
щих качественными характеристиками объектов (много, мало, сильный, очень
сильный и т. п.). Эти характеристики обычно размыты и не могут быть однознач­
но интерпретированы, однако содержат важную информацию (например, -«Од­
ним из возможных признаков гриппа является высокая температура�).
Кроме того, в задачах, решаемых интеллектуальными системами, чаtто прихо­
дится пользоваться неточными знаниями, которые не могут быть интерпретиро­
ваны как полностью истинные или ложные (логические true/false или 0/1). Су­
ществуют знания, достоверность которых выражается некоторой промежуточной
цифрой, например 0.7.
Как, не разрушая свойства размытости и неточности, представлять подобные зна­
ния формально? Для разрешения таких проблем в начале 70-х американский ма­
тематик Лотфu Заде предложил формальный аппарат нечеткой (fuzzy) алгебры и
нечеткой логики [Заде, 1972] . Позднее это направление получило широкое рас­
пространение [Орловский, 1981; Аверкин и др., 1986; Яшин, 199,0 ] и положило на­
чало одной из ветвей ИИ под названием - мяг1СUе вычисления (soft computing).
Л. Заде ввел одно из главных понятий в нечеткой логике - понятие лингвисти­
ческой переменной.
Лингвистическая переменная (ЛП) - это пе ременна я, значение которой оп ределяется
на боро м вер бальных ( то есть сло весных) ха ра ктеристик некоторого свойства .
Например, ЛП <рост» определяется
высокий, очень высо1СUй}.
через набор
{карликовый, низкий, средний,
1 . 4 . 1 . О сновы теории нечетких множеств
Значения лингвистической переменной (ЛП) определяются через так называе­
мые нечеткие множества (НМ), которые в свою очередь определены на некото­
ром базовом наборе значений или базовой числовой шкале, имеющей размер­
ность. Каждое значение ЛП определяется как нечеткое множество (например,
нм -«НИЗКИЙ росн ).
Нечеткое множество определяется через некоторую базовую шкалу В и функцию
принадлежности НМ - µ(х), хе В, принимающую значения на интервале [0 ... 1].
Таким образом, нечеткое множество В - это совокупность пар вида (х, µ(х)), где
хе В. Часто встречается и такая запись:
32
Глава 1 • Введение в интелл ектуальные системы
где х. - i-e значение базовой шкалы.
Функция принадлежности определяет субъективную степень уверенности экс­
перта в том, что данное конкретное значение базовой шкалы соответствует опре­
деляемому НМ. Эту функцию не стоит путать с вероятностью, носящей объек-_
тивный характер и подчиняющейся другим математическим зависимостям.
Например, для двух экспертов определение НМ •высокая))> для ЛП «цена автомо­
биля,> в условных единицах может существенно отличаться в зависимости от их
социального и финансового положения.
•Высокая_цена_автомобиля_1 ,> = {50000/1 + 25000/0.8 + 10000/0.6 + 5000/0.4}.
«Высокая_цена_автомоб�ля_2,> = {25000/1 + 10000/0.8 + 5000/0.7 + 3000/0.4}
1
,
П ример 1 .6
Пусть перед нами стоит задача интерпретации значений ЛП «возраст», таких как «мо­
лодой» возраст, «преклонный• возраст или «переходный» возраст. Определим «воз­
расн как ЛП (рис. 1 .6). Тогда «молодой», «преклонный», «переходный» будут значе­
ниями этой лингвистической переменной. Более полно, базовый набор значений ЛП
(
«возраст» следующий:
В = {младенческий, детский, юный, молодой, зрелый, преклонный, старческий}.
Рис . 1 .6. Лингви сти ческая п е ре м енная « возраст» и неч етки е м нож е ст ва,
о пределяю щи е ее з наче н и я
Для ЛП <<Возраст» базовая шкала - это числовая шкала от О до 1 20, обозначающая ко·
личество прожитых лет, а функция принадлежности определяет, насколько мы увере­
нь1 в том, что данное количество лет можно отнести к данной категории возраста. На
рис. 1 .7 отражено, как одни и те же значения базовой шкалы могут участвовать в опре­
делении различных НМ.
о
2
з
4
5
6
7
8
Рис. 1 . 7. Ф ормирован ие н еч етких м ноже ств
9
10
33
1 .4. Н ече тк ие знания
Например, определить значение НМ «младенческий возр ас т• можно та к:
4:младенческий»
=
0.5 1
2
3
4
5
10
{- + - + - + - + - + - + - } ·
1 0.9 0.8 0.7 0.6 0.3 0.1
Рисун ок 1 .8 илл юстрирует оценку НМ неким усредненным э ксперто м, который ребе н ­
ка до полу года с высокой степе1!1,ю уверенн ости отн осит к младенца м (ш = 1). Дети до
четырех лет причисля ются к мл аденцам тоже, н о с меньшей степенью уверенности
(0.5< ш <0.9), а в десять лет ребенка назьiвают так только в очень редких случаях - к
примеру, для девяностолетней бабушки и 15 лет м ожет считаться младенчеств ом. Та ­
ки м образом , нечеткие мн ожества п озволяют при определении по ня т ия учитывать
субъективные мнения отдельных индивидуумо в.
µ(х)
НМ = мл аденческий возраст
0,5
0,4
0,3
0,2
0,1
0,0
О
2
3
4
5
6
7
8
9
10
11
Возраст
Рис. 1 .8 . График функции п ринадлежности н ечеткому множеству «м л аде нческий возраст•
1 . 4.2. Операции с нечеткими знаниями
Для операций с нечеткими знаниями, выраженными при помощи лингвистичес­
I<ИХ переменных, существует много различных способов. Эти способы являются в
основном эвристиками. Мы не будем останавливаться на этом вопросе подробно,
укажем лишь для примера определение нескольких операций. К примеру, опера­
ция «ИЛИ� часто задается так [ Аверкин и др., 1 986; Яшин, 1990]:
µ(х) = max(µ1(x),µ2(x))
(так называемая логика Заде) или так:
µ(х) = µ1(х) + µ2(х) - µ1(х) * µ2(х)
(вероятностный подход).
Усиление или ослабление лингвистических понятий достигается введением спе­
циальных квантификаторов. Например, если понятие «старческий возраст>>
определяется как
60 70 80 90
{- + - + - + - } '
0.6 · 0.8 0.9 . l
34
Гл ава 1 • Введение в и нтеллещальн ые систе мы
то понятие <!очень старческий возраст� определится как
· con( A ) = A 2 = L
то есть <<Очень старческий возраст� равен
\,
; µ/
90
{_оо_ + � + .!О.. + } ·
0.36 0.64 0.8 1 . 1
Для вывода на нечетких множествах используются специальные отношения и
операции над ними (подробнее см. работу (O]:)ловский, i 981 ]).
Одним из первых применений теории НМ стало использование коэффициентов
уверенности для вывода ре1юмендаций медицинской системы MYCIN [Shortliffe,
1976]. Этот метод использует несколько эвристических приемов. Он стал приме.ром обработки нечетких знаний, повлиявших на последующие системы.
В настоящее время в большинство инструментальных средств разработ1си систем,
основанных на знаниях, включены элеr,._1енты работы с НМ, кроме того, разработа­
ны специальные программные средства реализации так называемого нечеткого
вывода, например <!Оболочка,> FuzzyCLIPS.
1 . 5 . Прикладные интеллектуальные системы
Центральная парадигма интеллектуальных технологий сегодня - это обрабоп<а
знаний. Системы, ядром которых является база знаний или модель предметной
области, описанная на язьп<е сверхвысокого уровня, приближенном к естествен­
ному, называют интеллектуальными. Будем называть такой язык сверхвысшю­
го уровня - языком представления знаний (ЯПЗ). Чаще всего интеллектуальные
системы (ИС) применяются для решения сложных задач, где основная сложность
решения связана с использованием слабо-формализованных знаний специалис­
тов-практиков и где логическая (или смысловая) обработка информации пре­
валирует над вычислительной. Например, понимание естественного языка, под­
держка принятия решения в сложных ситуациях, постановка диагноза и реко­
мендации по методам лечения, анализ визуальной информации, управление дис­
петчерскими пультами и др.
Фактически сейчас прикладные интеллектуальные системы используются в де­
сятках тысяч приложений. А годовой доход от продаж программных и аппарат­
ных средств искусственного интеллекта еще в 1989 r. в США составлял 870 млн
долларов, а в 1990 г. - 1,1 млрд долларов [ Попов, 1996]. В дальнейшем почти
тридцатипроцентный прирост дохода сменилсJ1 более плавным наращиванием
темпов (по материалам [Поспелов, 1997; Хорошевский, 1997; Попов, 1996;
Walker, Miller, 1987; Tuthill, 1 994, Durkin, 1998]}.
На рис:. 1.9 отражеirьt различные аспекты состояния рынка искусственного интел­
лекта: инвест:иции в разработку в области ИИ (США, Европа, Япония) (рис. 1.9, а);
ДОЛЯ систем ии в информатике (программном обеспечении) (рис. 1.9, б); доходы
от продаж традиционных языков программирования (рис. 1.9, в); инвестиции
1 .5. Прикладны е 14 нтелл ектуальные системы
35
только в программное обеспечение (СЩА ) (рис. 1.9, .z); инвестиции в аппаратное
обеспечение ( США) (рис. 1 .9, д); структура рынка ЭС ( США, 1993) (рис. 1.9, е).
П рирост % год
% от рынка информатики
220
1 00
80
Eaporra
Япони,�
США
87 · 89
, 1 984
млн $
420
''
230
20
1 984
а
92
а
млн $
270
96
Anna�
�не
1 570
1 986
зс
ЕЯ-интерфеi\с
' - · - - :- Расnоэнавание
------t-----t
1 986
90
г
94
►
Проrреммныi\
ментариi\
н
.....-.--и-.стру
депо
системное п о
··
Д11!t ann
apantolO
620
ПО дnя ИИ
840
650
\:<.�·:... . .
88
2000
90
млн $
Языки ии
'
1 985
9;3
91
г
J
2:
0, 16
,, ' '
_ , - - - - � • обесnеченм
90
94
Меди�
' и обраэоввние
Информатика
д
е
Рис:1 .�. �осто.яние и перспекти вы рынка ИИ
Наиболее распространенным видом ИС являются экспертные системы.
Экспертные системы (ЭС) -:- это наиболее расnроqтраненный кnасс ИС, ориентирован ­
ный н а тиражирование оп ыта в ысококвалифицированных сп ециал истов в о бластях , где
качество nринятия ·реш ен и й традици онно зав исит от уровня эксперти зы , напри мер; ме­
дицина, юриспруденци я, геоло�:ия, э кономика, военное дело и др.
·. ЭС эффективны лищь в специфических •экспертных• областях, где важен эмпи­
рический опыт специ11ЛисТQв•. .
Только в США ежегодный доход от продаж инструментальных. средств разработ­
ки ЭС состав{IЯЛ в Н!!,Чале. .9,�-х �;с:>,цов, зрО-400 млн доллаРQв., а . от прр:менен�я
ЭС - 80-90 млн долларов {По\1.о�,, Щ96]. Ежегодно крупные фирмы разрабаты. вщот десятки ЭС тJiЩl •in-hщ1se• для: в;нутреннеrо пользования. Эти системы ин­
. тегрируют опыт специалистов комl)ании по ключевым � страniгически важным
технологиям. В начале '90-х· iт. itоя:вилась новая наука - •менеджмент знаний•
36
Гл ава 1 • Введени е в интеллеКJУа льные си стемы
(knowledge management), ориентированная на методы обра6отк� и управлени.я:
корпоративными знаниями ( см. главу 5).
Современные ЭС - это сложные программные комплексы, аю(умулирующие зна­
ния специалистов конкретных предметных областях и распространяющие этот
эмпирический опыт для консультирования менее квалифицированных пользо­
вателей. Разработка экспертных систем, как активно развивающаяся ветвь ин­
форматики, направлена на использование ЭВМ для обработки информации в
тех областях науки и техники, где традиционные математические методы моде­
лирования малопригодны. В этих областях важна смысловая и логическая обра­
ботка информации, важен опыт экспертов.
Приведем некоторые условия, которые могут свидетельствовать о необходимо­
сти разрабqтки и внедрения экспертных систем (частично из [Уотермен, 1989]):
• нехва'l'ка специалистов, затрачивающих значительное время для оказания по­
мощи другим;
• вьmолнение небольшой задачи требует многочисленного колле1(Тива специа­
листов, пос�ольку ни один из них не обладает достаточным знанием;
• сниженная производительность, пос1(ольку задача требует полного анализа
сложного набора условий, а обычный специалист не в состоянии просмотреть
(за отведенное время) все эти условия;
• большое расхождение между решениями самых хороших и самых плохих ис­
полнителей;
• наличие конкурентов, имеющих преимущество, в силу того, что они лучше
справляются с поставленной задачей.
Подходящие задачи имеют следующие характеристики:
• являются узкоспециализированными;
• не зависят в значительной степени от общечеловеческих знаний или сооб­
ражений здравого смысла;
• не являются для эксперта ни слишком легкими, ни слишком сложными.
(Время, необходимое эксперту для реmения проблемы, может составлять
от трех часов до трех недель.)
Э1(спертные системы достаточно молоды - первые системы такого рода, MYCIN
[Shortliffe, 1976] и DENDRAL [Buchanan, Feigenbaum, 1978], появились в США в
середине 70-х годов. В настоящее время в мире насчитывается несколько тысяч
промышленных ЭС, которые дают советы:
'
• при управлении сложными диспетчерскими пультами, например сети распределения электроэнергии, - Alarm Analyser [Walker, Miller, 1987];
• при постановке медицинских диагнозов - ARAMIS [Shortliffe, Buchanan, Fei­
genbaum, J979], NEUREX [Reggia, 1988];
• при поиске' неисправнос'Гей в электронных приборах, диагности1(а отказов
контрольно-измерительного оборудования - Intelligence Ware [Slagle, Gardi­
ner, Kyungsook, 1 990], Plant Diagnostics [Уотермен, 1989 ] , FOREST [Finin,
McAdams, Кleinosky, 1984];
в
37
1 .5. Прикладные 1,1нтеллектуал ьн ые систем ы
• по проектированию интегральных мю<росхем - DAA [Сойер, Фостер, 1988],
NASL [Walker, Miller, 1988], QO [ Pega, Sticklen, Bond, 1993];
• по управлению перевозками - AIRPLAN [Masui, McDermott, 1983];
• по прогнозу военных действий - ANALYST [ Bonasso, 1984], BATTLE [Slagle,
Gaynor, 1983];
• по формированию портфеля инвестиций, оценке финансовых рисков - RAD
[Kestelyn, 1992], налогообложению - RUNE [ Durkin, 1998] и т. д.
Наиболее популярные приложения ИС отображены на рис. 1.10 [Durkin, 1998] .
Транспорn1ые системы
Космонавтика
-
Наука 111D
Системы управления
Горная промышленность
ное дело
Воен
М етеорология 1Ш1Ш
Медицина
Математика
вод о
роиз ств
ЮП
риспруденция
Управление информацией
Обработка изображений
Геоnогия
Окружающая среда
Инженерия
-
V'
Злектроника
Образование
Компьютерные системы
Коммуникации
Химия
Бизнес
Сельское ХОЗЯЙСТВО
о
50
100
150
200
250
300
350
Рис. 1 . 1 О. Основны е прил ожения ИС
Сейчас легче назвать области, где еще нет ЭС, чем те, где они уже применяются.
Уже в 1987 г. опрос пользователей, проведенный журналом <ilntelligent Techno­
logies>> ( США), показал, что примерно:
• 25 % пользователей используют ЭС;
. • 25 % собираются приобрести ЭС в ближайшие 2-3 года;
, • 50 % предпочитают провести исследование об эффективности их использования.
Главное отличие ИС и ЭС от других программных средств - это наличие базы
знаний ( БЗ), в которой знания хранятся в форме, понятной спещ1алистам пред­
метной области, и могут быть изменены и дополнены также в понятной форме.
Это и есть языки представления знаний - ЯПЗ.
До последнего времени именно различные Я П З были центральной проблемой
при разработке ЭС. Сейчас существуют десятки языков или моделей представ­
ления знаний (см. параграф 1 .3). Наибольшее распространение получили следу­
ющие модели:
• продукции (OPS5 [ Forgy, 1 981] , RO S I E [Fain, Hayes-Roth, Sowizral, Water­
man, 1982]);
38
Глава 1 • Введение в и нтеллектуальные системы
• семантические сети (SIMER+MIR [Осипов, 1997]; NET [Цейтин, 1985]);
• фреймы (FRL [Байдун, Бунин, 1988; Справочник по ИИ, 1990]);
• логическое программирование (ПРОЛОГ [Макалистер, 1990; Стерлинг, Ша­
пиро, 1990]);
• объектно-ориентированные языки (SMALLTALK [Goldberg, Robson, 1 9 83;
Буч, 1993] , CLOS [ Pega, Sticklen, Bond, 1993]).
Для перечисленных выше модеJiей сущест�уеt соответствующая математическая
нотация, разработаны системы программирования, реализующие эти ЯПЗ, и
имеется большое количество ре!1-7ч,ных, КQммерчес1<их ЭС. Подробнеl:! вопросы
программной реализации прикладнЬI:х ЙС' рассмотрены в главе 6.
Современное состояние разраб.оток, в облачu ЭС. в Росси.и можно охарактеризо­
вать как стадию все возрастающего интереса среди широких слоев специалис­
тов - финансистов, топ-менеджеров, преподавателей, инженеров, медиков, пси­
хологов, программистов, лирrвистов. В последние годы этот интерес имеет пока
достаточно слабое !',fатериальное подкрепление - явная нехватка учебников и
специальной литературы, отсутствие символьных процессоров и рабочих стан­
ций, ограниченное финансирование исследований в этой области, слабый отече­
ственный рынок программных продуктов для разработки ЭС.
Поэтому появляется возможность распространения •подделок� под экспертные
системы в виде многочислен ных диалоговых систем и интерактивных пакетов
прикладных программ, которые дискредитируют в глазах пользователей это чрез­
вычайно перспективное направление. Процесс создания экспертной системы тре­
бует участия высококвал]fфициро�а1шых специалистов в области искусственн<;>­
го интеллекта, которых ПОI<а вь1пускает небольшое количество высших учебных .
заведений страны.
Наибольшие трудности в разработке ЭС вызывает сегодня не процесс машинной
реализации d\:стем, а домашинный этап анализа знаний и проектирования базы
знаний. Этим занимается специальная наука - инженерия знаiшй [Гаврилова,
Червинская, 1992; Adeli, 1994; Scott, Clayton, Gibson, 1994] .
Современному состоянию этой науки и посвящены последующие главы этой
книги.
Разработка Систем ,
основанных
на знаниях
1
о
о
□
о
Введение в экспертные системы. Определение и структура
Классификация систем, основанных на знаниях
Коллектив разработчиков
Технология проектирования и разработки
2. 1 .
В в едение в экспертные системы .
О п ределен ие и структура
В качестве рабочего определения экспертной- системы примем следующее.
Экспертные системы (ЭС) - это сложные программны е ко мплексы, аккумулирующие
знания специалистов в конкретных п редметных о бластях и тиражирующие этот эм п ири ­
ческий о пыт для консультаций менее квалифици рованных пользов ателей .
Обобщенная структура экспертной системы представлена на рис. 2 . 1 . Следует
учесть, что реальные ЭС могут иметь более сложную структуру, однако блоки,
изображенные на рисунке, непременно присутствуют в любой действительно эк­
спертной системе, поскольку представляют собой стандарт de facto структуры
современной ЭС.
В целом процесс функционирования ЭС можно представить следующим обра­
зом: пользователь, желающий получить необходимую информацию, через поль­
зовательский интерфейс посылает запрос к ЭС; решатель, пользуясь базой зна­
ний, генерирует и выдает пользователю подходящую рекомендацию, объясняя
ход своих рассуждений при помощи подсистемы объяснений.
40
Глава 2 • Разработка систем, осн ованных на знани ях
Решатель
Интерфейс
пользователя
Беза
знаний
П одсистема
объяснений
Интеплектуальный
редактор
базы знаний
� +
i
. Инженер Экаnерт
по знаниям
Рис. 2. 1 . Структура экспертной системы
Польэоlilатель
Так как терминология в области разработки ЭС постоянно модифицируется, оп­
ределим основные термины в рамках данной работы.
Пользователь - специалист предметной области, для которого предназначена си­
стема. Обычно его квалификация недостаточно высока, и поэтому он нуждается в
помощи и поддержке своей деятельности со стороны Э С.
Инженер по знаниям - специалист в области искусственного интеллекта, высту­
пающий в роли промежуточного буфера между экспертом и базой знаний. Сино­
нимы: когнитолог, инженер-интерпретатор, аналитик.
Интерфейс пользователя - комплекс программ, реализующих диалог пользова­
теля с ЭС как на стадии ввода информации, так и при получении результатов.
База знаний (БЗ) - ядро ЭС, совокупность знаний предметной области, записан­
ная на машинный нос·итель в форме, понятной эксперту и пользователю ( обычно
на некотором языке, приближенном к естественному). Параллельно такому «че­
ловеческому• представлению существует БЗ во внутреннем «машинном• пред­
ставлении.
Решатель - программа, моделирующая ход рассуждений эксперта на основании
знаний, имеющихся в БЗ. Синонимы: дедуктивная машина, машина вывода, блок
логического вывода.
' . Подсистема обьяснений - проtрамма, позволяющая пользователю получить от­
"'i_еты на вопросы: « Как была получена та или иная рекомендация?• и «Почему
си��РJ:I»яла такое решение?• Ответ на вопрос «как• - это трассировка всего
проце(t{\ролучения решения с указанием использованных фрагментов БЗ, то
есть вс� Ul'S{OB цепи умозаключений. Ответ на вопрос «почему• - ссылка на умо­
заключеiще, �посредственно предшествовавшее полученному решению, то есть
отход на о�а : назад. Развитые подсистемы объяснен�й поддерживают и другие типы вопро�.
Интеллектуальный редактор БЗ - программа, представляющая инженеру по
знаниям возможность создавать БЗ в диалоговом режиме. Включает в себя
систему вложенных меню, шаблонов языка представления знаний, подсказок
( «help• - режим) и других сервисных средств, облегчающих работу с базой.
2.2. Кл ассифи каl.lJ,4 я систе м, основанн ы х на знаниях
41
Еще раз следует подчеркнуть, что представленная на рис. 2.1 структура является
минимальной, что означает обязательное присутствие указанных на ней блоков.
Если система объявлена разработчиками как экспертная, только наличие всех
этих блоков гарантирует реальное использование аппарата обработки знаний.
Однако промышленные прикладные ЭС могут быть существенно сложнее и до­
полнительно включать базы данных, интерфейсы обмена данными с различными
пакетами прикладных программ, электронными библиотеками и т. д.
2 . 2 . Кл асс ифи ка ци я с и с те м , осн ов анны х
на знан и я х
Класс ЭС сегодня объединяет несколько тысяч различных программных комп­
лексов, которые можно классифицировать по различным критериям. Полезными
могут оказаться классификации, представленные на рис. 2.2.
Экспертные
системы
По задаче
Интерпретация
данных
По сеяэям с реальным
временем
Статическое
Диагностика "
Квазидинамические
Проектирование
Динамические
Прогнозир
ование
ни о ан е
Ппа р в и
Обучение
nу
П о ти
эвм
На супер­
эвм
По сте п ен и
и нтеrр еции
Авто11омные
'! Гибридные
(интеrрированн ые)
На сммеольных
процессорах
На рабоч их
станциях
на ПЭВМ
Рис. 2 .2. Класс иф и каци я экспертных с и стем
2 . 2 . 1 . Классификация- по решаемой задаче
Рассмотрим указанные на рисунке типы задач подробнее.
• Интерпретация. данных. Это одна из традиционных задач для экспертных сис­
тем. Под интерпретацией понимается процесс определения смысла данных,
результаты которого должны быть_ согласованными и корректными. Обычно
предусматривается многовариантный анализ данных.
42
Глава 2 • Разработка систе м, ос нова нных на з на_н иm<
• Все примеры далее из работ [Попов и .n:p., (ред.), 1 990; Соловьев, Соловьев'!,
1 989; Хейес-Рот и др., 1987].
1
• Обнаружение и идентификация различных типов океанских судов по результатам аэрокосмического сканирования - SIAP;
• определение основных свойств личности по результатам психодиагности­
ческого тестирования в системах АВТАНТЕСТ и МИКРОЛЮШЕР и др.
• Диагностика. Под диагностикой понимается процесс соотнесения объекта с
некоторым классом объектов и/или обнаружение неисправJfОСТИ в не�<оторой
системе. Неисправность - это отклонение от нормы. Такая трактовr<а поз­
воляет с единых теоретических позиций рассматривать и неnсправность 'обо­
рудования в технических системах, и заболевания живых организмов, и вс�­
возможные природные аномалии. Важной спецификой является здесь
необходимость понимания функциональной сrруктуры («анатомии•) ди­
агностирующей систещ,r.
• Диагностика и терапия сужения коронарных сосудов - ANGY;
• диагностика ошибок в аппаратуре и математическом обеспечении ЭВМ система CRIB и др.
• Мониторинг. Основная задача мониторинга - непрерыв_ная интерпретация
данных в реальном масштабе времени и сигнализация о выходе тех ·или иных
параметров за допустимьrе пределы. Главные проблемы � «пропуск•. тревож­
ной ситуации и инверсная задача «ложного• срабатывания. Сложность этих
проблем в размытости симптомов тревожных ситуаций и необх�димо�ть уче­
та временного контекста.
• Контроль. за работой электростанций СПРИНТ, помощь дцспетчерам атом­
ного реактора - REACTOR;
• контроль. аварийных датчиков на химичес�ом_ заводе - FALCON и др,
• Прдектирование. Проектирование сосtоит в подготовке спецификаций на со­
здание «объектов• с заранее определенными свойствами. Под. спецификацией
понимается весь набор необходимых документов - чертеж, пояснительн� зl­
писка и т. д. Основные проблемы здесь -' получение четкого струr<турноrо
описания знаний об объекте и проблема «�леда•. Для организации эффектив­
ного проектирования и в еще большей степени перепроектирования необхо­
димо формировать не только сами проектные решения, но и мотивы их приня­
тия. Такuм .образом, в_ задачах. проектироваJIИЯ тесно связы)?аются два основ­
ных процесса, выполняемых в рамках соответствующей ЭС: процесс вы.вода
. ', .)
решения и n]Х)цесс ооьяснепия.
в
• Проектирование конфигураций ЭВМ VAX; - 1 1/780 системе XCON (или
R 1 ), проектирование БИС - CADHELPi ·
·
·
·
·
• синтез элеiщщчес:ких цепей - SYN и др . .
43
2.2. Классифи�а� систем; осно ванных на зна ниях
• . Прогнозирование. Прогнозирование позволяет предсказывать последствия не­
которых событий или явлений на основании анализа имеющихся данных.
Прогнозирующие системы логически выводят вероятные следствия из задан­
ных ситуаций. В прогнозирующей системе обычно используется параметри­
ческая динамическая модель, в которой значения параметров •подгоняются•
под заданну1? ситуацию. Выводимые из этой модели следствия составляют
основу для прогнозов с вероятностными оценками.
• Предсказание погоды - система WILLARD;
• оценки будущего урожая - PLANT;
• прогнозы в экономике - ECON и др.
• · Планирование. Под планированием понимается нахождение планов действий,
относящихся к объектам, способным выполнять некоторые функции. В та1шх
ЭС используются модели поведения реальных объектов с тем, чтобы логичес­
ки вывести последствия планируемой деятельности.
• Планирование поведения робота � STRIPS;
· • планирование промышленных заказов - ISIS;
\
• планирование эксперимента - MOLGEN и др.
• Обучение. Под обучением понимается использование !\ОМПьютера для обуче­
ния 1<акой-то дисциплине JiЛИ предмету. Системы обученця диагностируют
ошибки при изучении какой-либо дисциплины с помощью
и ПОДСI(азы­
вают правильные решения. Они аккумулируют знания о гипотетическом
•ученике• и его харакtерных ошиб!\ах, затем работе они способны диагнос­
тировать слабости в познаниях обуч аемых и находить соответствующие сред­
ства для их ликвидации. Кроме того, они планируют акт общения с учеником
в зависимости от успехов ученика с целью передачи знаний 7
в
эвм
• Обучение язь1ку программирования ЛИСП в системе •Учитель ЛИСПа•;
• система PROUST - обучение языку Паскаль и др.
• Управление. Под управлением понимается функция организованн9й системы,
поддерживающ!lЯ оnределенный режим деятельности. Такого рода ЭС осуще­
ствляют управление поведением сложных систем в соответствии
с заданными
·
'
спецификациями.
--J/1'
• Помощь в управлении газовой котельной - GAS;
• управленце системой календарного планирования Project Assistant и др.
• Поддержка принятия решений. Поддержка принятии решения - это совокуп­
ность процедур, обеспечивающая лицо, принимающ�е решения, .необходимой
информацией и рекомендациями, облегчающими процесс принятия решения.
Эти ЭС помогают специалистам выбрать и/или сформировать нужную аль­
тернативу среди множества выборов при принятии ответственных 'решений.
44
Глава 2 • Разработка с и стем, ос н ован н ых 1-1а зна1:1 и ях
• Выбор стратегии выхода фирмы из кризисной ситуации - CRYSIS ;
• помощь в выборе страховой компании или инвестора - CHOICE и др.
В общем случае все системы, основанные на знаниях, можно подразделить на си­
стемы, решающие задачи анализа, и на системы, решающие задачи синтеза. Основ­
ное отличие задач анализа от задач синтеза заключается в том, что если в задачах
анализа множество решений может быть перечислено и включено в систему, то в
задачах синтеза множество решений потенциально не оrраничедо и строится из
решений крмпонент или под-проблем. Задачами анализа являются: интерпрета­
ция данных, диагностика, по,zщержка принятия решения; I< задачам синтеза отно­
сятся проектирование, планирование, управление. Комбинированные: обучение,
мониторинг, прогнозирование.
2 . 2 . 2 . Классификация по связи с реальным
временем
• Статические ЭС разрабатываются в предметных областях, в которых база зна­
ний и интерпретируемые данные не меняются во времени. Они стабильны.
Пример
Диагностика не исправностей в автомобиле.
• КвазидинамичесlСUе ЭС интерпретируют ситуацию, которая меняется с некото­
рым фиксировашiым интервалом времени:
При мер
Микробиологические ЭС, в которых снимаются лабор аторные изм ерения <: технологи­
ческого процесса один раз в 4-5 часов (производство лизина, на пример) и анализиру­
ется ди намика полученных показателей по отношению к предыдущему измерению.
• Ди намические Э С работают в сопряжении с датчиками объектов в режиме ре­
ального времени с непрерывной интерпретацией поступающих в систему дан­
ных.
Примеры
Управлени е гибкими производственными комплексами, мониторинг в реанимацион­
ных п алатах;
программный инструментарий для разработки дин амических с исте м - G2 [ Попов,
1996] .
2 . 2 . З . Классификация по типу ЭВМ
Н а сегодняшний день существуют:
• ЭС для уникальных стратегически важных задач на суперЭ В М (Эльбрус,
CRAY, CONVEX и др.);
• ЭС на ЭВМ' средней производительности (типа ЕС ЭВМ, mainframe);
2.3 . Колле ктив разработч и ков
45
• ЭС на символьных процессорах и рабочих станциях (SUN, Silicon Graphics,
APOLLO);
• ЭС на мини- и супермин-ЭВМ (VAX, micro-VAX и др.);
• ЭС на персональных компьютерах (IВМ Р�, МАС II и т. п.).
2 . 2 . 4. Классифи кация по степени и'нте грации
с дру гими про граммами
Автономные ЭС работают непосредственно в режиме консультаций с пользовате­
лем для специфически «экспертных,> задач, для решения которых не требуется
привлекать традиционные методы обработки данных (расчеты, моделирование
и т. д.).
Гибридны е ЭС представляют программный комплекс, аrреrирующий стандарт­
ные пакеты прикладных .программ (например, математическую статистш<у, лис
нейное программирование или системы управления базами данных) и средства
манипулирования знаниями. Это может быть интеллектуальная надстройка над
ППП (пакетами прш<ладных программ) или интегрированная среда для реше­
ния сложной задачи с элементами экспертных знаний.
Несмотря на внешнюю привлекательность гибридного подхода, следует отме­
тить, что разработка таких систем являет собой задачу на порядок более сложную,
чем разработка автономной ЭС. Стыковка не просто разных пакетов, а разных
методологий (что происходит в гибридных системах) порождает целый комплекс
теоретических и практичесrшх трудностей.
2 . 3 . Коллектив разработчиков
Под коллективом разработчиков (КР) будем понимать группу специалистов, от­
ветственных за создание ЭС.
Как видно из рис. 2.1, в состав КР входят по крайней мере три человека - пользо­
ватель, эксперт и инженер по знаниям. На рисунке не видно программиста. Та­
ким образом, минимальный состав КР включает четыре человека; реально же он
разрастается до 8- 1 0 человек. Численное увеличение коллектива разработчиков
происходит по следующим причинам: необходимость учета мнения нескольких
пользователей, помощи нескольких экспертов; потребность как в проблемных,
так и системных программистах. На Западе в этот коллектив дополнительно тра­
диционно включают менеджера и одного технического помощника.
Если использовать аналогии из близких областей, то КР более всего схож с
группой администраторi{баз,ь1 да�шъ1х при построении интегрированных. ин­
формационных систем или бригадой программистов, разрабатывающих слож­
ный программный комплекс. При отсутствии профессионального менеджера
руководителем КР, участвующим во всех стадиях разработки, является инженер
по знаниям, поэтому к его квалификации предъявляются самые высокие требо­
вания. В целом уровень и численность rруппы зависят от характеристиr< постав­
ленной задачи.
46
Глав а - 2 • Разработка систем, основанных ма -знания;.
Для обеспечения эффективности сотрудничества любой творче�ой группы, в
том �исле и группы КР ЭС, необходимо во.з никновение атмосферы взаимопони­
мания и доверия, которое, в свою очередь, обусловщшо психологической совмес­
тимостью членов группы; следовательно, при формировании КР должны учиты­
ваться психологические свойства участников..
В настоящий момент в ттсихолоrии существует uескальl(о десятков методик по
определению свойств личuости, широко исцользуемых в вопросах профессио­
uальной ориентации. Эти психодиагностические ме:r(?дики, часть из коТQр�I� уже
автоматизирована, различаются направлещюстью, глубиной, временем оµроса и
способами интерпретации. В частно<;ти, систем.а АВЛНТЕСТ (Аl;Пома�ический
Анализ ТЕСТов) [Гаврилова, 1984) позволяет'моделироJiать рассуждения психо­
лога при анализе результатов тестирования по 1 6-факторному опроснику Р: Кэт�
тела и выдает связuое психологическое заключение на естественном русском язы�
ке, характеризующее такие свойства личнос·щ, каr< общительность, аналщ;ичность,
добросовестность, самоконтроль и т. п. Модифицированная база знаний системы
АВТАНТЕСТ позднее была использована в ЭС •Cattell• (см. параграф 7.3).
Ниже приведены два аспекта характеристик членов КР: 1 - ттсихофизиолоrиче­
ский, 2 - профессиональный.
Пол.ьзоваm(JЛь
1 . К пользователю предъявляются самые слабые требования, поскольку его не
выбирiООТ, Он является в н;екотором роде заказчиком системы. Желательные
качества:
а) дружелюбие;
б) умение объяснить, что же он хочет от системы;
в) отсутствие психологического барьера к применению вычислительной тех­
ники;
r) интерес к новому. От пользователя зависит, будет ли применяться разра­
ботанная ЭС. Замечено, что наиболее ярко качества в) и г) проявляются в
молодом возрасте, поэтому иногда такие пользователи охотнее прим�няют
ЭС, не испытывая при этом комплекса неполноценнооти оттого, что. ЭВМ
им что-то цодсказывает.
2. Необходимо, чтобы пользователь имел некоторый базовый уровень квалифи­
кации, который позволит ему правильно истолковать рекомендации ЭС. Кро­
ме того, должна быть полная совместимость в терминологии интерфейса к ЭС
с той, которая привь1чна и удобна для пользователя. Обычно требования к ква­
лификации пользователя не очень вели!(и. иначе .он переходит в ра:}ряд экс­
пертов � совершенно. не нуждается в ЭС; .
, Экспер т
1 . Эксперт - чрезвычайно важная фигура в группе Х{Р. В конечном счете, его под­
готовка определяет уровень компетенции базы знаний. Желательные качества:
а) доброжелатедьносТРi
б) готовность поделиться своим опытом;
47
2.3. Коллектив рааработч и ков
В) ум�ние ОО'ЬЯСИИТЬ ,(ПедагоmЧесl(Ие навыки);•.
r) заинтересованность (моральная, а лучше еще и материальная) успешнос­
ти разработки. Возраст эксперта обычно почтенный, что необходимо учи­
тывать всем членам группы. Часто встает вопрос о количестве экспертов.
Поскольку проблема совмещения подчас противоречивых знаний остается
открытой, ·обычно с каждым из экспертов· работают индивидуально, иног­
да создав1µ1 альтернативные базы.
2. П()мимо безус:ловно высокого профессионализма в выбранной предметной об­
ласти, желательно знакомство эксперта с популярной литературой по искус­
. ственному интеллекту и экспертным системам для тоrо, чтобы эффективнее
прошел этап извл�чения знан�й.
·в
Про�раммист
1 . · Известно, что программисты обладают самой низкой потребностью в общении
среди представителей разных профессий . Однако при разработ1<е ЭС'необхо­
дим тесный контакт членов группы, поэтому желательны следующие его 1саче­
ства:
а) общительность;
б) способность отказаться от традиционных навыков и освоить новые методы;
в) интерес к разработке.
2. Поскольку современные ЭС - сложнейшие и дорогостоящие программные ком­
плексы, программисты в КР должны иметь опыт и навыки разработки про­
грамм. Обязательно знакомство с основными структурами представления зна­
ний и механизмами вывода, состоянием отечественного и мирового рынка
программных продуктов для разработки ЭС и диалоговых интерфейсов.
Инжен ер по зна ниям
1 . Существуют такие профессии и виды деятельности, для которых природные
качества лич:ности (направленность, способности, темперамент) могут иметь
характер абсолютного показания или противопоказания к занятиям. По-ви­
димому, инженерия знаний nринадлежит к таким профессиям. По различным
оценкам, это одна из самых малочисленных, высокооплачиваемых и дефицит­
ных в мире специальностей. Попытаемся дать наброски к портрету инженера
по знаниям (без претензии на полноту и точность определений).
,,,Пол. Психологи утверждают, что ·мужчины более склонны к широкому охвату
явлений и в среднем у них выше аналитичность, чрезвычайно полезная инже11еру по знаниям, коtорому 'надо имеn. развитое логическое мышление и уме­
нйе оперировать сложными формальными структурами: Кроме того, при- об­
щении с экспертами, которые в большинстве своем настроены скептически по
отноше�ию к будуще;i ЭС, инженер по знаниям-мужчина вызывает более
высокую мотивацию успешнQсти _со стороны эксперта-женщины . С другой
стороны, известно, что у женщин выше наблюдательность к отдельным дета­
лям объектов. Так что пол не является окончательным показанием или проти­
вопоказанием к данной профессии.
48
Гл ава 2 • Разработка систем , ос но ванн ы х на знан ия х
Ин теллект. Это понятие вызывает самые бурные споры психологов; суще­
ствует до 50 .о пределений интеллекта, но с прагматической точки зрения оче­
видно, что специалист в области искусственного интеллекта должен стре­
миться к максимальным оценкам по тестам как вербального, так и невербаль­
ного интеллекта.
СmШLь общения. Инженер по знаниям «задает тон• в общении с эr<спертом, он
ведет диалог, и от него в конечном счете зависит его продуктивность. Можно
выделить два стиля общения: деловой (или жесткий) и· дружеский (или мяг­
кий, деликатный). Нам кажется, что дружеский будет заведомо более успеш­
ным, так как снижает «эффект фасада• у эксперта, расr<репощает его. Дели­
катность, внимательность, интеллигентность, ненавязчивость, скромность,
умение слушать и задавать вопросы, хорошая коммуникабельность и в то же
время уверенность в себе - вот рекомендуемый .с тиль общения. Безусловно,
что это дар и искусство одновременно, однако занятия по психологическому
тренингу могут дать полезные цавыки.
Портрет инженера по знаниям можно было бы дополнить другими характери­
стиками - широтой взглядов и интересов, артистичностью, чувством юмора,
обаянием и т. д.
2. При определении профессиональных требований к аналитику следует учиты­
вать, что ему необходимы различные навыки и умения для грамотного и эф­
фективного проведения процессов извлечения, концептуализации и формали­
зации знаний.
Инженер по знаниям имеет дело со всеми формами знаний ( см. параграф 1 .3).
Z 1 (знания в памяти) ➔ Z2 (знания в книгах) ➔ ZЗ (поле знаний) ➔ Z4 (модель
знаний) ➔ ZS (база знаний).
Работа на уровне Z 1 требует от инженера по знаниям знакомства с элементами
rюгнитивной психологии и способами репрезентации понятий и процессов в па­
мяти человека, с двумя основными механизмами мышления - логическим и ас­
социативным, с таrшми способами активизации мышления как игры, мозговой
ш1урм и др., с различными моделями рассуждений.
Изучение и анализ текстов на уровне Z2 подразумевает широкую общенаучную
подготовку инженера; знакомство с методами реферирования и аннотирования
текстов; владение навыками быстрого чтения, а также текстологическими мето­
дами извлечения знаний.
Разработка поля знаний на уровне ZЗ требует квалифицированного знакомства с
методологией представления знаний, системным анализом, теорией познания,
аппаратом многомерного шкалирования, кластерным и факторным анализом.
Разработка формализованного описания Z4 предусматривает предварительное
изучение аппарата математической логики и современных языков представле­
ния знаний. Модель знаний разрабатывается на основании результатов глубоко­
го анализа инструментальных средств разрабоч:ки ЭС и имеющихся «оболочек• .
Кроме того, инженеру по знаниям необходимо владеть методологией разработки
ЭС, включая методы быстрого прототипирова:ния.
2.4. Техн ол оги я про е ктирова н и я и разр аботк и
49
И наконец, реализация базы знаний ZS, в которой инженер по знаниям участвует
вместе с программистом, подразумевает овладение практическими навыками ра­
боты на ЭВМ и, возможно, одним из языков программирования.
Так I(ак инженеров по знаниям «выращивают�, из программИ<;тов, уровень ZS
обычно не вызывает затруднения, особенно если разработка ведется на традици­
онных языках типа С или Паскаль. Специализированные языки искусствённого
интеллекта Лисп и Пролог требуют некоторой перестройки архаично-алгорит­
мичесrшго мышления.
Успешность выбора и подготовки коллектива разработчиков ЭС определяет эф­
фективность и продолжительность всего процесса разработки.
2 . 4 . Технология проектирован·и я
и разработки
2 . 4 . 1 . П роблемы р азработки промышленных ЭС
Разработка программных комплексов экспертных систем как за рубежом, так и в
нашей стране находится на уровне скорее искусства, чем науки. Это связано с тем,
что долгое время системьr искусственного интеллекта внедрялись в ос}jовном во
время фазы проектирования, а чаще всего разрабатывалось несколько прототип­
ных версий программ, и - на их основе уже создавался конечный продукт. Такой
подход действует хорошо в исследовательских условиях, однако в коммерческих
условиях он является слишком дорогим, чтобы оправдать затраты на разработку.
Процесс разработки промышленной эr<спертной системы, опираясь на тради­
ционные. технолопщ [Николов и др., 1 990 ; Хейес-Рот и др., 1987 ; Tuthill, 1 994 ] ,
практичесrш для любой предметной области можно разделить на шесть более или
менее независимых этапЬв (рис. 2.3).
Выбор проблемы
2
Разработка п рототи па ЭС
З Доработка до-промышленной ЭС
4
О ценка ЭС
5
Стыковка ЭС
6
Подцержка ЭС
Рис . 2.3. Эта п ы разработки ЭС
50
Глава 2 •• Разработка сио:rем ; оснощзнных на з1-1анияJ;<
Последовательность этапов, д�на только с целью 11ОJ1ученип �щеrо, прwщrавде�
ния .о .процессе создания, ид�алрноrо цроекта. Конечно, ПQ<Щед()Вательность эта
не вполне фикс�рованная . В дей ствительности КЭ)J(дый посл�ющий этап раз­
работки может принести новые идеи , которые могут повл�ть на пред1'{дущие
решения и даже привести к их переработке. Именно поэтому многие специалис­
ты по .информатике весьма критично относятся к, м�тодолоrии экспертных сис­
тем. Они считают , что расходы на разработку тщ<их си стем очень большие, время
разработки слишком велико, а полученны� в результате проrраммы на1<Ладыва­
ют тяжелое бремя на вычислительные ресурсы.
В целом за разработку экспертных систем целесообраз110 браться организацип,
где накоплен опыт по автоматизации рутинных процедур обработI<И информа�
ции, таких как:
• формирование корпоративных информационных систем;
• орrанизация сложных ра счетов;
• работа с компьютерной графикой;
• обработка текстов и автоматизированный документооборот.
Решение таких задач, во-первых, подготавливает высококвалифицированных .спе­
циалистов по информатике, необходимых для создания интеллектуальных систем,
во-вторых, позволяет отделить от экспертных систем неэкспертные задачи,
2 . 4 . 2 . Выбор подхQдящей проблемы.
Этот этап определяет деятельность, предшествующую решению начать разраба•
тывать конкретную ЭС. Он включает [Николов и др . , 1 990]:
• определение пробл емной области и задачи;
• нахождение эксперта, желающего сотрудничать при решении проблемы, 'и назначение коллектива разработчиков;
• определение предварительноrо подхода к решению проблемы;
• анализ расходов и прибылей от разработки;
• подготовку подробного плана разработки.
Правильный выбор проблемы представляет самую критическую час ть разработ­
к и в целом. Если выбрать неподходящуld проблему, можно очень быстро увяз­
нуть в сбол оте• проектирования задач, которые ни1<то не знает, как решать. Не­
подходящая проблема может также привести к созданию экспертной системы,
которая стоит намного больше, чем экономит. Дело будет обстоять еще хуже,
если разработать си стему, которая·работает, но неприемлема для пользователей.
Даже если разработка выполняется самой орrанизацией для собственных целей,
эта фаза является подходящ им моментом :для ·получения· рекомендаций извне,
чтобы гарантировать удачно выбранный и осуществимый с технической точки
зрения первоначальный проект.
При выборе области применения следует учитывать, что если знание, необход и­
мое дЛя решения задач, постоянное, четко формулируемое и связано с вычисли­
тельной обработкой, то обычные алrоритмические , программы, по всей вероятн<J,­
сти, будут самым делесообра;эным спосо6Qм решения проблем в этой области. ,,
2.4,• Технология п�оектирования и разработки
51
ЭRспертная система ни в коем случае не устранит потребность в релящюнных
базах данных, статистическом программном обеспечеflии, электронных таблицах
и системах текстовой обработки. Но если результативность задачи зависит от
знания, которое является субъективным, изменяющимся, символьным или выте­
кающим частично из соображений здравого смысла, тогда область может обосно­
ванно выступать претендентом на экспертную систему.
Обычно экспертные системы разрабатываются путем получения специфических
знаний от эксперта и ввода их в систему. Некоторые системы могут содержать
стратегии одного индивида. Следов-ательно, найти подходящего эксперта - это
клЮ'Iеоой шаг в создании экспертных систем.
В процессе разработки и последующего расширения системы инженер по знани­
ям и эксперт обычно работают вместе. Инженер по знаниям помогает эксперту
структурировать знания, определять и формализовать понятия и правила, необ­
ходимые для решения пробле1Wы.
Во время первоначальных бесед они должны решить, будет ли их сотрудничество
успешным. Это немаловажно, поскольку обе стороны будут работать совместно,
по меньшей мере в течение одного года. Кроме них в коллектив разработчиков це­
лесообразно включить потенциальных пользователей и профессиональных про­
граммистов. Подробно функции каждого члена коллектива описаны в следую­
щем параграфе.
Предварительный подход к программной реализации задачи определяется, ис­
ходя из характеристик задачи и ресурсов, вьiделенных на ее решение. Инженер
по знаниям выдвигает обычно несколько вариантов, связанных с использовани­
ем имеющихся на рынJ<е программных средств. Окончательный выбор возможен
лишь на этапе разработки прототипа.
После того как задача определена, необходимо подсчитать расходы и прибыль от
разработки экспертной системы. В расходы включаются затраты на оплату труда
коллектива разработчиков. В дополнительные расходы будет включена сто­
имость приобретаемого программного инструментария, с помощью которого бу­
дет разработана экспертная система.
Прибыль может быть получена за счет снижения цены продукции, повышения
прщыводительности труда, расширения номенклатуры продукции или услуг или
даже разработки новых видов продукции или услуг в области, в которой .будет
использоваться ЭС. Соответствующие расходы и прибыль от систем.ы определя­
ются относительно времени, в течение которого возвращаются средства, вложен­
ные в разработку. На современном этапе большая часть фирм, развивающих
крупные экспертные системы, предпочли разрабатывать дорогостоящие проекты,
приносящие значительную прибыль.
Можно ожидать развития тенденции разработки менее дорогостоящих систем,
хотя и с более длительным ср01�ом окупаемости вложенных в них средств, так как
программные средства разработки экспертных систем непрерывно совершен­
ствуются.
После того как инженер по знаниям убедился, что:
•, данная задача может быть решена с помощью экспертной системы;
• экспертную систему можно создать предлагаемыми на рынке средствами;
52
Глава 2 • Разработ ка систем, ос н ованн ых на з нани ях
• имеется подходящий эксперт;
• предложенные критерии производительности являются разумными;
• затрf!ТЫ и срок их окупаемости прием�емы для заказчика,
он составляет план разработки. План определяет шаm процесса разрабопси и не­
обходимые затраты, а также ожидаемые результаты.
2 . 4 . 3 . Технология быстрого прототипирования
Прототипная система является усеченной версией экспертной системы,
спроек­
тированной для проверки правильности кодирования фактов, связей и стратегий
рассуждения эксперта. Она также дает возможность инженеру по знаниям при­
влечь эксперта к активному участию в процессе разработки экспертной системы,
и, следовательно, к принятию им обязательства прилож ить все усилия к созда-.
нию системы в полном объеме.
Объем прототипа - несколько десятков правил, фреймов и.ли примеров. На
. рис. 2.4 изображено шесть стадий разработки прототипа и минимальный коллек­
тив разриботчиков, занятых на каждой из стадий (пять стадий заимствовано из
работы [. {ейес-Рот и др., 1 987]). Приведем краmую характеристи1су каждой из
стадий, хотя эта схема представляет собой грубое приближение к сложному, ите­
ративному процессу.
Идентификация проблемы
(переопределение проблемы)
Проблема
Получение знаний
(дополнительное извпечение)
Знания
Структурирование
(изменение поля)
Поле знаний
Формализация
(переформализация)
БЗ на языке nредос;тавпения знаний
®
�+1
® ®
®
Пользователь
Реализация прототипа
(перепро граммирование)
П рограмма-прототип ЭС
Тестирование
�
Инженер по
знаниям
j
Эксперт
®
Про граммист
Рис. 2 . 4 . Стади и разработки п рототипа ЭС
2. 4. Тех нологи я проект ирован и я и разработки
53
Хотя любое теоретиче ское разделение бывает часто условным, осознание кол­
ле1стивом разработчиков четких задач каждой стадии представляется целесооб­
разным. Роли разработчиков (эксперт, программист, пользователь и аналитик)
являются постоянными на протяжении всей разработки. Совмещение ролей не­
желательно.
Сроки приведены условно, так как зависят от квалификации спе циалистов и осо­
бенностей задачи.
И дент ифика ц ия п робл е м ы
Уточняется задача, планируется ход разработки прототипа экспертной системы,
определяются:
• . необходимые ресурсы (время, люди, ЭВМ и т. д.);
• источники знаний (книги, дополнителыtые эксперты, методики);
• имеющиеся аналогичные экспертные системы;
• цели (распространение опыта, автоматизация рутинных действий и др.);
• классы решаемых задач и т. д.
Ид ентификация про блемы - зн а ком ст во и о буч е н ие ч л е н ов к оллекти ва ра зр а ботчи ко в , а
так ж е с о зда н ие неформал ьн о й формули ровки пр о бле м ы .
Средняя продолжительность 1 -2 недели.
И з вл е ч ен ие з н а н ий
· На этой стадии происходит перенос компетентности от эксперта к инжен еру по
знаниям, с использованием различных методов (см. главу 4):
• анализ текстов;
• диалоги;
• экспертные игры;
• лекции;
• дис1<уссии;
• интервью;
• наблюдение и друmе.
Из влече ние з н а н и й - п олуче ние инжен ером п о з н а н и я м н аиболее полн о го и з во з м ожн ых
предс та влен ий о предм етн о й о бл асти и с п о с обах при н яти я реше н и я в ней .
Средняя продолжительночь 1 -3 месяца.
Стру ктурирование или ко нце птуали з ац ия з н а н ий
Выявляется структура полученных знаний о предметной области, то есть опреде­
ляются:
• терминология;
• списш< основных понятий и их атрибутов;
54
Глава 2 • Раз()!бQтка сие.те м, осно�нных на знаниях
• отношения между понятия,ми;
• / структура входной и вых<'Щной информации;
• стратегия принятия решений;
• ограничения стратегий и. т. д.
Структурнрсва нне ( нлн конц ептуалнзацня) знаний - разра б отка неформального опи ­
сани я знаний о предметной о бласти в виде графа , та бл ицы, диаграммы или текста , ко ­
торое отражает основные концепции и взаимосвязи между понятиями предметной о б ­
ласти .
Такое описание называется полем знаний. Средняя продолжительность этапа 2-4
недели. Подробно стадия структурирования описана в главе 3. .
Формализация
Строится формализованное представление концепций предметной области на
основе выбранного язы1<а представления знаний (ЯПЗ). Традиционно, на
этом
'
этапе используются:
•
•
•
•
•
логические методы (исчисления предикатов I-ro порядка и др.);
продукционные модели (с прямым и обратным выводом);
семантические сети;
фреймы;
объектно-ориентированные языки, основанные на иерархии классов, объек�
тов.
фQрмализацня знаний - разработка базы знаний на языке nредс:тавления -энаниЯ'; ко� · : ·
торый , с одной стороны , соответствует структуре поля знаний, а с другой - позволяет
реализовать прототип системы на следующей стадии программной реализации_. .
Все чаще на этой стадии· используется симбиоз языков представления знаний,
например, в системе ОМЕГА [ Справочник по ИИ, 1 990] - фреймы + _семаJ-пи�
ческие сети + полный набоР. возможностей языка исчисления. fIРедикат�в. �ред­
няя продолжительност:r:, 1 -2 месяца. Подробно см. в �ла�ах 3, 4.
Р еапизация
Создается прототип экспертной системы, включающий базу знаний и остальные
блоки, при помощи одного из следующих способов:
• программирование на традиционных языках типа Pascal, С++ и др.;
• программирование на специа.лизирован;ных ,языках, применяемых в зада.чах
искусственно� инте�лекта: LISP [Хювянен; Сеппянен, 199 1 }, FRL [Байдун,
Бунин, 1990), SMALLTALK [ Справочник по ИИ, 1990} и др.;
• использование инструментальных средств разработки ЭС типа СПЭИС [Ков•
риrин, Перф;илъев, 1988), ПИЭС [Хорощевский, 1993), G2 [ Попов, Фоминых,
Кисель, 1 996];
-2.4. Техн ол огия nро е кти ров аtt и я и р азработки
• использовани е �пустых� ЭС или �оболочек� типа ЭКСПЕРТ [Кирсанов, По­
пов, 1990], ФИАКР [Соловье в, Соловьева, 1 989] и др.
Реализация - разработка про граммно го комплекса , демонстри рующего жизнес посо б ­
ность подхода в целом. Ч а ще все го первый прототип отб рас ывается на эта п е реал изаци и
действ ующе й ЭС .
Средняя продолжительность 1 -2 месяца. Более подробно эти вопросы рассмат­
риваются в главе 6.
Те сти р ова н ие
Оценивается и проверяется работа программ прототипа с целью приведения в
соответствие с реальными запросами пользователей. Прототип проверяется на:
• удобство и адекватность интерфейсов ввода/вывода (характер вопросов в ди­
алоге, связность выводимого текста результата и др.);
• эффективность стратегии управления (порядок перебора, использование не­
четкого вывода и др.);
• качество проверочных примеров;
• корректность базы знаний (полнота и непротиворечивость правил).
Тестирование - выя влени е оши бок в подходе и реал изаци и прототи па и выраб от ка реко­
мендаци й по доводке системы до-промышленного варианта.
Средняя продолжительность 1 �2 недели.
2 . 4 . 4 . Развитие прототипа до промышленной ЭС
При неудовлетворительном функционировании прототипа эксперт и инж енер по
знаниям имеют возможность оценить, что именно будет включено в разработку
окончательного варианта системы.
Если первоначально вь1бранные объекты или свойства оказываются неподходя­
щими, их н еобходимо изменить. Можно сделать оценку общего числа эвристи­
ческих правил, необходимых для создания окончательного варианта экспертной
системы. Иногда [Хювянен, Сеппянен, 1 99 1 ] при разработке промышл ещюй и/
или коммерческой системы выделяют дополнительные этапы для перехода
(табл. 2. 1 ).
демонстрационный прототип
коммерческая система
➔
действующий прототип
➔
промышленная система
➔
Однако чаще реализуется плавный переход от демонстрационного прототипа к
промышленной системе, при этом, если программнъ1й инструментарий был вы­
бран удачно, не обязательно даже переписывать окончательный вариант други­
ми программными средствами.
Понятие же коммерческой системы в нашей стране входит в понятие �промыш­
ленный программный продукт�, или �промышленная эс� (в этой работе).
56
Гла в а 2 • Разработка систем, основа нн ых н а знаниях
Основная работа на данном этапе заключается в существенном расширении базы
знаний, то есть в добавлении большого числа дополнительных правил, фреймов,
узлов семантической сети или других элементов· знаний. Эти элементы знаний
обычно увеличивают глуби ну системы, обеспечивая большее число правил для
трудно уловимых аспектов отдельных случаев. В то же время эксперт и инженер
по знаниям могут увеличить базу знаний системы, включая правила, управляю­
щие дополнительными подзадачами или дополнительными аспектами эксперт­
ной задачи (метазнания).
Тебnице 2 . 1 . Переход от прототипа к про мышленной экспертной системе
Сист•ме
Описан ие
Демонстрационный прототип ЭС
Система решает часть задач, демонстрируя
жизнеспособность подхода ( несколько десятков
правил или понятий)
Исследовательский прототип ЭС
Система решает большинство задач, но неустойчива
в работе и не полностью проверена (несколько
сотен правил или понятий)
Действующий прототип ЭС
Система надежно решает все задачи на реальных
примерах, но для сложной зада чи требует
много времени и памяти
Про мышленная система
Система обеспечивает высокое качество решени й
при мини миза ции требуемого времени и памяти ;
переписывается с использованием более
эффективных средств представлени я знан и й
Коммерческая система
Промышленная система, пригодная к продаже ,
то есть хорошо документирована и снабжена сервисом
После установления основной структуры ЭС знаний инженер по знаниям при ­
ступает к разработке и адаптации интерфейсов, с помощью которых система бу­
дет общаться с пользователем и экспертом. Необходимо обратить особое внима­
ние на языковые возможности интерфейсов, их простоту и удобство ДЛЯ управ­
ления работой ЭС. Система должна обеспечивать пользователю возможность лег­
ким и естественным образом уточнять непонятные моменты, приостанавливать
работу и т. д. В частности, могут оказаться полезными графические представле­
ния.
На этом этапе разработки большинство экспертов-узнают достаточно о вводе пра�
вил и могут сами вводить в систему новые правила. Таким образом, начинается
процесс, во время которого ицженер по знаниям передает право собственности и
контроля за системой эксперту для уточнения·, детальной разработки и обслужи­
вания.
2 . 4 . 5 . Оценка системы
После завершения этапа разработки промышленной экспертной системы необ­
ходимо провести ее тестирование в отношении критериев эффективности. К те­
стированию широко привлекаются другие эксперты с целью апробирования ра-
2. 4 . Технология проектирования и разработки
57
ботоспособности системы на различных примерах. Экспертные системы оцени­
ваются главным образом для того, чтобы проверить точность работы программы
и ее полезность. Оценку можно проводить, исходя из различных критериев, ко­
торые сгруппируем следующим образом:
• критерии пользователей (понятность и �прозрачность� работы системы, удоб­
ство интерфейсов и др.);
• критерии приглашенных экспертов (оценка советов-решений, предлагаемых
системой, сравнение ее с собственными решениями, оценка подсистемы объяс­
нений и др.) ;
• критерии коллектива разработчиков (эффективность реализации, производи­
тельность, время от1<лика, дизайн, широта охвата предметной области, не�ро­
тиворечивость БЗ, количество тупиковых ситуаций, когда система не может
принять решение, анализ чувствительности программы к незначительным из­
менениям в представлении знаний, весовых коэффициентах·, применяемых в
механизмах логического вывода, данных и т. п. ).
2 . 4 . 6 . Ст ыков ка сис тем ы
На этом этапе осуществляется стыковка экспертной системы с другими программ­
ными средствами в с:реде, в которой она будет работать, и обучение щодей, кото­
рых она будет обслуживать. Иногда это означает внесение существенных изме­
нений. Такие изменения требуют непременного вмешательства инженера по
знаниям или какого-либо другого специалиста, который сможет модифициро­
вать систему. Под стыковкой подразумевается также разработка связей между
экспертной системой и средой, в которой она действует.
Когда экспертная система уже готова, инженер по знаниям должен убедиться в
том, что эксперты, пользователи и персонал знают, как эксплуатировать и обслу­
живать ее. После передачи им своего опыта в области информационной технологии инженер по' знаниям может
' полностью предоставить ее в распоряжение пользавателей.
Для подтверждения полезности системы.важно предоставить каждому из пользо­
вателей возможность поставить перед Э С реальные задачи, а затем проследить,
как она выполняет эти задачи. Для того чтобы система была одобрена, необходи­
мо представить ее как помощника, освобождающего полъзоватедей от обремени­
тельных задач, а не как средство их замещения.
Стыковка включает обеспечение связи ЭС с существующими базами данных и
другими системами на предприятии, а также улучшение системных факторов,
зависящих от времени, чтобы можно было обеспечить ее более эффективную ра­
боту и улучшить характеристики ее технических средств, если система работает
в необычной среде (например, связь с измерительными устройствами).
.
П ри мер 2. 1
Успешно состыкована со своим окружен ием система PUFF - экспертная с и стема для
диагностики заболеваний легких [Хейес- Р от и др., 1987]. После того как PUFF была
58
Глава 2 • Разработка систем, осн ованных на зн аниях
закончена и все были удовлетворены ее работой, систему перекодировали с LISP на
Бейсик. Затем систему перенесли на ПЭВМ, которая уже работала в больнице. В свою
очередь, эта ПЭВМ была связана с измерительными приборами. Данные с измеритель­
ных приборов сразу поступают в ПЭВМ. PUFF обрабаты вает эти данные и печатает
рекомендации для врача. Врач в принципе не взаимодействует с PUFF. Система пол­
ностью интегрирована со своим окружением - она представляет собой интеллектуаль­
ное расширение аппарата исследованиg легких, котор�й в'рачи давно используют.
П р и м е р 2.2
Другой системой, которая хорошо фующионирует в своем окружении, являе-rся САТ-1
[Уотермен, 1 990 } - экспертная система для диагностики неисправностей:4:щ� елей лq­
комотивов.
Эта система была разработана также на LISP, а затем была переведена на FORTH с ·тем,
чтобы ее можно было более эффективно использовать в различных локомотивных це­
хах. Мастер по ремонту запрашивает систему о возможных причинах неисправности
дизеля. Система связана с видеодиском, с помощью которого мастеру показывают ви­
зуальные объяснения и подсказки, касающ иеся более подробных проверок, котdрые он
должен сделать.
Кроме того, если оператор не уверен в том, как устранить неисправность,. си стема пре­
доставляет ему обучающие материалы, которые фирма подготовила предварительно, и
показывает ему их на видеотерминале. Таким образом, мастер по ремонту может с по­
мощью экспертной системы диагностировать проблему, найти те стовую процедуру,
которую он должен использовать, получ ить на дисплее объясн�ии�. как провести тесr,
или получить инструкции о том, как справиться с возникшей проблемой.
2.4. 7 . П одде ржка системы
При перекодировании системы н а язык, подобный С, повышается е е быстр одей;-,
ствие и увеличивается переносимость, однако гибкость при этом уменьшается .
Это приемлемо лишь в том случае, если система сохраняет все знан:ия пробJJе�- .
ной области и это знание не будет изменяться в ближайшем будущем. Однако
если экспертная система создана именно из-за того, что проблемная ,область из�е­
няется, то необходимо поддерживать систему в ее инструментальной среде разработки.
Пример 2.3
Удачным примером ЭС, внедренной таким образом, является XCON {R1 ) - ЭС, кото­
рую фирма DEC использует для комплектации ЭВМ семейства VАХ. Одной из клю- .
чевых проблем, с которой столкнулась фцрма DEC, является необходимость постоян­
ного внесения изменений для новых версий оборудования, новых спецификаций и т. д.
Для этой цели XCON поддерживается в программной среде OPSS.
Теоретические
аспекты инженерии
знании,
□
□
□
□
П оле зн аний
Стр ат е ги и п олуч е н ия зн а н и й
Теор ети ч еск и е аспекты и з вле ч е н ия зн а н и й
Те орет и ч еск и е ас п екты с труктуриро ва н ия зн а н ий
3. 1 . Поле знаний
Инженерия знания - достаточно молодое направление искусственного интел­
лекта, появившееся тогда, когда практические разработчики столкнулись с весь­
ма нетривиальными проблемами трудности •добычи� и формализации знаний.
'В первых: книгах по ИИ эти факты обычно только постулировались, в дальней­
шем нача.tiись серьезные исследования по выявлению оптимальных ' стратегий
в:ь1явления знан:ий [Boose, 1990; Wielinga, Schreiber, Breuker, 1992; Tuthill, 1 994;
Adeli, 1994}.
Данная глава целиком посвящена теоретическим проблемам инженерии знаний,
другими слова:ми - проектированию баз знаний - получению и структурирова­
нию знаний специалистов для последующей разработки баз знаний. Централь­
ным понятием на стадиях получения и структурирования является rак называе­
мое поле знаний, уже упоминавшееся в параграфе 1 .3 . .
Поле знаний - это условное неф ор мально е описан и е основных понятий и вза им освя ­
зей между пон яти ями п редметной области , выявленных из си стемы знан ий ·эксперта , в
виде графа, диагра ммы , табли цы или текста .
3 . 1 . 1 . О язы ке описания пол я знаний
Поле знаний Pz формируется на третьей стадии разработки ЭС ( см. п. 2.4) - ста­
дии структурирования.
Поле знаний, как первый шаг к формализации, представляет модель знаний о
предметной области, в том виде, в каком ее сумел выразить аналитик на некото-
60
Гла в а З • Те о ретические ас п екты инженерии з наний
ром <�:своем,> языке. Что это за язык? Известно, что словарь языка 1юнкретной на­
уки формируетея путем пополнения общеупотребительного языка епециальны­
ми терминами и знаками, которые либо заимствуются из повеедневноrо языка,
либо изобретаютея [ Кузичева, 1 987] . Назовем этот язык L и раеемотрим его же­
лаемые евойства, учитывая, что стандарта этого языка пока не еуществует, а каж. дый инженер по знаниям вь�нужден еам его изобретать.
Во-первых, как и в языке любой науки, в нем должно быть как можно меньше не­
точностей, приеущих обыде·н ным языкам. Частично точность достигается более
етрогим определением понятий. Идеалом точноети, конечно, являетея язык ма­
тематики. Язык L, в идимо, занимает промежуточное положение между еете­
ственным языком и языком математики.
Во-вторых, желательно не иепользовать в нем терминов иных нау1< в другом, то
ееть новом, смыеле. Это вызывает недоразумения.
В-третьих, язык L, видимо, будет либо еимволъным языком, либо языком rрафи­
чееким (ехемы, рисунки, пюаограммы).
При выборе .нзыка опиеания поля з н аний не еледует забывать, что на етадии
формализации необходимо его заменить на машинно-реализуемый язык пред­
ставлеиия з11а11и й (ЯПЗ), выбор которого зависит от структуры поля знаний.
Сущеетвует ряд языков, доетаточно универеальных, чтобы претендовать на роль
языка инженерии знаний, - это структурно-логический язык SLL, включающий
аппарат лямбда-конвереии [Вольфенrаrен и др., 1979], язык К-еиетем [ Кузнецов,
1989] , УСК [Мартынов, 1977] и др. Однако они не нашли широкого применения.
В некотором смыеле еоздание языка L очень близко к идеям разработки универ­
еальных языков науtш [ Кузичева, 1 987] . К XVII веку еложилиеь два подхода в
разработке универсальных языков: еоздание языков-1<Лассификаций И' лoгuico­
icoucmpyicmuвныx языков. К первому примыкают проекты, воеходящие к идее
Ф. Бэкона, - это языки Вилкинеа и Далrарно. Второй подход евязан е исследо­
ваниями в рамках поиека универсального метода познания, наиболее четко выс­
казанного Р. Декартом, а затем в проекте универеальной характериетики Г. Лейб­
ница. Именно Лейбниц наметил оеновные контуры учения о еимволах, которые
в еоответетвии е его замыслами в XVIII веке развивал Г. Ламберт, который дал
имя науке <�:еемиотика>-'>. Семиотика в оеновном нашла евоих адептов в ефере гу­
манитарных наук. В поеледнее время сложилась также новая ветвь семиотики прикладная еемиотика [ Pospelov, 1 995].
Представители еетественных наук еще не до конца осознали доетоинетва ееми­
отики только из-за того, что имеют дело с достаточно проетымй .и <�:жееткими>-'>
предметными облаетями. Им хватает аппарата традиционной математюш. В ин­
женерии знаний, однако, мы имеем дело с -с:, мяrкими>-'> предметными областями,
где щшо не хватает выразительной адекватноети клаееичеекоrо математичее­
коrо аппарата и где большое значение имеет эффективноеть нотации (ее ком­
пактноеть, простота модиq�икации, ясноеть интерпретации, наглядность и т. д.).
В главе 8 раеематриваютея еовременные тенденции в этой облаети и вводитея
понятие онотолоrическоrо инжиниринrа, как одного из подходов к семиотичее­
кому моделированию предметной ьблаети.
61
З . 1 . Пол е зн а ний
Языки семиотического моделирования [Осипов, 1988 ; Поспелов, 1986) как есте­
ственное развитие языков ситуационного уnравления являются, как нам кажет­
ся, первым приближением к языку инженерии знаний. Именно изменчивость и
условность зна1<ов делают семиотическую модель применимой к сложным сфе­
рам реальной человеческой деятельности. Поэтому главное на стадии концептуа­
лизации - сохранение естественной структуры поля знаний, а не выразительные
возможности языка.
Традиционно семиотика включает (рис. 3. 1 ):
• синтаксис ( совокупность правил построения языка или отношения м�жду
знаками);
• семантику ( связь между элементами языка и их значениями или отношения
между знаками и реальностью);
• прагматику (отношения между знаками и их пользователями).
Mac ll
аки
◄111(1-----�<Зн
-="'"""
) ____.,.
► компьютер
ПРАГМАТИКА
(отношения
между знаками
и их пользоеа­
тепя-)
(чел овек)
(объект)
Рис. 3 . 1 . Структура семиоти ки
З. 1 . 2 . Семиотическая модель поля знаний
Поле знаний Pz я вляется некоторой семиотической моделью, которая может
быть представлена как граф, рисунок, таблица, диаграмма, формула или текст в
зависимости от вкуса инженера по знаниям и особенностей предметной области.
Особенности ПО могут оказать существенное влияние на форму и содержание
компонентов структуры Pz.
62
Гл ав а 3 • Те оретичес ки е ас п е кты инже не р и и зна ни й ·
Рассмотрим соответствующие компоненты Pz .(рис. 3.2).
п
м
Рис . 3.2. Структура пол я з н а н и й
Синтаксис. Обобщенно синтаксическую структуру поля знаний можно предста­
вить как
П = (I, О, М),
где I - структура исходных данных, подлежащих обработке и интерпретации в
экспертной системе;
О- структура выходных данных, то есть результата работы системы;
М - операциональная модель предметной области, на основании которой про­
исходит модификация I в О.
Включение компонентов I и О в Р обусловлено тем., что составляющие и структу­
ра этих интерфейсных компонентов имплицитно ( то есть неявно) присутствуют
в модели репрезентации в памяти эксперта. Оnерациональная модель М может
быть представлена как совокуп�_ость концептуш�ьной структуры S k , отражающей
понятийную структуру предметной области, и функционш�ьной структуры Sr, мо­
делирующей схему рассуждений эксперта:
м = (Sk,Sr).
S k выступает как статическая, неизменная·�оставляющая Р, в то время как Sr пред­
ставляет динамическую, изменяемую составляющую.
Формирование S k основано на выявлении понятийной структуры предметной
области. Параграф 3.4. описывает достаточно универсальный алгоритм проведе­
ния концептуального анализа на основе модификации парадигмы структурного
анализа [Your<;lon, 1989] и построения иерархии понятий (так называемая �пира­
мида знаний,> ). П р�мер S k .и S 1 представлен на рцс. 3.3 и 3.4.
63
З. 1 . Лоле знаний
Пор8Ж8МИ8 С1'М3ИСТЫХ
ЯаwкоdпоженныА о.течнwА
Я оЫI< С\l)Фй •р-й
Яаwк еоnеанеммwА с ,р..........,.
Рис. 3.3. Концептуальная составляющая поля знаний
Рис. 3.4. Функциональная составляющая поiiя знаний
64
Гла в а 3 • Те о ретиче ски е аспекты и нж е н ерии зна н ий
Структура S r включает понятия предметной области А и моделирует основные
функциональные связи RA или отноµ�ения между понятиями, образующими S k .
Эти связи отражают модель или стратегию принятия решения в выбранной ПО.
Таким образом S 1 образует стратегическую составляющую М.
Семантика. Семантика, придающая определенное значение предложениям любо­
го формального языка, определяется на некоторой области. Фактически это на­
бор правил интерпретации предложений и формул языка. Семантика L должна
быть композиционной, то есть значение предложения определяется ка�< функция
значений его составляющих.
Семантика язьп<а L зависит от особенностей предметной области, она обладает
свойством полиморфизма, то есть одни и те же операторы языка в разных зада­
чах могут иметь свои особенности.
Семантику поля знаний Pz можно рассматривать на двух уровнях. На первом
уро вне p;Zg есть семантическая модель знаний э ксперта i о некото рой предметной
области Оg• На втором уровне любое поле знаний Pz явл.srеtся моделью некоторых
знаний, и, следовательно, можно говорить о смысле его как некото рого зеркала
действительности. Рассматривать первый уровень в отрыве от конкретной облас­
ти нецелесообразно, поэтому остановимся подробнее на втором.
Схему, отображающую отношения между реальной действительностью и полем
знаний, можно представить та�<, как показано на рис. 3.5.
M gj
Mgi
с:=:>
Эксперт i
.,,,,_____
Инженер
по знаниям j \.Г""""
Og
Рис. 3 . 5. �Ис порченный телефон• гiри формирован ии п оля з�аний
Ка1< следует из рисунка , поле p;jzg - это результат, полученный • после 4 - й транс­
ляции». (если говорить на языке информатики).
• 1 -я трансляция (1;) - это восприятие и интерпретация действительности О
предметной области gi-м э1<спертом. В результате I; в памяти э1<сперта образу­
ется модель Mg; как семантическая репрезентация действительности и его лич­
ного опыта по работе с ней.
65
3. 1 . Пол е з наний
• 2-я трансляция (V; ) - это вербализация опыта i-ro эксперта, когда он пытает­
ся объяснить свои рассуждения S; и передать свои знания Z; инженеру по зна­
ниям. В результате v; образуется либо текст Т;, либо речевое сообщение С;
• 3-я трансляция ( !) - это восприятие и интерпретация сообщений Т; или С;j -м
инженером по знаниям. В результате в памяти :инженера по знаниям образует­
ся модель мира Mt,i.
• 4 -я трансляция ( Kj) - это кодирование и вербализация модели Мю в форме
поля знаний p;jzg•
Более всего эта схема напоминает детскую игру в 4Испорченный телефон».; перед
инженером по знаниям стоит труднейшая задача - добиться максимального со­
ответствия М81 и pij • У читателей не должно возникать иллюзий, что Pzg отобра­
жает 08 • Ни в коем случае, ведь знания - вещь сугубо авторизованная, следовало
бы на каждой ЭС ставить четкий ярлык i-j, то есть 4база знаний э1<сперта i в пони­
мании инженера по знаниям j»-. Стоит заменить, например, инженера по знаниям
j на h, и получится совсем другая картина.
Zg
Прим е р 3 . 1
П р и ведем пример вли яни я субъективных взглядов эксперта на м. и Vi. Реаль ­
ность (08 ): два человека прибегают на вокзал за 2 минуты до отхода поезда. В кассы очередь. В автоматических кассах свободно, но ни у того, ни у другого пет мелочи. Сле­
дующий поезд через 40 минут. Оба опаэдывают на важную встречу.
Интерпретация 1-ro эксперта ( 1 1 ): нельзя приходить на вокзал менее чем за 10 минут.
Интерпретация 2-ro эксперта ( 1 2 ): надо всегда иметь мелоч ь в карман е.
Вербализация 1 -ro эксперта (V 1 ): опоздал к нужному поезду, так как не рассчитал
время.
Вербализация 2-ro эксnерта (V 2 ) : опоздал , так как на вокзале неразбериха, в кассах
толпа.
Последующие трансляции еще больше будут искажать и видоизменять модель, но те­
перь уже с учетом субъективного восприятия инженеров по знаниям.
Таким образом, если считать поле знаний смысловой (семантической) моделью пред­
метной о_бласти, то эта модель дважды субъективна. И если модель Mg; (см. рис. 3.5) ­
это усеченное отображение 011, то само P.t - лишь отблеск Mg; через призму V1 и Мю,
Прагматика. В качестве прагматической составляющей семиотичес1<0й модели
следует рассматривать технологии проведения структурньго анализа ПО, поль­
зуясь которым инженер по знаниям может сформировать Pz по результатам ста­
дии извлечения знаний.
Таким образом, под праrматикой будем понимать практические аспекты разра­
ботки и использования поля, то есть как от хаоса черновиков и стенограмм сеан- _
сов извлечения знаний перейти к стройной или хотя бы ясной модели.
Подробнее эти вопросы освещен'ы в п�раrрафах 3.4. и 4.4. Однако поле знаний,
несмотря на все старания инженера по знаниям и эксперта, всегда будут лишь
бледным отпечатком реально существующей предметной области, ведь окружа­
ющий нас мир так изменчив, сложен и многообразен, а то, что хранится в нашем
сознании, так плохо поддается вербализации. Тем не менее с точки зрения науч-
66
Гла ва З • Те о рети ч ес кие аспе кты ин ж е нерии знан и й
ной методологии без продуманного, четкого и красивого пол!{ знаний не может · ·
·
идти и речи о создании базы знаний промышленной ЭС.
3 . 1 . 3. « П ирамида)) знаний
Иерархичность понятийной структуры сознания подчеркивается в работах мно­
гих психологов [Брунер, 1 97 1 ; Беккер, 1 976]. Поле знаний можно стратифициро­
вать, то есть рассматривать на различных уровнях абстракции понятий . В 4Пира­
миде знаний,> каждый следующий уровень служит для восхождения на новую
ступень обобщения и углубления знаний в предметной области. Таким образом,
возможно наличие нескольких уровней понятийной структуры S k.
Представляется целесообразным связать это с глубиной профессионального опы­
та (например, как в системе АВТАНТЕСТ [ Гаврилова, Червинская, 1 992]) или с
уровнем иерархии в структурной лестнице организации (рис. 4. 1 2 главы 4).
Естественно, что и стратегии принятия решений, то есть функциональные струк­
туры S1, на различных уровнях будут существенно отличаться .
Если попытаться дать математическую интерпретацию уровней пирамиды эна­
ний U = (U 1 , U 2 , U 3 , ••• , U" ), то наиболее прозрачным является понятие гомомор­
физма - отображения некоторой системы Е, сохраняющего основные операции и
основные отношения этой системы.
Пусть
Е = ( Е 1 (oi : i Е 1), (rj : j Е J))
некоторая система с основными понятиями o i , i Е I и основным и отношениями rj ;
j Е J.
Гомоморфизмом с и стемы Е в однотипную ей систему Е':
Е' = ( Е', (о'; : i Е 1), (r'j : j Е J)),
называется отображение
Ф : Е ⇒ Е',
удовлетворяющее следующим двум условиям:
Ф(о i (ер . .. , еп) ) = о / ( Ф (е 1 ) , •• • , Ф (e nj )) ;
(е 1 , • • • , е ,,) Е rj ::::::> ( Ф (е 1 ) , • . . , Ф (е11 Е r'j •
))
Для всех элементов e l ' . . . , е 111 из Е и всех i Е 1, j Е J .
Согласно введенным обозначениям уровни пирамиды суть rомоморфизмы моде­
лей (то есть понятий и отношений) предметной области
Ф : М ⇒ М',
где М = (А, R, S); М ' = (А', R', S'), А' - мета-понятия, или понятия более в ы сокого
уровня абстракции; R' - мета-отношения; S ' - мета-стратегии .
Во сходя по ступеням пирамиды, мы получаем систему гомоморфизмов, что со­
ответствует результатам, полученным в I<оrнитивной психологии об уменьше­
нии размерности семантического пространства памяти с увеличением опыта эк­
спертов.
3.2. Страте гии получен ия знаний
67
3 . 2 . Стратегии получения знаний
,
При формировании поля знаний ключевым вопросом является сам процесс по­
лучения знаний, коrда происходит перенос компетентности экспертов на инженеров по знаниям. Для названия этоrо процесса в литературе по ЭС получило
распространение несколько терминов: приобретение, добыча, извлечение, полу­
чение, выявление, формирование знаний. В англоязычной специальной литера­
туре в основном используются два: acquisition (приобретение) и elicitation (вы­
явление, извлечение, установление).
Термин •приобретение,,. трактуется либо очень широко - тогда он включает
весь процесс передачи знаний от эксперта к базе знаний ЭС, либо уже как способ
автоматизированного построения базы знаний посредством диалога эксперта и
специальной программы (при этом структура поля знаний заранее закладывает­
ся в программу). В обоих случаях термин •приобретение,,. не касается самого та­
инства экстрагирования структуры знаний из потока информации о предметной
области. Этот процесс описывается понятием )4:Uзвлечение,,,.
Авторы склонны использовать этот термин как более емкий и более точно выра­
жающий смысл процедуры переноса компетентности эксперта через инженера по
знаниям в базу знаний ЭС.
Извлечение знаний (knowledge e/icitation) - эт о п р о цедура взаимодействия эк сперта с
источником знаний, в результате которой становятся я вными про цесс рассуждений спе­
циалистов при принятии реш ения и структура их представлений о предметной области.
В настоящее время большинство разработчиков ЭС отмечает, что процесс извле­
чения :таний остается самым •узким• местом при построении промышленных ЭС.
При этом им приходится практически самостоятельно разрабатывать �етодъr из­
влечения, сталкиваясь со следующими трудностями [Gaines, 1 989):
• организационные неувязки;
• неудачный метод извлечения, не совпадающий со структурой знаний в данной
области;
• неадекватная модель (язык) для представления знаний.
Можно добавить к этому [Гаврилова, Червинская, 1 992) :
• неумение наладить контакт с экспертом;
• терминологический разнобой;
• отсутствие целостной системы знаний в результате извлечения только •фрагментов•;
• упрощение •картины мира• эксперта и др.
Процесс извлечения зн:ший - это длительная и трудоемкая процедура, в кото­
рой инженеру по знаниям, вооруженному специальными знаниями по когнитив­
ной психологии, системному анализу, математической лоrике и пр., необходимо
воссоздать модель предметной области, которой пользуются эксперты для при-
68
Гла ва 3 • Те о р ет и че ски е ас пе кт ы и нже нер ии знани й
нятия решения. Часто начинающие разработчики ЭС, желая упростить эту про­
цедуру, пытаются подменить инженера по знаниям самим экспертом. По многим
причинам это нежелательно.
Во-первых, большая часть знаний эксперта - это результат многочисленных на­
слоений, ступеней опыта. И часто, зная, что из А следует В, эксперт не отдает себе
отчета, что цепочка его рассуждений была гораздо длиннее, например А ➔ D ➔
С ➔В или А ➔ Q ➔ R ➔ B.
Во-вторых, как было известно еще Платону, мышление диалоrично. И поэтому
диалог инженера по знаниям и эксперта - наиболее естественная форма изуче­
ния лабиринтов памяти эксперта, в которых хранятся знания, частью носящие
невербальный характер, то есть выраженные не в форме слов, а в форме нагляд­
ных образов, например. И именно в процессе объяснения инженеру по знаниям
эксперт на эти размытые ассоциативные образы надевает четкие словесные яр­
лыки, то есть вербализует знания.
В-третьих, эксперту труднее создать модель предметной области вследствие глу­
бины и объема информации, которой он владеет. Еще в ситуационном управле­
нии [ Поспелов, 1986) было выявлено: объекты реального мира связаны более чем
200 типами отношений (временные, пространственные, причинно-следственные,
типа •часть-целое» и др.). Эти отношения и связи предметной области образуют
сложную систему, из которой выделить •скелет» или главную структуру иногда
доступнее аналитику, владеющему к тому же системной методологией.
Термин •приобретение• в рам1,ах данного учебника оставлен за автомати­
зированными системами прямого общения с экспертом. Они действительно
непосредственно приобретают уже готовые фрагменты знаний в соответствии
со структурами, заложенными разработчиками систеl\f: Большинство этих ин­
струментал·ь ных средств специально ориентировано на конкретные ЭС с жестко
обозначенной предметной областью и моделью представления знаний, то есть не
являются универсальными.
Приобре тение знаний ( know/вdge acquisition) - п роце сс н ап олнен ия б азы з н ан и й э кс ­
п ертом с и сп ол ьзов а н ие м сп еци ал и з и рованных п рогр ам мн ы х средств.
Например, система TEIRESIAS [Davis, 1982), ставшая прародительницей всех
инструментариев для приобретения знаний, предназначена для пополнения базы
знаний системы MYCIN или ее дочерних ветвей, построенных на •оболочке»
EMYCIN [Shortliffe, 1976) в области медицинской диагностики с использованием
продукционной модели представления знаний. Три поколения и основные тен­
денции СПЗ будут подробно описаны в параграфе 4.5. Более современные конк­
ретные системы описаны далее в параграфе 4.6.
Термин формирование знаний традициоlfно закрепился за чрезвычайно перспек­
тивной и активно развивающейся областью инженерии знаний, которая занима­
ется разработкой·моделей, методов и алгоритмов обучения. Она включает индук­
тивные модели формирован!'{Я знаний и автоматического порождения гипотез,
например ДСМ-м_етод [Аншаков, Скворцов, Финн, 1 986] на основе обучающих
выборок, обучение по аналогии и другие методы. Эти модели позволяют выявить
З.2. Страте гии получения знаний
69
причинно-следс�енные эмпирические зависимости· в базах данных с неполной
.
информацией, с_одержащих структурированные числовые и символьные объекты
(часто в условиях неполноты информации).
Формирование знаний (machine leaming) - п роцесс анализа данных и вы я в ление
скрыты>\ закономерностей с ис п ол ьзованием с п е циального математического апп арата
и nрогр$ммн ых средств.
Традиционно к задачам формирования знаний или машинного обучения отно­
сятся задачи прогнозирования, идентификацня (синтеза) функци�, расшифров­
ки языков, индуктивного вывода и синтеза с дополнительной информацией
[Епифанов, 1 984] . В широком смысле к обучению по примерам можно отнести и
методЪJ обучения распознавацию образов [Аrкинсон, 1989; Schwartz, 1988] .
Индуктивный в ывод правил из фактов применен также в сис'rемах AQ,
AQUINAS, KSSI, INSТIL и некоторых других.
Н аиболее продвинутыми среди методов машинного обуч ения являются, по-ви­
димому, методы распознавания образов , в частности, алгебраический подход, в
котором предусматривается обогащение исходных эвристических алгоритмов с
помощью алгебраических операций и построение семейства алгоритмов, гаран­
тирующего получение корректного алгоритма для решения изучаемого класса
задач, то есть алгоритма, правильно классифицирующего конечную выборку по
всем классам [Берков, 1972]. Однако применение методов формирования зна­
ний пока не стало · промышленной технологией разработки баз знаний.
Для того чтобы эти методы стали элементами технологии интеллектуальных си­
стем, необходимо решить ряд задач [Осипов, 1997]:
• обеспечить механизм сопряжения независимо созданных баз данных, имею­
щих различные схемы, с базами знаний интеллектуальных систем;
• установить соответствие между набором полей базы данных и множеством
элементов декларативной компоненты базы знаний;
• выполнить преобразование результата работы алгоритма обучения в способ
представления, поддерживаемый программными средствами интеллектуаль­
ной системы.
Помимо перечисленных существуют также и другие стратегии получения
знаний, например, в случ ае обучения на примерах ( case-based reasoning) , ког­
да источник знаний - это множество примеров предметной области [ Оси­
пов, 1997 ; Попов, Фоминых, Кисель , 1996) . Обучение на основе примеров
(прецедентов ) включает настройку алгоритма распознавания на задачу по­
средством предъявления примеров, классификация которых известна [Ибер1
ла, 1980) .
Обучение н а примерах тесно связано с машинным обучением. Различие заключа­
ется в том, что результат обучения в рассматриваемом здесь случае должен
быть интерпретирован в некоторой модели, в которой, возможно, уже содержатся
факты и законймерности nредмеnюй области, и преобразован в способ представ-
70
Глава З • Те орет ичес к ие ас пе кты и нже н е р и и знаний
ления, который допускает исполь�ование ре�ультата обучения � базе з наний, для
моделирования рассуждений, для работы механизма объяснения и т. д., то есть
делает результат обучения элементом соответствующей технологии.
Например, в системе INDUCE [Коов и др., 1 988) порождается непротиворечивое
описание некоторого класса объектов по множествам примеров и контр-приме­
ров данного класса. В качестве языка представления используется язык перемен­
но-знач)!ОЙ логики первого порядка (вариант языка многозначной логики первого порядка).
Следует отметить также появление двух новых •Флагов• в стане сторонников
методов машищюго обучения - это data mining и knowledge discovery. Оба подхо­
да базируются на анализе данных и поиске закономерностей.
Таким образом, можно выделить три основные стратегии проведения стадии по­
лучения знаний при разработке ЭС (рис. 3.6).
1 . С использованием ЭВМ при наличии подходящего программного инструмен­
тария, иначе приобретение знаний.
2. С использованием программ обучения при наличии репрезентативной (то есть
достаточно представительной) выборки примеров принятия решений в пред­
метной области и соответствующих пакетов прикладных программ, иначе фор­
мирование знаний.
3. Без использования вычислительной техники путем непосредственного контак­
та инженера по знаниям и источнИI<а знаний (будь то эксперт, специальная
литература или другие источники), иначе извлечение знаний .
Идентификация
проблемы
...._п
_о
_л_уч
....ен_и_е__,�Структурироаание\ �
• •
L.y
знаний
i-vi
Без применения
С применением
эвм '
1
И з влечение
знаний
_
эвм
2 П
рио ретение
б
знаний
3
Форми рование
знаний
Рис. 3 . 6. Стратеги и получения энани А
В учебнике подробно будут рассматриваться процессы извлечения и приобрете­
ния знаний, так как на современном этапе разработки ЭС эти стратегии являются
наиболее эффективными и перспективными. Формирование знаний, тяготеющее
в большей степени к области machine learning, то есть индуктивному обучению,
основываясь на хорошо исследован ном аппарате распознавания образов [Гаек,
Гавранек, 1 983) и обнаружения сходства объектов [Гусакова, Финн, 1 987] , выхо­
дит за рамки данного учебника. Также вне этой книги остались вопросы форми­
рования знаний из данных (data mining, knowledge- discovery) и др.
3 .3. Тео ретические ас пекты извлечения зна ний
71
3.3. Теоретические аспекты и звлечения ·
знаний
Поскольку основной проблемой инженерии знаний является процесс извлечения
знаний, инженеру по знаниям необходимо четко понимать природу и особенное. ти этих процессов. Для того чтобы разобраться в природе извлечения знаний,
выделим три. основных аспекта этой процедуры (рис. 3.7):
А = { А 1 , А2, АЗ} ... {психологический, лингвистический, гносеологический}.
Ри с . 3 . 7 . Те о рети чес ки е ас п е кты инже не р ии знаний
3 . 3 . 1 . Психологический аспект
Из трех аспектов извлечения знаний психологический - А 1 - является ведущим,
поскольку он определяет успешность и эффективность взаимодействия инжене­
ра по знаниям (аналитика ) с основным источником знаний - э кспертом-профес­
сионалом . Психологический аспект выделяется еще и потому, что извлечение
знаний происходит чаще всего в процессе непосредственного общения разработ­
чиков системы. А в общении психология является доминантной.
Общение, или коммуникация (от лат. communicatio - связь), - это междисцип­
линарное понятие, обозначающее все формы непосредственных контактов между
людьми - от дружеских до деловых. Оно широко исследуется в психологии, фи­
лософии, социологии, этологии, лингвистике, семиотике и других науках. Суще­
ствует несколько десятков теорий общения, и единственное, в чем сходятся все
авторы, - это сложность, многоплановость процедуры общения. Подчеркивает­
ся, что общение - не просто однонаправленный процесс передачи сообщений и
не двухтактный обмен порциями сведений, а нерасчлененный, процесс циркуля­
ции информации , то есть совместный поиск истины [ Каган, 1 988] (рис. 3.8 ) .
Итак, общение есть процесс выработки новой информации , общей для общаю­
щихся людей рождающей их общность. И хотя общение - первый вид деят�ль­
ности, которым овладевает человек в онтогенезе, по-настоящему владеют куль­
турой и наукой общения единицы.
и
72
Глава З • Тео ретич ес кие асп екты инжен ерии зна ний
Неправильная
схема
Эксперт
Правильная
схема
Эксперт
Инженер
по знаниям
�
�
ИЮl<енер
по знаниям
Рис. 3.8. Структура процесса общен ия
Можно выделить четыре основных уровня общения [Саrатовский, 1 980].
1 . Уровень манипулирования, когда один субъект рассматривает другого как сред­
ство или помеху по отношению к проекту своей деятельности.
2. Уровень •рефлексивной игры•, когда в процессе своей деятельности человек
учитывает •контрпроект• другого субъекта, но не признает за ним -самоцен­
ность и стремится к •выигрышу•, к реализации своего проекта.
3. Уровень правового общения, когда субъекты признают право на существова­
ние проектов деятельности друг друга и пытаются согласовать их хотя бы вне­
шне.
4. Уровень нравственного общения, коtда субъекты внутренне прйнимают общий
проект взаимной д�ятельности.
Стремление и умение общаться на высшем, четвертом, уровне может характе­
ризовать степень профессионализма инженера по знаниям. Язвлечение зна­
ний - это особый вид общения, который можно отнести к духовно-информа­
ционному типу. Согласно работе [Каган, 1 988] общение делится на мате­
риально-практическое; духовно-информационное; практически-духовное. При
этом информационный аспект общения для инженера по знаниям с прагмати­
ческой точки зрения важнейший.
Известно, что потери информации при разговорном общении велики [ Мицич,
1 987] (рис. 3.9).
l
:i::
о
i::
111
Эксперт
Инженер
по знаниям
Рис. 3.9. Потери информации при разговорном общении
73
З . З . Те орет ическ ие аспе кты из влечен и я знани й
В связи с этим рассмотрим проблему увеличения информативности общения
аналитика и эксперта за счет использования психологических знаний.
Можно выделить такие структурные компоненты модели общения при извлече­
нии знаний:
• участники общения (партнеры);
• средства общения (процедура);
• предмет общения (знанчя).
В соответствии с этой структурой выделим три •слоя; психологических проблем,
возникающих при извлечении знаний (рис. 3. 1 О):
А1 = {S 1 1 , S 1 2 , S 1 3 } = {контактный, процедурный, когнитивный}.
"•
'<r\
}
<:-,<f
S11
Контактный
слой
S12
П роцедурный
слой
S13
Когнитивный
слой
Ри с . 3 . 1 О. Психол оги ч еский ас пе кт из вл ече ния знани й
Ко н та ктны й с лой (S 1 1 )
Практически все психологи отмечают, что на любой коллективный процесс вли­
яет атмосфера, возникающая в группе участников. Существуют эксперименты,
результаты которых неоспоримо говорят, что часто дружеская атмосфера в кол­
лективе больше влияет на результат, чем индивидуальные способности отдель­
ных членов группы [ Немов, 1 984] . Особенно важно, чтобы в коллективе раз­
работчиков складывались кооперативные, а не конкурентные отношения. Для
кооперации характерна атмосфера сотрудничества, взаимопомощи, заинтересо­
ванности в успехах друг друга, то есть уровень нравственного общения, а для от­
ношений конкурентного типа - атмосфера индивидуализма и межличностного
соперничества (более низкий уровень общения).
В настоящее время прогнозировать совместимость в общении со 100%-й гаран­
тией невозможно. Однако можно выделить ряд факторов и черт личности, ха­
рактера и других особенностей участников общения, несомненно, оказываю­
щих влияние на эффективность процедуры.
Разработка проблематики контактного слоя позволила выявить следующие па­
раметры партнеров, влияющие на результаты процедуры извлечения знаний:
74
Гл ава 3 • Те о рети чес к и е аспекты и нженер ии з н аний
S 1 1 - {s1 1_i} - {пол, возраст, личность, темперамент, мотивация и др.}, часть из
1<оторых впоследствии вошли в формирование модели пользователя.
Значения параметрqв пола (s 1 1_1) и возраста (s 1 1_2) хотя и влияют на эффек­
тивность контакта, но не являются критическими. В литературе [ Иванов, 1986]
отмечается, что хорошие результаты дают гетерогенные пары (мужчина/женщи­
на) и соотношение:
20 > ( В, - В.) > 5,
где В" - возраст эксперта; Б. - возраст аналитика.
Под личностью (s1 1_3) обычно понимается устойчивая система психолоrичес�
ких черт, характеризующая индивидуальность человека. Рекомендуемые компо­
ненты s 1 1_3 исследованы в работе [ Гаврилова, 1 990] и дополнены качествами из
руководства для журналистов в работе [Schouksmith G., 1978]. s 1 1_3 = (доброже­
лательность, аналитичность, хорошая память, внимание, наблюдательность, во­
ображение, впечатлительность, большая собранность, настойчивость, общитель­
ность, находчивость).
Со времен Галена и Гиппократа, выделивших четыре классических типа темпе­
рамента (s 1 1_4), вошли в научную термино}lоrию понятия
s 1 1_4 = (холерик, сангвиник, меланхолик, флегматик).
Известно, что флегматики и меланхолики медленнее усваивают информацию
[Лунева, Хорошилова, 1 987] . И для обеспечения психологического контакта с
ними не следует задавать беседе слишком быстрый темп, торопить их с ответом.
Зато они гораздо лучше усваивают новое, в отличие от холериков, для которых
свойственно поверхностное усваивание информации. Последних следует специ­
ально наводить на размышление и рефлексию. У меланхоликов часто занижена
самооценка, они застенчивы и в беседе их надо подбадривать. Таким образом,
наиболее успешными в рамках слоя S 1 1 являются сангвиники и холерики.
На эффективность коллективного решщшя задач влияет также и мотивация
(s 1 1_5), то есть стремление к успеху. Инженер по знаниям в зависимости от ус­
ловий разработки должен изыскивать разнообразные стимулы для экспертов
(включая, разумееtся, и материальные). Эксперт передает аналитику один из са­
мых дорогих в мире продуктов - знания. И если одни люди делятся опытом доб­
ровольно и с удовольствием, то другие весьма неохотно приоткрывают свои про­
фессиональные тайны. Иногда полезно оказывается возбудить в эксперте дух
соперничества, конкуренции (не нарушая, естественно, обстановки кооператив­
ности в коллективе).
П р оцедурн ы й слой (S 1 2)
Параметры процедурного слоя S 1 2 описывают непосредственно процесс прове­
дения процедуры извлечения знаний. Фактически это профессиональные пара­
метры:
S 1 2 - {s1 2_i} = {ситуация общения (место, время, продолжительность); оборудо­
вание (вспомогательные средства, освещенность, мебель) ; профессиональные
приемы (темп, стиль, методы и др.)}.
З . З . Теоретичес кие аспект ы извлечения знан ий
75
Инженер по знаниям, успешно овладевший наукой установления атмосферы до­
верия и взаимопонимания с эиспертом (контактный слой '-- S 1 1 ), должен еще су�
меть воспользоваться благоприятным воздействием этой атмосферы. Проблема
процедурного слоя касается проведения самой процедуры извлечения знаний.
Здесь мало проницательности и обаяния, полезных для решения проблемы кон­
таr<та, тут необходимы профессиональные знания.
Остановимся на общих закономерностях проведения процедуры.
s12_1 - ситуация общения определяется следующими компонентами:
• s 1 2_1_1 - место проведения сеансов;
• s 1 2_1_2 - продолжительность проведения сеансов;
• s 1 2_1_3 - время проведения сеансов.
,Беседу с экспертом лучше всего проводить в небольшом помещении наедине
(s12_1_1: место), поскольку посторонние люди нарушают доверительность бесе­
ды и могут породить эффект •Фасада• . Рабочее место эксперта является не са­
мым оптимальным вариантом, так как его могут отвлекать телефонные звон1ш,
сотрудниr<и и пр. Атмосфера замкнутого пространства и уединенности положи­
тельно влияет на эффективность.
Американский психолог И. Атватер считает, что для делового общения наиболее
благоприятная дистанция от 1,2 до З метров [ Schouksmith, 1 978). Минимальным
•комфортным• расстоянием можно считать 0,7-0,8 метра.
Реконстру1щия собственных рассуждений - трудоемкий процесс , и поэтому
длительность одного сеанса ( s 1 2_1_2: �родолжительность) обычно не превыша­
ет 1 ,5-2 часа. Эти два часа лучше выбрать в первой половине дня, например с 10
до 1 2 часов, если эксперт типа •жаворонок• ( s 1 2_1_3: время). Известно, что взаимная утомляемость партнеров при беседе наступает обычно через ·20-25 минут
[Ноэль, 1 978) , поэтому в сеансе нужны паузы.
s 12_2 - оборудование включает:
• s 12_2_1 - вспомоrа:rельные средства;
• s 1 2_2_2 - освещенность;
• s 1 2_2 З - мебель.
-;;
Вспомогательные средства (s1 2_2_1):
• средства для увеличения эффективности самого процесса извлечения знаний;
• средства для протоколирования результатов.
К средствам для увеличения эффективности процесса извлечения знаний прежде
всего относится наглядный материал. Независимо от метода извлечения (см. гла­
ву 4), выбранного в конкре.тной ситуации, его реализаци·я возможна разными спо­
собами. Например, можно учитывать следующий фактор: широко известно, что
людей, занимающихся интеллектуальной деятельностью, можно отнести к худо­
жественному либо мыслительному типу. Термины тут условны и не имеют отно­
шения к той деятельности, которую традиционно называют художественной или
76
Глава З • Теоретич ес кие а спект ы ин.жен ер �и знаний
мыслцтельной. Важно, что, определив. тип эксперта, инженер по знаниям может
плодотворне.е использовать любой из методов извлечения, зная, что люди худо­
жественного типа легче воспринимают зрительную информацию в форме рисун­
ков, графиков, диаграмм, так как эта информация воспринимается через первую
сигнальную систему. Напротив, эксперты мыслительного типа лучше понимают
язык формул и текстовую информацию. При этом учитывается факт, что боль­
шую часть информации человек получает от зрения. Совет пользоваться актив­
нее наrлядным материалом из работы [ Хейес- Рот, Уотермена, Ленат, 1987)
. можно считать универсальным. Такие методы, как свободный диалог и игры, пре­
доставляют богатые возможности использовать слайды, чертежи, рисун1(и.
Для протоколирования результатов в настоящее время используются следую­
щие способы:
• запись на бумагу непосредственно по ходу беседы (недостатки - это часто ме­
шает беседе, кроме того, трудно успеть записать все, даже при наличии ·навы!
ков стенографии);
• магнитофонная запись (диктофон) , помогающая аналитику проанализиро­
вать весь ход сеанса и свои ошибки (недостаток - может сковывать э1(сперта);
• запоминание с последующей записью после беседы (недостаток - годится
только для аналитиков с блестящей памятью).
Наиболее распространенным способом на сегодня является первый. При этом
наибольшая опасность тут - потеря знаний, поскольку любая запись ответов это уже интерпретация, то есть привнесение субъективного понимания предмета.
Значения параметров освещенности (s 1 2_2_2) и мебели (s 1 2_2_3) очевидны и
связаны с влиянием внешних факторов на эксперта.
s12_3 - профессиональные приемы аналитика, включают, в частности: .
• s 1 2_3_1 - темп;
• s1 2_3_2 - стиль;
• s 1 2_3_3 - методы.
Учет индивидуального темпа (s1 2_3_1) и стиля (s 1 2_3_2) эксперта позволяет
аналитику снизить напряженность процедуры извлечения знаний. Типичной
ошибкой является навязывание собственных темпа и стиля.
На успешность также влияет длина фраз, которые произносит инженер по зна­
ниям. Этот факт был установлен американскими учеными - лингвистом Ингве
и психологом Миллером при проведении исследования о причинах низкой усвояемости команд на Военно-морском флот� США (Gammack, Young, 1 985].
Причина была в длине команд. Оказалось, 'JTO человек лучше всего воспринимает
предложения глубиной (или длиной) 7 + 2 (-2) слова. Это число (7±2) получило
название число Инrве-Миллера. Можно считать его мерой •разговорности�
речи. Опытные лекrоры используют в лекции в основном короткие фразы, умень­
шая потерю информации с 20-30 % (у плохих лекторов) до 3-4 % [ Горелов, 1987).
Большая часть информации поступает к инженеру по знаниям в форме предло­
жений на естественном языке. Однако внешняя речь эксперта есть воспроизведе­
ние его внутренней речи (мышления), которая гораздо богаче и многообразнее.
3.3. Тео рети чес ки е асп екты и звл ече ни я зн ан ий
77
При этом для передачи этой внутренней речи эксперт использует и невербаль­
ные средства, такие как интонация, мимика, жесты. Опытный инженер по знани­
ям старается записывать по возможности в протоколы (в форме ремарок) эту до­
полнительную интонацию.
В целом, невербальная компонента стиля общения важна и для проблем контакт­
ного слоя при установлении контакта, когда по отдельным жестам и выражению
лица эксперта инженер по знаниям может установить границу возможной •дру­
жественности• общения.
Значение параметра методов (s 1 2_3_3) подробно рассмотрено в следующей
главе, ll:сходя из позиции, что метод должен подходить к эксперту как •ключ к
замку• .
Ког ни т и в н ый с л ой (S1 3)
Когнитивные ( от англ" cognition - познание) науки исследуют познавательные
процессы человека с позиций возможности их моделирования (психология, ней­
рофизиология, эргономика, инженерия знаний). Наименее исследованы на сегод­
няшний день проблемы когнитивного слоя S 1 3, связанные с изучением семанти­
ческого пространства памяти эксперта и реконструкцией его понятийной струк­
туры и модели рассуждений.
Основными факторами, влияющими на когнитивную адекватн6сть, будут:
S 1 3. = {s 1 3_i} = {когнитивный стиль, семантическая репрезентативность поля зна­
ний и концептуальной модели}.
Под когнитивным стилем (s 1 3_1) человека понимается совокупность критериев
предпочтения при решении задач и познании мира, специфическая для каждого
человека. Когнитивный стиль определяет не столько эффективность деятельно­
сти, сколько способ достижения результата [Алахвердов, 1986] . Это способ по­
знания, который позволяет людям с разными способностями добиваться оди­
наковых результатов в деятельности. Это система средств и индивидуальных
приемов, к которым прибегает человек для организации своей деятельности.
Инженеру по знаниям полезно изучить и прогнозировать свой когнитивный
стиль, а также стиль эксперта. Особенно важны такие характеристики когнитив­
ного стиля, как:
• s13_1_1 - (полезависимость - поленезависимость);
• s 1 3_1_2 - (импульсивность - рефлективность (рефлексивность);
• s 1 3_1_3 - (ригидность - гибкость);
• s 1 3_1_4 - (когнитивная эквивалентность).
s13_1_1 . Поленезависимость позволяет человеку акцентировать внимание лишь
на тех аспектах проблемы, к.оторые необходимы для решения конкретной зада­
чи, и уметь отбрасывать все лишнее, то есть не зависеть от фона или окружаю­
щего задачу шумового поля. Эта характеристика коррелирует с такими чертами
личности, как невербальный интеллект, аналитичность мышления, способность
78
Гл ава З • Те о рети чес к и е аспект ы инженер ии знаний
к пониманию сути. Очевидно, что помимо того, что самому аналитику необходи­
мо иметь -в ысокое значение параметра s 1 3_1_1, поленезависимый эксперт - это
тоже желательный фактор. Однако приходится учитывать, что больше нуждают­
ся в общении полезависимые люди, а потому они и более контактны [ Орехов,
1 985}.
Особенно полезны для общения гетерогенные (смешанные) пары, например •по­
лезависимый - поленезависимый• [ Иванов, 1 986]. В литературе описаны раз­
личные эксперименты, моделирующие общение, требующее понимания и совмест­
ной деятельности. Наиболее успешным в понимании оказались поленезависимые
испытуемые (92 % успеха) , для сравнения полезависимые давали 56 % успеха
[ Кулюткин, Сухобская, 1 9 7 1 } .
Для совместной профессиональной деятельности важна также гибкость когни­
тивной организации, которая связана с поленезависимостью. Итак; большую
способность к адекватному пониманию партнера демонстрируют субъекты с вы­
сокой психологической дифференциацией, то есть поленезависимостью.
Поленезависимость является одной из характерных профессиональных черт ког­
нитивного стиля наиболее квалифицированных инженеров по знаниям. По неко­
торым результатам [ Алахвердов, 1 986] мужчины более поленезависимы, чем жен­
щины.
s13_1_2. Под импульсивностью понимается быстрое принятие решения (часто
без его достаточного обоснования), а под рефлексивностью - склонность I< рас­
судительности. Рефлексивность по экспериментальным данным коррелирует со
способностью к формирования понятий и продуктивностью стратегий решеюtя
логических задач [ Кулюткин, Сухобская, 1 97 1 ]. Таким образом, и 11нженеру, по
знаниям, и эксперту желательно быть рефлексивным, хотя собственный стиль
изменяется лишь частично и с большим напряжением.
s13_1_3. Ригидность - гибкость характеризует способность человека к измене­
нию установок и точек зрения в соответствии с изменяющейся ситуацией. Ригид­
ные люди не склонны менять свои представления и структуру восприятия, напро­
тив, гибкие легко приспосабливаются к новой обстановке. Очевидно, что если
эксперт еще может себе позволить ригидность (что характерно для долго работа­
ющих над одной проблемой специалистов, особенно старшего возраста), то для
инженера по знаниям эта характеристика когнитивного стиля явно противопо­
казана. Увеличение ригидности с возрастом отмечается многими психологами
[Кулюткин, Сухобская, 197 1 ; Орехов, 1985].
s13_1_4. Когнитивная эквивалентность характеризует способность человека к
различению понятий и разбиению их на классы и подклассы. Чем уже диапазон
когнитивной эквивалентности, тем более тонкую классификацию способен про­
вести индивид, тем большее количество признаков понятий он может выделить.
Обычно у женщин диапазон когнитивной эквивалентности уже, чем у мужчин.
Семантическая репрезентативность (s 1 3_2) подразумевает подход, исключающий
традиционное навязывание эксперту некой модели представлений (например,
продукционной или фреймовой ) , и заставляет инженера по знаниям последова­
тельно воссоздавать модель мира эксперта, используя как неформальные методы,
79
З . З. Теоретическ ие ас пе кты извлечени я знаний
та�< и математический аппарат, например многомерное шкалирование (см. главу,
4). Проблема семантической репрезентативности ориентирована на достижение
rюrнитивной адекватност'и поля знаний и концептуальной модели. В настоящий
момент она может быть сформулирована как проблема •испорченного телефона•
[Гаврилова, Червинская, 1 992) ( см. рис. 3.5) - возможные трансформации и по­
тери в цепи передачи информации:
(Og: предметная о бласть или реальный мир) ➔
Д: интерпретация i-zo эксперта] ➔
(Mg;: модель мира эксперта) ➔
[V;: вербализация модели мира эксперта] ➔
(Тi & Ci: вербальные и невербальные сообщения i-zo экспертаj- м� аналитику) ➔
f½: их интерпретация j-ым аналитиком] ➔
(Mgj: модель мира j-zo аналитика) ➔
[К;: кодирование при формировании поля знаний с последующей структуризацией
в концептуальную модель].
Круглые скобки определяют понятия, квадратные - процессы.
3.3.2. Л ингв и ст и чески й аспект
Лингвистический (А2) аспект касается исследований языковых проблем, так I<ак
язык - это основное средство общения в процессе извлечения знаний.
Сразу же следует оговорить, что поскольку тема данной книги ограничена изло­
жением теории и технологии инженерии знаний, то область разработки есте­
ственно-языковых интерфейсов и весь спектр проблем, связанных с ней - лекси­
ческих , синтаксических, семантических, прагматических и т. д. [Виноград, 1 976;
Мальковский, 1985; Попов, 1 982) , - не рассматривается.
В инженерии знаний можно выделить три слоя лингвистических проблем
(рис. 3. 1 1 ):
А2 - {S2 1 , S22, S23} = {•общий код•, понятийная структура, словарь пользова­
теля}.
S21
сОбщий код•
!--- а -------­
�
S22
Понятийная
структура
S23
Словарь
пользователя
Ри с . 3. 1 1 . Лингвистический аспект извлече ния знаний
80
Глава 3 • Теорет ич еск и е асп екты и нженер и и знани й
ссОбщий КОД)> (52 1 )
«Общий КОД\> решает проблему языковых ножниц между профессиональной тер­
минологией эксперта и обыденной литературной речью инженера по знаниям и
включает следующие компоненты:
S2 1 = {s2 1_i} = {общенаучная терминология; специальные понятия из профессио­
нальной литературы; элементы бытового языка; неологизмы, сформированные
за время совместной работы; профессиональный жаргон и др.}.
Детализация схемы общения (см. рис. 3.8) на рис. 3. 1 1 позволяет представить
средства общения как два потока [Горелов, 1987], в которых нас интересуют ком­
поненты V1 и V2 - языки, на которых говорят аналитик и эI<сперт (V 1 ', V2' невербальные компоненты). Различие язы1<ов V 1 и V2 и обусловли(Jает «языко­
вый барьер;, или «языковые ножницы;, в общении инженера по знаниям и экс­
перта.
Эти два языка являются отражением «внутренней речи» эксперта и аналитш<а,
поскольку большинство психологов и лингвистов считают, что язык - это ос­
новное средство мышления наряду с другими знаковыми системами «внутрен­
него пользования;, (универсальный семантический код - УСК [ Мартынов, 1977],
языки «смысла;, [ Мельчук, 1 97 4 ] , концептуальные языки [ Шенк, 1980] и др.).
Язык аналитика V 1 состоит из трех компонентов:
• s2 1_1 - общенаучной терминологии из его «теоретичес1<0го багажа;, ;
• s2 1_2 - терминов предметной области, которые о н почерпнул из специальной
литературы в период подготовки;
• s2 1_3 - бытового разговорного языка, которым пользуется аналитик
Язык эксперта V2 включает:
• s2 1_1 - общенаучную терминологию;
• s2 1_2 - специальную терминологию, принятую в предметной области;
• s2 1_3 - бытовой язык;
• s2 1_4 - неологизмы, созданные экспертом за время работы, то есть его профессиональный жаргон.
Если считать, что бытовой и общенаучный языки у двух участников общения
примерно совпадают (хотя реально объем второго компонента у эксперта суще­
ственно больше), то некоторый общий язык или код, который необходимо выра­
ботать партнерам для успешного взаимодействия, будет складываться из пото­
ков, представленных на рис. 3. 12.
В дальнейшем этот общий код преобразуется в некоторую понятийную (семан­
тическую) сеть, которая является прообразом поля знаний предметной области.
Выработка общего кода начинается с выписыванием аналитиком всех терминов,
употребляемых экспертом, и уточнения их смысла. Фактически это составление
словаря предметной области. Затем следует группирование терминов и выбор
синонимов (слов, означающих одно и то же). Разраб отка общего кода заканчи-
81
3.3 . Те оретические аспекты извлечения зна ний
вается составлением словаря терминов предметной области с предварщ:ельной
группировкой их по смыслу, то есть по понятийной близости (это уже первый
шаг структурирования знаний).
На этом этапе аналитик должен с большим вниманием отнестись ко всем специ­
альным терминам, пытаясь максимально вникнуть в суть решаемых проблем и
терминологию. Освоение аналитиком языка предметной области - первый ру­
беж на подступах к созданию адекватной базы знаний.
s21_3
Бытовой
язык
s2 1_4
Специальная
терминология
эксперта
Эксперт
=)1
IJ
Общий
код
u
! (=
s21 2
Специал ьные
термины
из литературы
И нже нер
по знан иям
s21 1
Об щенаучные
термины
Рис. 3 . 1 2. Структура общего кода
Рисунок 3. 1 2 дает представление о процессе неоднозначности интерпретации
терминов двумя специалистами. В семиотике, науке о знаковых системах,
проблема интерпретации является одной из центральных. Интерпретация свя­
зывает •Знак» и •означаемый предмет». Только в интерпретации знак получает
смысл. Так, на рис. 3. 13 слова •прибор Х» для эксперта означает некоторую кон­
кретную схему, которая соответствует схеме оригинала прибора, а в голове начи­
нающего аналитика слова •прибор Х» вызывают пустой образ или некоторый
черный ящик с ручками.
Образ 1
Объект
Е]
О браз 2
ООО
оО оО оО
11
Эксперт ◄�1---------1 «Прибор Х» 1-------•
JIII Инженер
по знаниям
Знак
Р ис-. 3. 1 3. Неоднознач ность и нтерпретаци и
82
Глава 3 • Те о ретич еские аспе кт ы инженерии з нани й
Внимание к лингвистическому аGпекту проблемы извлечения знаний способству­
ет сближе)':!ИЮ образа 1 с образом 2 и интерпретации 1 1 с »нтерпретацией 12, а сло­
ва «прибор Х• перейдут в действительно «общий• код.
Таким образом, слой S21 включает изучение и управление процессом разработ­
ки специального промежуточного языка, необходимого для взаимодействия ин­
женера по знаниям и эксперта.
П о ня ти й ная стру ктура (S22)
Проблемы формирования понятийной структуры представляют следующий
слой S22 линrвистиче:;скоrо аспекта проблемы извлечения знаний. Особенности
формирования понятийной структуры обусловлены установленным постулатом
когнитивной психологии о взаимосвязи понятий в памяти челове1<а и наличии
семантической сети, объединяющей отдельные термины во фрагменты, фраг­
менты в сценарии и т. д. Построение иерархической ,сети понятий, так называе­
мой «пирамиды знаний• , - важнейшее звено в проектировании интеллектуаль­
ных систем.
Большинство специалистов по искусственному интеллекту и когнитивной пси­
хологии считают, что основная особенность естественного интеллекта и памяти
в частности - это связанность всех понятий в некоторую сеть. Поэтому для раз­
работки базы знаний и нужен не словарь, а «энциклопедия• [ Шенк, Бирнбаум,
Мей, 1 989] , в которой все термины объяснены в словарных статьях со ссылками
на друmе термины.
Таким образом, лингвистическая работа инженера по знаниям на данном слое
проблем заключается в построении таких связанных фрагментов с помощью
«сшивания• терминов. Фактически зта работа является подготовкой к этапу кон­
цептуализации, где это «шитье• (по Шенку - КОП, концептуальная организация
памяти [Шею<, Хантер, 1987]) приобретает некоторый законченный вид.
При тщательный работе аналитика и эксперта в понятийных структурах начина­
ет просматриваться иерархия понятий, подробно о которой будет говориться в
параграфах 4.4. и 8.2. Такие структуры имеют важнейшее rносеолоrическое и
дидактическое значение и последнее время для них используется специальный
термин - онтологии. Следует заметить, что эта иерархичес1<ая организация хо­
рошо согласуется с теорией универсального предметного кода (УПК) [Горелов,
1 987; Жинкин, 1 982), согласно которой при мышлении используются не языко­
вые конструкции, а их коды в форме некоторых аб стракций, что в общем согла­
суется с результатами когнитивной психологии [Величковский, 1 982].
Иерархия абстракций - э_то глобальная схема, которая может б ыть положена в
основу концептуального анализа структуры знаний любой предметной области.
Лингвистический эквивалент иерархии - иерархия понятий, которую необхо­
димо построить в понятийной структуре, формируемой инженером по знаниям
(рис. 3. 14).
Следует подчеркнуть, что работа по составлению словаря и понятийной структу­
ры требует. лингвистического «чутья•, легкости манипулирования терминами и
3.3 . Те орет ические ас пект ы извлечения з н а ни й
83
богатого словарного запаса инженера по знаниям, так как зачастую аналитик вы­
нужден самостоятельно разрабатывать словарь признаков. Чем богаче и вырази­
тельнее получается общий код, тем более полнее база знаний.
Обобщение
Ин вариа нты
п редм етов
Образная память
Следы ощущений,
восприятий. представлений
Рис. 3. 1 4. Пример иерархии
Аналитик вынужден все время помнить о трудности передачи образов и пред­
ставлений в вербальной форме. Полезными тут оказываются свойства многознач­
ности слов естественного языка. Часто инженеру по знаниям приходится под­
сказывать слова и выражения эксперту, и такие новые лексические конструкции
оказываюrся полезными.
Способность к словесной интерпретации зависит и от пола аналитика (параметр
s 1_1). Установлено, что традиционно женщины придают большую значимость
невербальным компонентам общения, а в вербальных имеют более обширный ал­
фавит признаков. И вообще, существуют половые различия восприятия не толь­
ко в бытовой сфере, что очевидно, но и в профессиональной. Следовательно, у
эксперта-мужчины и у эксперта-женщины могут существенно отличаться алфа­
виты для вербализации признаков воспринимаемых объектов.
Сло вар ь п ол ь зо вателя (S23)
Лингвистические результаты, соотнесенные к слоям общего кода и понятийной
структуры, направлены на создание адекватной базы знаний. Однако часто про­
фессиональный уровень конечного пользователя не позволяет ему применить
специальный язык предметной области в полном объеме.
Неожиданными для начинающих разработчиков являются проблемы формиро­
вания отдельного словаря для создания дружественного интерфейса с пользова­
телем ЭС, исследуемые в слое S23. Необходимы специальные приемы, увеличи­
вающие •прозрачность• и доступность системы. Для разработки пользователь­
ского интерфейса требуется дополнительная доработка словаря общего кода с по­
правкой на доступность и •прозрачность• системы.
84
Глава 3 • Те о ретические ас пекты и н женерии зна ни й
Так, при разработке экспертной системы по психодиагностике АВТ АНТЕСТ
[ Гаврилова, 1 984] пришлось разработать два словаря терминов - один для психо­
логов-профессионалов, второй - для неспециалистов (испытуемых). Поскольку
результат психодиагностического тес;rирования всегда интересен испытуемому,
ему выдается листинг с психологическим заключением на общелитературном
. языке без употребления специальных терминов. Интересно, что при внедрении
системы использовался в основном этот второй словарь; даже профессиональные
психологи предпочитали получать тексты на обыденном языке .
3 . 3 . 3 . Гносеологическ и й а спект и звлечен и я
знан и й
Гносеология - это раздел философии, связанный с теорией познания, или теорией
отражения действительности в сознании человека. Гносеологический аспе1ст (АЗ)
извлечения знаний объединяет методологические проблемы получения нового
научного знания, поскольку при создании БЗ эксперт часто впервые формулиру­
ет некоторые закономерности, до того момента составлявшие ero личный опыт.
Инженеr ия знаний как наука, если можно так выразиться, дважды гносеолоrич­
на - сна·�ала действительность (О) отражается в сознании эксперта ( М 1 ), а за­
тем деятельность и опыт эксперта интерпретируются сознанием инженера по
знаниям (М2), что служит уже основой для построения третьей интерпретации
(Р) - поля знаний экспертной системы (см. рис. 3.5). Процесс познания, в сущ­
ности, направлен на создание внутренней репрезентации окружающего мира в
сознании человека.
Предметом данного учебника являются в основном процессы отображения 12 и 13
(1 1 - изучают психология и философия); подробно интерпретация 13 будет рас­
смотрена далее.
Если описать процессы 12 и 13 в терминологии, введенной в главе 1 , то мы имеем
дело с превращением экспертного знания и теоретического (книжного) опыта Z 1
в поле знаний Z2, которое есть материализация модели мира М 2 инженера п о зна­
ниям.
В процессе извлечения знаний аналитика в основном интересует компонент Z 1 ,
связанный с неканоническими индивидуальными знаниями экспертов, посколь­
ку предметные области, требующие именно такого типа знаний, считаются наи­
более восприимчивыми к внедрению экспертных систем. Эти области обычно
называют эмпирическими, так как в них накоплен большой объем отдельных эм­
пирических фактов и наблюдений, в то время как их теоретическое обобщение вопрос будущего.
Если считать, что инженер по знаниям извлекает только фрагмент Z t\ то есть
часть из системы знаний эксперта Z 1 , то его задача, во-первых, стараться, чтобы
структура Z 1 ' соответствовала Z 1 , и, во-вторых, чтобы Z 1 ' как можно более пол­
но отражал Z 1 .
Познание часто сопровождается созданием новых понятий и теорий. Иногда экс­
перт порождает новые знания прямо в ходе беседы с аналитиком. Такая генера-
3.3. Те ор е тичес кие аспекты извлечен и я знан ий
85
ция знаний цолезна и самому эксперту, который до того момента мог не осозна­
вать ряд соотношений ff закономерностей предметной области. Аналитику может
помочь тут и инструментарий системной методологии, позволяющий использо­
вать известные принципы логики научных исследований, понятийной иерархии
науки. Эта методология заставляет его за частным всегда стремиться увидеть об­
щее, то есть строить цепочки.
Гносеологическая цепочка: факт � обобщенный факт � эмпирический закон � теоре­
тический зако н .
Не всегда
удается дойти до последнего звена этой цепочки, но уже само стремле•
u
ние к движению бывает чрезвычайно плодотворным. Такои подход полностью
согласуется со структурой самого знания, которое имеет два уровня:
1 . Эмпирический (наблюдения, явления).
2. Теоретический (законы, абстра1щии, обобщения).
Но теория - это не только стройная система обобщения научного знания, это та1<­
же некоторый способ производства новых знаний. Основными методологически­
ми критериями научности, позволяющими считать научным и само новое знание
и способ его получения, являются [Коршунов, Манталов, 1 988]:
АЗ = { S3 1 , S32, S33} = {внутренняя согласованность, системность, объективность,
историзм}.
В н ут р е н няя с о глас ова нн о ст ь (53 1 )
Основные характеристики эмпирического знания:
S3 1 = {s3 1_i} = {модальность, противоречивость, неполнота}.
На первый взгляд критерий внутренней согласованности знания не соответству­
ет реальным характеристикам, описывающим знания с точки зрения слоя s3 1_i.
Эти хара1перистики эмпирических знаний подчеркивают его «многоуклад­
ность• - столь часто факты не согласуются друг с другом, определения противо­
речат, �<ритерии диффузны и т. д. Аналитику, знающему особенности эмпиричес­
кого знания, - приходится сглаживать эти «шероховатости• эмпирюш.
Модальность (s31_1 ) знания означает возможность его существования в различ­
ных категориях, то есть в конструкциях существования и долженствования. Та­
ким образом, часть закономерностей возможна, другая обязательна и т. д. Кроме
того, приходится. различать такие оттенки модальности, как:
• эксперт знает, что... ;
• эксперт думает, что ... ;
• эксперт хочет, чтобы ... ;
• э1<сперт считает, что ... .
Возможная противоречивость (s3 1�2) эмпирического знания - естественное
следствие из основных законов диалектики, и противоречия эти не всегда долж-
86'
Глава 3 • Теор ети чески е асп екты и нженер ии знаний
ны р�рещат,ься в поле знаний, а напротив, именно противоречия служат чаще
всего отправной точкой в рассуждениях экспертов.
Неполнота (s3 1_3) знания связана с невозможностью полного описания предмет­
ной области. Задача аналитика эту неполноту ограничить определенными рам1<а­
ми •полноты• , то есть сузить границы предметной области либо ввести ряд ограничений и допущений, упрощающих проблему.
С исте мн ость (S32)
\
Системно-структурный подход к познанию (восходящий еще к Гегелю) ориен­
тирует аналитика на рассмотрение любой предметной области с пооиций зако­
номерностей системного целого и взаимодействия составляющих его частей.
Современный структурализм исходит из многоуровневой иерархической органи­
зации любого объекта, то есть все процессы и явления можно рассматривать ка1<
множество более мелких подмножеств (признаков, деталей) и, наоборот, любые
объекты можно ( и нужно) рассматривать как элементы более высокnх классов
обобщений. Например, системный · взгляд на проблематику структурирования
знаний позволяет увидеть его иерархическую организацию. Подробнее об этом
в параграфе 3. 4 .
Объект и в ност ь (S33)
Процесс познания глубоко субъективен, то есть он существенно зависит от осо­
бенностей самого познающего субъекта. • Факты существуют для одного глаза и
отсутствуют для другого• (Виппер). Таким образом, субъективность начинается
уже с описания фактов и увеличивается по мере углубления идеализации объек­
тов.
Следовательно, более корректно говорить о глубине понимания, чем об объек­
тивности знания. Понимание - это сотворчество, процесс истолкования объекта
с точки зрения субъекта. Это сложный и неоднозначный процесс, совершающий­
ся в глубинах человеческого сознания и требующий мобилизации всех интел­
лектуальных и эмоциональных способностей человека. Все свои усилия анали­
тик должен сосредоточить на понимании проблемы.
В психологии известен результат [Величковский, Капица, 1987), подтверждаю­
щий факт, что люди, быстро и успешно решающие интеллектуальные зада9:и,
большую часть времени тратят на понимание ее, в то время как плохие решатели
быстро приступают к поискам решения и чаще всего не могут его найти.
И сто р изм (S34)
Этот критерий связан с развитием. Познание настоящего - есть познание поро­
дившего его прошлого. И хотя большинство экспертных систем дают •горизон­
тальный• срез знаний - без учета времени (в статике), инженер по знаниям дол­
жен всегда рассматривать процессы с учетом временных изменений - как связь с
прошлым, так и связь с будущим. Например, структура цоля знаний и база зна­
ний должны допускать подстройку и коррекцию как в период разработки, так и
во время эксплуатации Э С.
3.3. Теорети ческие аспе кты и звлече ни я з н а ни й
87
Рассмотрев основные критерии научности познания, попытаемся теперь описать
его структуру. Методологическая структура познания может быть представлена
как некоторая последовательность этапов (Коршунов, Манталов, 1 988].
Параметры { SЗi} органически вписываются в эту структуру познания, которая
может быть представлена как последовательность этапов, описанных далее с позиций инженера по знаниям:
• Э_1 : описание и обобщение фактов;
• Э_2: установление логических и математических связей, дедукция и индукция
заI<ОНОВ;
• Э_З: постро�ние идеализированной модели;
• Э_4: объяснение �1 предсказание явлений.
Э_ 1 . О п иса н ие и о бо бще ни е ф акто в
· Тщательность и полнота ведения протоколов во время процесса извлечения и
пунктуальная <iдомашняя работа» над ними - вот залог продуктивного первого
этапа познания и материал для описания и обобщения фактов.
На практике оказывается трудным придерживаться принципов объективности и
системности, описанных выше. Чаще всего на этом этапе факты просто собирают
и как бы бросают в <,общий мешок» ; опытный инженер по знаниям часто сразу
пытается найти �полочку» или <iящичек» для каждого факта, тем самым подспуд­
но готовясь к этапу концептуализации .
3_2 . Уста но влен ие с в язе й и зако но мерно стей
В памяти эксперта все понятия увязаны и закономерности установлены, хотя ча­
сто и неявно задача инженера -,выявить каркас умозаключений эксперта. Рекон­
струируя рассуждения эксперта, инженер по знаниям может опираться на две
наиболее популярные теории мышления - логическую и ассоциативную. При
этом если логическая теория благодаря горячим поклонникам в ли це математи­
ков широко цитируется и всячески эксплуатируется в работах по искусственному
интеллекту, то вторая, ассоциативная, гораздо менее известна и популярна, хотя
имеет также древние корни. Так, Р. Фейнман в своих <,Лекциях по физике,> отме­
чает, что в физике по-прежнему преобладающим является вавилонский, а не гре­
ческий метод построения· знаний. · Известно, что древневосточные математики
умели делать сложные вычисления, но формулы их не были логически увязаны.
Напротив, греческая математика дедуктивна (например, <iНачала» Евклида).
Традиционная логика формирует критерии, которые гарантируют точность, ва­
лидность, непротиворечивость общих понятий рассуждений и выводов. Ее осно­
вы заложены еще в �Органоне,> Аристотеля в 4 в. до н. э. Большой вклад в разви­
тие логики внес Джон Стюарт Милль ( 1 806-1 873).
Инженер по знаниям и сам использует операции традиционной логики и выде­
ляет их в схеме рассуждений эксперта. Эт_о следующие операции:
• определение;
• сравнение и различение;
\
88
Глава 3 • Теорети чески е аспекты и нже н е р и и з н ан и й
• анализ;
• абстрагирование;
• обобщение;
• классификация;
• категоризация;
• образование суждений;
• умозаключение;
• составление силлогизмов и т. д.
Однако красота и стройность логической теории не должны заслонять того, что
человек редко мыслит в категориях математической логики [ Поспелов, 1989] .
Теория ассоциаций представляет мышление как цепочку идей, связанных общи­
ми понятиями. Основными операциями такого мышления являются:
• ассоциации, приобретенные на основе различных связей;
• припоминание прошлого опыта; пробы и ошибки со случайными успехами;
• привычные ( •автоматические•) реакции и пр.
Однако эти две теории не исчерпы'вают всего многообразия психологических
школ. Большой интерес для инженерии знаний может представлять гештальт­
психология. Одним из ее основателей является выдающийся немецкий психолог
М. Вертrеймер ( 1 880- 1943). Под rештальтом (нем. Gestalt) понимается прин­
цип целостности восприятия - как основа цышления. Гештальт-психологи ста­
раются во всем выделять некий целостный образ или структуру как базис для по­
нимания процессов и явлений окружающего мира. Эта теория близка теории
фреймов и объектному подходу и направлена на постижение глубинного знания,
которое характеризуется стабильностью и симметрией. При этом важен так на­
зываемый •центр ситуацию, , относительно которого развивается знание о пред­
метной области.
Для инженера по знаниям это означает, что, выявляя различные фрагменты зна­
ний, он не должен забывать о главном, о rештальте фрагмента, который влияет на
остальные компоненты и связывает их в некоторую структурную единицу. Геш­
тальтом может быть некий главный принцип, или идея, или гипотеза эксперта,
или его вера в силу каких-то отдельных концепций. Этот принцип редко форму­
лируется экспертом явно, он всегда как бы за •кадром•, и искусство инженера по
знаниям обнаружить этот основной гештальт эксперта.
В гештальт-теории существует закон •стремления к хорошему гештальту•, со­
гласно которому структуры сознания стремятся к гармонии, связности, простоте.
Это близко к старинному классическому принципу •бритвы Оккама• - •сущно­
сти не должны умножаться без необходимости• - и формулируется как принцип
прегнантности Вертгеймера [Вертrеймер, 1 987] : •Организация поля И!-fеет тен­
денцию быть настолько простой и ясной, насколько позволяют данные условия•.
Рассуждения о гештальте подводят вплотную к третьему этапу в структуре позна­
ния.
3 . 3. Теоретич еские аспекты из влечения з н аний
89
Э_З . П острое н и е идеализи рова н н о й м одели
Для построения модели, отражающей представление субъекта о предметной об­
ласти, необходим специализированный язык, с помощью которого можно опи­
сывать и конструировать те идеализированные модели мира, которые возникают
в процессе мышления. Язык этот создается постепеАно с помощью катеrориаль­
ноrо аппарата, принятого в соответствующей предметной области, а также фор­
мально-знаковых средств математики и логики. Для эмпирических предметных
областей такой язык пока не разработан, и поле знаний, которое полуформализо­
ванным способом опишет аналитик, может быть первым шаrом к созданию тако­
го языка.
Любое познавательное отражение включа�т в себя условность, то есть упрощение
и идеализацию. Инженеру по знаниям необходимо овладение такими специфи­
ческими rносеолоrическими приемами, как идеализация, огрубление, абстраrи•
.рование, которые позволяют адекватно отображать в модели реальную картину
мира. Эти приемы доводят свойства и признаки объt!ктов до пределов, позволяю�
щих воспроизводить законы действительности в более лаконичном виде (без вли­
яния несущественных деталей).
На тернистом пути познания проверенный диалектический подход оказывается
лучшим •поводырем• . Инженер по знаниям, который стремится познать про­
блемную область, должен быть готов постоянно изменять свои уже утвердившие�
ся � пособы восприятия и оценки мира и даже отказываться от них. При этом тща­
тельнее всего следует проверять правильность суждений, которые кажутся самыми
очевидными.
Э_4. Объ я сн е н ие и п редсказа н ие моделей
Этот завершающий этап в ·структуре познания является одновременно и частич­
ным критерием истинности полученного знания. Если выявленная система зна·
ний эксперта полна и объективна, то на ее основании можно делать прогнозы и
объяснять любые явления из данной предметной области. Обычно базы знаний
ЭС страдают фрагментарностью и модульностью (несвязанностью) компонен­
тов. Все это не позволяет создавать действительно интеллектуальные системы,
которые, равняясь на человека, могли бы предсказывать новые закономерности n
· объяснять случаи, не указанные в явном виде в базе. Исключением тут являются
обучающие системы, которые ориентированы на генерацию новых знаний и
•предсказание•.
Предлагаемая методология вооружает аналитика аппаратом, позволяющим избе­
жать традиционных ошибок, приводящих к неполноте, противоречивости, фраг­
ментарности БЗ, и указывает направление, в котором необходимо двигаться раз­
работчикам. И хотя на сегодняшний день большинство БЗ прорабатываются
лишь до этапа Э_3, знание полной схемы обогащает и углубляет процесс проекти­
рования.
90
Глава 3 • Теорети ч ески е аспекты и нженер и и з наний
3 . 4 . Те о рет ические ас пекты
структур и р ова н и я знан ий
Разделение стадий извлечения и структурирования знаний является весьма ус­
ловным, поскольку хороший инженер по знаниям, уже извлекая знания, начинает
работу по структурированию и формированию поля знаний, описанному в пара­
графе 3. 1 .
Однако в настоящее время прослеживается тенденция опережения технологи­
ческих средств разработки интеллектуальных систем по отношению к их теоре­
тическому обоснованию. Практически сейчас существует пропасть между блес­
тящими, но несколько •постаревшими• математическими основами киберне­
тики (труды Винера, Эшби, Шеннона, Джорджа, Клира, Йордона, Ляпунова,
Глушкова и др.) и современным поколением интеллектуальных систем, которые
основаны на парадигме обработки знаний (экспертные системы, ·лингвистичес­
кие процессоры, обучающие системы и т. п.).
С одной стороны, это объясняется тем, что с первых шагов наука об искусствен­
ном интеллекте ( ИИ) была направлена на моделирование слабоформализуе­
мых смысловых задач, в которых не применим традиционный математический
аппарат; с другой стороны, ИИ - это ветвь информатики и активно развивается
как промышленная индустрия программных средств в условиях жесткой конку­
ренции, где подчас важнее быстрое внедрение новых идей и подходов, чем их
анализ и теоретическая проработка.
Необходимость разработки теоретических основ науки о методах разработки си­
стем, основанных на знаниях - инженерии знаний, - обосновывается в работах
Поспелова Д. А., Попова Э. В., Стефанюка В. Л., Шенка Р., Минского М. - веду­
щих специалистов в области ИИ в России и зарубежом. Первые шаги в создании
методологии (работы Осипова Г. С., Хорошевскоrо В. Ф., Яшина А. М., Wielinga,
Slagle, etc.) фактически являются пионерскими и чаще всего ориентированы на
определенный класс задач, моделируемых в рамках конкретного программного
инструментария.
В данном параграфе рассмотрена новая методология [Гаврилова, 1995 ] , позволя­
ющая провести стадию структурирования независимо от последующей прщрамм­
ной реализации, опираясь на достижения в области разработки сложных систем.
3 . 4 . 1 . Историческая справка
Стадия концептуального анализа или структурирования знаний традиционно
является (наряду со стадией извлечения) сузким местом• в жизненном цикле
разработки интеллектуальных систем [Adeli, 1 994). Методология структурирова­
ния близка к современной теории больших систем [Гиr, 198 1] или сложных сис­
тем [Courtois, 1985; Peters, 1981 ) , где традиционно акцент делается на процессе
проектирования таких систем. Большой вклад в эту теорию внесли классики
объектно-ориентированного анализа [Буч, 1 992].
3.4. Теоретиче ские аспекты ст рукту рирования зна ний
91
Разработку интеллектуальных систем с уверенностью можно отнести к.данному
классу задач, поскольку они обладают основными признаками сложности (иерар­
хия понятий, внутриэлементные и межэлементные связи и пр.). Сложность про­
еr<тирования ИС определяется в основном сложностью предметных областей и
управления процессом разработки, а также сложностью обеспечения гибкости
конечного программного продукта и описания поведения отдельных подсистем.
Среди первых сторонников исследований по теории систем наиболее заметными
были Берталанфи [Bertalanffy, 1950], Раппопорт и Боулдинг [Boulding, 1 956] .
Аналогичные концепции, но связанные не с общесистемными исследованиями, а
рассматривающие информационные процессы в системах, таrшх как связь и уп­
равление, положили начало кибернетике как самостоятельной науке [ Винер,
1 958; Эшби, 1 959] . Этот подход был существенно поддержан работами Шеннона
по математическому моделированию понятия информации [Шеннон, Уивер,
1963; Feinstein, 1958; Watanabe, 1969].
Позднее, в 1960-х гг. было сделано несколько попыток сформулировать и развить
математические теории систем высокого уровня общности [Mesarovic, 1964; Ар­
биб, 1975]. Существенный вклад в математичесr<ую теорию систем и основы
структурирования внесли отечественные исследователи Моисеев Н. Я. [Моисе­
ев, 198 1 ], Глушков В. М. [Глушков, 1 964], Ивахненко А. Г. [Ивахнешщ 1 97 1 ] , По­
спелов Д. А. [ Поспелов, 1986] и другие. Системный анализ тесно переплетается с
теорией систем и включает совокупность методов, ориентированных на исследо­
вание и моделирование сложных систем - технических, экономических, экологи­
ческих и т. п.
3 .4.2. Ие рар хический п одход
Проектирование сложных систем и методы структурирования информации тра­
диционно использовали иерархический подход [ Месарович, Такахара, 1972] как
методологический прием расчленения формально описанной системы на уровни
(или блоки, или модули). На высших уровнях иерархии ·используются наименее
детализованные представления, отражающие только самые общие черты и осо­
бенности проектируемой системы. На следующих уровнях степень подробности
возрастает, при этом система рассматривается не в целом, а отдельными бло­
ками.
В теории САПР такой подход называется блочно-иерархическим (БИП) [Норен­
!(ОВ, 1983; Петров, 199 1 ]. Одно из преимуществ БИП состоит в том, что сложная
задача большой размерности разбивается на после,цовательно решаемые группы
задач малой размерности.
На каждом уровне вводятся свои представления о системе и элементах. Элемент
к-го уровня является системой для уровня к- 1 . Продвижение от уровня к уров­
ню имеет строгую направленность, определяемую стратегией проектирования сверху вниз или снизу вверх.
Глава з.
92
•
Те о рети ческие аспекты инже н е р ии зна н ий
Предлагаемый.ниже объектно-структурный подход позволяет объединить две,
обычно . противопоставляемые, стратегии проектирования - нисходящую или
дедуктивную STRtd (top-down) с последовательной декомпозицией объектов и
процессов сверху вниз и восходящую или индуктивную STRbu (bottom-up) с по­
степенным обобщением понятий и увеличением степени абстрактности описа­
ний снизу вверх.
Синтез этих стратегий, а также включение возможности итеративных возвратов
на предыдущие уровни обобщений позволили создать дуальную концепцию, пре­
доставляющую аналитику широкую палитру возможностей на стадии стру1,тури­
рования знаний как для формирования концептуальной структуры предметной
области Sk , так и для функциональной структуры S rРисунок 3. 1 5. иллюстрирует дуальную концепцию при проектировании S k для ЭС
помощи оператору энергетического блока,
U1
процесс
Запуск
rенератора
р
23_1 1
U2
части
процесса
uз
режим
работы u::
U4
фун к­
циональ­
ные
состав­
ляющие :s:
us
блоки
U6
действия
оператора
Рис. з. 1 5 . Дуальная стратеги я п роектирован и я
и о а ия з нан и й
3. 4. Те оре ти ч еские аспекты структур р в н
93
Нисходящая концепция (top-down) декларирует движение от n ⇒ n+ l , где n - n-й
уровень иерархии понятий ПО (предметной области) с последующей дет�иза­
цией понятий, принадлежащим соответствующим уровням.
1
п+ 1
STR td : рjп ⇒ pn+
1
, •• , рki
}
где n � номер уровня порождающего концепта;
i - номер порождающего концепта;
k; - число порождаемых концептов, сумма всех k, по i составляет общее число
концептов на уровне n+ 1 .
Восходящая концепция (bottoш-up) предписывает движение n ⇒ n-1 с последова­
тельным обобщением понятий.
STRbu .• Р"t , •• , Р,пki ⇒ рiп-1 ,
где n - номер уровня порождающих концептов;
i - номер порождаемого концепта;
k; -- число порождающих концептов, сумма всех k, по i составляет общее число
концептов на уровне n.
Основанием для прекращения агрегирования и дезагре гирования является пол­
ное использование словаря терминов, которым пользуется эксперт, при этом чис­
ло уро в ней является значимым фактором успешности структурирования ( см.
«вербальные отчеты�, в главе 4).
3 . 4 . З . Тр адици о нн ы е м етодологии
стр уктури ров а н и я
Существующие подходы к проектированию сложных систем можно разделить на
два больших класса:
• Структурный (системный) подход или анализ, основанный на идее алгорит­
мической декомпозиции, где каждый модуль системы выполняет один из важ­
нейших этапов общего процесса.
• Обьектный подход, связанный с декомпозицией и выделением не процессов, а
объектов, при этом каждый объект расс�атривается как экземпляр определен­
ного класса.
В структурном анализе [Yourdon, 1989; DeMarco, 1 979; Gane & Sarson, 1979] раз­
работано большое число выразительных средств для проектирования, в том чис­
ле графических [Буч, 1 993]: диаграммы потоков данных ( DFD ...:.... data-flow diag­
rams), структурированные словари (тезаурусы), языки спецификации систем, ·
таблицы решений, стрелочные диаграммы « объект-связь�, ( E RD - entity-rela­
tionship diagraшs), диаграммы переходов (состояний) , деревья целей, блок-схе­
мы алгоритмов (в нотации Насси-Шнейдермана, Гамильтона-Зельдина, Фест­
ля и др.), средства управления проектом ( РЕRТ-диаграммьr, J,J.Иаграммы Ганта и
др.), модели окружения.
94
Глава 3 • Тео ретические аспекты инжене ри и з нани й
Множественность средств и их некоторая избыточность объясняются тем, что
каждая . предметная область, используя структурный подход как универсальное
средство моделирования, вводила свою терминологию, наиболее подходящую
для отражения специфики �fонкретной проблемы. Поскольку инженерия знаний
имеет дело с широким классом ПО (это «мягкие• ПО), встает задача разработки
достаточно универсального языка структурирования.
Объектный (объектно-ориентированный) подход (ООП), возникший как техно­
логия программирования больших программных продуктов, основан на следую­
щих основных элементарных понятиях [ Буч, 1992): объекты, классы как объекты,
связанные общностью структуры и свойств, и классификации как средства упо­
рядочения знаний; иерархии с наследованием свойств; инкапсуляции как сред­
ства ограничения доступа; методы и полиморфизм для определения функций и
отношений.
ООП имеет свою систему условных обозначений и предлагает богатый набор
логически х и физических моделей для проектирования систем высокой степени
сложности, при этом эти системы хорошо структурированы, что порождает лег­
кость их модификации. Впервые принцип ООП установлен в 1 979 Uones, 1979),
а затем развит в работах [Shaw, 1984; Peterson, 1987; Буч, 1992].
Широкое распространение объектно-ориентированных языков программирова­
ния С++, CLOS, Smalltalk и др. успешно демонстрирует жизнеспособность и
перспективность этого подхода.
3 . 4 . 4 . О бъектн о -стру ктурн ы й п одход ' (О СП}
Можно предложить в качестве базисной парадигмы методологии структурного
анализа знаний и формирования поля знаний Р, обобщенный обьектно-струк­
турный подход ( ОСП), последовательно разработанный от математического обо­
снования до технологии и программной реализации [Гаврилова, 1 995).
Основные постулаты этой парадигмы заимствованы из ООП и расширены.
1. Системность (взаимосвязь между понятиями).
2. Абстрагирование (выявление существенных характеристик понятия, кото­
рые отличают его от других).
3. Иерархия (ранжирование на упорядоченные системы абстракций).
4 . Типизация (выделение классов понятий с частичным наследованием
св9йств в подклассах).
5. Модульность (разбиение задачи на подзадачи или «возможнь1е миры•).
6. Наглядность и простота нотации.
Использование пятого постулата ОСП в инженерии знаний позволяет строить
глобальные БЗ с возможностью выделить локальные задачи с помощью горизон­
тальных и вертикальных сечений на отдельные модули пространства-описания
предметной области.
3. 4. Те оретическ ие ас п екты структурирования знани й
95
Шестой постулат внесен в список последним, но не по значимости. В инженерии
знаний формирование Р. традиционно является критической точ1<0й [Гаврилова,
Червинская, Яшин, 1 988; Гаврилова, Червинская, 1 992), так каI< создаваемая не­
формальная модель предметной области должна быть предельно ясной и лако­
ничной. Традиционно языком инженерии знаний были диаграммы, таблицы и
другие графические элементы, способствующие наглядности представлений.
Именно поэтому премагаемый в данной работе подход к языку связан с возмож­
ной 'lшзуализацией процесса проектирования.
ОСП позволяет наглядно и компактно отобразить объекты и отношения предмет­
ной области на основе использования шести постулатов.
Объектно-структурный подход подразумевает интегрированное использование
сформулированных выше постулатов от первой до последней стадий разработки
БЗ интеллектуальных и обучающих систем. На основе ОСП предлагается алго­
ритм обьектно-структурного анализа ( ОСА) предметной области, позволяюще­
го оптимизировать ,и упорядочить достаточно размытые процедуры стру1<тури­
рования знаний.
Стратифика ц ия зн а ний
Основы ОСА были предложены автором еще в работах [Гаврилова, 1 989; Гаври­
лова, Красовская, 1 990] и успешно применялись при разработке ЭС МИКРО­
ЛЮШЕР [Гаврилова, Тишкин, Золотарев, 1 989) и АВЭКС [Гаврилрва, Минко­
ва, Карапетян, 1992).
ОСА подразумевает дезагрегацию ПО, как прав ило , на восемь страт ил и сло­
ев (табл. 3.1 и 3.2).
Таб n и ца 3. 1 . Ст ратиф и кация зна ни й п редметной области
s_1
s_2
s_З
s_4
s_5
ЗАЧЕ М-зна ни я
Стратегнческнi,f а нализ: назначен и е и фун кции с и сте мы
Ч Т О-зна н и я
Концептуальный анализ: основны е концепты , понятийна я
структура
ГДЕ-з нания
Пространственныi,f а нал и з: окружен и е, обо рудов а н и е,
коммуникации
ПОЧЕМУ-знани я
Каузальный ил и при ч ин но-следстве нный ана11t11э: фо р м и рован и е
подс и стемы о бъяснен и й
КТО-знан и я
КАК-з нания
s_6
s_7
КОГДА-знан и я
s_8
СКОЛ ЬКО-знан и я
Орrаннэацнонныi,f анал и з: коллектив раз работчи ков системы
Функцнональныi,f ан ал из: ги потезы и модели п ри нят и я реше н и я
Временной а нализ: в ре м енные па рам етр ы и о гран и чен и я
Экономнческнi,f а нал и з: ре сур сы , затраты , п риб ыль, окупаемост ь
Объектно-структурный анализ подразумева�т разработку и использование мат­
рицы ОСА (см. табл. 3.2), которая позволяет всю собранную информацию деза­
грегировать последовательно по слоям-стратам (вертикальный анализ), а затем
Глава 3 • Те оретичес кие ас п екты инженерии з наний
по уровням - от уровня проблемы до уровня подзадачи ( горизонтальный ана­
лиз). Или наоборот - сначала по уровням, а потом по стратам.
Табn и ца 3 . 2 . Матрица объектно -структурно г о анализа
Уровни
Страты
Уровень
области u1
Организационны й
анализ s2
Е 21
Стратеrический
анал из s 1
l:1 1
Концептуал ь ный
анализ Sэ
Еэ 1
Пространственны й
анал из ss
Es 1
Функциональн ы й
анал из 54
Временн ой
а н ал из se
Каузал ь ный
ан ал из s 1
Эконом ически й
анализ Se
....
Sm
Уровен ь
Уровень
проблемы u2 задачи u,
l: 12
l: 1 3
Уровень
подзадачи 14
Е 14
.
...
Un
E 1n
l:41
Е в1
Е11
Е в1
Eu
E m1
E rm
При необходимости число страт может быть увеличено. В свою очередь знания
каждой страты подвергаются дальнейшему ОСА и декомпозируются на ..состав­
ляющие
где m - номер уровня, n - номер страты, а
концептов (понятий) предметной области.
Е тп
=
етп
принадлежит множеству К всех
е1 "
( 1)
Матрица ( 1 ) является матрицей над К . Пусть М (К) - совокупность всех mxn
матриц над К. Тогда можно определить клеточную матрицу Е, в которой
m - m 1 + ... + mk,
n == n 1 + ... + nl,
где m и n - целые положительные числа. Е е M m n ( К), и ее можно представить в
виде:
3. 4 . Теоретические ас п е кт ы с труктури рования зн а ний
Е=
97
(2)
Ek l
где Eµv Е М, µ (К), µ = 1 , ... ,k; v = 1 , ... ,1.
Матрица Е является несимметричной, так как часть клеточных элементов Eµv мо­
гут подвергаться декомпозиции, а часть представляет некоторые базисные ато­
марные концепты из К, не подлежащие детализации.
Предлагаемый подход предполагает реализацию концепции последовательного
генезиса ОСП через ОСА к объектно-структурной разработке (ОСР).
11
Алгорит м ОСА
Алгоритм ОСА ( объектно-структурного анализа) предназначен для детального
практического структурирования знаний ПО. В основе ОСА заложен алгоритм
заполнения ОСА- матрицы Е , Алгоритм содержит последовательность аналити ­
ческих процедур, позволяющих упростить и оптимизировать процесс структури­
рования. Алгоритм разделяется на две сост,авляющие:
• A_I. Глобаль н ый (вертикальный) анализ, включающий разбиение ПО на мето­
дологические страты (что-знания, как-знания и т. д.) на уровне всей ПО. В ре­
зультате заполняется первый столбец матрицы (2).
• А_П. Анализ страт (горизонтальный), включающий построение многоуров­
невых структур по отдельным стратам. Число уровней n определяется особен­
ностями стратифицированных знаний ПО и может существенно отличаться
для разных страт. С точки зрения методологии n<З свидетельствует о слабой
проработке ПО.
Первый уровень соответствует уровню всей ПО (уровень области). Второй уровню проблемы, выделенной для решения. Третий - уровню конкретной ре­
шаемой задачи. Дальнейшие уровни соответствуют подзадачам, если имеет
смысл их выделять.
При этом возможно как последовательное применение восходящей (bottoш-up)
и нисходящей концепций (top-down), так и их одновременное применение.
1111•
Глобальный анализ
Технология глобального анализа сводится к разбиению пространства основной
задачи структурирования ПО на подзадачи, соответствующие особенностям
ПО. Для разрабопш интеллекту<l.!Iь�ых систем существует минимальный набор
s-страт, обеспечивающий формирование БЗ. Минимальный набор включает три
стратьr:
• s3 - формирование концептуальной структуры S k ;
• s4 - формирование функциональной структуры Sr;
• s 7 - формирование подсистемы объяснений S0
•
98
Глава 3 • Тео рети че ски е аспекты инже нерии зна ний
Формирование остальных страт позволяет существенно оптимизировать процесс
разработки и избежать многих традиционных ошибок проектирования. Страты s4
и s5 являются дополнительными и формируются в случаях, когда знания предмет­
ной области существенно зависят от временных и пространственных параметров
(системы реального времени, планирование действий роботов и т. п.).
Алгоритм А_1 глобального анализа может быть кратко сформулирован следую­
щим образом:
• А_1_1. Собрать все материалы по идентификации задачи и по результатам из­
влечения знаний.
• . А"_1_2. Выбрать набор страт N, подлежащих формированию (Nmin = З).
• А_1_3. Отобрать всю информацию по первой выбранной страте (i-1 , где i номер из выбранного набора страт N).
• · А_1_4. Повторить шаг А_1_) для i+ 1 для всех выбранных страт до i <= N.
• А_1_5. Если часть информации останется неиспользованной, увеличиtь чис­
ло страт и повторить для новых страт шаг А_1_3; иначе перейти к последова­
тельной реализации алгоритмов горизонтального анализа страт А_2.
Анализ страт
Последовательность шагов горизонтального анализа зависит от номера страты,
но фактически сводится к реализации дуальной концепции структурирования
для решения конкретной подзадачи.
Ниже предлагается алгоритм ОСА для одной из обязательных страт s3 (ЧТО-ана­
лиз), результатом которого является формирование концептуальной структуры
предметной области S k .
• А_2_3_1 . Из группы информации, соответствующей ЧТО-страте, выбрать все
значимые понятия и сформулировать соответствующие концепты.
• А_2_3_2. Выявить имеющиеся иерархии и зафиксировать их rрафичес1<и в
виде стру1пуры.
• А_2_3_3. Детализировать концепты, пользуясь нисходящей концепцией (topdown).
• А_2_3_4. Образовать метапонятия по концепции (bottom-up).
• А_2_3_5. Исключить повторы, избыточность и синонимию.
• А_2_3_6. Обсудить понятия, не вошедшие в структуру S 1, с экспертом 1, пере­
нести их в другие страты или исключить.
• А_2_3_7. Полученный граф или набор графов разделить на уровни и обозна­
чить - согласно матрице ОСА ( 1 ).
Аналогичные алгоритмы разработаны для всех страт и апробированы при разра­
боТI<е экспертных систем ПРОГОР и АВЭКС.
Технологии
инженерии
знаний
о Классифика ция методов пра ктического извлечения знаний
о Коммуникативные методы
о Текстол огические м етоды
о Просте йшие методы структури рования
о Состо я ние и пе рспект ивы автом атизированного приобрете ни я зн аний
о П римеры методов и систем приобретения зн а ний
4 . 1 . Кла сс и ф ик а ц и я м етодов п р а кт и че с кого
и звл е ч е н и я з н ан ий
Подробно рассмотрев в главе 3 теоретические аспекты инженерии знаний, мы,
однако, в явном виде не определили, каким практическим методом эти знания
будут получены. В неявном виде предполагалось, что это некоторое взаимодей­
ствие инженера по знаниям и эксперта в форме непосредственного живого обще­
ния. Однако это не 'е динственная форма извлечения знаний, хотя и довольно рас ..:
пространенная. В работах [ Волков, Ломнев, 1 989; Осипов, 1998; Boose, 1 989;
Cullen, Bryman, 1 988; Gammack, Young, 1 985; Hart 1 986) упоминается около 1 5
ручных (неавтоматизированных) методов извлечения и более 2 0 автоматизиро­
ванных методов приобретения и формирования знаний.
Рисунок 4. 1 иллюстрирует предлагаемую классификацию методов извлечения
знаний, в которой используются наиболее употребительные термины, что позво­
лит инженерам по знаниям в зависимости от конкретной задачи и ситуации выб­
рать подходящий метод.
Из предложенной схемы классификации видно, что основной принцип деления
связан с источником знаний.
Глава 4 • Техноло гии инженери и зн а ний
1 00
Извлечение знаний
Коммуникетивные
методы
Текстологические
методы
Активные
Пассивные
Н аблюдение
Протокол
«мыслей вслух»
Лекции
Групповые
«Мозговой
штурм»
Кругл ый стол
Ролевые игры
Индивидуальные
Анкетировани<'!
Интервью
Анализ
учебников
Анелиз
литературы
Анализ
документов
Диалог
Экспертные игры
Рис. 4. 1 . Классификвция методов извлечения знаний
Коммуникативные методы извлечения знаний охватывают метод1>1 и про цедуры контак­
тов и нженера по знаниям с непосредствен ным источником знаний - эксп е ртом , а тек­
стологические включают методы извлечен и я знаний и з документов (методик, пособий ,
руководств) и специал ьной литер атуры (стетей , монографий, учебников) .
Раздел е н ие эти х групп методов на в ерхнем уровне класси ф икац ии н е означ ает их
антагонистичности, обычно и нже нер по знан ия м ко мб и нирует разл ичны е мето­
ды, напри мер с начала изучает литературу, затем беседует с экспертам и , ил и на ­
оборот.
В с вою оче р едь, ко ммуникати вные методы м ожно такж е разде лить на дв е груп­
пы: активные и пасс и вные . Пассивн ые м етоды подразуме в ают , что в еду щая р оль
в про цедур е извл ече н ия как бы пе редается эк сперту, а и н же не р по зн а н ия м толь ­
ко протокол и рует р ассужде н и я эк сперта во вр емя его р е ал ьной работы по п р иня ­
тию ре ш е ний или зап и сыв ает то, ч т о э к спе рт сч итает нужн ым самост оя тельно
р асс казать в фо рме л ек ции . В активных методах, напротив , и н и ц иатива п ол нос­
тью в рук ах и нже не ра по з нан ия м, котор ый активно контакт ирует с экспертом
р азли ч ным и спо собам и - в игр ах , диал огах, беседах з а кру глы м с толом и т . д.
Следует е ще р аз подче ркнуть, что и акти в ные и пасси вн ы е методы могут ч ередо ­
в аться даже в р амках одно го сеанса извл еч е ния знан ий. Н ап ри мер , если и нже не р
по зн ания м засте нчив и не имеет большо го опы та, то вначал е он может и спол ьзо ­
в ать пасс и вные метод ы , а по степе нно, ближе зн акомя сь с экспертом , зах в атыв ать
ин и циати ву и пер еходить «в н ас тупл е н и е ».
4 . 1 . Кл ассифика ция методов п ра ктиче ско го и з вле ч ения зн аний
101
Пассивные методы на первый взгляд достаточно просты, но н а самом деле требу­
ют от инженера по знаниям умения четко анализировать поток сознания эксперта
и выявлять в нем значимые фрагменты знаний. Отсутствие обратной связи (пас­
сивность инженера по знаниям) значительно ослабляет эффективность этих ме­
тодов, чем и объясняется их обычно вспомогательная роль при активных методах.
Активные методы можно разделить на две группы в зависимости от числа экс­
пертов, отдающих свои знания. Если их число больше одного, то целесообразно
помимо серии индивидуальных контактов с каждым применять и методы груп­
повых обсуждений предметной области. Такие групповые методы обычно акти­
визируют мышление участников дискуссий и позволяют выявлять весьма не­
тривиальные аспекты их знаний. В свою очередь, индивидуальные методы на
сегодняшний день остаются ведущими, поскольку столь деликатная процедура,
как «отъем знаний�,,, не терпит лишних свидетелей.
Отдельно следует сказать об играх. Игровые методы сейчас широко используются
в социологии, экономике, менеджменте, педагогике для подготовки руководите­
лей, учителей, врачей и других специалистов. Игра - это особая форма деятель­
ности и творчества, где человек раскрепощается и чувствует себя намного свобод­
нее, чем в обычной трудовой деятельности.
На выбор метода влияют три фактора: личностные особенности инженера по зна­
ниям, личностные особенности эксперта и характеристика предметной области.
Одна из возможных классификаций людей по психологическим характеристи­
кам [Обозов, 1 986] делит всех на три типа:
• мыслитель (познавательный тип);
• собеседник ( эмоционально-коммуникативный тип);
• практик (практический тип).
Мыслители ориентированы на и нтеллектуальную работу, учебу, теоретические
обобщения и обладают такими характеристиками когнитивного стиля, как поле­
независимость и рефлексивность (см. параграф 3.3). Собеседники - это общи­
тельные, открытые люди, готовые к сотрудничеству. Практики предпочитают
действие разговорам, хорошо реализуют замыслы других, направлены на ре­
зультативность работы.
Для характеристики предметных областей можно предложить следующую клас­
сификацию:
• хорошо документированные;
• средне документированные;
• слабо документированные.
Эта классификация связана с соотношением двух видов знаний Z 1 и Z2, введен­
ных в п. 1 .3, где Z 1 - это экспертное «личное�,, знание, а Z 2 - материализованное в
книгах «общее�,, знание в данной конкретной области. Если представить знания
z no предметной области как объединение I и 2• то есть z no = Z 1 E Z 2 , то рис. 4.2 на­
глядно иллюстрирует предложенную классификацию.
z z
Гл ава 4 • Технологии инженерии з н а н и й
1 02
Предметные
области
Хорошо
документированные
Средне
документированные
Слабо
документи рованные
Рис. 4.2. Классификация предметных облестей
Кроме этого, предметные области можно разделить по критерию структуриро­
ванности знаний. Под структурированностью будем понимать степень теорети­
ческого осмысления и выявленности основных закономерностей и принципов,
действующих в данной предметной области. И хотя ЭС традиционно применя­
ются в слабо структурированных предметных областях, сейчас наблюдается тен­
денция расширения сферы внедрения экспертных систем.
По степени структурированности знаний предметные области могут быть:
• хорошо структурированными - с четкой аксиоматизацией, широким приме­
нением математического аппарата, устоявшейся терминологией;
• средне структурированными - с определившейся терминологией, развиваю­
щейся теорией, явными взаимосвязями между явлениями;
• слабо структурированн�u - с размытыми опре]!:елениями, богатой эмпирикой, скрытыми взаимосвязями, с большим количеством «белых пятен�>.
Введенные в данном параграфе классификации методов и предметных областей
помогут инженеру по знаниям, четко о пределив свою предметную область, соот­
нести ее с предложенными типами и наметить подходящий метод или группу ме­
тодов извлечения знаний. Однако, скорее всего, реальная работа полностью
зачеркнет его выбор, и окажется, что его хорошо документированная область яв­
ляется слабо документированной, а метод наблюдений надо срочно заменят.!;, иг­
рами !
Такова реальная сложность процедуры извлечения знаний.
4 . 2 . Коммуникативные методы
В соответствии с классификацией, представленной на рис. 4. 1 , рассмотрим под­
робнее обе разновидности коммуникативных методов: пассивные и активные.
4 . 2 . 1 . Пассивные методы
Термин «пассивные» не должен вызывать иллюзий, поскольку он введен как про­
тивовес к «активным» методам. В реальности же пассивные методы требуют от
инженера по знаниям не меньшей отдачи, чем такие активные методы, как игры и
диалог.
4. 2. Ко м мун икатив ны е м етоды
1 03
пассивные методы извлечения знаний,вкnючают rакие методы, где в едущая роль в про­
цедуре извлечения фактически передается эксперту, а инженер по знаниям только фик­
сирует рассуждения эксперта во время работы по принятию решений.
Согласно �лассификации (см. рис. 4. 1) к этой группе отtюсятся :
• наблюдения;
• анализ протоколов •мыслей вслух•;
• лекции.
Наблюдения
В процессе наблюдений инженер _по знаниям находится непосредственно рядом с
экспертом во время его профессиональной деятельности или имитации этой дея­
тельности. При подготовке к сеансу извлечения эксперту необходимо объяснить
цель наблюдений и попросить максимально комментировать свои действия.
Во время сеанса аналитик записывает все действия эксперта, его реплики и
объяснения. Может быть сделана и видеозапись в реальном масштабе времени.
Непременное условие этого метода - невмешательство аналитика в работу экс·
перта хотя бы на первых порах. Именно метод наблюдений является единствен­
но счистым• методом, ИС}<Лючающим вмешательство инженера по знаниям и на­
вязывание им каких-то своих структур представлений.
Существуют две основные разновидности проведения наблюдений:
• наблюдение за реальным процессом;
• наблюдение за имитацией процесса.
Обычно используются обе разновидности. Сначала и нженеру по знаниям по­
лезно наблюдать за реальным процессом, чтобы глубже понять предметную об­
ласть и отметить все внешние особенности процесса принятия решения. Это не,­
обходимо для проектирования эффе�тивноrо интерфейса пользователя. Ведь
будущая ЭС должна работать именно в контексте такого· реального производ­
ственного процесса. Кроме того, только наблюдение позволит аналитику уви­
деть предметную область, а, как известно, случше один раз увидеть, чем сто раз
услышать•.
Наблюдение за имитацией процесса проводят обычно также за р�бочим местом
эксперта, но сам процесс деятельности запускается специально для аналитика.
Преимущество этой разновидности в том, что эксперт менее напряжен, чем в пер•
вом варианте, когда о н р аботает на •два фронта• - и ведет профессиональную
деятельность, и демонстрирует ее. Недостаток совпадает с преимуществом именно меньшая напряженность эксперта может повлиять на результат - раз ра­
бота ненастоящая, то и решение может отличаться от настоящего.
Наблюдения за имитацией проводят также и в тех случаях, когда наблюдения за
реальным процессом по каким-либо причинам невозможны (например, профес­
сиональная этика врача-психиатра может не допускать присутствия посторонне­
го на приеме).
1 04
Глава 4 • Те хн ологии инженер и и з нан и й
Сеансы наблюдщшй могут потребовать от инженера по знапиям:
• овладения техникой стенографии для фиксации действий эксперта в реаль­
ном масштабе времени;
• ознакомления с методиками хронометража для четкого структурирования
производственного процесса по времени;
• развития навыков счтения по глазам•, то есть наблюдательности к жестам, ми­
мике и другим невербальным компонентам общения;
• серьезного предварительного знакомства с предметной областью, так как из-за
отсут�твия собратной связи• иногда многое непонятно в действиях экспертов.
Протоколы наблюдений после сеансов в ходе домашней работы тщательно рас­
шифровываются, а затем обсуждаются с экспертом.
Таким образом, наблюдения - один из наиболее распространенных методов из­
влечения знаний на начальных этапах разработки. Обычно он применяется не
самостоятельно, а в совокупности с другими методами.
Ан ал из протоколов «мы слей вслух »
Протоколирование смыслей всдух• отличается от наблюдений тем, что эксперта
просят не просто прокомментировать свои действия и решения, но и объяснить,
как это решение было найдено, то есть продемонстрировать всю цепочку своих
1
рассуждений. Во время рассуждений эксперта все его слова, весь споток сознания• протоколируется инженером по знаниям, при этом полезно отметить даже
паузы и междометия. Иногда этот метод называют свербальные отчеты• [Морrо­
ев, 1988] .
Вопрос об и<;пользовании для этой цели магнитофонов и диктофонов является
дискуссионным, поскольку магнитофон иногда парализующе действует на экс­
перта, разрушая атмосферу доверительности, которая может и должна возни­
кать при непосредственном общении.
Основной трудностью при протоколирован ии смыслей вслух• является прин­
ципиальная сложность для любого человека объяснить, как он думает. При этом
существуют экспериментальные \{сихологические доказательств а того факта,
что люди не всегда в состоянии достоверно описывать мыслительные процессы.
Кроме того, часть знаний, хранящихся в невербальной форме ( например, различ­
ные процедурные знания типа скак завязывать шнурки• ), вообще слабо корре­
лируют с их словесным описанием. Автор теории фреймов М. Минский считает,
что «только как исключение, а не как правило, человек может объяснить то, что
он знает• [ Minsky, 1 98 1 ] . Однако существуют люди, склонные к рефлексии , для
которых эта работа является вполне доступной. Следовательно, описанная в па­
раграфе 3.3. такая характеристика когнитивного стиля, как рефлексивность, яв­
ляется для эксперта более чем желательной.
Расшифровка полученных протоколов производится инженером по знаниям са­
мостоятельно с коррекциями на следующих сеансах извлечения знаний. Удач но
4. 2 . Коммун и кати в ные методы
1 05
проведенное протоколирование •мыслей вслух• .является одним из наиболее эф�
фективных методов извлечения, поскольку в нем эксперт может проявить себя
максимально ярко, он ничем не скован, никто ему не мешает, он как бБ1 свободно
парит в потоке собственных умозаключений и рассуждений. Он может здесь
блеснуть эрудицией, продемонстрировать глубину своих познаний. Для большо­
го числа экспертов это самый приятный и лестный способ извлечения знаний.
От инженера по знаниям метод •мысли вслух• требует тех же умений, что и метод
наблюдений. Обычно •мысли вслух• дополняются потом одним из активных ме­
тодов для реализации обратной связи между интерпретацией инженера по знани­
ям и представлениями эксперта.
Лекци и
Лекция является самым старым способом передачи знаний. Лекторское искусст­
во издревле очень высоко ценилось во всех , областях науки и культуры. Но нас
сейчас интересует не столько способность к подготовке и чтению лекций, сколь­
ко способность эту лекцию слушать, конспектировать и усваивать. Уже говори- ,
лось, что чаще всего экспертов не выбирают, и поэтому учить эксперта чтению
лекции инженер по знаниям не сможет. Но если эксперт имеет опыт преподава­
теля (например, профессор КЛИJIИКИ или опытный руководитель производства),
то можно воспользоваться таким концентрированным фрагментом знаний, как
лекция. В лекции эксперту также предоставлено много степеней свободы для са­
мовыражения; при этом необходимо сформулировать эксперту тему и задачу
лекции. Например, тема цикла лекций • Постановка диагноза - воспаление лег­
ких»- , тема конкретной лекции •Рассуждения по анализу рентгенограмм• , зада­
ча - научить слушателей по перечисленным экспертом признакам ставить диаг­
ноз воспаления легких и делать прогноз. При такой постановке опытный лектор
может заранее структурировать свои знания и ход рассуждений. От инженера по
знаниям в этой ситуации требуется лишь грамотно законспектировать лекцию и
в конце задать необходимые вопросы.
Студенты хорошо знают, что конспекты лекций одного и того же лектора у раз­
ных студентов сущест�нно отличаются. Списать конспект лекций просят, как
правило, у одного-двух студентов из группы. Люди, умело ведущие конспект,
обычно сильные студенты. Обратное не верно. В чем же заключается искусство
ведения конспекта? В •помехоустойчивости•. Записывать главное, опускать вто­
ростепенное, выделять фрагменты знаний (параграфы, под-параграфы), записы­
вать только осмысленные предложения, умет ь обобщать.
Хороший вопрос по ходу лекции помогает и лектору и слушателю. Серьезные и
глубокие вопросы могут существенно поднять авторитет инженера по знаниям в
глазах эксперта.
Опытный лектор знает, что все вопросы можно условно разбить на три группы:
• умные вопросы, углубляющие лекцию;
• глупые вопросы или·вопросы не по существу;
• вопросы •на засыпку• или провокационные.
1 06
Гл а ва 4 • Техно л огии инжене р ии зна н и й
Если инженер по знаниям задает воп р осы второго типа, то ·возможны две реак­
ции. Вежливый эксперт будет разговаривать с таким аналитиком как с ребенком,
который сейчас не понимает и все равно ничего уже не поймет. Заносчивый экс­
перт просто выйдет из контакта, не желая терять время. Если же инженер по зна­
ниям захочет продемонстрировать свою эрудицию вопросами третьего типа, то
ничего, кроме раздражения и отчуждения, он, по-видимому, в ответ не получит.
Продолжительность лекции рекомендуется стандартная - от 40 до 50 минут и
через 5 - 10 минут - еще столько же. Курс обычно от двух до пяти лекций.
Метод извлечения знаний в форме лекций, как и все пассивные Методы, использу­
ют в начале разработки как эффектюшый способ быстрого погружения инженера
по знаниям в предметную область.
В заключе:�,ш е несколько советов, как слушать лекции [ Ребельский, 1989].
1 . К лекции подготовьтесь, то есть познакомьтесь с предметной областью.
2. Слушайте с максимальным вниманием, для этого: устраните мешающие фак­
торы ( скрип двери, шорохи и т. д. ); удобно устройтесь; поменьше двигайтесь.
3. Учитесь отдыхать во время слушания (например, когда лектор приводит циф­
ры, которые можно взять из справочника).
4. Слушайте одновременно и лектора, и самого себя (параллельно с мыслями лек­
тора по ассоциации возникают собственные мысли).
5. Слушайте и одновременно записывайте, но записывайте текст сокращенно, ис­
пользуя условные значки (для этого вовсеяе следует непременно быть стено­
графом, достаточно толы<о установить для себя ряд условных значков и ими
неизменно пользоваться).
6. Расшифруйте записи лекции в тот же день.
7. Не спорьте с лектором в процессе лекции.
8. Рационально используйте перерывы в лекции для подведения итогов прослу­
шанного.
Сравнительные характеристики пассивных методов извлечения знаний пред­
ставлены в табл: 4. 1 .
Таблица 4 . 1 . Сравнительн ые характери стики пассивных методов извлечения знаний
Пассивный
метод
извлечения
знаний
Наблюдения
•М ысли вспух»
Л екции
Достоинства
Отсутствие вл и яния
аналитика и его
субъективной
позици и
Максимальное
пр и ближение анал итика
к предметно й о бласти
Свобода
самовыражен и я
дл я эксперта
Свобода
самовыражен и я
для эксперта
Обнаже нность
структур
рiiссуждени й
Структур и рованное
изложение.
В ысокая концентрация
1 07
4.2. Ко ммуникативные методы
ПассивныА
метод
и авпечения
ананиА
Недостатки
Требования
к аксnерту
(ТИПЫ
и основные
качестаа)
Требования
к аксnерту
(тип ы
и основные
качества)
Характеристика
предметно А
обпа сти
Набп�одени•
Отсутствие
обратной связи
Фрагментарность
полученных
комментариев
Собеседник
или мыслитель
(с пособность
к ве рбализации +
мысл ей +
аналитичность +
открытость +
рефлексивность)
Мыслитель
(наблюдательность +
nол е н езависимость)
Слабо и средне
структурированные;
слабо и средне
документированные
..Мыоп и вспух,.
Лекци и
Отсутствие влияния
аналитика и его
субъективной
позиции
Отсутствие
обратной связи
Возможность
ухода «в сторону•
в рассуждениях
эксперта
Отсутстви е влияния
аналитика и его
субъективной
Собеседник
или мыслитель
. (способность
к ве рбализации +
мыслей +
аналитичность +
открытость +
рефлексивность)
Мыслитель
или собеседник
( контактность +
nопенеэависимость)
То же
ПОЗИЦИИ
«Зашумленность»
деталями
Слабая
обратная связь
Недостаток
хо роших л е кторов
среди экспертовпрактиков
Мыслитель
(лекторски е
способности )
Мыслитель
( поленезависимость +
способность
к обобщению)
Слабо
документи рованны е
и слабо
ст руктурированны е
4 . 2.2 . Актив ные индивидуальные методы
Активные и ндивидуальны е м етоды извлече ния з нан и й на се годняш ний де нь наиболее распространен ны е . В той ил и и ной с тепе ни к н и м приб егают пр и раз­
работ1с е практич ес ки любой ЭС.
К ос новным акт и вным методам можно отнест и :
• анкет и рован и е ;
• и нте рвью;
• с вободн ый диалог;
• игры с э кспертом.
Во в сех этих методах активную функци ю выполня ет инже не р по знаниям, кото­
рый пи шет с це нари й и режиссирует сеансы извле ч е н ия знаний . И гры с э кспе ртом
'
1 08
Глава 4 • Техноло гии ин же н ер ии з нан и й
существенно отличаются от трех других методов. Три оставшихся метода очень
схожи между собой и отличаются лишь по степени свободы, которую может себе
позволить инженер по знаниям при прове�нии сеансов извлечения знаний. Их
можно назвать вопросными методами поиска знаний.
Анкетирование
Анкетирование - наиболее жесткий метод, то есть наиболее стандартизирован­
ный. В этом случае инженер по знаниям заранее составляет вопросник или анrсе­
ту, размножает ее и использует для опроса нескольких экспертов. Это основное
преимущество анкетирования.
Сама процедура может проводиться двумя способами:
1 . Аналитик вслух задает вопросы и сам заполняет анкету по ответам эксперта.
2. Эксперт самостоятельно заполняет анкету после предварительного инстру1стирования.
Выбор способа зависит от конкретных условий (например, от оформления анке­
ты, ее понятности, готовности эксперта). Второй способ нам кажется предпочти­
тельнее, так как у эксперта появляется неограниченное время на обдумывание
ответов.
Если вспомнить схему общения, представленную ца рис. 3.8, то основными фак­
торами, на которые можно существенно повлиять при анкетировании, являются
средства общения (в данном случае это вопросник) и ситуация общения.
Вопросник (анкета) заслуживает особого разговора. Существует несколько об­
щих рекомендаций при составлении анкет. Эти рекомендации являются универ­
сальными, то есть не зависят от предметной области. Наибольший опыт работы с
анкетами накоплен в социологии и психологии, поэтому часть рекомендаций за­
имствована из [Ноэль, 1 978; Погосян, 1985).
• Анкета не должна быть монотонной и однообразной, то есть вызывать скуку
или усталость. Это достигается вариациями формы вопросов, сменой темати­
ки, вставкой вопросов-шуток и игровых вопросов.
• Анкета должна быть приспособлена к языку экспертов ( см. п. 3.3).
• Следует учитывать, что вопросы влияют друг на друга и поэтому последова­
тельность вопросов должна быть строго продумана.
• Желательно стремиться к оптимальной избыточности. Известно, что в анкете
всегда много лишних вопросов, часть из них необходима - это так называемые
контрольные вопросы ( см. о них ниже), а другая часть должна быть минимизи­
рована.
П р им ер 4 . 1
Лишн и е в опросы п оявляются, нап ри м ер, в таких с итуациях. Фрагмент анкеты:
•В 12. Считаете ли вы, что лечения анzины эффеюпивнет эритромицин ?•
•В 13. Какие дозы эритро,wицина вы обычно рекомендуете?•
4.2. Ко ммун и кати в ные методы
1 09
При отрицательном ответе на 1 2-й вопрос 1 3-й является лишним. Его можно избежать,
усложнив вопрос.
«В 12. Применяете ли вы эритромицин для лече11ия ашины и если да, то в каких дозах?»
• Анкета должна иметь «хорошие манеры;., то есть ее язык должен быть ясным,
понятным, предельно вежливым. Методическим мастерством составления ан­
кеты можно овладеть только на практике.
И н тервь ю
Под интервью будем понимать специфическую форму общения инженера по зна­
ниям и эксперта, в которой инженер по знаниям задает эксперту серию заранее
подготовленных вопросов с целью извлечения знаний о предметной области.
Наибольший опыт в проведении интервью накоплен, наверное, в журналистике и
социологии. Большинство специалистов этих областей отмечают тем не менее
крайнюю недостаточность теоретических и методических исследований по тема­
тике интервьюирования [ Ноэль, 1 978; Шумилина, 1 973].
Интервью очень близко тому способу анкетирования, когда аналитик сам запол­
няет анкету, занося туда ответы эксперта. Основное отличие интервью в том, что
оно позволяет аналитику опускать ряд вопросов в зависимости от ситуации,
вставлять новые вопросы в анкету, изменять темп, разнообразить ситуацию об­
щения. Кроме этого, у аналитика появляется возможность «взять в плен;. экспер­
та своим обаянием, заинтересовать его самой процедурой и тем самым увеличить
эффективность сеанса извлечения.
В опросы для инте рвью
Теперь несколько подробнее о центральном звене активных индивидуальных ме­
тодов - о вопросах. Инженеры по знаниям редко сомневаются в своей способно­
сти задавать вопросы. В то время как и в философии и в математике эта проблема
обсуждается с давних лет. Существует даже специальная ветвь математической
логики - эротетическая логика (логика вопросов). Есть интересная работа Бел­
напа «Логика вопросов и ответов�,, [ Белнап, Стил, 1 98 1 ], но, к сожалению, исполь­
зовать результаты, полученные логиками, непосредственно при разработке ин­
теллектуальных систем не удается.
Все вопросительные предложения можно разбить на два типа [Сергеев, Соколов,
1 986]:
• вопросы с неопределенностью, относящейся ко всему предложению ( «Дей­
ствительно, введение больших доз антибиотиков может вызвать анафилакти­
ческий шок?);
• вопросы с неполной информацией ( « При каких условиях необходимо включать
кнопку?�>), часто начинающиеся со слов «кто,> , что�>, « где�,,, «когда�> и т. д.
Это разделение можно дополнить классификацией, частично описанной в работе
[ Шумилина, 1973] и представленной на рис. 4.3.
1 10
Глава 4 • Технологии инженер ии гнаний
Вопросы
По функции
По форме
По воздействию
Открытые
Закрытые
Личные
Безличные
Прямые
Основные
Н ейтральные
Зондирующие
Н а в одящие
Контрольные
Косвенные
Вербальные
С исп ользованием
наглядного материала
Рис. 4.3. Классификация вопросов
Открытый вопрос называет тему или предмет, оставляя полную свободу экспер­
ту по форме и содержанию ответа ( «Не могли бы вы рассказать, как лучше сбить
высокую температуру у больного с воспалением легких? ►).
В закрытом вопросе эксперт выбирает ответ из набора предложенных («Укажи­
те, пожалуйста, что вы рекомендуете при ангине: а) антибиотики, б) полоскание,
в) компрессы, г) ингаляции�>). Закрытые вопросы легче обрабатывать при после­
дующем анализе, но они более опасны, так как «закрывают�> ход рассуждений эк­
сперта и «программируюн его ответ в определенном направлении. При состав­
лении сценария интервью полезно чередовать открытые и закрытые вопросы,
особенно тщательно продумывать закрытые, поскольку для их составления тре­
буется определенная эрудиция в предметной области.
Ли-чиый вопрос касается непосредственно личного индивидуального опыта экс­
перта ( « Скажите, пожалуйста, Иван Данилович, в вашей практике вы применяете
вулнузан при фурункулезах? ► ). Личные вопросы обычно активизируют мышле­
ние эксперта, «играют�> на его самолюбии, они всегда украшают интервью.
Безли-чиый вопрос направлен на выявление наиболее распространенных и обще­
принятых закономерностей предметной области ( «Что влияет на скорость про­
цесса ферментации лизина? ► ) .
При составлении вопросов следует учитывать, что языковые способности экс­
перта, как правило, ограничены и вследствие скованности, замкнутости, робости
4.-2 . Коммуни кативн ые методы
11 1
он не может сразу высказать свое мнение и предоставить знания, которые от него
требуются (даже если предположить, что он их четко для себя формулирует).
Поэтому часто при «зажатости• эксперта используют не прямые вопросы, кото­
рые непосредственно указывают на предмет или тему ( «Как вы относитесь к ме­
тодИI,е доктора Сухарева?•), а косвенные, которые лишь косвенно у1<азывают на
интересующий предмет ( « Применяете ли вы методику доктора Сухарева? О пи­
шите, пожалуйста, результаты лечения•). И ногда приходится задавать нес1,оль­
ко десятков косвенных вопросов вместо одного прямого.
Вербш�ьные вопросы - это традиционные устные вопросы. Вопросы с использо­
ванием наглядного материш�а разнообразят интервью и снижают утомляемость
эксперта. В этих вопросах используют фотографии, рисунки и карточки. Напри­
мер, эксперту предлагаются цветные картонные карточки, на которых выписаны
признаки заболевания. Затем аналитик просит разложить эти карточки в поряд­
ке убывания значимости для постановки диагноза.
Деление вопросов по функции на основные, зондирующие, контрольные связано
с тем, что часто основные вопросы интервью, направленные на выявление знаний,
· не срабатывают - эксперт по каким-то причинам уходит в сторону от вопроса,
отвечает нечетко.
Тогда аналитик _ использует зондирующие вопросы, которые направляют рассуж­
дения эксперта в нужную сторону. Например, если не сработал основной вопрос:
«Какие параметры определяют момент окончания процесса ферментации лизи­
на?• - аналитик начинает задавать зондирующие вопросы: «Всегда ли процесс
ферментации длится 72 часа? А если он заканчивается раньше, как это узнать?
Если он продлится больше, то что заставит микробиолога не закончить процесс
на 72-м часу? • и т. д.
Контрольные вопросы применяют для проверки достоверности и объективности
информации, полученной в интервью ранее ( «Скажите, пожалуйста, а мос1,ов­
ская школа психологов так же как вы трактует Uil(aлy К опросника M MPI?• или
сРе!(омендуете ли вы инъекции АТФ?• (АТФ - препарат, снятый с производ­
ства). Контрольные вопросы должны быть схитро• составлены, чтобы не оби­
деть эксперта недоверием (для этого используют повторение вопросов в другой ·
форме, уточнения, ссылки на другие источники). •Лучще два· раза спросить, чем
один раз напутать• ( Шолом-Алейхем).
И наконец, о нейтральных и наводящих вопросах. В принципе интервьюеру
• (в нашем случае инженеру по знаниям) рекомендуют быть беспристрастным, от­
сюда и вопросы его должны носить нейтрш�ьный характер, то есть не должны ука­
зывать на отношение интервьюера к данной теме. Напротив, наводящие вопросы
заставляют респондента (в данном случае эксперта) прислушаться или даже при­
нять во внимание позицию интервьюера. Нейтральный вопрос: « Совпадают
ли симптомы кровоизлияния в мозг и сотрясения мозга?• Наводящий вопрос:
«Не правда ли, очень трудно дифференцировать симптомы кровоизлияния в
мозг?.•
1 12
Глава 4 • Технологии и нженерии з наний
Кроме перечисленных выше, полезно различать и ВКJ,Iючать в интер вью следую­
щие вопросы [Ноэль, 1 978]:
• контаК'Тные ( «ломающие лед• между аналитиком и э1<спертом);
• буферные (для разграничения отдельных тем интер вью);
• оживляющие память экспертов (для реконструкции отдельных случаев из
праI(ТИК и);
• •провоцирующие• (для получения спонтанных, неподготовленных ответов).
В заключение описания интервью у1<;ажем три основные характеристики вопро­
сов ( Шумилина, 1 973], которые влияют на качество интервью:
• язык воп роса (понятность, лаконичность, терминология);
• порядок вопросов (логическая последовательность и немонотонность);
• уместность вопросов ( этика, вежливость).
Вопрос в инте р вью - это не просто средство общения, но и способ передачи мыс­
лей и п озиции аналитика.
с Вопрос представляет собой форму движения мысли, в нем ярко выражен момент
перехода от незнания к знанию, от неполного, неточного знания I< более полному
и более точному• [Лимантов, 1 97 1 ] . Отсюда н еобходимость в протоI<олах фикси­
ровать не только ответы, но и вопросы, предварительно тщательно отрабатывая
их форму и содержание.
Очевидно, что любой воп рос имеет смысл только в контексте. Поэтому вопросы
может готовить инженер по знаниям, уже овладевший ключевым набором зна­
ний.
Вопросы имеют для экспе р та диагностическое значение - несколько откро­
венных «глупых• вопросов могут полностью разочаровать эксперта и отбить
у него охоту к дальнейшему сотрудничеству. Известен ответ Маркса на во­
прос Прудона: • Вопр ос был до такой степени н е п равильно поставлен, что на
него нев озможно было дать правильный отв ет•.
С во бодн ы й ди ап оr
Свободный диалог - это метод извлечения знаний в форме беседы инжене ра по
знаниям и эксп�рта, в которой нет жесткого регламенти рованного плана и во­
просника. Это определение не означает, что к свободному диалогу не надо го­
товиться. Напротив, внешне свободная и легкая фо р ма этого метода требует
высочайшей профессиональной и психологичес1<0й подготовки. Подготов1<а к
свободному диалогу практически может совпадать с предлагаемой в работе [Шу­
милина, 1 973] подготовкой к журналистскому интер вью. Рисунок 4.4 графичес­
ки иллюстр и рует схему такой подготовки, дополненную в связи со спецификой
инженер ии знаний. Подготовка занимает разное время в зависимости от степени
профессионализма аналитика, но в любом случае она необходима , так как не­
с1<0лько уменьшает вероятность самого нерационального метода - метода проб
и ошибок.
113
4 .2. Комм ун икативн ы е м етоды
1
1
1
Общая
1
-
Повышение
научной
эрудиции
-
Обл адание
общей
культурой
-
1
1 Специальная \
-
1
Подrотовка
Оаладение
теорией и
навыками
интервьюирования
1
Конкретная
-
Изучение
предметной
области
по литературе
-
Подrотовка
ситуации
общения
н
Знакомство
с системной
методологией
,
1
1
Психолоrическая 1
-
Знакомство
с теорией
общения
-
Изучение
когнитивной
nсихолоrии
Знакомство
с экспертом
ц Тестирование
эксперта
· Рис. 4.4. Подготовка к и з влечению знаний
Квалифицированная подготовка к диалогу помогает аналитику стать истинным
драматургом или сценаристом будущих сеансов, то есть запланировать гладкое
течение процедуры извлечения: от приятного впечатления в начале беседы пере­
ход к профессиональному контакту через пробуждение интереса и завоевание
доверия эксперта. При этом для обеспечения желания эксперта продолжить бе­
седу необходимо проводить •поглаживания» (терминология Э. Берна [Берн,
1 988]), то есть подбадривать эксперта и подтверждать всячески его уверенность
в собственной 1,омпетентности (фразы-вставки: •Я вас понимаю... •, .... это очень
интересно» и т. д.).
Так, в одном из исследований по технике ведения профессиональных журналист­
ских ди<1:7юго� [Matarozzo, Wettman, Weins, 1 963] было экспериментально дока­
зано, что одобрительное и поощрительное •хмыканье» интервьюера увеличива­
ет длину ответов респондента. При этом одобрение должно быть искренним, как
·показал опрос интервьюеров Института демоскопии Германии: «Лучшая улов1,а - это избегать вся1,их уловок: относиться к опрашиваемому с истинным чело­
веколюбием, не с наигранным, а с подлинным интересом• [ Ноэль, 1 978] . Чтобы
разговорить собеседника, можно сначала аналитику рассказать о себе, о работе,
то есть поговорить самому.
Мы уже писали о профессиональной пригодности инженеров по знаниям и необ­
ходимости предварительного психологического тестирования при подготовке
инженеров по знаниям. Здесь только приведем каталог свойств идеального ин­
тервьюера [Ноэль, 1 978] . На наш взгляд, это в полне подходящий образец порт­
рета инженера по знаниям перед серией свободных диалогов: •Он должен вы­
глядеть здоровым, спокойным, уверенным, внушать доверие, быть искренним,
веселым, проявлять интерес к беседе, быть опрятно одетым, ухоженным•. Хоро-
1 14
Глава 4 • Техн ологии инже нf1) р ИИ зн аний
ший ан� итик . м�жет личным обаядием, и .умени��. ск� щть и;зъяны подготовк�.
Блестящая кр'аткая характеристика интервьюера приведена в той же JЩботе • общи тельный педа н т � .
В свободном диалоге важно также выбрать правильный темп или ритм беседы:
без больших пауз, так как эксперт может отвлечься, но и без гонки, иначе быстро
утомляются оба участника и нарастает напряженность, кроме того, некоторые
люди говорят и думают очень медленно. Умение чередовать разные темпы, на­
пряжение и разрядку в беседе существенно влияет на результат.
Подготовка к диалогу так же, как и к другим активным методам извлечения зна­
ний, включает составление плана проведения сеанса извлечения, в котором необ. ходимо предусмотреть следующие стадии:
1. Начало беседы (знакомство, создание у эксперта «образа>> аналитика, объяс­
нение целей и задач работы).
2. Диалог по извлечению знаний.
3. Заключительная стадия (благодарность эксперту, подведение итогов, договор
о последующих встречах).
Девизом для инженера по знаниям могут послужить взгляды одного из классиков
отечественного литературоведения М. М. Бахтина [Бахтин, 1975 ] :
�Диалог - столкновение разных умов, разных истин, несходных культурных по-·
зиций, составляющих единый ум, единую истину, общую культуру•.
• д иалог предполагает:
• уникальность каждого партнера и их принципиальное равенство друг другу;
• различие и оригинальность их точек зрения ;
• ориентацию каждого на понимание и на активную интерпретацию его точки
зрения партнером ;
• ожидание ответа и его предвосхищение в собственном высказывании;
• · взаимную дополнительность позиций участников общения, соотнесение кото­
рых и является целью диалога�.
Сравнительные характеристики активных индивидуальных методов извлечения
знаний пред ставлены в табл. 4.2.
Таблица 4.2. Сравнительные характеристики активных индивидуальных методов извлечения
Активный
Анкетирование
индивидуальный
метод извлечения
знаний
Достоинства
Возможность
стандартизиро­
ванного опроса
нескольких
экспертов
Интерв1аю
Свободный диалог
Наличие обратной
связи (возможность
уrочнений и разрешения
противоречий)
для эксперта
Гибкость
Сильная
обратная связь
изменения
1 15
4;2. Коммун и ка ти в ные мет оды
Активный '
инди видуаn�.ный
метод и эаn е ч ения
зн ани й
Ан кетмрова lfие
Свободный диапоr
Возможность
и з мен ен ия
сцен а ри я и ф о р мь1
сеанса
Недостатки
Не требует
особенного
напряжения
от анал итика во
в ремя процедуры
а нкетиро вания
Требует умения
и оnыта
соста вления
анкет
Требо вания
к э к с пе рту (Тl!IПЫ
кач ества)
Требо аания
к анап ити ку
(тип w и ка ч е ст ва)
Характе ри сти ка
п редм етн ой
области
Требует з на ч ител ьного
времени на подготовку
во п росо в интерв ыо
Отсутствие
контекста
между э кспертом ,
нет обратной свя з и .
Вопросы анкеты
моrут быть непра вил ьно
поняты экспертом
Практик
и м ы слитель
М ы слител ь
(педа нтиз
в сосtа влении а нкет,
внимател ьность)
Собеседник
и л и м ы слите л ь
С обеседник
( жур налистские
навыки, умение
сл ушать)
То же
Сла бо
структури р ованные,
сл або и средне
документированн ые
Требует
от анал итика
высоча йше го
напряжения
Отсутствие
форм ал ьн ы х
методик проведени я
Трудность
протоколировани я
резул ьтатов
Собеседник
или мыслител ь
Со беседник
( н абл юдател ьность
ум ение слушать,
обаяние )
То же
4 . 2 . З . Активные групповые методы
К групповым методам извлечения знаний отно�тся ролевые игры, дискуссии за
«круглым столом• с участием нескольких экспертов и «мозговые штурмы•. Ос­
новное достоинство групповых методов - это возможность одновременного
«поглощения• знаний от нескольких экспертов, взаимодействие которых вносит
в этот процесс элемент принципиальной новизны от наложения разных взглядов
и позиций.
Поскольку эти методы менее популярны, чем индивидуальные (что связано со
сложностью организации), попытаемся описать их подробно.
сс Кру rлый сто л »
Метод круглого стола (термин заимствован из журналистики) nредусматривает
обсуждение какой�либо проблемы из выбранной предметной области, в котором
принимают участие с равными правами несколько экспертов. Обычно вначале
1 16
Глава 4 • Техн ологии инженерии знаний
участники высказываются в определенном порядке, а затем переходят к живой
свободной дискуссии. Число участников дискуссии колеблется от трех до пя­
ти-семи.
Большинство общих рекомендаций по "Извлечению знаний, предложенных ранее,
применимо и к данному методу. Однако существует и специфика, связанная с
поведением человека в группе.
Во-первых; от инженера по знаниям подготовка «круглого стола�,, потребует до­
полнительных усилий: как организационных (место, время, обстановка, мине­
ральная вода, чай, кворум и т. д.), так и психологических (умение вставлять уме­
стные реплики, чувство юмора, память на имена и отчества, способность гасить
конфликтные ситуации и т. д. ).
Во-вторых, большинство участников будет говорить под воздействием «эффекта
фасада>> совсем не то, что они сказали бы в другой обстановке, то есть желание
произвести впечатление на других экспертов будет существенно «подсвечивать�,,
их высказывания. Этот эффект часто наблюдается на защитах диссертаций. Чле­
ны ученого совета спрашивают обычно не то, что им действительно интересно, а
то, что д�монстрирует их собственную компетентность.
Ход бесЕды за круглым столом удобно записывать на магнитофон, а при расшиф­
ровке и 1нализе результатов учитывать этот эффект, а также взаимные отноше­
ния участников.
Задача дискуссии - коллективно, с разных точек зрения, под разными углами ис­
следовать спорные гипотезы предметной области. Обычно эмпирические области
богаты таким дискуссионным материалом. Для остроты на «круглый стол�,, при­
глашают представителей разных научных направлений и разных поколений, это
также уменьшает опасность получения односторонних однобоких знаний.
Обмен мнениями по научным вопросам имеет давнюю традицию в истории чело­
вечества (античная Греция, Индия). До наших дней дошли литературные памят­
ники обсуждения спорных вопросов (например, Протагор «Искусство спорить�,,,
работы софистов), послужившие первоосновой диалектики - науки вести бесе­
ду, спорить, развивать теорию. В самом слове дискуссия ( от лат. discussio - иссле­
дование) содержится указание на то, что это метод научного познания, а не просто
споры (для сравнения, полемика - от греч. polemikos - воинственный, враждеб­
ный).
Несколько практических советов по процедурным вопросам «круглого стола�,, из
работы [Соколов, 1980]. Перед началом дискуссии ведущему полезно:
• убедиться, что все правильно понимают задачу (то есть происходит сеанс извлечения знаний);
• установить регламент;
• четко сформулировать тему.
По ходу дискуссии важно проследить, чтобы слишком эмоциональные· и разговор­
чивые эксперты не подменили тему и чтобы критика позиций друг друга была обо­
снованной.
Научная плодотворность дискуссий делает этот м�тод привлекательным и для
самих экспертов, особенно для тех, кт9 знает меньше. Это заметил еще Эпикур:
4.2. К омму ни кати в н ые методы
1 17
«При философской дискуссии больше выигрывает побежденный - в том отно­
шении, что он умножает знания,> [Материалисты, 1 955]. Хорошим напутствием
для проведения «круглого стола1> служат слова П. Л. Капицы: «Когда в какой­
либо науке нет противоположных взглядов, нет борьбы, то эта наука идет по пути
к кладбищу, она идет хоронить себя,> [Капица, 1 967] .
« М озгов о й штурм»
Активные групповые методы обычно используются в качестве острой приправы
при извлечении знаний, сами по себе они не могут служить источником более или
менее полного знания. Их применяют как дополнительные к традиционным ин­
дивидуальным методам (наблюдения, интервью и т. д.), для активизации мышле­
ния и поведения экспертов.
«Мозговой штурм,> или «мозговая атака>> - один из наиболее распространенных
методов раскрепощения и активизации творческого мышления. Другие методы
(метод фокальных объектов, синектика, метод контрольных вопросов [Шепотов,
Шмаков, Крикун, 1 985]) применяются гораздо реже из-за меньшей эффективно­
сти.
Впервые этот метод был использован в 1 939 г. в США А. Осборном как способ
получения новых идей в условиях запрещения критики. Замечено, что боязнь
критики мешает творческому мышлению, поэтому основная идея штурма - это
отделение процедуры генерирования идей в замкнутой группе специалистов от
процесса анализа и оценки высказанных идей.
Как правило, штурм длится недолго (около 40 минут). Участникам (до 10 чело­
век) предлагается высказывать любые идеи (шутливые, фантастические, ошибоч­
ные) на заданную тему (критика запрещена). Обычно высказывается более 50
идей. Регламент до 2 минут на выступление. Самый интересный момент штур­
ма - это наступление пика (ажиотажа), когда идеи начинают «фонтанировать,> ,
то есть происходит непроизвольная генерация гипотез участНИI<ами. Этот пик
имеет теоретическое обоснование в работах выдающегося швейцарского психо­
лога и психиатра 3. Фрейда о бессознательном. П р и последующем анализе всего
лишь 1 0- 1 5 % идей ОI<азываются разумными, но среди них бывают весьма ориги­
нальные. Оценивает результаты об�1чно группа экспертов, не участвовавшая в
генерации.
Ведущий «мозгового штурма,> - инженер по знаниям - должен свободно вла­
деть аудиторией, подобрать активную группу экспертов -- «генераторов1>, не за­
жимать плохие идеи - они могут служить катализаторами хороших. Иекусство
ведущего - это искусство задавать вопросы аудитории, «подогревая1> генера­
цию. Вопросы служат «крючком1> [Шепотов, Шма1<0В, Крикун, 1 985] , которым
извлекаются идеи. Вопросы также могут останавливать многословных экспер­
тов и служить способом развития идей других.
Основной девиз штурма - «чем больше идей, тем лучше1>. Фиксация хода сеан­
са - традиционная (протокол или магнитофон).
Достоинства и недостатки активных групповых методов извлечения знаний пред­
ставлены в табл. 4.3.
118
Глава 4 • Технологии и н же н ерии з нан ий
Таблица 4.3. Сравнение активных групповых методов из�л,эчения знаний _ .
Активный rрупповой · «Круrпый c:ron•
метод иэаnечения
знаний
Позволяет получить более
Достоинства
объективные фрагменты
знаний
Недостатки
Требования
к эксперту
(тип и качестаа)
Требования
к июкенеру по
знаниям (тип
и качества)
Характеристика
предметной
области
«Мозговой wтурм•
Позволяет выявлятьглубинные
пласты знаний ( на уровне
бессознательного)
Ожи вляет процедуру
и звлечения
Активизирует экспертов
Позволяет участникам
обмен и ваться знаниям и
Требует больших
организа ционных затрат
Позволяет получать
новое знание (гипотезы)
Отличается СJ'IОжностью
проведен и я
Не всегда эффективны
(довольно низкий про цент
продуктив1::1ых идей)
Собеседник или мысл итель
(искусство полемики)
Собеседн и к (диплома­
тические способности )
Слабо структури рованные
и слабо документированные
с наличием спорных
проблем
Возможен только для новых
и нтересных и сследовательских
проблем
Мыслитель{креативность,
то есть способность
к творчеству)
Собеседн и к или мыслитель
(быстрая реак ция и
чувство юмора)
СЛабо струкrурированные
и слабо документирова+1ные
с нали чи ем перспе ктивных
«белых пятен•
Э ксп е рт н ы е игры
называют такой вид человеческой деятельности, который отражает ( вос­
создает) другие ее виды [ Комаров, 1 989]. При этом для игры характерны одно­
временно условность и серьезность.
Игрой
Понятие экспертной игры или игры с экспертами в целях извлечения знаний вос­
ходит к трем источникам - это деловые игры, широко используемые при подго­
товке специалистов и моделировании [Борисова, Соловьева и др., 1 988; Бурков,
1980; Комаров, 1 989]; диагностические игры, описанные в работах [Алексеевская,
Недоступ, 1 988; Гельфанд, Розенфельд, Шифрин, 1 988] , и компьютерные игры,
все чаще применяемые в обучении [ Пажитнов, 1 987].
В настоящее время в психолого-педагогических науках нет развитой теоретичес1юй концепции деловых игр и других игровых методов обучения. Тем не менее на
практике эти игры широко используются. Под деловой игрой чаще всего понима­
ют эксперимент, где участникам предлагается производственная ситуация, а они
на основе своего жизненного опыта, своих общих и специальных знаний и пред-
1 19
4 .2. Коммуникати в ны е м етоды
ставлений принимают решения [Бурков, 1 980]� Решения анализируются, и
вскрываются закономерности мышления участников эксперимента. Именно эта
анализирующая часть деловой игры полезна для получения знаний. И если уча­
стниками такой игры становятся эксперты, то игра из деловой превращается в
экспертную. Из трех основных типов деловых игр (учебных , планово-производ­
ственных и исследовательских) к экспертам ближе всего исследовательские, ко­
торые исnользуются для анализа систем, проверки правил принятия решений.
Диагностическая игра - это та же деловая игра1 но применяемая конкретно для
диагностики методов принятия решения в медицине (диагностика методов диаг­
ностики). Эти игры возникли при исследовании способов передачи опыта от
опытных врачей новичкам. В нашем понимании диагностическая игра - это игра,
безусловно, экспертная без всяких оговорок, только с жестко закрепленной пред­
метной областью - медициной.
Плодотворность моделирования реальных ситуаций в играх подтверждается се­
годня практически во всех областях науки и техники. Они развивают логическое
мышление, умение быстро принимать решения, вызывают интерес у экспертов.
В соответствии с классификацией, введенной в п. 4.1 , будем разделять эксперт­
ные игры на:
• индивидуальные�
• групповые.
Кроме этого (рис. 4.5), продолжим и разовьем эту классификацию введением
других критериев:
• использование �пециального оборудования;
• применение вычислительной техники.
1 Экспертн ы е 1
игры
1
1
По ч исл у
участнико в
-
'
1 1И
д
ндиви уальн ы е
( и гр ы с
экспертом )
Группов ы е
(ролевые и гр ы
в группе )
По применению
специально го
оборудовани я
-
И гры с
wенаж.ером
1
1
По использов а нию 1
-
И гр ы без
реквизита
Рис. 4.5. Кл асс и ф и кация экс пе ртных и гр
ЭВМ
Комп1аютерн ы е
игрw
Руч н ы е
и гры
1 20
Глава 4 • Технологии и нженер ии знани й
Иг ры с э кс п ерто м
В этом сл учае с эксп ертом играет инженер по знания м , которы й берет на себя ка­
кую - нибудь роль в модели руемой ситуации. Напр имер, о дном у из авторов ч асто
приходилос ь р азыгр ывать с экспертом игру •Учитель и ученик• , в которо й ин ­
жене р по знания м берет на себя роль уч еника и на гл азах у эксперта выполня ет
его работу ( нап р имер , пишет психодиагн о стическое заключение ) , а эксперт по­
правля ет ошибки •уч еника• . Эта игр а - удобны й с пособ разговорить застенч и­
вого эксперта.
Пример 4. 2
Другая игра (заимствована и з работы [ Гельфанд, Розенфельд, Шифрин, 1988]) застав­
ляет инженера по знаниям взять на себя роль врача, который знает хорошо больного, а
эксперт играет роль консультанта. Консультант задает вопросы и делает прогноз о це­
лесообразности применения того или иного вида лечения (в описанной игре это ·был
прогноз целесообразности электростимульной терап ии при сердечной аритмии). Игра
сдвух врачей• позволила выявить, что эксперту понадобилось всего 30 вопросов для .
успешного прогноза, в то время как первоначальный вариант вопросника, составлен­
ный медиками для той же цели, содержал 170 вопросов.
Пример.4.3
Сначала эксперта просят написать обоснование для собственного прогноза. Напр:имер,
почему он считает, что язва у больного Х заживает. Накапливается несколько таких
обоснований [ Гельфанд, Розенфельд, Шифрин, 1988] , а через некоторое время экспер­
ту зачитывают только его обоснование и просят сделать прогноз. Как правило, этого он
сделать не может, то есть обоснование (или его знания) было неполным. Эксперт до­
полняет обоснование, тем самым выявляютс� скрытые (для самого эксперта) пласты
знаний. Так, в играх с Обоснование прогноза рецидива язвенного кровотечения• уда­
лось выявить, что значимыми для прогноза являются всего три правила. Причем два
правила входили в традиционно-диагностический вопросник, а третье было сформу­
лировано во время игры.
Пример 4.4
Игра сфокусировка на контексте•: эксперт играет роль ЭС, а инженер по знаниям роль пользователя. Разыгрывается ситуация консультации. Первые вопросы э ксперта
выявляют наиболее значимые понятия, самые важные аспекты проблемы. Роль
пользователя может взять на себя и другой эксперт [Rabblts, Wright, 1987].
Основные советы инженеру п о знаниям п о проведению индивидуал ьных игр :
• играйте смелее, придумывайте игры сами ;
• не навя зывайте игру эксперту, если он не расположен ;
• в игре •не давите• .на эксперта, не забыв айте цели игры;
• играйте вес ел о, нешаблонно ;
• не забывайте о в р емени и о том, ч то игра утомительна дл я эксперта.
Ро лев ые иг р ы в г ру п п е
Групповые игры предусматривают участие в игре нескольких эксперто в. К тако й
игре обыч н о зар анее составля ется сценар ий , р аспределя ютс я роли , к каждо й р оли
4.2. Коммуникати вные методы
1 21
готовится портрет-описание (лучше с дев изом) и разрабатывается система оце­
нивания игроков [Борисова, Соловьева и др., 1 988] .
Существует несколько способов проведения ролевых игр. В одних играх игроки
могут придумать себе новые имена и играть под ними. В других все игроки пере­
ходят на • ты•. В третьих роли выбирают игроки, в четвертых роли вытягивают по
жребию. Роль - это комплекс образцов поведения. Роль связана с другими рqля­
ми . • Короля играет свита• . Поскольку в нашем случае режиссером и сценаристом
игры является инженер по знаниям, то ему и предоставляется полная свобода в
выборе формы про ведения игры.
Пример 4 .5
Так, в работе [Л азарева, Пашинин, 1987] описана игра •План•, предназначенная для
извлечения знаний из специалистов предприятия, разрабатывающих производствен­
ные планы выпуска для цехов и принимающих различные решения по управлению
производством .
В игре экспертов разбили н а три игровые группы: ЛПР 1 - группа планирования;
ЛП Р 2 - группа менеджеров; Э - группа экспертизы по оцениванию действия ЛПР 1 и
Л ПР2 • Группам ЛПР 1 и ЛПР2 задавались различные производственные ситуа ции и
тщательно протоколировались их споры, рассуждения, аргументы по принятии реше­
ни й. В результате игры был создан прототип базы знаний экспертной системы плани­
рования.
Обычно в игре принимает участие от трех до шести экспертов, если их больше, то
можно разбить всех на несколько конкурирующих игровых бригад. Элемент со­
стязательности оживляет игру. Например, чей диагноз окажется ближе к истин­
ному, чей план рациональнее использует ресурсы, кто быстрее определит причину неисправности в техническом блоке.
Создание игровой обстановки потребует немал� фантазии и тв о рческо й выдумки
от инженера по знаниям. Ролевая игра, как правило, требует некоторых простей­
ших заготовок (например, табличек •директор•, •Бухгалтерия •, • План овый от­
дел• , специально напечатанных инструкций с правилами игры). Но rла�щое, ко­
нечно, чтобы эксперты в игре действительн о •заиграли• , раскрепостились и
•раскрыли свои карты •.
И гры с т ренаже ра м и
Игры с тренажерами в значительной степени ближе не к играм, а к имитацион­
ным упражнениям в ситуации, прирлиженной к действительности.
Наличие тренажера позволяет воссоздать почти производственную ситуацию и
понаблюдать за экспертом. Тренажеры широко применяют для обучения (напри­
мер, летчиков или операторов атомных станций). Очевидно, что применение тре�
нажеров для извлечения знаний п озволит зафиксировать фрагменты •летучих•
знаний, возникающих во время и на месте реальных ситуаций и выпадающих из
памяти при выходе за пределы ситуации.
Ко мпьютер ные эксп ертные и г р ы
Идея использовать компьютеры в деловых играх известна дав но. Но только
когда компьютерные игры взяли в плен практически всех пользователей пер -
1 22
Глава 4 • Техноло гии инжене рии знаний
сональных ЭВМ от мала до велика, стала очевидной особая притягательность­
такого рода игр.
Традиционная современная классификация компьютерных игр из журнала
GAME.EXE:
• Action/Arcade games (экmн/аркады) . Игры-действия. Требуют хорошего
глазомера и быстрой реакции.
• Simulation games (симуляторы) . Базируются на моделировании реальной
действительности и отработки практических навыков, например в вождении
автомобиля, пассажирского самолета, поезда, авиадиспетчера и даже симу­
ляторы рыбной ловли. Также популярны спортивные симуляторьi - теннис,
бокс и др.
• ЗD Action games ( ◄стрелялки► ). То же, что и экшн, но с активным использо­
ванием трехмерной графики.
• Strategy games ( стратегические игры). Требуют стратегического планирова­
ния и ответственности при принятии решений, например развитие цивилиза­
ций, соперничество миров, экономическая борьба. Особый класс стратегичес­
ких игр- wargames (военные игры). В последнее время упор в ЗD Action
делается на многопользовательский режим (игру по сети).
• Puzzles (настольные игры-головоломки). Компьютерные реализации различ­
ных логических игр.
• Adventure/Quest (прИКJ1Юченческие игры). Обычно обладают разветвленным
сценарием, красивой графикой и звуком. Управляя одним или несколькими
персонажами, игрок должен правильно вести диалоги, разгадывать множество
загадок и головоломок, замечать и правильно использовать предметы, спря­
танные в игре.
• Role-playing games RPG (ролевые игры) . Распространенный жанр, берущий
свое начало в старых английских настольных играх. Существует один или не­
сколько персонажей, обладающих индивидуальными способностями и харак­
теристиками. Им приходится сражаться с врагами, решать загадки. По мере
выполнения этих задач, у героев накапливается опыт, и по достижении опреде­
ленного значения их характеристики улучшаются ...
Следует отметить, что многие игры могут быть отнесены сразу к нескольким
классам; и в целом, эту классификацию нельзя считать строrой. Игры иногда по­
лезны для развлечения эксriертов перед сеансом извлечения знаний. Кроме того,
очевидно, что экспертные игры, сочетая элементы перечисленных выше IСЛассов,
могут успешно применяться для непосредственного извлечения знаний. Однако
разработка и программная реализация такой игры потребуют существенных вло­
жений временных и денежных ресурсов.
П рим ер 4 .6
Одна из первых отечественных экспертных компьютерных игр описана в работе [ Гин­
кул, 1989). Основной принцип игры сЗоосад• состоит в создании иг.ровой ситуации
при организации диалога с экспертом. При этом задача извлечения знаний маскиру­
ется нацеленностью на решение чисто игровой задачи: необходимо определить содер�
жимое •черного ящика•, в котором находится некое животное, при этом надо набрать
1 23
4. 2. Ко ммуникати вные мето ды
наи большее количество очков, не истратив выделенного ресурса денег. В ходе игр ы
эксперт делает ставки на различн ые гипотезы, указ ывая при этом , как и ми призна�са­
ми обладает то или иное животное. После каждого ответа он получает н еобходимую
· инфо рмацию о результатах. По ходу игры невидимо для эксперта формируются п равила, отражающие знания эксперта на основании сделанных им ходов. В данной
игре - зто знания о том, какими п р изнаками обладают те или иные животные. Таки м
образом, в ыя вляется алфавит значимых признаков для диагностики и классифика­
ции животных.
Сравнительные характеристики экспертных игр приведены в табл. 4.4.
Табл и ца 4 . 4. С равнительные характерис"f'ики э кс пертных игр
Э кспе ртные
и гры
Достоинства
И ндивидуальные
Групповые
Дают возм ожность
сравнительно быстро
получит ь качественную
картину принят ия
решения
Реалистично воссоздают Выз ывают интерес
ат м осф еру конкретной
у эксперта
задачи
Поз воляют выясн и ть ,
какую инфор м ацию
и как использует эксперт
Недостатки
«Группо вые � з нания
более
объе кти вны
Выявляют логику
и аргум е нтацию э кспертов
Отсутствие м етодик
стандартного
набора игр
Требует от аналитика
зна ния осно в
игротехники
Высоки е
профессиональн ые
т ребования к а н алитику
Сложность создания
игр для конкретных
предм етн ых областей
Собеседник или практик
Тре бования
к э ксперту
(раскованность
(тип и кач ес тва) и а ктерское м астерство)
С обеседник
Требовани я
к анал ити ку
( ре жиссерски е
(тип и кач еств а) спос о бности +
ум ение создавать
сце нарии +
а ктерское м астерство)
Требования
к предм етн о й
обл асти
Раскрепощают
экс пертов
Средне и слабо
структурированн ые
и слабо
докум е нтированные
То же
Ком пьютер ные
Привле кают
ди зайном
и дина м и кой
Сложносп.
и высокая цена
создания
специализирован н ых
игр в кон кр етн ой П О
Практик без
психологического
б арьера к ЭВ М
С о б еседни к
Мыслит ел ь
(контакт
( способность к веде нию
с програ м м истом )
ко нферанса +
ре ж иссерс кие
способности + с це нарист +
актерс ко е м астерство)
То же
То же
1 24
Глава 4 • Технологи и инжене р ии знани й
4 . 3 . Текстол о г ические метод ы
Гр уппа текстологических методов объединяет методы извлечения з наний, осно­
ванные на изучении специальных текстов из учебников, монографий, СТ,:iтей, ме­
тодик и др угих носителей п рофессиональных знаний.
В буквальном смысле текстологические методы не относятся к текстологии - на­
уке, которая родилась в русле филологии с целью критического п р очтения лите­
р атур ных текстов, изучения и интер пр етации источников с узкоприкладной за­
дачей - подготовки текстов к изданию. Сейчас текстология расшир ила свои гра­
ницы включен ием аспектов смежных наук - ге рменевтики ( науки правильного
толкования д р евних текстов - библии, античных р укописей и др.), семиотики,
психолингвистики и д р .
'
Текстологические методы извлечения знаний, безусловно, используя основные
положения текстологии, отличаются п р инципиально от ее методологии, во - пер­
вых, характером и п р иродой своих источников (п рофессиональная специал ьная
литер атур а, а не художественная, живущая по своим особым законам) , а во-вто­
рых, жесткой п р агматической нап равленностью извлечения конкретных профес­
сиональных знаний.
С р еди методов извлечения знаний эта группа является наименее разработанной,
по ней практически нет никакой библиографии, поэтому дальнейшее изложение
является как бы введением в методы изучения текстов в том виде, как это пред­
ставляют авторы.
Задачу извлечения знаний из текстов можно сфо рмули ровать как задачу поиима­
иия и выделения смысла текста. Сам текст на естественном языке является лишь
п роводником смысла, а замысел и знания авто ра лежат во вторичной ст руктуре
(смысловой ст р укту р е или мак р ост р укту р е текста), настраиваемой н ад есте­
ственным текстом [ Величковский, Капица, 1 987 ] , или, как сформулировано в
работе [Файн, 1 987 ] , «текст не содержит и не пер едает смысл, а является лишь ин ­
струментом для авто р а текста».
При этом можно выделить две такие смысловые структуры:
М1 - смысл, кото рый пытался заложить автор, это его модель мир а, и М2 - смысл,
кото рый постигает читатель, в данном случае инжене р по знаниям (рис. 4.6), в
проц ессе инте р п р етации 1 . П р и э том Т - это словесное одеяние М1, то есть р езуль­
тат вербализации V.
Сложность процесса заключается в п р инципиальной невозможности совпадения
знаний, обр азующ их М1 и М2 , из -за того , что М1 образуется за счет всей совокуп ­
ности пр едставлений, потребностей, интер есов и опыта авто ра, лишь малая часть
кото р ых находит отражение в тексте Т. Соответственно, и М2 обр азуется в п роцес­
се интерпретации текста Т за счет п р ивлечения всей совокупности научного и че­
ловеческого багажа читателя. Таким образом, два инжене ра по знаниям извлекут
из одного Т две различные модели М i1 и М ; 2 •
125
4.3. Текстол ог и че ские методы
1 •..,;,.,_>
Эксперт
Текст
книги
@
nож�-> �
Инженер
no знаниям
Рис . 4.6. Схема извлечения знани й из специальных текстов
Встает задача: выяснить, за счет чего можно достичь максимальной адекватности
М1 и М2, помня п р и этом, что понимание всегда относительно, поскольку это син ­
тез двух смыслов •свое-чужое• [Бахтин, 1975] .
Рассмотр им подро бнее, какие источники питают модель М1 и создают текст Т.
В работе [Сергеев, 1 987] указаны два компонента любо го научного текста. Это пер­
вичный матер иал наблюдений а и система научных понятий /3 в момент создания
текста. В дополнение к этому, на наш вз гляд, помимо объективных дан'ных э кспе­
р иментов и наблюдений, в тексте обязательно пр исутствуют субъективные взгля­
ды авто ра у, результат его личного опыта, а также некото рые •общие места• или
•вода• 8. Кроме этого, любой научный текст содержит заимствования из дру гих
источников (статей, моно графий) и т. д. П р и этом все компоненты по гружены в
языковую среду L. Можно записать:
Т - ( а, /3 ,уДО ) L.
Таким образом, компоненты научного текста можно представить в виде следую­
щей схемы ( р ис. 4.7). При этом компоненты /3 , у, часть а входят и в модель М1•
т
Рис. 4. 7. Компоненты научно го текста
При извлечении знаний аналитику, интерпретирующему текст, приходится решать
задачу декомпозиции этого текста на перечисленные выше компоненты для выделе­
ния истинно значимых для реализации базы знаний фрагментов. Сложность интер ­
претации научных и специальных текстов заключается еще и в том, что любой текст
1 26
Глава 4 • Техноло ги и инжене р ии зн ани й
приобретает смысл только в контексте, где под контекст ом понимается окружение,
в которое •погружен� текст.
Различают микро- и макроконтекст. Микроконтекст - это ближайшее окруже­
ние текста. Так, предложение получает смысл в контексте абзаца, абзац в контек­
сте главы и т. д. Макроконтекст - это вся система знаний, связанная с предмет­
ной областью (то есть знания об особенностях и свойствах, явно не указанных в
тексте) . Другими словами, любое знание обретает смысл в контексте некоторого .
метазнания.
Теперь несколько подробнее о центральном звене процедуры извлечения зна­
ния - о понимании текста. Классическим в текстологии является определение
немецкого философа и языковеда В. фон Гумбольдта [Фон Гумбольдт, 1 984 ] :
• .. .Люди понимают друг друга н е потому, что передают собеседнику знаки пред•
метов, и даже не потому, что взаимно настраивают друг друга на точное и полное
воспроизведение идентичного понятия, а потому, что взаимно затрагивают друг
в друге одно и то же звено цепи чувственных представлений и зачатков внутрен­
них понятий, прикасаются к одним и тем же клавишам инструмента своего духа,
благодаря чему у каждого вспыхивают в сознании соответствующие, но не тож·
дественные смыслы.•
Говоря на языке современного языкознания, понимание - это формирован�е
•второго текста�, то есть семантической структуры (понятийной структуры)
[ Сиротко-Сибирский, 1 968] . В нашей терминологии - это попытка воссоздания
семантической структуры М1 в процессе формирования модели М2, то есть это
·первый шаг структурирования знаний.
Как происходит процесс понимания I? Одна-из возможных схем изложена в ра­
боте [ Соколов, 1 947; Соколов, 1 968]. Мы внесли несколько изменений в эту схе­
му в связи с тем, что в ней трактуется понимание текста на иностранном языке, а
нас интересует понимание текста в новой для познающего субъекта предметной
области. Кром� этого, дополним ее некоторыми положениями герменевтики.
В целом полученная схема согласуется со стратегией изучения всего нового.
Основными моментами понимания текста являются:
• Выдвижение предварительной гипотезы о смысле всего текста ( предугадыва­
ние).
• Определение значений непонятных слов (то есть специальной терминоло­
гии) .
• Возникновение общей гипотезы о содержании текста (о знаниях).
•
Уточнение значения терминов и интерпретация отдельных фрагментов текста
под влиянием общей гипотезы (от целого к частям).
• Формирование некоторой смысловой структуры текста за счет установления
внутренних связей между отдельными важными ( ключевыми) словами и
фрагментами, а также за счет образования абстрактных понятий, обобщаю­
щи� конкретные фрагменты знаний.
4. 3. Текстологи че ские мет о ды
1 27
•
Корректировка общей гипотезы относительно содержащихся в тексте фраrментов знаний (от частей к целому).
•
Принятие основно й гипотезы, то есть формирование М2•
Следует отметить наличие как дедуктивной (от целого к частям), так и ·индук­
тивной ( от частей к целому) составляющей процесса понимания. Та1<0й двуе­
диный подход позволяет охватывать текст как смысловое единство особого рода,
с е го основными признаками, такими как связность, цельность, закон ч енность
и др. [ Сиротко- Сибирский, 1 968] .
Центральными моментами процесса I являются шаги 5 и 7, то есть формирование
смысловой структуры или выделение •опорных• , ключевых, слов или •смысло­
вых вех• [ Сирот ко - Сибирский, 1 968] , а также заключительное связывание
•смысщ>вых вех• в единую семантическую структуру.
При анализе текста важно выявление внутренних связей между отдельными эле­
ментами текста и понятиями. Традиционно выделяют два вИда связей в тексте эксrтицитные (или явные связи), которые выражаются во внешнем дроблении
текста, и имплицитные ( скрытые связи). Эксплицитные связи делят текст на па­
раграфы с помощью перечисления компонентов , в водных слов ( или коннекто­
ров) типа •во-первых ... , во-вто рых... , однако и т. д.• . Имплицитные, или внут­
ренние, связи между отдельными •смысловыми вехами• вызы вают осн овное
затруднение п ри понимании.
И так, семант�ческая структура текста образуется в сознании познающего субъек­
та с помощью знаний о языке, знаний о мире, а также общих (фоновых) знаний
в той предметной обЛ,\СТИ, которой посвящен текст. •TeKCTj,l пишут для посвя­
щенных • . Другими словами, если текст не является науч но-популярным, то для
его адекватного прочтения требуется некоторая подготовка.
Таким образом, путь к знаниям удлиняется еще на одно звено. Если мы раньше
говорили, что сами текстологические методы редко употребляются как самостоя­
тельный метод извлечения, а обыч но используются как некоторая подготовка к
коммуникативному взаимодействию, то теперь утверждаем, что и для прочтения
текстов нужна подготовка. Какая же?
Подготовкой к проч тению специальных текстов является выбор совместно с эк­
спертами некоторого •базового• списка литературы , который постепенно введет
аналитика в предметную область. В этом списке могут быть уч ебники для начи­
нающих, главы и фрагменты из монографий, популярные издания. Только после
ознакомления с «базовым• списком целесообразно приступать к чтен ию специ­
альных текстов.
Таким образом, на проц есс п онимания (или интерпретации) 1 и модель М2 вли яют следующие компоненты (рис. 4.8):
• экстракт компонентов (а, (3, у, 0)', почерпнутый из текста Т;
• предварительные знания аналитика о предметной области оо;
•
общенауч ная эрудиция аналитика Е;
•
его лич ный опыт q,.
128
Глава 4 • Технологии и нже н е р ии зн а н ий
М2 - [(а, (3, у, 0)', ro, е, <Р],
Процесс 1 - это сложный, не поддающийся формализации процесс, на который
существенным образом влияют такие чисто индивидуальные компоненты, как
когнитивный стиль познания, интеллектуальные характеристики и др.
Экстракт текста Т
(Cl, JS,f, 8 )
Рис. 4 . 8 . Компоненты формиро вания смысла текста
Но процедура разбивки текста на части ( • смысловые группы� ), а затем сгущение,
сжатие содержимого каждого смыслового куска в • смысловую веху� является,
видимо, основой для любого индивидуального процесса понима�шя. Такая комп­
рессия: (сжатие) текста в виде набора ключевых слов, передающих основное со­
держание текста, может служить удобной методологической основой для прове­
дения текстологических процедур извлечения знаний.
В качестве ключевого слова может служить любая часть речи ( существительное,
прилагательное, глагол и т. д.) или их сочетание. Набор ключевых слов ( И КС) это набор опорных точек, по которым развертывается текст при кодировании в
память и осознается при декодировании, это семантическое ядро цельности [ Си­
ротко-Сибирский, 1 968] .
Прим ер 4 .7
В кач_естве примера при ведем результаты эксперимента по формированию Н КС. Зна­
ния извлекались из следующего текста [Уэно, Исидзука, 1989].
•Теория фреймов относится к психологическим понятиям, касающимся понимани я ·
того, что мы видим и слышим. Эти способы воспр и ятия трактуются с последователь­
ной точки зрения, на их основании осуществляется концептуаль ное моделирование,
целесообразность полученных моделей исследуется вместе с различными проблемами,
возникающими в этих двух областях.
Для осознания того факта, что заданная и н формация в этих областях имеет единствен ­
ный смысл, человеческая память прежде всего должна быть способна увязывать эту
информацию со специальными концептуальн ы ми объектами. В проти вном случае не
удается систематизировать информацию, которая выглядит разрозненной. В основе
теории фреймов лежит восприятие фактов посредством сопоставлен и я полученной
извне информации с конкретными элементами и значениями, а также с рамками, опре'
4.3. Те кстол огические ме тод ы
1 29
деленными для каждого концептуального объекта в нашей памяти. Структура, п ред­
ставляющая; эти рамки, называется фреймом . Поскольку между различными 1<онцеп­
туальными объектами имеются некоторые аналогии, то образуется иерархическая
структура с классификационными и обобщающи м и свойствами. Собственно, она пред­
ставляет собой иерархическую структуру отношений типа •абстрактное-конкретное• .
.Сложные объекты представлены комбинацией нескольких фреймов, другими словами,
они соответствуют фреймовой сети. Кроме того, каждый фрейм дополняется связан­
ными с ним фактами и процедурой, обеспечивающей выполнение запросов к другим
фреймам.
Причиной, по которой представление знаний фреймам и в ыглядит до статочно
точным , является возможность более полного описания процесса мышления че­
ловека посредством определения крупной и структурированной основной едини­
цы представления знаний и более тесной связи знаний, ос нованных на фактах, и
процедурных знаний. Тем не менее, как было отмечено ее автором, теор�,:ю фрей­
мов следует скорее отнести к теории по становки задач, чем к результативной тео­
рии. Можно считать, что она существенно повышает уровень и детализирует ме­
ханизм памяти человека, выводов, понимания и обучения.•
В группе из 34 испытуемых не было получено ни одного совпадающего Н КС и,
соответственно, все структуры с ущественно отличались. Для примера приведем
две работы (рис. 4.9, а, 6).
Интересно, что одна из гипотез линrвостатистики о том, что наиболее употребля­
емые слова являются наиболее важными с точки зрения содержания текста, то
есть отражают ero тематическую структуру, частично подтвердилась.
Следует сказать несколько слов о том, почему мы выделяем три вида текстоло ги­
чес1шх методов ( см. рис. 4 . 1 ):
•
анализ специальной литературы;
•
анализ учебников;
•
анализ методик.
Перечисленные три метода существенно отличаются, во-вторых, по степени 1<он­
центрированности специальных знаний, и, во - вторых, по соотношению специ­
альных и фоновых знаний. Наиболее просtым методом является анализ учеб­
ников, в которых логика изложения обычно соответствует ло гике предмета
и поэтому макроструктура такого текста будет, наверное, более знач има, чем
структура текста какой - нибудь специальной статьи. Анализ м етодик затруднен
как раз сжатостью изложения � практическим отс утствием комментариев, то есть
фоновых знаний, облегчающих понимание для неспециалистов. Поэтому мож­
но рекомендовать для практическо й работы комбинацию перечисленных мето­
дов.
В заключение предложим одну из возможных практических методик анализа тек­
стов с целью извлечения и структурирования з наний.
1 30
Гла ва 4 • Технологии инженер.ии зн а ний
Абстра ктное 1------1� Моделирование
(видим, слышим)
Знания, основанные Процедурные
знания
на фактах
Конкретное
Концептуальный
объект
Процедуры
Сложный
объект
Факт
Конкретное t--t--,-+--­
значение
Конкретны
зпементы
Фрайм
(рамки)
Фреймовая
сеть
Механизм памяти (теория фреймов) ·
Сопоставление
8
<теория фреймов ТФ
(ISA - теория постановки задач),
(АКО - психологическое понятие),
(НАЗНАЧЕНИЕ - систематизация+
описание мышления).
(П РИНЦИП - восприятие внешних факторов
и сопоставление с фреймами),
( ОС НОВНОЕ ПОНЯТИЕ - фрейм, сеть фреймов)>
<фрейм
(ISA - понятие ТФ) ,
(ОПРЕДЕЛЕНИЕ - •.. ),
)>
(...
б
Рис. 4.9. Примеры смысловых структур, извлеченных из текста
, 4.4. П ростей шие м етоды структуир ов а ни я
1 31
Алгоритм извлечения знаний из текста
1. Составление •базового• списка литературы ДЛЯ ознакомления с предмет­
ной областью и чтение по списку.
2. Выбор текста для извлечения знаний.
3. Первое знакомство с текстом (беглое прочтение). Для определения зна­
чения незнакомых слов - консультации со специалистами или привле­
чение справочной литературы.
4. Формирование первой гипотезы о макроструктуре текста.
5. Внимательное прочтение текста с выписыванием ключевых слов и выра­
жен·и й, то есть выделение •смысловых вех• (компрессия текста).
6. Опре�еление связей между ключевыми словами, разработка макрострук­
туры текста в форме графа или •сжатого• текста (реферата).
7. Формирование поля знаний на основании макроструктуры текста.
4 . 4 . П ростейшие методы структурирован ия
Методы извлечения знаний, рассмотренные выше, являются непосредственной
подrотов1,ой к структурированию знаний. Данный параграф посвящен изучению
практических методов структурирования знаний.
4 . 4 . 1 . Алгоритм для «чайников»
В качестве простейшего прагматического подхода к формированию поля зна­
ний начинающему инженеру по знаниям можно предложить следующий алrо­
ри-rм дл� •чайников• ( рис. 4.1 0).
1. Определение входных {Х} и выходных {У} данных. Этот шаr совершенно необ­
ходим, так как он определяет направление движения в поле знаний - от Х к У.
Кроме того, структура входных и выходных данных существенно влияет на
форму и содержание поля знаний. На э.том- шаrе определение может быть до­
статочно размытым, в дальнейшем оно будет уточняться.
2. Составление словаря терминов и наборов ключевых слов N. На этом шаге про­
водится текстуальный анализ всех протоколов сеансов извлечения знаний и
выписываются все значимые. слова, обозначающие понятия, явления, процес­
сы, предметы, действ,ия, признаки и т. п. При этом следует попытаться разобраться в значении терминов. Важен осмысленный словарь.
3. Выявление объектов и понятий {А}. Производится •просеивание• словаря N и
выбрр значимых для принятия решения понятий и их признаков. В идеале на
этом шаге образуется полный систематический набор терминов из какой-либо
области знаний.
4. Выявление связей между понятиями. Все в мире связано. Но определить, как
направлены связи, что ближе, а что дальше, необходимо на этом этапе. Таким
132
5.
6.
7.
8.
Гл а в а 4 • Тех нол о гии инже нерии знан ий
образом, строится сеть ассоциаций, где связи только намечены, но пока не по­
именованы. Например, понятия •день•, •ночь•, •утро• и •вечер• явно как-то
связаны, связаны также и понятия •красный флаг• и � красный галстук• , но
характер связи тут существенно отличен.
Выявление метапонятий и детализации понятий. Связи, полученные на пре­
дыдущем шаге, позволяют инженеру по знаниям структурировать понятия и
как выявлять понятия более высокого уровня обобщения (метапонятия), так и
детализировать на более низком уровне.
Построение пирамиды знаний. Под пирамидой знаний мы понимаем иерар­
хическую лестницу понятий, подъем по которой означает углубление понима­
ния и повышения уровня абстракции (обобщенности) понятий. Количество
уровней в пирамиде зависит от особенностей предметной области, профессио­
нализма экспертов и инженеров по знаниям.
Определение отношений { RA}. Отношения между понятиями выявляются ка:к
внутри каждого из уровней пирамиды, так и между уровнями. Фактически на
этом шаге даются
имена тем связям, которые обнаруживаются на шагах 4 и 5, а
1
также обозначаются причинно-следственные, лингвистические, временные и
другие виды отношений.
Определение стратегий принятия решений (Sr). Определение стратегий при­
нятия решения, то есть выявление цепочек рассуждений, связывает все сфор­
мированные ранее понятия и отношения в динамическую систему поля зна­
ний. Именно ст.ратеrии п ридают активность знаниям, именно они •пе­
ретряхивают• модель М в поиске от Х к У.
Оп ределе ни е в ходных и выходных данных
Сосrавпение словаря терми нов
Выявnение объе ктов , понятий и их атрибутов
Выявnение связе й между понятиями
Выделение метаnонятий и детализация понятий
Построе н ие пирамиды знаний
О предвnе ние отнош е ний
Определение стратегии п ринятия решения
Структурирование поля знаний
Рис. 4. 1 0. Стади и структурирования зна ний - алгор итм для «ча йн иков»
4 . 4 . Просте й ш ие м етоды структуриро ва н ия
1 33
Однако на практике при использовании данного алгоритма можно столкнуться с
непредвиденными трудно�ями, связанными с ошибками на стадии извлечения
знаний и с особенностями знаний различных предметных областей. Тогда воз­
можно привлечение других, более •прицельных» методов структурирования.
При этом на разных этапах схемы (рис. 4. 1 0) возможно использование различных
методик.
4 . 4 . 2 . Спе циальн ы е метод ы структурир ования
Используя представленный на рис. 4.1 О алгоритм, инженер по знаниям может
испытывать необходимость в применении специальных методов структурирова­
ния на разных шагах алгоритма. При этом, естественно, для таких простых и оче­
видных шагов, как определение входных и выходных понятий или составление
словаря, никаких искусственных методов предлагаться не будет.
Методы в ыявл ен ия объектов , п о н ятий и и х атрибуто в
Понятие или концепт - это обобщение предметов некоторого класса по их спе­
цифическим признакам. Обобщенность является сквозной характеристикой всех
1<0гнитивных психических структур, начиная с простейших сенсорных образов.
Так, понятие •автомобиль» объединяет множество различных предметов, но все
они имеют четыре колеса, двигатель и массу других деталей, позволяющих пере­
возить на них грузы и людей. Существует ряд методов выявления понятий пред­
метной области в общем словаре терминов, который составлен на основании се­
ансов извлечения знаний. При этом важно выявление не только самих понятий,
но и их признаков.
Возвращаясь к терминологии, введенной в параграфе 1 .3 , на этом этапе опреде­
ляются также интенсионалы и экстенсионалы понятий предметной области. Ин­
тенсионал очерчивает пЬнятие через взаимосвязь значимых признаков, а эк­
стенсионал - через перечисление конкретных экземпляров объекта.
Если задача выделения реальных объектов А связана только с наблюдательнос­
тью и лингвистическими способностями эксперта и инженера по знаниям, то оп­
ределение метапонятий В требует от них умения проводить операции обобщения
и классификации, которые никогда не считались тривиальными.
Поспелов Д. А. [ Поспелов, 1 986] предложил ряд подходов к созданию основ тео­
рии обобщения и классификации применительно к ситуационному управле­
нию и искусственному интеллекту в целом, а также выделил ряд особенностей
задач формирования понятий. Среди них особое место занимает выявление
прагматически значимых признаков для формирования понятий, способствую­
щих решению задачи.
Сложность заключается в том, что для многих понятий практически невозможно
однозначно определить их признаки, это связано с различными формами репре­
зентации понятий в памяти человека.
1 34
Гла ва 4 • Тех нологии ин жен ер ии знаний
Все методы выявления понятий мы разделили на:
• традиционные, основанные на математическом аппарате распознавания образов и классификации;
• нетра ди ционные, основанные на методологии инженерии знаний.
Если первые достаточно хорошо освещены в литературе, то вторые пока менее из­
вестны.
Пример 4.8
Интересный экёперимент по выявлению понятий описан в работе [Кук, Макдональд,
1�86).
Тридцати студентам, имеющим права на вождение автомобиля, предложили составить
словарь терминов предметной области с помощью четырех методов:
1. Формирование перечня понятий ( 1 7 %).
2. Интервьюирование специалистов (35 %).
3. Составление списка элементарных действий ( 18 %).
4. Составление оглавления учебника (30 %).
Цифры в скобках характеризуют продуктивность соответствующего метода,
то есть показывают, какой процент понятий из общего выявленного списка (702 тер­
мина) был получен соответствующим методом. Для классификации понятий были
привлечены еще два участника эксперимента, которые разделили 702 выявленных по­
нятия на семь категорий (методом сортировки карточек). Таблица 4.5 отражает чис­
ленные данные концептуализации.
Таблица 4.5. Данны е ко нцептуализации
Категории
О бъяснение
О бщие правила
Режимные
правила
Понятия
П роцедуры
Факты
П рочие
по нят ия
Процент от общего числа терминов, поnученныА
Процент
соответствующим
от общего
числа терминов методом
Перечень
п о нятий
Интервьюирование
Списо к
о иераций
Составление
о главления
6
22,0
9,0
5,5
43,6
9,8
7 ,2
1 8,9
8,4
7,0
36,8
1 1 ,6
4, 9
4, 9
6,6
42,0
9 ,0
9,0
1 8,4
5, 1
1 5,0
38,9
9,5
1 2,5
8, 5
25,6
8,9
77,7
1 ,2
1 ,2
2,6
4,6
1 ,6
3,0
3,5
В целом результаты показали, что для выявления непосредственно концептов
наиболее результативными оказались методы интервьюирования и составления
оглавления учебника. Однако наибольшее число общих правил было порождено
в методе списка действий. Таким образом, еще раз подтвердилось утверждение о
том, что нет •лучшего• метода, есть методы, подходящие для тех или иных ситу�­
ций и типов знаний.
4,4 . П ростейшие методы стру'iсrурирования
135
Интересно, что число правил - продукций •если - то • - с оставило небольшой
проц�нт во всех четь�рех методах. Это говорит о том, что популярная продукци­
онная модель вряд ли является естественной дЛЯ человеческих моделей репрезен­
тации знаний.
Методы выявл ения с вязей между п онятия м и
Концепты не существуют независимо, они включены в общую понятийную
структуру с помощью отношений. Выявление связей между понятиями при раз­
работке баз знаний доставляет инженеру по знаниям немало проблем. То, что зна­
ния в памяти - это некоторые связные структуры, а не отдельные фрагменты,
общеизвестно и очевидно. Тем не менее основной упор в существующих моделях
представления знаний делается на понятия, а связи вводят весьма примитивные
(в основном причинно-следственные).
В последних работах по теории ИИ все больше внимания уделяется взаимосвя�
занности структур знаний. Так, в работе [Шенк, Бирнбаум, Мей, 1989) введено
понятие сценария (script) как некоторой структуры представления знаний. Ос­
нову сценария составляет КОП (концептуальная организация памяти) и мета­
КОПы - некоторые обобщающие структуры.
Сценарии, в свою очередь, делятся на фрагменты - или сцены (chunks). Связи
между фрагментами - временные или пространственные, внутри фрагмента самые различдые: ситуативные, ассоциативные, функциональные и т. д.
Все методы выявления таких связей можно разделить на две группы:
• Формальные.
• Неформальные ( основаны на дополнительной работе с экспертом).
Неформальные методы выявления связей придумывает инженер по знаниям для
того, чтобы вынудить эксперта указать явные и неявные связи между понятиями.
Наиболее распространенным является метод •сортировка карточек• в группы
[ Волков, Ломнев, 1989; Rabblts, Wright, 1987), широко применяемый и для фор­
мирования понятий. Другим неформальным методом является построение замк­
нутых кривых. В этом случае эксперта просят обвести замкнутой кривой свя·­
занные друг с другом понятия [ Olson, Reuter, 1 987) . Этот метод может быть
реализован как на бумаге, так и на экране дисплея. В этом случае можно говорить
о привлечении элементов когнитивной графики [Зенкин, 1 99 1 ).
После того как определены связи между понятиями, все понятия как бы распада­
ются на группы. Такого рода группы представляют собой метапонятия, присвое­
ние имен которым происходит на следующей стадии процесса структурирования.
Методы выдел е ни я мет а п онятий и детали за ц ия п он я тий
(п ирамида з наний )
Процесс образования метапонятий, то есть интерпретации групп понятий, полу­
ченных на предыдущей стадии, как и обратная пр<:щедура - детализация (разук­
рупнение) понятий, - видимо, принципиально не поддающиеся формализации
операции. Они требуют высокой квалификации экспертов, а также наличия спо­
собностей к •наклеиванию• лингвистических ярлыков. Если на рис. 4. 1 1 показа-
136
Гл а ва 4 • Техноло гии и нженерии з на н ий
ны схемы обобщения и детализации на тривиальных примерах, то в реальных
предметных областях эта задача оказывается весьма трудоемкой. При этом неза­
висимо от того, формальными или неформальными методами были выявлены
понятия или детали понятий, присвоени� имен которым или интерпретация их всегда неформальный процесс, в котором инженер по знаниям просит эксперта
дать название некоторой группе понятий или отдельных признаков.
li
Рис. 4. 1 1 . Обобщение и детализация понятий
Это не всегда удается. Так, в системе АВТ АНТЕСТ [Гаврилова, Червинская,
1 992] при образовании метапонятий, полученных методами кластерного анализа,
интерпретация заняла несколько месяцев и не может считаться удовлетворитель­
ной. Это связано с тем, что формальные методы иногда выделяют «искусствен­
ные» концепты, в то время как неформальные обычно - практически исполь­
зуемые и потому легко узнаваемые понятия.
Методы построения пирамиды знаний обязательно включают использование на­
глядного материала - рисунков, схем, кубиков. Уровни пирамиды чаще возника­
ют в сознании инженера по знаниям именно как некоторые образы.
Построение пирамиды знаний может быть основано и на естественной иерархии
предметной области, например связанной с организационной структурой пред­
приятия или с уровнем компетентности специалистов (рис. 4.12).
Знания консультанта
uз
З нания медсестры
U1
Знания глав ного технолога
uз
Знания технолога цеха
U1
Знания врача
Знания начальника цеха
Р ис . 4. 1 2. П и рамиды знаний
U2
U2
4. 5 . Состоян ие и перс пе ктив ы автом атизиро ва нно го приобрете н и я знаний
1 37
М етоды о пре делени я от,ноw е ни й
Если на стадии 4 (см. рис. 4. 1 0) мы выявили связи между понятиями и использо­
вали их на стадиях 5 и 6 для получения пирамиды знаний, то на стадии ? мы даем
имена связям, то есть превращаем их в отношения.
В работе [ Поспелов, 1 986) указывается на наличие более 200 базовых видов раз­
личных отношений, существующих между понятиями. Предложены различные
классификации отношений [ Келасьев, 1984; Поспелов, 1 986]. Следует только
подчеркнуть, что помимо универсальных отношений (пространственных, вре­
менных, причинно-следственных) существуют еще и специфические отноше­
ния, присущие той или иной предметной области [ Гаврилова, Червинская,
Яшин, 1988).
Интересные возможности к структурированию знаний добавляют системы ког­
нитивной графики. 'Гак, в системе OPAL [Olton., Muser, Combs et al., 1987] экс­
перт может манипулировать на экране дисплея изображениями простейших по­
нятий и строить схемы лечения заболеваний, обозначая отношения явными
линиями, которые затем именуются.
Предлагаемая в данном учебнике методология структурирования опирается на
современные представления о структуре человеческой памяти и формах репре­
зентации информации в ней [Величковский, 1982].
Скудность методов структурирования объясняется тем, что методологическая
база и нженерии знаний только закладывается, а большинство инженеров 110 зна­
ниям проводит концептуализацию, руководствуясь наиболее дорогими и неэф­
фективными способами - •проб и ошибок• и •по наитию•, то есть исходя из со­
ображений здравого смысла.
4 . 5 . Состоя ние и перспективы
автоматизированного
приобретения знаний
В данном параграфе мы рассмотрим автоматизированный подход I< проблеме из­
влечения и структурирования знаний, традиционно называемый приобретен ием
знаний (knowledge acquisition).Пocкoлькy основную трудность в создании интеллектуальных систем представ­
ляет домашинный этап проектир о ва н ия, выполняемый инженером по знаниям
(или аналитиком), - анализ предметной области, получение знаний и их струк­
турирование, - эти процедуры традиционно считаются •узким местом• (bottle­
neck) проектирования экспертных систем [Gaines, 1 987; Boose, 1 990]. Последние
5-6 лет усилия разработчиков направлены на создание инструментальной про­
граммной поддержки деятельности инженера по знаниям и эксперта именно на
этих этапах.
1 38
Глава 4 • Тех н �ло гии ин женери � знаниV.
4 . 5 . 1 . Эволюция систем приобретения знаний
Первое поkоление таких систем появилось в середине 80-х - это так называемые
системы приобретения знаний (СПЗ) (TEIRESIAS [Davis, 1982 ), SIMER+
MIR [ Осипов, 1988], АРИАдНА [ Моргоев, 1988]). Это средства наполнения так
называемых •пустых• ЭС, то есть систем, из БЗ которых изъяты знания (напри­
мер, EMYCIN - Е МРТУ MYCIN, опустошенная медицинская ЭС MJCIN со спе­
циальной диалоговой системой заполнения базы знаний TEI RESIAS). Их авто­
ры считали, что прямой диалог эксперта с компьютером через СПЗ поможет
сократить жизненный цикл разработки. Однако опыт создания и внедрения СПЗ
продемонстрировал несовершенство такого подхода.
Основные недостатки СПЗ I поколения:
• Слабая проработка методов извлечения и структурирования знаний.
• Жесткость модели представления знаний, встроенной в СПЗ и связанной с
привязкой к программной реализации.
• Ограничения на предметную область.
Таким образом, традиционная схема разработки СПЗ I поколения:
создание конкретной ЭС ➔ опустошение БЗ ➔ разработка СПЗ для новых
наполнений БЗ ➔ формирование новой БЗ для другой ЭС
1
оказалась несостоятельной для промышленного применения.
Второе поколение СПЗ появилось в конце 80-х и было ориентировано на более
. широкий модел�ный подход [Gaines, 1989; Борисов, Федоров, Архипов, 1991] с
акцентом на предварительном детальном анализе предметной области. Так, в Ев­
ропе широкое применение получила методология KADS (Knowledge Acquisition
and Documentation Structuring) [Wielinga et al. , 1989] , в основе которой лежит
понятие интерпретационной модели, позволяющей процессы извлечения, струк­
турирования и формализации знаний рассматривать как •интерпретацию• линг­
вистичес�их знаний в другие представления и структуры.
КАDS- м етодоло гия
Рисунок 4.13 демонстрирует преобразование знаний согласно методологии KADS
[ Breuker, Wielinga, 1989] через спецификацию пяти шагов анализа «идентифика ­
ция - концептуализация - гносеологический уровень - логический уровень - уро ­
вень анализа выполнения• и стадии или пространства проектирования.
Результатом анализа является концептуальная модель экспертизы, состоящая из
четырех уровней (уровня области - уровня вывода ...,.. уровня задачи - стратеги ­
ческого уровня), которая затем вводится в пространство проектирования и преоб­
разуется в трехуровневую модель проектирования (рис. 4.14).
При решении реальных задач KADS использует библиотеку интерпретацион­
ных моделей, описывающих -общие экспертные задачи, такие как диаmостика,
мониторf1НГ ·(см. классификацию 1 из п. 2.2) и пр., без конкретного наполнения
объектами предметной области. Интерпретацuонная модель представляет собой
;_4 . 5 . Состоя ние и перспекти в ы авто матизиро ванно го прио брете ния знаний
1 39
концептуальцую МОJ;\,ель без уровн� области. На основаниtt извлеченных лин�и­
стических данных происходит отбор, комбинация и вложение верхних уровней
модели, то есть уровней вывода и задачи, которые наполняются конкретными
объектами и атрибутами из уровня области и представляют в результате концеп­
туальную модель рассматриваемой задачи. На рис. 4 .15 представлена модель
жизненного цикла KADS.
Л ингвистические
данные
Концептуальная
модел ь
М одель
проектирования
Детальная модель
проектирования
Коды
1
1
111
1
с:
1
!&
1
i
с:
\--\
Концептуальный
уровень
\�\
\
Лоrический
уровень
1!
i
111
�
Уровень
анализа
выполнения
Рис. 4. 1 3. Методология КADS
Первые системы программной поддержки КАDS-методолоrии представлены на­
бором инструментальных средств KADS Power Tools [Schreiber G., Breuker J. et al.,
1 988]. В этот набор входят следующие системы: редактор протоколов PED (Pro­
tocol Editor); Редактор системы понятий ( Concept Editor); Редактор 1<онцепту­
альных моделей СМЕ (Conceptual Model Editor) и ИМ-библиотекарь IML (Inter­
pretation Model Librarian).
Редактор протоколов - программное средство, помогающее инженеру по знани­
ям в проведении анализа знаний о предметной области на лингвистичес1шм уров­
не. При работе со знаниями на этом уровне исходным• материалом являются тек­
сты (протоколы) - записи интервью с экспертом, протоколы •мыслей вслух• и
любые другие тексты, nолезные с точки зрения инженера знаний. Редактор про­
токолов реализован как гипертекстовая система, обеспечивающая выделение
фрагментов в анализируемом тексте, установление связей между фрагментами,
группирование фрагментов, аннотирование фраrментов. Фрагменты могут иметь
любую ,длину - от отдельного слова до протокола в целом. Фрагменты могут пе­
рекрывать друг друга.
Глава 4 • Технол о гии инже н е р ии знаний
1 40
Планы
Стратеrически й
уровень
Контроли рует
Уровень
з адач и
----1 Метаправила
Цепи
�-- З
адачи
П рим�няет
уРоввнь
вывода
Уровень
задачи
Метаклассы
.____ Источники
знаний
Оп и сывает
Структуры
Рис. 4. 1 4. Осно вные модел и'КАDS
Возможны следующие типы связей между фрагментами:
• аннотация ( связь между фрагментом протокола и некоторым текстом, введен.­
ным инженером знаний для спецификации этоrо фрагмента);
• член группы ( связь между фрагментом и названием - именем rруппы фраг­
ментов; объединение фрагментов в rруппу позволяет инженеру знаний струк­
турировать протоколы, при этом rруппа фрагментов получает уникальное
имя );
• поименованная связь ( связь между двумя фрагментами, имя связи выбирает­
ся инженером знаний);
• по нятийная �вязь (поименованная связь между фрагментом и понятием; обычно используется, если фрагмент содержит определение понятий).
Редактор понятий помогает инженеру знаний организовывать предметные зна­
ния в виде набора понятий и связывающих их.отношений. Каждое понятие име­
ет имя и может иметь атрибуты; каждый атрибут может иметь значение. Какие
именно атрибуты используются - это определяет инженер знаний с учетом спе­
цифики предметной области. С помощью Редактора понятий инженер знаний
может вводить произвольные отношения между понятиями и создавать иерар­
хические структуры по тому или иному отношению. Существует единственное
отношение (ISA), семантю(а которого свстроена» в Редактор. Если инженер зна­
ний устанавливает это отношение между двумя понятиями, то имеет место на­
следование атрибутов.
4.5. С остояние и п ерсп е ктивы автом атизированного п р иобретения знани й
1 41
Извпечение
лингвистически х
данных
Библиотека
интерп ретацион ных
модепей
Отбор
интерпретационных
модепей
Планирование
На блюдение
Диаrностика
· Комбинация и
впожения верхн их
· уровней моделей
Планировение
Модеnи реаnьноrо мира
Вложение
на уровне
области
Концеnтувпьная
модель
Рис . 4. 1 5. Жиз н ен н ый цикл КADS
ИМ-библиоте карь помогает инженеру знаний проводить анализ предметных зна­
ний на эпистемологическом уровне. Основное назначение Библиотекаря состоит
в том, чтобы помочь инженеру знаний выбрать одну или более ИМ, подходящих
для исследуемой проблемной области (ПО). Помощь Библиотекаря проявляется
в чисто информацио!-IНОМ аспекте. Вначале Библиотекарь демонстрирует пользо­
ватещо иерархию типов задач, для которых в библиотеке имеются ИМ. После
тоrо как пользователь выбрал интересующую ero ИМ, ему демонстрируется ее
краткое описание и список атрибутов, включающий в себя следующие атрибуты:
•краткое описание•, •определение•, 4:структура задачи•, •стратегии•, •ПО-зна-
1 42
Глав а 4 • Технологии инжен ер ии зна ний
нИЯ!>. Выбрав атрибут «определение�, , пользователь сможет увидеть на экране
графическое изображение структуры вывода, элементами которой являются ис­
точники знаний и метаклассы. Как источники знаний, так и метаклассы имеют
сври наборы атрибутов; инженер знаний может просмотреть их, указывая на со­
ответствующий элемент.
Пс и хо с е ман ти ка
Помимо идеологии KADS на разработку СПЗ II поколения большое влияние
оказали методы смежных нау1<, в частности психосемантики, одного из молодых
направлений прикладной психологии [Петренко, 1 988; Шмелев, 1983], перспек­
тивного инструмента, позволяющего реконструировать сема1пическое простран­
ство памяти и тем самым моделировать глубинные структуры знаний эксперта
(см . параграф 5. 1 ). Уже первы е приложен l!я психосемантики в И И в середине
80-х годов позволили получить достаточно наглядные результаты [Кук, Макдо­
нальд, 1986] . В дальнейшем развитие этих методов шло по линии разрабоп<И
удобных пакетов прикладных программ, основанных на методах многомерно­
го шкалироnания, факторного анализа, а также специализированных методов
обработки репертуарных решеток [ Франселла, Ваннистер, 1 987] (параграф 5.2).
Примерами СПЗ такого типа являются системы KELLY [ Похилько, Страхов,
1990], MADONNA [Терехина, 1988], MEDIS [Алексеева и др., 1 989] . Специфи­
ка 1<онкретных приложений требовала развития также «нечисленнЫХ!> методов,
использующих парадигму логического вывода. Примерами систем этого направ­
ления служат системы ETS [Boose, 1986] и AQUINAS [Boose, Bradshaw, Scheшa,1988].
Успехи СПЗ II поколения позволили значительно расширить рынок Э С, кото­
рый к концу 80-х оценивался в 300 млн долларов в год [ Попов, 1 99 1 ] . Тем не менее
и эти системы были не свободны от недостатков, 1< важнейшим из которых можно
отнести:
• несовершенство интерфейса, в результате чего неподготовленные эксперты не
способны овладеть системой и отторгают ее;
• сложность настрой1<и на конкретную профессиональную языковую среду;
• необходимость разработки дорогостоящих лингвистических процессоров для
�нализа естественно-язы1<овых сообщений и текстов.
Третье поколение СПЗ - КЕА TS [ Eisenstadt et al., 1990], МАСЛО [Aussenac­
Gilles, Natta, 1 992] , NEXPERT-O BJ ECT [NEXPERT-OBJECT, 1990] - перенес­
ло акцент в проектировании с эксперта на инженера по знаниям [Гаврилова,
1988; Gruber, 1 989] . Новые С П З - это программные средства для аналитика,
более сложные, гибкие, а главное использующие графические возможности со­
временных рабочих станций и достижения САSЕ-технолоrии (Computer-Aided
Software Engineering). Эти системы позволяют не задавать заранее интерпрета­
ционную модель, а формировать структуру БЗ динамически.
Существуют различные классификации СПЗ - по выразительности и мощнос­
ти инструментальных средств [ Попов, 1 988]; по обобщенным характеристикам
[Boose, 1990] ; в рамках структурно-функционального подхода [ Волков, Ломнев,
1989]; интегрированная классификация предложена в работе [Гаврилова, Чер­
винская, 1992].
4.5 . Со сто яние - и перс пективы а втоматизированно го п риобретения знаний
1 43
Учитывая новейшие :rенденции в инженерии знаний можно предложить следую·
щую схему таксономии СПЗ, представленную на рис. 4. 16.
i�
с ::::Е
i! �
i1
}
о
с:
о
с: 15
15
Jj1
i
!
8
�
i
j§
J
I
1 1 -- 11 1
1!! В� 'D
u!. t
ф
1
i
..:
l
J
1
1i
1:1
1
!
f !s
!
1l
1
1�,�
!
11 j 1 1l i 1 1
J 1 1
�
� �
1
С)
i
:z:
Рис. 4 . 1 6. Кл ассификация систем приобретения з наний
Однако и современные СПЗ не полностью лишены серьезных недос татков СПЗ
1 и II поколений, большая ч асть которых обусловлена отсутствием теоретической
концепции проектирова ния БЗ. ,в результате эта область до нас тоящеrо времени
справедливо считается скорее •и скусством•, чем наукой и основана на «ad hoc•
технологии (то есть применительно к случаю).
4 . 5 . 2 . Совре-м енное состояние
автоматизированных систем
приобретения знаний
Анализ с овременного состояния программных средств приобретения зн а ний и
поддержки деятельнос ти инженера по ,JНаниям позволяет выявить две групп ы
проблем, характерных для существующих СПЗ:
• Методологич еские проблемы.
• Технологич е ские проблемы.
1 44
Глава 4 • Техн ологии инженер ии знаний
А. Методологические проблемы
Основная проблема, встающая перед разработчиками, - отсутствие теорети­
ческого базиса процесса извлечения и структурирования знаний - порождает
дочерние более узкие вопросы и казусы на всех этапах создания интеллектуаль­
ных систем. Даже тщательно проработанная методология KADS, описанная в пре­
дыдущем параграфе, страдает громоздкостью и явной избыточностью. Н1iже пе­
речислены наиболее общие из возникающих проблем в последовательности,
соответствующей стадиям жизненного цикла (см. рис. 2.4):
• размытость критериев выбора подходящей задачи;
• слабая проработанность теоретических аспектов процессов извлечения зна­
ний (философские, лингвистические, психологические, педаrоrичес1ше, ди­
дактические и другие аспекты), а также отсутствие обоснованной классифи­
кации методов извлечения знаний и разброс терминологии;
• отсутствие единого теоретического базиса процедуры структурирования зна­
ний;
• жесткость моделей представления знаний, заставляющая разработчиков обед­
нять и урезать реальные знания экспертов;
• несовершенство математического базиса моделей представления знаний (дес­
криптивный, а не конструктивный характер большинства имеющихся матема­
тических моделей);
• эмпиричность процедуры выбора программного инструментария и процесса
тестирования (отсутствие критериев, разрозненные классификации, etc. ).
Б. Техн ологические проблемы
Большая часть технологических проблем является естественным следствием ме­
тодологических и порождена ими. Наиболее серьезными из технологических
проблем являются:
• отсутствие 1юнцептуальной целостности и согласованности между отдельны­
ми приемами и методами инженерии знаний;
• недостаток или отсутствие квалифицированных специалистов в области ин­
женерии знаний;
• отсутствие технико-экономических показателей оценки эффективности ЭС
(в России);
• несмотря на обилие методов извлечения знаний ( фактически более 200 в обзо­
ре [Boose, 1990] ), практическая недоступность методических материалов по
практике проведения сеансов извлечения знаний;
• явная непол нота и недостаточность имеющихся методов структурирования
знаний [Кук, Макдональд, 1986; Гаврилова, Черви нская, 1992], отсутствие
классификаций и рекомендаций по выбору подходящего метода;
• несмотря на обилие рынка программных средств, недостато1( промышленных
систем поддержки разработки и их узкая направленность (зависимость от
платформы, языка реализации, ограничений предметной области) , разрыв
между ЯПЗ и языками, встроенными в «оболочки>> ЭС;
4.6. П р и меры м етодов и систе м п р иобретения знани й
1 45
• жесткость программных средств, их низкая адаптивность, отсутствие индиви­
дуальной настройки на пользователя и предметную область;
• . слабые графические возможности программных средств, недостаточный учет
когнитивных и эргономических факторов;
• сложность внедрения ЭС,' обусловленная пс и хологическими проблемами пер­
сонала и неприятия новой технологии решения задач.
4 . 6 . Примеры методов. и систе м
приобретения зн а ний
Данный параграф посвящен обзору некоторых наиболее известных методов и си­
стем приобретения знаний, на основе переработки материалов из работ [ Осипов,
1 990; Молокова, 1992; Осипов, 1997).
4 . 6 . 1 . Автоматизированное структурирован ное
интервью
Впервые структурированное интервью применено при созда нии системы TEI­
RESIAS [Davis, 1 982] для формиров а ния новых правил и новых понятий. Для
этих целей в системе использованы следующие соображения: в случа е неудачи в
режи ме консультации (или тестирования) система предлагает эксперту выде­
лить пр и ч и ны неудачи. Контекст, полученный в результате этого, позволяет сис­
теме сформировать некоторые •ожидания•, характеризующие содержание ново­
го правила, которое будет вводиться экспертом для устранения неудачи.
Система ROGET [ Bennet, 1 985) - это первая попытка заменить инженер а знаний
программной системой н а начальном этапе пр и обретения знаний. Эта система
беседует с экспертом как инженер по знаниям, стремящийся понять, как концеп­
туально могут быть организованы экспертные знания, необходи мые для создания
диагностической ЭС.
В системе MOLE [Eshelman, 1987) приобретение знаний осуществляется в два
этапа : на первом этапе используется стру�:сrурированное интервью и эксперту
(или инжене,ру по зна ниям) предлагается ввести список событий предметной об­
ласти и определить связи между ними; на втора){ этапе выполняется контекстное
приобретение знаний, как это сделано в системе TEIRESIAS.
С и стема состоит из двух частей: интерпретатор а базы предметных знаний и
подсистемы приобретения знаний. Последняя поддерживает как процесс перво�
начального заполнен и я БЗ, так и процесс отладки и уточнения БЗ.
Интерпl? етатор БЗ ориентирован н а класс диагностических задач и о(?уществляет
вывод решения путем сопоставлени я заранее определенного множества гипотез
(о причине неисправности, о заболевании и т. д.) с совокупностью наблюдений
(симптомов, показа ний приборов и т. д.). Иными словами, и нтерпретатор систе­
мы MOLE реализует некоторый вариант метода эвристической классификации.
1 46
Гл ава 4 • Техн оло�;и.и и нже не рии зн ан и й
В базе знаний MOLE п�рвоначально существуютзнания о том, какие тииы .1юrН:J1тивнь1х структур необходимы для осуществления вывода ц как распознать зна­
ния того ил и иного типа в информации, сообщаемой экспертом. MOLE зацраши­
вает у эксперта список объектов, играющих роли гипотез и наблюдений. Эксперт,
кроме того, должен указать, какие пары «наблюдение - гипотеза:�, и «гипотеза гипотеза,> ассоциативно связаны.
Результатом этого этапа извлечения знаний является сеть объектов. Затем MO­
LE пытается получ и ть дополнительную и нфермацию: о ти пе объекта (является
объект наблюдаемым или выводимым); о природе ассоциативной связи (какой
ти п знаний лежит в основе ассоциации - объясняющие, предс1<азывающие или
иные); о направлении ассоциативной связи, о численной оценке «силы» ассоциа­
тивной связи. Однако MOLE понимает, что эксперт не всегда может предоста­
вить та кую информацию. Поэтому на этом этапе MOLE использует стратегию
ожиданий: она пытается вывести необходи мую и нформаци ю из сообщен и й экс­
перта на основе свои х ож иданий.
На этапе начального формирования базь1 знаний MOLE назначает ч и сленные
веса ассоциативных связей по умолчанию на основе следующих посылок:
• каждое наблюдение должно быть объяснено некоторой гипотезой;
• только одна из гипотез, объясняющих данное наблюден и е, является в каждом
конкретном случае наиболее вероятной;
• сумма оценок для связей данного наблюдения с объясняющими его гипотезами равна единице.
Тогда по умолчанию MOLE назначает для каждой связи данного наблюдения
оценку, полученную как частное от деления единицы на число rипоте�. объясня­
ющи х данное наблюдение. MOLE предполагает, что если эксперт сообщил не­
сколько объяснений для одного и того же объекта, то, вероятно, он может сооб­
щить и знания, позволяющие различать эти объяснени я.
Система приобретения знаний SALT [Ma rkus, 1 987] создана в университете Car­
negie Mellon. Система SALT - система приобретения знаний для задач конструи­
рования. Система SALТ разрабатывалась в предположении, что решение этой за­
дачи осуществляется методом пошагового распространения ограничений.
Для решения задач конструиров ания методом пошагового распространения огра­
ничений необходимы знания следующих типов:
• процедуры установлен и я значений параметров;
• процедуры проверки ограничений;
• процедуры коррекции значений параметров с указан�ем •цены» каждого корректирующего действия.
Важно, чтобы все эти зн ания составляли целостную и непроти воречивую БЗ.
Наибольшую трудность для эксперта представляет необходимость последова­
тельно, шаг за шагом описать вес свои действия при разработке проекта. Р аботая
с системой SAL Т, эксперт избавлен от этой необходимости.
4 .6. П ри м е ры методов
и систем п риобретени я знаний
1 47
Исходя из того, как именно экспертные знания будут использоваться в ЭС при
составлении конкретных проектов, SALТ анализирует текущее состояние БЗ и
предлагает эксперту-пользователю ввести или пересмотреть тот или иной фраг­
мент знаний. Диалог с пользователем в SALТ ведется либо посредством вопро­
сов-подсказок, либо посредством меню. Инициатива в диалоге принадлежит си­
стеме.
Система приобретения знаний OPAL [Musen, Fagan, et al., 1 987] была создана в
начале 80-х годов в Стэнфордском университете. Эта система обеспечивает
формирование и наращивание базы знаний для ЭС ONCOCIN, дающей советы
по лечению онкологических больных. Система приобретения знаний OPAL ос­
нована на детально проработанной модели медицинских знаний, используемых
врачами-онкологами для рекомендации лечения.
Системой используется девять типов знаний:
• схема лечения (порядок и длительность режимов лечения);
• критерий выбора протокола;
• химиотерапия ( описание комбинаций лекарств, назначаемых в том или ином
.режиме, их дозировка);
• радиотерапия (локализация и дозировка радиотерапии);
• изменения в составе крови, требующие модификации дозировки;
• негативные реакции на лечение, выявленные путем лабораторных исследова­
ний;
• другие отрицательные последствия проводимого лечения, требующие моди­
фикации дозировки лекарств;
• перерыв или прекращение лечения;
• лабораторные исследования, необходимые для обнаружения токсичности лечения и для соХ!)анения истории течения болезни.
Эти типы медицинских знаний связаны в иерархическую структуру.
Для ввода каждого типа знаний разработан специальный графический интер­
фейс, учитывающий то, как принято фиксировать соответствующие знания. Так,
например, для записи схемы лечения онкологи используют диаграммы перехо­
дов с условиями на дугах. В системе OPAL ввод таких знаний осуществляется с
помощью графического языка программирования. Схема лечения создается как
программа на этом языке.
Схемы прот-околов и заполненные формы транслируются системой OPAL во
внутреннее представление БЗ ЭС ONCOCIN. Этот процесс осуществляется без
участия пользователя. По схемам протоколов порождаются диаграммы перехо­
дов, называемые генераторами; по формам-бланкам порождаются правила про­
дукций, присоединяе�ые к соответствующим состояниям в диаграмме.
Система KNA СК создана в 1 989 r. в университете Carnegie Mellon. Она представ­
ляет собой ориентированный на экспертов предметной области инструмент для
создания ЭС, помогающих оценивать и улучшать различные виды проектов.
1 48
Гл а в а 4 • Технол огии и н жен ерии зн а н и й
Единственными знаниями , изначально встроенными в систему KNACK, явля­
ются знания о процессе оценки проектов вообще, то есть независимо от конкрет­
ного содержания проектов. Все остальные знания приобретаются системой
KNACK на основе диал ога и анализа документов, называемых отчетами. Отчет
описывает процесс оценк и' ка1юго-либо конкретного проекта.
Пр и обретение знаний, необход и мых для оценки проектов определенного класса,
система KNACK осуществляет в два этапа. Первый этап - это настрой1<а на класс
проектов. На этом этапе си стема КNАСК с помощью эксперта со_здает предв ар и ­
тельную модель. Расш иренная с помощью специальных процедур модель пред­
метной области автоматически транслируется в программу на языке OPS-5.
К методам структурированного и нтервью примыкают и использованные при по­
строении системы МЕДИКС [Ларичсв, Мечитов и др., 1989] процедуры эксперт­
ной классификац и и. Задача экспертной классификаци и формулируется в работе
[Ларичев, Мечитов и др., 1989] для:
• множества независимых свойств Р;
• множ�ства признаков Q;
• множ�ства Q,, возможных значеннй ш-rо пр изнака;
• множества А всех возможных состояни й.
Эксперту (или группе экспертов) предлагается идентифи ц ировать налич и е свойств
из множества Р и тем самым построить класси фикаци ю множества А = UK,, та­
кую, что состояние а О А относится к некоторому классу Kj, есл и·, по мнению экс­
перта, это состояни е обладает свойством Р О Р. Повысить эффекти вность экспер­
тной классификации в этом случае удается благодаря использованию априорно
заданного отношения л инейного порядка на множестве состоян ий.
4 . 6 . 2 . И м ита ц ия конс ультаций
Этот метод реал и зован в системе АРИАДНА fMoproeв, 1 988] , В основе этого ме­
тода - многократное решен и е экспертЪм проблемы класс и ф и каци и в режиме
последовательной вопросно-ответной консультации «кл и ент - эксперт». При
этом роль клиента моделируется всеми участни ками работы, а эксперт выполня­
ет функции, близкие к его профессиональной консультативной деятельности.
С появлением персональных компьютеров связано появление игр эксперта с
компьютером [Андриенко Г., Андриенко Н., 1 992]. В системе ЭСКИЗ реализо­
ван набор игр для приобретения знаний, являющихся той или и ной моди ф и ка­
цией принципа репертуарных решеток. Например , в игре «Регата» объектами,
для которых эксперт долж·ен указать различающие пр и знаки, являются яхты.
В ходе гонок яхты должны проходи ть в пролеты мостов; в один и тот же пролет
проходят яхты, соответствующи е сходным по какому-либо атрибуту объектам.
Рассмотренные выше системы поддержки процессов пр и обретения знаний, как
правило, ориентированы на отдельные фазы всего технологического цикла.
В связи с вышесказанным и нтересно хотя бы кратко рассмотреть интегрирован­
ные средства поддержки определенных методологи й.
4 .6. Пр и меры методов и с и стем пр и обрете н и я знани й
1 49
4 . 6 . 3 . И нтегрированные среды
приобретения знаний
Интегрированная среда приобретения знаний A QUINAS [Boose, Bradshaw, Sche­
ma, 1988] представляет собой набор программных средств для извлечения экс­
пертных знаний разл и чных т и пов различными методами. В состав AQUINAS
входят:
• система Dialog Manager для помощи новичкам в работе с AQUINAS;
• система ETS для извлечения и анализа репертуарных решеток с последующим
преобразованием их в базу продукционных правил;
• средства конструирования различных иерархических структур знаний;
• средства извлечения, представления и использования неточных знаний;
• средства тестирова ния и коррекции БЗ;
• средства, позволяющие эксперту оценивать конструкторы п,о наиболее подходящи м шкалам;
• средства работы с несколькими экспертами;
• средства автоматического пополнения и коррекции БЗ.
Dialog Manager представляет собой ЭС, специально созданную для тоrо, чтобы
консультировать эксперта о возможностях, представляемых AQUINAS, и руко­
водить экспертом при р аботе с AQUINAS. Возможны три режима взаимодей­
ствия с Dialog Manager:
• автоматический, при котором Dialog Manager полностью берет на себя руко­
водство процессом извлечения знаний;
• ассистирующий, при котором хотя эксперту и даются рекомендации относительно ero дальнейш и х действий, но он может им не следовать;
• режим наблюдения за действиями эксперта и сохранения истории.
Выбрав а втоматический или ассистирующий режим, экспрет должен выбрать
степень подробности подсказок и объяснений, даваемых системой («полностью»,
«на среднем уровне», «кра,тко» ).
В БЗ Dialog Manager имеются эвристики, которые позволяют этой системе при
накоплении экспертом достаточного опыта перейти от автоматического режима
к ассистирующему. Dialog Manager информирует эксперта о переключении ре­
жимов. Работая в ассистирующем режиме, Dialog Manager оставл·яет за экспер­
том выбор деятельности , но на основе сво и х эвристик рекомендует наиболее
подходящую. В частност и, если Dialog Manager сч и т ает, что эксперту следует
заняться анал и зом БЗ, то в рекоме'ндации обычно указывается, какой именно
аспект нужда ется в анализе. Так, эксперту может быть рекомендова но обрат и ть­
ся л и бо к процедурам анализа сходства элементов (конструкторов), либо I< про­
цедурам I<Ластеризации элементов (конструкторов), либо к разбиению исходной
решетки на несколько и ерархически связ анных.
1 50
Глава 4 • Технол оги и инже н ерии, знан ий
Ин тегриро ванная среда при о бреm(fния з наний КЦ:ТДN (Knowledge lniti�twn &
transfer Tools for Experts and Novices) [Show, Woodward, .1988] , подобно AQПI­
NAS, основана на построении и анализе репертуарных решето1<. Отличие KIT­
TEN от AQUINAS заключается в том, что в KIТTEN обеспечивается извлечение
элементов и конструкторов из текстов, а кроме того, имеются прощщуры, ащщи­
зирующие примеры решения задач экспертом и генерирующие по ним проду1<­
ционные правила. Продукционные правила, порождаемые из примеров и реше­
ток, могут быть загружены в Б З оболочки NEXPERT, с помощью которой про­
-водится тестирование БЗ.
Завершая обзор прямых методов приобретения знаний, суммируем проблемы,
которые этими методами не решаются:
• эти методы не устраняют посредника между системой и экспертом;
• автономное использование описанных методов не решает таких проблем ин­
женерии знаний, как устранение •nробелов• в знаниях, выявление •глубин­
ных•, невербальных знаний; сохраняется большая •время-емкость• и субъек­
тивность интервью;
• фаза приобретения знаний идеологически и теоретически не связывается со
следующими фазами инженерии знаний.
4 . 6 . 4 . Приобретение зн,а ний из текстов
Как было у1,азано в параграфе 4.3, даже ручные методы выявления знаний из тек­
ста I<райне слабо разработаны. В тех же немногих случаях, когда применяются
автоматизированные методики, речь, как правило, идет о методах лекси1,о-семан­
тическоrо анализа, а также о моделях понимания текста.
Наибольшую известность имеют модели понимания на лингвистическом уровне.
Системы, основанные на них, состоят в большинстве сJiучаев из двух частей:
• первая - морфологический и синтаксический анализ;
• вторая - семантический анализ, который использует результаты рiботы пер­
вой части, а также словарную или справочную информацию для построения
формализованного образа текста.
Говоря о семантическом анализе текста, надо иметь в ВИдУ, что всякие отношения
текста с его семантикой начинаются, после того, как в нашем распоряжеtt:ии.ока­
зывается некоторая модель действительности. Объектами этой модели, в частно­
сти, могут являться индивиды и отношения.
Таким образом, первая проблема, возникающая при попытках автоматического
извлечения знаний из текста, - это выявление свойств элементов текста для со­
отнесения этих элементов с объектами модели. Крайне редко эти свойства при­
сутствуют в тексте эксплицитно, то есть явно.
Вторая особенность существующих с11стем анализа текста - это, как правило,
необходимость использования словаря предметной области для выполнения
4.6. Пр и м ер ы методов и с и стем пр и обрете ни я знани й
1 51
морфологического анализа, выделения имен и словосочетаний и т. д. Однако тре­
бование nредварительноrо создания словаря п редметной области одновременно
сильно осложняет задачу и уменьшает степень универсальности п олучаемой сис­
темы.
Понимание текста на семантическом уровне п редп олагает выявление не только
лингвистических, но и л о гических отношений между я зы к о в ы м и объектами
[ Апресян, 1 974 ] . Среди подходов к пониманию текста на семантическом уровне
следует выделить модели типа •смысл - текст•, в частности, модель семантик
предпочтения [Wilks, 1 976], модель концептуальной зависимости [ Хейес-Рот и
др., 1 987]. В модели •смысл - текст• [Мельчук, 1 974] предлагается семантичес­
кое п редставление на основе семантического графа и описания коммуникатив­
ной структуры текста.
В сист еме KRITON [ Diderich, Ruchman, Мау, 1987 ] анализ текста ис пользуется
для выявления хорошо структурированных знаний из книг, документов,_ описа­
ний, инструкций. Основанный на контент-анализе метод протокольного анализ а
ис пользуется для выявления процедурных з наний. Он осуществляется в пять
шагов.
1 . Протокол делится на сеrу.tенты на основании пауз, которые делает эксперт в
процессе записи.
2. Семантический анализ сегментов, формирование высказываний для каждого
сегмента.
3. Из текста выделяются операторы и аргументы.
4 . Делается п о пытка п оиска по образцу в БЗ для обнаружения переменных в
высказываниях ( п еременная вставляется в высказывание, если соответствую­
щая ссылка в тексте не обнаружена).
5. Утверждения упорядочиваются в соответствии с их появлением в протоколе.
В системе TAKT(Tool for Acquisition of Knowledge from Text) [ Kaplan, Berry.:..Rog­
ghe, 1 99 1 ] п ред п олагается предварительная подготовка (разметка посредством
введения явной скобочной структуры) предложений текста до начала работы тек­
стового анализатора. В результате анализа выделяются объекты, процессы и от­
нщuения каузального характера.
4 . 6 . 5 . Инструментарий прямого приобретения
знаний SI M ER + M I R
Программная система SIMER + MIR, разработанная в ИПС РАН под руководством
Осип ова Г. С. [Оси пов, 1 997], представляет собой совокупность программных ·
средств для формирования модели и базы знаний предметной области. Система
ориентирована преимущественно на области с неясной структурой объектов, с
неполно описанным множеством свойств объектов и богатым наборо·м связей
различной •связывающей силы• между объектами.
1 52
Гла в а 4 • Техн ологи и ин жене р ии знаний
Одна из ос'обенностей системы состоит в том, что ее использование на заключи­
тельном этапе не предполагает участия специалистов-разработчююв экспертных
сист,ем. Это означает, что система SIMER + MIR представляет собой технологию
создания систем, основанных на знаниях о предметной области, причем техноло­
гию, ориентированную на экспертов.
Архитектура. Система SIMER + M I R включает модуль прямого приобретения
знаний SIMER, систему моделирования рассуждений типа аргументации MIR,
программу адаптации системы MIR к базе знаний, сформированной с помощью
SIMER + и программной среды поддержки базы знаний, над которой работают
все названные модули. Конструкции базы знаний создаются и просматриваются с
помощью языка инженера знаний FORTE, 1юторый включается в технологию в
специальных случаях (рис. 4.1 7 ) .
И нте рфе йс nользоватепя
Программа MIR
Программа +
Инте рф е йс эксnе р,а
Система SIMER
пользо вателя
Программная среда
базы з н а н ий
пользователя
Инте рфе йс и нже н е ра
no зн а н иям
Яз ык Форте
Рис. 4. 1 7. Созда н и е ко нструкции баз ы з на ни й с п омощью языка FORTE
Представление и база знаний. Одним из наиболее распространенных видов экспертизы являются высказывания ( сообщения ) эксперта об объектах (событиях )
предметной области. Эти высказывания имеют вид:
< имя обьекта > < имя отношения > < имя обьекта > .
Для ряда <1бластей - медицины, экологии, политики, социологии - можно выде­
лить формы сообщений, показанные в табл. 4.6:
Та блица 4.6. Ф о р м ы сооб ще ни й
Но м е р
фо р м ы
Имя
ф ор м ы
Ном ер
фо рм ы
Имя
фор м ы
Ф1
а ха рактер н о для fl
Фа
П ри а н е р едко п р исутс тв уе т fl
а отм еча етс я n ри 1}
Ф10
Ф2
а н аблюдаетс я n ри fl
Ф.
а е сть п р оявл ение f1
Фе
а со про вождает р
Фз
Фs
Ф1
а е с ть п р и з н ак fl
а н е редко с о п ро вождается р
Ф9
а может н аб людать ся п р и 1}
Ф, 1
П р и а как п рав и ло р
Ф,2
Ф 1з
ф14
а обыч н о соп ро вождаетс я 1}
П ри аобыч н о р
а ин огда с о провождае тся р
а часто со п ро в ожда е тся р
1 53
4.6. Пр и м е р ы м етодов и сис те м пр ио бретени я знаний
Н ом ер
форм ы
Имя
форм ы
Номер
фо р м ы
Имя
форм ы
Ф, 6
а. при в оди т к [3
Ф2 ,
[3 разви ва ется п ри а.
Ф, s
Фн
Ф, в
Ф,
g
а. ис кл юча ет [3
Ф 20
П ри а. во з ни кае т [3
а. м о жет при в ест и к [3
а. м о же т разв и ватьс я в [3
Ф22
Ф 2з
С а. н а ч ин ае тс я [3
[3 м о жет разв и ваться при а.
[3 может н ача ть ся с а.
Этот список не является исчерпывающим, однако дает представление о тех ког­
нитивных структурах, которые необходимо пред ставлять и обрабатыв ат ь в базе
знани й .
Каждая из этих форм может иметь различный смысл; уточнение смысла можно
получить при рассмотрении «прямого�> сообщения с «обращенным>> . Ин ыми сло­
вами, если для некоторых фиксированных а или t3 справедливо сообщение ф ор­
м ы Ф 10 , то необходимо поп ытаться установить , какое из сообщений Ф 1 - Ф 23
справедливо при замене а на t3 , t3 на а. Так, для соо бщения «Гром наблюдается при
грозе,> справедливо «обращенное>> сообщение « Гроза сопро в ожд а ется гро ­
мом�>, а для сообщения « Воспалител ь ный процесс может наблюдаться при повы­
шенной температуре >> справедливо сооб щ ение « Повышенная температура ха­
рактерна для воспалительного процесса >> . Таким образом , смысл сообщений
уточняется построением « конъюнкци й,,. форм Ф 1 - Ф 23_ Такие << кон ъ юнrщ ии >>
форм сообщений будут называться типам и сообщеиий . Возможные типы сообще ­
ни й приведены в табл. 4.7.
С каждым типом сообщения из табл. 4 . 7 связывается форм альная конструкция
базы знаний, то есть бинарное отношение на множестве объектов ( событий). Эти
конструкции можно проиллюстрировать следующим образом : если каждый
объект ( событие) представить в виде «двухмерного,> множества, по первому из­
мерению которого можно откладывать атрибуты этого объекта, а по второму множества значений соответствующих атрибутов, то кажды й объект предс тав ­
ляется в виде фигуры :
1 АТР 1 1 АТР 2 1 АТР 3 1
й
ы
Те блица 4. 7. Тип сооб щени
Тип
I AT P n
1
Сооб щен ие
а. есть п ро явл ение р, и р м ож ет с о пр овождать а.
а е ст ь пр о явление р , и [3 с о п ровождается а.
а. м о же т уве л и ч и вать в о змо жн о ст ь р, и р у вел и ч и ва ет возм ож н о ст ь а.
а м о ж ет с о про в ождат ься [3, и [3 может бы ть про явл е ни е м а.
а со про вожда ется р , и [3 м о же т бы ть п р оявлени е м а
а ест ь про явл ение р, и р е сть про явл ение а
продолжение #
1 54
Гла ва 4 • Технологи и инже н е ри и знан ий .
Табnица 4. 7. (продолжение )
Тип
Сообщение
а может увеличивать возможность �. и � может увеличивать возможность а
а может протекать с �. и � может протекать с а
а увеличивает возможность �. и � увеличивать во зможность а
а сопровождается �. и � может сопровождает а
а сопровождается �. и � сопровождаться а
а исключает �• . и � исключает а
а приводит к �
а может привести к �
а увеличивает возможность развития �
а может увеличить возможность развития �
а исключает возможность развития �
Если считать множества всех атрибутов равновеликими, то можно рисовать пря­
моугольники.
Тогда типу сообщения Т 1 можно поставить в соответствие диаграмму (пересече­
ние а и Р всюду далее заштриховано).
ш
В качестве примера приведем интерпретации некоторых диаграмм. Так, диаграм­
му, соответствующую сообщению типа Т3, можно интерпретировать следующим
образом: для всякого примера объекта р качестве примера приведем интерпрета­
ции некоторых диаграмм. Так, диаграмму, соответствующую сообщению типа Т3,
можно интерпретировать следующим образом: для всякого примера объекта Р
найдутся такие примеры объекта а, в которых равны совпадающие имена и. значе­
ния атрибутов.
Для остальных типов сообщений получим диаграммы, представленные в табл. 4.8.
Табnица 4.8. Диаграммы для различных типов сообщений
Т2
Тз
Т4
Ts
1
а
,
р
.
�
Те
Т7
\
а
1
р
4.6. Пр и м е р ы м етодов и с и сте м п риобретени я з нани й
1 55
т"
а
�
T,s
а
Для сообщения типа Т8 : для всякого имени атрибута примера объекта а найдется
совпадающее с ним имя атрибута из примера объекта 13, и наоборот; при эт9м со­
ответствующие значения атрибутов равны. Найдутся такие примеры объекта а, в
которых равны совпадающие имена и значения атрибутов.
Каждой из изображенных диаграмм можно дать такую теоретико-множествен­
ную интерпретацию, связав с каждым· из типов сообщений 1\ некоторое бинарное
отношение R k примеров объектов (при k = i).
Способ представления с определенными так отношениями называется неодно ­
родной семантической сетью.
В реализации базы знаний основ ными элементами структур данных являются
элементы -«Вершина•, -«Элемент кортежа•, •атрибут•, -«цепь•, •стрелка•. Э лемент
•вершина• соответствует объекту (событию), он содержит имя, списки входных
и выходных 4стрелок• и список типа •элемент кортежа•. Список •элементов кор­
тежа• соответствует совокупности атрибутов события.
Для обеспечения 'простого способа определения указателя •вершины• существу­
ют элементы типа «цепь•. Элемент типа •цепь• содержит указатель на •верши­
ну• и указатель на следующий элемент типа «цепь•. Указатель на первый элемент
списка •цепь• входит в описание элемента типа -«атрибут•. «Атрибут• характе­
ризуется также именем, множеством значений и единицей измерения.
Отношения на множестве объектов реализованы в элементах типа •стрелка• .
Каждый такой элемент содержит имя, сорт, вес, тип веса, указатель на 4Вершину•
и указатель на следую щий элемент типа -«стрелка•. Отношения на двух объектах
описьщаются парой элементов типа «стрелка•, один из которых входит в список
1 56
Гл а ва 4 • Технологи и ин жен ер ии з наний
входя щих стрелок одного объекта, другой - в список входящих стрелок другого
объекта.
Процедурная компонента системы содержит функции создания струr(тур дан­
ных, поддержки корректности базы знаний, наследования свойств и ряд других
функций. Для обеспечения поиска по именам элементов типа «вершина» и «ат­
рибут• в системе реализовано В-дерево. Доступ ко всем элементам базы осуще­
ствляется через виртуальную память. Каждый элемент имеет внутренний иден­
тификатор, по значению которого однозначно определяется его размещение в
оперативной или внешней памяти. Для работы с объектами, отсутствую щими в
оперативной памяти, осуществляется их динамический перенос из внешней па­
мяти в оперативную. Это позвол�ет системе работать на компьютере с ограничен­
ным объемом оперативной памяти.
Прямое приобретение знаний в системе SIMER
Для выявления структурных знаний о предметной области используются страте­
гии разбиения на ступени и репертуарных решеток. Подробнее о репертуарных
решетках см. параграф 5.2.
Стратегия разбиения на ступени направлена на выявление структурны х и клас­
сификационных свойств событий (понятий, объектов). области и rаксонометри­
ческой структуры событий предметной области.
Стратегия разбиения на ступени реализуется в одном из двух сценариев, который
выбирается экспертом
1. «Имя -_ свойство:!> .
2 . « Множество имен· - свойство•.
Сценарий сс И мя - свойство»
1.
2.
3.
4.
5.
Вопрос системы об имени события.
Сообщение эксперта об имени события.
Вопрос системы об имени свойства.
Сообщение эксперта об имени свойства.
Вопрос системы о существовании множества значений свойства.
6. Ответ эксперта (Да/Нет) .
7. В случае отрицательного ответа имя свойства воспринимается ка.к имя
события.
8. Если имя события, образованного на шаге 3, отсутствует в базе знаний,
то это событие рассматривается ка.к новое, и для него выполняются шаги
2-7.
9. Вопрос системы о типе множества значений свойства ( непрерывноt:!'/дис­
кретное ).
10. Ответ эксперта.
4.6. Пр и м е р ы м етодов и систе м п р и обр етени я з наний
1 57
11. Вопрос системы о единице измерения свойства.
1 2 . Сообщение эксперта о единице измерения.
13. Вопрос системы о множестве значений свойства.
14. Сообщения эксперта о множестве значений свойства.
15. В процессе выполнения шагов 2-6 создается глобальный объект 4ИМЯ
свойства• и область его значений. Совокупность таких объектов будем
называть базисом свойств области.
1 6. Вопрос системы о подмножестве значений свойства, характерного для
описываемого события.
1 7. Сообщение эксперта о подмножестве значений свойства.
В результате выполнения шага 7 один из элементов базиса свойств связывается с
описываемым событием ( с указанием подмножества области значений элемента
базиса, характеризующего описываемое событие).
Сценарий «Множество имен - свойство»
При работе сценария шаг 1 многократно повторяется, а затем выполняются
шаги 2-7 для каждого имени события.
Стратегия репертуарных решеток направлена на прео;tоление когнитивной за­
щиты эксперта. Механизм преодоления основан на выявлении его личностных
конструктов. Каждый конструкт описывается некоторой совокупностью шкал, а
каждая шкала образуется _о ппозицией свойств.
Наиболее эффективный способ выявления противоположных свойств - предъяв­
ление эксперту триад семантически связанных событий с предложением назвать
свойство, отличающее одно событие от двух других [Kelly, 1 955] . На следующем
шаге эксперту предлагается назвать противоположное свойст�ю. Таким способом
выявляются элементы·множества лич�остных психолоzических конструктов кон­
кретного эксперта.
С другой стороны; свойства, различаю щие события, - это те свойства, кот-орые
влияют на формирование решения. Так как при этом не ставится задача выявле­
ния когнитивной организации индивидуального сознания эксперта, то описан­
ная процедура используется для формирования базиса свойств области, а не для
построения личностных конструктов. Пополнение базиса свойств области осу­
ществляется путем повторения это й процедуры с другими триадами.
Прим е р 4 . 9
Наприме р, э кс перту в области пред ст�вле ния з нан и й предъявля ется триада п о н ятий ,
оп исыв ающих сп ос обы представле н и я: се м анти че ские сети , фре ймы, с и сте мы пр оду к­
ци й . Э ксперту предл агается ответи ть н а следующи е во про с ы:
Какой из указанных способов представления отличается от двух других?
1 58
Глава 4 • Техноло гии ин женерии з нан ий
системы продукций;
Какое свойство отличает системы продукций от семантических сетей и фреймов?
леrкость описания динаМИIСи;
Назовите противоположное свойство свойс�у .легкость описания динамики•?
трудность описания дииамнки;
Дайте имя свойству, имеющему значения ,меzкость описания динамики• и •трудность
описания динамики•?
возможность описания дниаМИIСИ.
В результате формируется шкала с именем •возможность описания динамики• и с о
значением •легкость описания динамики• дJJЯ объекта •системы продукций•; •труд­
ность описания динамики• для объектов • семантические сети• и •фреймы•.
ПредJJаrая э ксперту аналогичные вопросы об отличии семантических сетей от си стем
продукций и фреймов, можно выявить и другие с войства базиса области.
Еще один пример - выявление каузальных знаний о предметной области. К кау­
зальным знаниям о предметной области в соответствии с работой [Поспелов,
1986) относятся:
• связи между следствиями и необходимыми и достаточными причинами;
• связи между следствиями и достаточными причинами;
• связи между следствиями и необходимыми со-причинами; связи между следствиями и возможными со-причинами.
Будем пон и мать каузалf:\ные знания несколько шире, включив в рассмотрение,
кроме связей событий настоящего с будущим и событий прошлого с настоящим,
и связи между событиями настоящего. В соответствии с этим отнесем к каузаль­
ным знаниям все типы сообщений из табл. 4.6.
Тогда задача выявления каузальных знаний сведется к установлению соответ­
ствия между множеством типов сообщений и множеством отношений R 1 -R 17 , то
есть к поиску отображения Т в R. Для поиска этого отображения используется
стратегия выявления с ходства [Осипов, 1 989). Она основана на выявлении в ин­
терактивном режиме алгебраических свойств сообщений Т; (таких как симмет­
ричность - ассимметричность, рефлексивность - иррефлексивность и др уги х)
и появлении на основании этого гипотез о принадлежности сообщений тем или
иным отношениям Rk (именно эти свойства оказываются нужными при работе
механизма рассуждений).
Пример 4 . 1 0
Н апример, относительно двух событий: •рост заработной платы• и •повышение уров­
ня жизни• эксперт сооб щил, что •рост заработной платы• обычно сопровождается
•повышением уровня жизни•. Тогда возникают вопросы:
а) повышение уровня жизни всегда сопровождается ростом заработной платы?
б) повь1шение уровня жизни обычно сопровождается ростом заработной платы?
в) повышение уровня жизни может сопровождаться ростом заработной платы?
4 .6. ·Прим ер ы м е тодов и с и сте м приобр етени я знани й
1 59
Ответ э кспе рта а ) �дет свидетельст вов ать о том , что исходн ое сообщён ие относится к
типу Т2 табл. 4.6; ответ в) - исход н ое сооб щение относится к ти п у Т10 той же табл ицы.
Дал ее п оявля ютс я ги п отез ы о то м, что сооб щение эксперта ц нтерпретирует�я отн оше­
нием R2 и л и R10 в зависи мост и от ответа а) или в). По вышение степени до стоверн ости
такой rи п отезьi в озможн о при исп ол ьзов ан ии стратегии п одт вержден и я · сходств а
[ О си по в , 1989].
· Стратегия подтверждения сходства является комбинированной, о_с нованной на
взаимодействии стратегий разбиения на ступени и выявления сходства, а также
на анализе свойств событий (если они определены).
Например, в результате работы стратегии выявления сходства ус;т ановлена при­
надлежность предыдуще го пр имера отно·шению R2 • На основании определения
отношения R;i для всякого свойства первого события найдется единственное
свойство второго события, и наоборот, TaI< что область значения свойства перво­
го события является подобластью области значений соответствующего свойства
второго события. В случае выполнения этого услов ия гипотеза о принадлежнос­
ти предыдущего примера отношению R2 считается достоверным ут�ерждением,
в противном случае запускается стратегия разбиения на ступени с целью выявле­
ния новых свойств событий, для которых было бы верно это условие. Если, не­
смотря на это, условие достоверности не выполняется, то статус гипотезы сохра­
няется, одющо в базе знаний системы появляется информация о некорре1,тности
соответствующей связи между событиями. Эта информация ограничивает воз­
можность использования построенной связи, например, с точки зрения механиз­
ма наследования свойств. При работе стратегий выявления и подтверждения
сходства сценарий работы называется системой.
Моделирование рас�уждений в системе MIR
Введем следующие обозначения:
• О - опрос признаков из множества S;
• П - порождение множества гипотез Г;
• И - исключение м ножества гипотез Г.
Э.1I ементы данных типа • стрелка �- , соответствующие отношению R 12, буде м назы­
вать отрицательными связями, остальные - положительными.
Работа системы MIR начинается с работы модуля О, затем моду-!,(Ь П строит м но­
жество гипотез Г на основе анализа положительных связей S с Г для подтвержден­
ных признаков S. М ножество гипотез Г используется модулем О для порождения
нового множества признаков S " связанных с гшютезами из Г положи:тельными
связями, и осуществления их тести рования. К подтвержден н ым признакам из S 1
применяется модуль П для порожд ения нового множества гипотез Г I " Выполня­
ются операции Г: "" Г u Г 1 , S: = S u S 1 • Этот процесс продолжается итеративно до
стабилизации множества S и Г. Затем выполняется модуль И исключения гипотез
из Г на основе анализа отрицательных связей для подтверждения симптомов и
анализа положительных связей для обусловленных признакрв, то есть таких не-
160
Глава 4 • Технологи и инженер ии знан и й
подтвержденных признаков, отсутствие которых имеет большее значение для
принятия решения, чем их присутствие.
Если в результате выполнения модуля И во множестве гипотез осталось более
одной гипотезы, то выполняется поиск дифференциальных признаков для под­
множеств множества гипотез (дифференциальным признаком для некоторого
множества гипотез называется значение свойства, характерное для одной гипо­
тезы из множества и нехарактерное для других, или событие, связанное положи­
тельной связью с одной гипотезой из множества и не связанное та1<овой с други­
ми). В результате этого процесса происходит исключение соответствующих
гипотез. При необходимости процедура повторяется для оста�шегося множества
гипотез до его стабилизации.
После выполнения еще нескольких модулей осуществляется анализ полученного
множества гипотез с целью поиска его минимального подмножества, связанного
положительными связями со всеми подтвержденными признаками и тем самым
объясняющего их. Это последнее множество и считается окончательным резуль­
татом.
Новые тенденции
и прикладные
аспекты ин�енерии
знании
о
о
□
о
□
Латентные структуры знаний и психосемантика
Метод репертуарных решеток
Управление знаниями
Визуальное проектирование баз знаний как инструмент ·п ознания
Проектирование гипе р медиа БД и адаптивных обучающих систем
5. 1 . Латентные структуры знаний
и психосемантика
Большинство систем приобретения знаний (обзор в п. 4.5) облегчают сложньiй и
трудоемкий процесс формирования баз знаний и реализуют прямой диалог с экспертом. Однако выявляемые таким образом. струnуры знаний часто отражают
лишь поверхностную составляющую знаний эJ(сперта, не затрагивШ.J их глубин- ·
ной структуры. Этим же недостатком обладает большинство методо� непосред­
ственного извлечения знаний (параграфы 4. 1 .-4.3).
Для извлечения глубинных пластов экспертного знания можно воспользоваться
методами психосемантики - науки, возникшей на стыке когнитивной психоло­
гии, психолингвистики, психологии восприятия и исследований индивидуаль­
ного сознания. Психосемантика исследует структуры сознания через моделиро­
вание
индивидуальной системы знаний [Петренко, 1988] и выявление тех
_
категориальных: структур сознания, которые могут не осознаваться (латентные,
имплицитные или скрытые) [Петренко, 1983; Терехина, 1988; Шмелев, 1 983] .
Глава 5 • Н ов ы е тенден ции и при кл адн ы е асп е кты и н женерии зна н ий
5 . 1 . 1 . Семантичес кие п ространства
и п сихол о ги ч еское w ка 11 ирован ие
Основным методом экспериментальной психосемантики является метод рекон•
струкции субъективных семантических пространств. Здесь психосемантика ·тес­
но сплетается с психолингвистикой и лингвистической семантикой - с методо­
логией выявления значений слов, лексикографией, •падежной грамматикой• и
структурными исследованиями (Апресян, 1977; Мельчук, 1974; Соссюр, 1977;
Филлмор, 1983; Щерба, 1974) . Однако лингвистические методы в основном на·
правлены на анализ текстов, отчужденных от субъекта, от его мотщюв и замыс­
лов.
Психолингвистические методы обращаются непосредственно к испытуемому.
Большинство из них связано с различными формами субъективного шкалирова­
ния. Перед испытуемым ставится задача оценить •сходство знаний• с помощью
некоторой градуированной шкалы, например от О до 5 или от О до 9. В этом случае
исследователь получает в руки численно представленные стандартизированные
данные; легко поддающиеся статистической обработке.
Психосемантика - как одно из молодых направлений современной психологии
[ Петренко, 1988; Шмелев, 1 983) - сразу была оценена специалистами в области
искусственного интеллекта как перспективный инструмент, позволяющий ре­
конструировать семантическое пространство памяти как психологическую мо­
дель глубинной структуры знаний эксперта. Уже цервые приложения психосе­
мантики в ИИ в середине 80-х годов позволили получить достаточно наглядные
результаты. В психологии семантические прос_транства выступают как модель
категориальной структуры индивидуального сознания. При концептуальном
анализе знаний структуру семантического пространства эксперта можно считать
основой для формирования поля знаний. При этом отдельные параметры семан­
тического пространства соответствуют различным компонентам поля (размер­
ность пространства соотносится со сложностью поля, выделенные понятийные
структуры с метапонятиями, содержательные связи между понятиями-стиму­
лами - это суть отношения и т. д.).
Легче всего познакомиться с экспериментальной психосемантикой на примере,
связанном с выявлением структуры и размерности семантического пространства
знаний из некоторой предметной области [Петренко, 1988).
В основе построения семантических пространств, как правило, лежит статисти­
ческая процедура (например, факторный анализ [Аверкин, Батыршин, Блишун
и др., 1986] , многомерное шкалирование [Тиори, Фрай, 1985) или йластерный
анализ [Дюран, Оделл, 1977)), позволяющая группировать ряд отдельных при­
знаков описания в более емкие категории-факторы. Говоря на языке поля знаний,
это - построение кон1:'ептов более высокого уровня абстракции. При геометри­
ческой интерпретации семантического пространства значение отдельного при­
знака отображается :как точка или вектор с заданными координатами внутри
n-мерного пространства, координатами которого выступают выделенные факто-
1 63
5. 1 . Л ате нт н ы е стру ктур ы з н а н и й и пс ихосе ма н ти ка
ры. Построение семантического пространства, таким образом, включает переход
к описанию предметной области на более высокомуровне абстракции, то есть пе­
реход от язьiка, содержащеrо большой алфавит признаков описания, к более ем­
кому языку концептуализации, содержащему меньшее число концептов и вы­
ступающему своеобразным метаязыком по отношению к первому.
В зависимости от опыта и профессиональной компетентности испытуемых раз­
мерность пространства и расположение в ней первичных понятий может суще­
ственно варьироваться. Эта особенность семантических пространств может быть
использована на стадии контроля в процессах обучения, при тестировании экс­
периментов и пользователей.
П р имер 5 . 1
l)к, для проверки знаний и понимания английского языка в работе [Терехина, 1988]
были взяты десять наиболее распространенных предлогов, достаточно трудно перево­
димых. На экране дисплея испытуемому предъявлялась пара предлогов и спрашива­
лось, часто ли у него вызывает затруднения выбор одного из этих предлогов. Степень
затрулнения оценивалась в баллах от 1 до 9 . На этих данных методами многомерного
шкалиров�ния была построена структура сложности употребления английских пред­
логов с точки зрения носителя русского языка. Эта модель существенно зависит
от уровня знаний. Так, модель новичка не представляет организованной структуры .
У людей, имеющих определенные навыки, проявилась некоторая структурирован­
ность семантического пространства, в нем отчетливо обозначились пары и тройки
сходных предлогов.
to
from
Рис. 5. 1 . Семантическое пространство близости английских предлогов
1-lаиболее четкая и связная структура приведена на рис. 5. 1 . По ней можно объяснить
особенности дифференциации предлогов в английском языке. Основа структуры пред­
. с'тавляется в виде окружности, близкие точки на которой соответствуют трудно диф­
ференцируемым предлоrам. Структура опирается на две ортогональные оси. Ось абс­
. цисс соответствуt;:r предлогам направления движения, а ось ординат - предлогам цел'и средства.
1 64
Глава 5 • Н овы е тенденции и при кл адн ы е ас п екты �1-1женер и и з н а н и й
На Qсновании получаемых методами псщосемантики мо,целей, можно чроводить
контроль знаний. При анализе индивидуальных семантических пространств вы­
являются вопросы, которые не усвоены и не уложились в систему. Контроль
структуры знаний проводится на основе сопоставления семантических про­
странств хороших специалистов и новичков ( студентов, слушателей, молодых
специалистов). Степень согласованности семантических пространств (их размер­
ности, признаки и конфигурации понятий) будет определять уровень знаний но­
вичка.
Однако здесь необходимо учесть, что семантические пространства двух квалифи­
цированных специалистов могут быть разными, так как содержат индивидуаль­
ные различия восприятия, отражающие опыт и характер деятельности человека.
Поэтому не всегда можно формально сравнить семантические пространства экс­
перта и новичка, следует предварительно изучить семантические пространства
нескольких специалистов, а затем уж производить сравнение.
В работе [ Кук, Макдональд, 1 986) описан подобный эксперимент. Были получе­
ны когнитивные структуры знаний опытного летчика-истребителя и пилота-но­
вичка, с использованием двух методов: многомерного шкалирования (алгоритм
MDS - Alscal) и сетевого шкалирования со взвешенными связями (алгоритм
Pathfinder). Оба алгоритма основаны на использовании оценок психологичес­
кой близости. Опытный пилот и пилот-новичок оценивали все возможные nap­
Hf:de сочетания 30 связанных с полетом понятий, приписывая числа от О до 9 каж­
дой паре, где О обозначал самую слабую степень связи между понятиями, а 9 самую сильную. Эти оценки затем обрабатывались с применением обоих алго­
ритмов шкалирования.
В соответствии с алгоритмами; MDS каждый концепт, выражающий некоторое
понятие, помещается в к-мерное пространство таким образом, что расстояние
между точками отражает психологическую близость соответствующих кон­
цептов. Алгоритм Pathfinder строит семантическую сеть [Schvaneveldt, Durso,
Dearholt, 1 985) . Дуги могут быть либо ориентированными (несимметричное
отношение), либо неориентированными (симметричное отношение). Оба мето­
да обеспечивают сжатия больших объемов данных (в форме попарных оценок)
к меньшему набору параметров; однако нацелены они на выявление разных .
свойств исследуемых структур. Если в алгоритме Pathfinder центром внимания
являются локальные отношения между концептами, то алгоритм MDS обеспечи­
вает более широкое понимание свойств метризуемого пространства концептов.
Результирующие когнитивные структуры оказались близкими для летчиков-ис­
требителей с одинаковым уровнем опыта, но были различными для разных групп
испытуемых. Авторы экспериментов обнаружили, что по когнитивной структуре,
характерной для летчика-истребителя, можно установить, новичок он или опыт­
ный пилот. Наконец, проведенный ими же анализ когнитивных структур вьrявил
наличие концептов и отношений, общих для представлений онытноrо специали­
ста и новичка, и, кроме того, ряд концептов и отношений, которые появились
1 65
5. 1 . Л ате нтн ые структур ы зн а н ий и психосема нти ка
тоnько в одном из представлений. Прямым развитием рассмотренной работы ста­
ла экспертная система управления воздушным боем ACES [ Goldsmith, Schvane­
· veldt, 1985 ].
Аналогичное исследование механизмов накопления опыта было проведено в об­
ласти программирования на ЭВМ [Cooke, 1985]. С помощью методов шкалиро­
вания было показано, что один из аспектов программистского опыта включает в
себя организацию знаний соответственно замыслу программы, или семантике, а
не в соответствии с синтаксисом.
Прим е р 5.2
Сетевое представление абстрактных понятий программирования н а основе оценок
связности концептов у программистов показано на рис. 5.2. Эксперимент показал, что
в�ех программистов на основе анализа структуры семантического пространства можно
разбить на три группы: новички, неопытные -специалисты среднего уровня, опытные
специалисты. Это заключение совпадает с результатами, полученными в работе [Гав­
рилова, 1 984] . Кроме того, исследовалась эволюция коrnитивной структуры програм­
миста по мере его продвижения от новичка до опытного специалиста.
Параметр
-.-----т--
Подnроrрамма i----------1
Оператор
Отладка
Проrрамма
Выход
Чисnовые
данные
Глобал ьная
переменная
Симвоnьные .,____,
данные - 1--------t..__......__
Сортировка
Покск
ПОвторение
Рис . 5 .2. Ассоци ативная сеть структуры зн аний эксперта-п рограммиста
Интерпретация выявленных отношений (связей) между понятиями требует дополни­
тельн�х усили� от коллектива разработчиков ЭС. Так, например, означивание дуг на
_ рис. 5.2. потребовало дополнительного эксперимента , участникам которого была пред­
ложена пара понятий и поставлена задача дать словесное описание связи между поня­
тиями. пары. Результаты представлены в табл. 5. 1 . Таким образом, ассоциативная сеть
на рис. 5.2 может быть превращена в семантическую.
166
Гл ава 5 • Н ов ы е тенде н ци и и п ри кл адные ас П(tКТЫ инженери и з на н и й
Таблица 5. 1 . Описание свя� между понятиями
Свяэвнные'nвры nонятий
Отношение между
связанной nарой понятий
Подпрограм ма - программа
Си маольные данные - выход
Параметр - программа
Программа - выход
Сортировка - поиск
Численные данные - параметр
Функция - оператор
Функция - программа
Отладка - программа
Выход - численные данные
Массив - си м вольные данные
Функция - подпрограмма
Присваивание значений - параметр
Массиа - глобальная перемена
Массив - численные данные
Повторение - сортировка
Программа - алгоритм
Сортировка - алгоритм
Сортировка - численные данные
Присваивание - оператор
Есть часть
Есть тип
Используется
Производит
Вкл ючает в себя
Может быть
Есть
Есть часть
Подвергается
Состоит из
Может состоять из
Есть
Используется для
Может быть
Может состоять из
Есть часть
Есть выполнение
Есть
Делается на
Есть
Все упомянутые выше методы (включая кластерный анализ) можно отнести к
методам псих ологического шкалирования. Их основу составляют алгоритмы
преобразования сложных структур данных в более понятную форму, которая
предполагается псих ологически содержательной. Результирующее представле­
ние зависит от метода:
• кластерный анализ порождает древовидную структуру [Дюран, Оделл, 1 977];
• многомерное шкалирование и факторный анализ - пространственную [Окунь,
1974; Терехина, 1986] ;
• алгоритм MDS - сетевую [Кук, Макдональд, 1986] ;
• репертуарные решетки (см. параграф 5.2 и работу [ Франселла, Баннистер,
1987] ) порождают конструкты или метаизмерения [Кintsch, 1 974].
Формальная методология психосемантического шкалирования позволяет час­
тично автоматизировать процесс структурирования знаний и получать «когни­
тивный разрез• его представлений о предметной области. Методология шкалиро­
вания позволяет выявлять структуры знания косвенным путем при получении
ответов от экспертов на довольно простые вопросы (например, «насколько близ­
I<И понятия Х 1 и Х 2 • вместо «скажите, какова связь между Х 1 и Х 2 как они :влияют
друг на друга•).
5. , . Лате нтн ы е стру ктуры �наний и nсихос еманти ка
1 67
Почти все эксперименты позволили выявить одну закономерность. Размерность
семаmического просtранства с повышением уровня профессионализма умень­
шается. Этот вывод согласуется с известными положениями когнитивной психо­
логии о том, что процесс познания сопровождается обобщением.
Построение семантического пространства обычно включает три последователь­
ных шага [Петренко, 1 983).
1 . Выбор и применение соответствующего метода оценки семантического сход­
ства. Этот шаг включает в себя эксперимент с испытуемыми, которым предла­
гается оценить общность предъявляемых стимульных признаков на некоторой шкале.
2. Построение структуры семантического пространства на основе математичес­
кого анализа полученной матрицы сходства. При этом происходит уменьше­
ние числа исследуемых понятий за счет обобщения и получения генерализо­
ванных осей.
3. Идентификацию, интерпретацию выделенных факторных структур, кластеров
или групп объектов, осей и т. д. На этом шаге необходимо найти смысловые
эквиваленты, языковые •ярлыки• для выделенных структур. Здесь большое
значение приобретает лингвистическое чутье и профессионализм специалис­
та, проводящего исследование, и экспертов-испытуемых. Часто к интерпрета­
ции привле�т группу экспертов. .
5 . 1 . 2 . Методы многомерного ш калирования
В дальнейшем развитие методов психqсемантики шло по .линии разработки
удобных пакетов прикладных программ, основанных на методах многомерного
шкалирования (МШ), факторного анализа, а также специализированных мето­
дов (статистической) обработки репертуарных решеток [Франселла, Баннистер,
1987) . Примерами пакетов такого типа являются системы KELLY [ Похилько,
Страхрв, 1990], MADONNA [Терехина, 1 988], MEDIS [Алексеева, Воинов и др.,
1 9891. С другой стороны, специфика ряда конкретных приложений, прежде все­
го - в инженерии знаний, требовала также развития иных (не численных) мето­
дов обработки психосемантических данных, использующих - в той или иной
форме - парадигму логического вывода на знаниях. Ярким примером этого на­
правления служит система AQUINAS [Boose et al. , 1 989; Boose, 1 990) . Однако
анализ практического применения систем обоих типов к задачам инженерии
знаний приводит к выводу о несовершенстве имеющихся методик и необходимо­
сти их развития в соответствии с современными требованиями инженерии зна­
ний. Наибольшие перспективы в этой области, по-видимому, у методов много­
мерного шкалирования).
Многомерное шкалировщше (МШ) сегодня - это математический инструмен­
тари;й, предназцаченный для обработки данных о попарных сходствах, связях
и.ли отношениях между анализируемыми объектами с целью представления этих
объектов в виде точек некоторого координатного пространства. МШ представ�
ляет собой один из разделов прикладной статистики, научной дисциплины, раз-
1 68
Глава 5 • Н о вы е те нде н ции и п рикл адны е ас пе кты инже н ери и з наний
рабатывающей и систематизирующей понятия, приемы, математические методы
и модели, предназначенные для сбора, стандартной записи, систематизации и
обработки стапiстических данных с целью их лаконичного представления, ин­
терпретации и получения научных и практических выводов.
Традиционно МШ используется для решения трех типов задач:
1 . Поиск и интерпретация латентных (то есть скрытых, непосредственно не на­
блюдаемых) переменных, объясняющих заданную структуру попарных рассто­
яний (связей, близостей).
2. Верификация геометрической конфигурации системы анализируемых объек­
тов в координатном пространстве латентных переменных.
3. Сжатие исходного массива данных с минимальными потерями в их информативности.
Независимо от задачи МШ всегда используется как инструмент наглядного
представления (визуализации) исходных данных. М Ш широко применяется в
исследованиях по антропологии, педагогике, психологии, экономике, социологии
[Дэйвисон, 1 988].
В основе данного подхода .лежит интерактивная про цедура субъективного шка­
лирования, когда испытуемому (то есть эксперту) предлагается оценить сходство
между различными элементами П с помощью некоторой градуированной шкалы
(например, от О до 9, или от -2 до +2). После такой процедуры аналитик распола­
гает численно представленными стандартизованными данными, поддающимися
обработке существующими пакетами прикладных программ, реализующими раз­
личные алгоритмы формирования концептов более высокого уровня абстракции
и строящими геометрическую интерпретацию семантического пространства в ев­
клидовой системе координат.
Основной тип данных в МШ - меры близости между двумя объектами (i, j ) ­
dij. Если мера близости такова, что самые большие значения dij соответствуют
парам наиболее похожих объектов, то dij - мера сходства, если, наоборот, наиме­
нее похожим, то dij - мера различия.
МШ использует дистанционную модель различия, используя понятие расстоя­
ния в геометрии как аналогию сходства и различия понятий (рис. 5.3).
Для того чтобы функция d, определенная на парах объектов (а, Ь), бьiла евКJtидо­
вым расстоянием, она должна удовлетворять следующим четырем аксиомам:
d(a,b) � о,
d(a,a) = О,
d(a,b) = d(b,a),
d(a, b ) + d(b, c ) � d(a,c) .
Тогда, согласно обычной формуле евклидова расстояния, мера различия двух
объектов i и j со значениями признака k у объектов i и j соответственно х и х :
2
Би = du = I, (x;k - xjk )
[ k=l
К
]½
ik
jk
5.
1 69
J, Лат:ентные структуры з наний и психосема нти ка
L (3; 1 )
М (-3; 2)
Рис . 5 . 3 . Расстоян ие в евклидовой метрике
Дистанционная модель была многократно проверена в социологии и психологии
[Monahan, Lockhead, 1 977; Петренко, 1 988; Шмелев, 1 983] , что дает возможность
оценить ее пригодность для использования.
В большинстве работ по МШ используется матричная алгебра. Геометрическая
интерпретация позволяет представить абстрактные понятия матричной алгебры
в конкр,етной графической форме. Для облегчения интерпретации решения за­
дачи МШ к первоначально оцененной матрице координат стимулов Х применя­
ется вращение.
Среди множества алгоритмов МШ широко используются различные модифика­
ции метрических методов Торrерсона [Torgerson, 1958], а также неме трические
модел�. например Крускала [ Kruskal, 1964] .
При сравнении методов МШ с другими методами анализа, теоретически приме­
нимыми в инженерии знаний (иерархический кластерный анализ [Д юраи, Оделл,
1977] или факторный анализ [Иберла, 1 980]), МШ выигрывает за счет возможно­
сти дать наглядное количественное координатное представление, зачастую более
простое и поэтому легче интерпретируемое экспертами.
5 . 1 . 3 . Использован ие метафор для выявления
«с крытых» структур знаний
Несмотря на кажущуюся близость задач, инженерия знаний и психосемантика
существенно отличаются как в теоретических основаниях, на которых они бази­
руются, так и в практических методиках. Но главное отличие заключается в том,
что инженерия знаний направлена на выявление - в конеч:ном итоге - модели
рассуждений [Поспелов, 1 989], динамической или операциональной составляю­
щей ментального пространства (или функциональной структуры поля знаний
S 1), в то время как психосемантика, пытаясь представить ментальное простран­
ство в виде евклидова пространства, позволяет делать fшдимой статическую
структуру взаимного •расположения• объектов в памяти, в виде проекций скоп­
лений объектов (концептуальная структура S k ).
· 1 70
Глава 5 • Новые тенденции и прикладные ас�кты 1-1нженерии ·энаний
Помимо этого следует отметить ряд недостатков методов психосемантики с точ·ки зрения практиче<::кой инженерии знаний.
1. Поскольку в основе психосемантическоrо эксперимента лежит процедура из­
мерения субъективных расстояний между предъявляемыми стимулами, то и
результаты обработки такого эксперимента, как правило, используют геомет­
рическую интерпретацию - евклидово пространство небо�ьшоrо числа изме­
рений (чаще всего - двумерное). Такое сильное упрощение модели памяти
может привести к неадекватным базам знаний.
2. Естественность иерархии как глобальной модели понятийных структур созна­
ния служит методологической базой ОСП. Кроме того, и в естественноh,J· языке
понятия явно тяготеют к различным уровням обобщения. Однако в бdльшин­
стве прикладных пакетов не предусмотрено разбиение семантического про­
странства на уровни, отражающие различные степени общности понятий, -вклю­
ченных в экспериментальный план. В результате получаемые кластеры
понятий, пространственно изолированные в геометрической модели шкали­
рования, носят таксономически неоднородный характер и трудно поддаются
интерпретации.
3. Единственные отношения, выявляемые процедурами психосемантики, - это
-.далеко - близко• по некоторой шкале. Для проектирования и построения баз
знаний выявление отношений является на порядок более сложной задачей, чем
выявление понятий. Поэтому семантические пространства, полученные в р�­
зультате шкалирования и кластеризации, должны быть подвергнуты дальней­
шей обработке на предмет определения отношений, особенно функциональ­
нь1х и каузальных.
Нельзя ожидать, что эти противоречия могут быть разрешены быстро и безболез­
ненно, в силу того, что математический аппарат, положенный в основу всех паке­
тов прикладных программ по психосемантике, имеет определенные границы
применимости. Однако одним из возможных путей сближения без нарушения
чистоты процедуры видится расширение пространства конкретных объектов­
стимулов предметной области за счет добавления некоторых абстрактных объек­
тов из мира метафор, которые заставят эксперта-испытуемого выйти за рамки
объективности в мир субъективных представлений, которые зачастую в большей
степени влияют на его рассуждения и модель принятия решений, чем традицион­
ные правильные взгляды.
Ниже описан подход, разработанный совместно с Воиновым А. В. [Voinov, Gav­
rilova, 1 993; Воинов, Гаврилова, 1 994] и позволяющий вывести эксперта за гра­
ницы традиционной установки и тем самым выявить субьективные, часто скры­
ваемые или скрытые структуры его профессионального опыта.
Большинство результатов, полученных в коmитивной психологии, подтвержда­
ют, что у человека (в том числе и у эксперта) формальные знания о мире (в част­
ности, о той предметной области, где он является экспертом) и его личнь1й пове­
денческий опыт не могут существовать изолированно, они образуют целостную,
стабильную структуру. В западной литературе за этой ·структурой закрепилось
51 1 .._.Ла,;�н.т ные структуры знани й и пс ихосемантика
171
название •11,Jодел11 (или картина) мира•. Принципиальным сво·й ством модели
мира является то, что ее структура не дана человеку - .ее носИ1'ел;ю -· в интрос­
пекции, она работает на существенно латентном, . неосознаваемом уровне, зачас­
тую вообще ничем не отмеченном (в символической форме) на поверхности вер­
бального сознания.
Изучение модели мира человека является задачей когнитивной психологии, пси­
хосемантики и прочих родственных дисциплин. Что же касается эксперта как
объекта пристального внимания инженерии знаний, то здесь одна из проблем,
в решении которых может помочь психосемантика, связана с необходимостью
(и неизбежностью) отделения опыта эксперта от его объективных знаний в про­
цессе формализации и структурирования последних для экспертных систем.
Строго говоря, невозможно указать ту грань, за которой знания (которые можно
форма..�шзовать и извлечь) переходят в опыт (то есть в то, что остается уникаль­
ной, неотчуждаемой собственностью эксперта). Более корректно, по-видимому,
говорить о неком континууме, детальность градации которого может зависеть от
конкретной задачи.
Например, можно выделить следующие три уровня:
1 . Знания, предназначенные для изложения или доказательства (аргументации),
например, на междисциплинарном уровне или для популярной лекции (вер­
бальные).
2. Знания, которые применяются в реальной практике, - знания еще вербализуемые, но уже нерефлектируемые.
3. Собственно опыт, то есть знания, лежащие на наиболее глубоком, неосознава­
емом уровне, отвечающие за те решения эксперта, которые внешне ( в том чис­
ле и для него самого) выглядят как мгновенное озарение или -.инсайт�, интуц­
тивный творческий акт (интуитивные).
Классическая методика психосе.м антическоrо эксперимента также не позволяет
выделить из его результатов интуитивный уровень. Это видно из самой тестовой
процедуры. Просят ли испытуемого оценить сходство-раэличие стимулов напря­
мую или же предлагается оценить их соответствие некоторым -.конструктам• - в
любом случае испытуемый вольно или невольно настраивается на необходимость
доказательности своего ответа в терминах объективных с�ойсtв стимулов.
Большинство методов извлечения зн�ний ориентировано на верхни� - вербаль­
ные или вербализируемые - уровни знания. Необходим косвенный метод, ори­
ентированный на выявление скрытых предпочтений практического опыта или
операциональнwс составляющих опыта. Таким методом может служить метафо­
рический подход. Метафорический подход, впервые описанный с чисто лингвис­
тических позиций [Black, 1962; Ricoeur, 1975], а также с позиций практической
психолоrцlf [Гордон, 1987], был видоизменен для нужд инженерии знаний. На­
пр 1:1мер, в экспериментах no объ ективному сравнению языков проrраммирова1-JИЯ м�у собой были также использованы два метафорических «мира• - мир
живщных и мир транспорта.
1 72
1
Глава 5 • Но в ы е тенден ци и и при кладн ы е аспекты и нже н ерии , э н.ани й
В рамках этого подхода удалось экспериментально доказать следующие тезисы:
• метафора работает как фw�ьтр, выделяющий, посредством подбора адекват­
ного объекта сравнения, определенные свойства основного объекта (то ееть
того, о котором собственно и идет речь). Эти вь1деляемые свойства имеют су­
щественно операциональный характер, проявляющийся на уровне полимор­
физма методов, так как метафора по самой своей сути исключает возмож­
ность сравнеция объектов по их внутренним, объективным свойствам;
• метафора имеет целью скорее не сообщить что-либо о данном объекте (то есть
ответить на вопрос • что это?•), а призвать к определенному отношению к
нему, указать на некую парадигму, говорящую о том, как следует вести себя по
отношению к данному объекту;
• субъективному сдвигу в отношении к основному объекту (например, 1( языку
программирования) сопутствует также и сдвиг в восприятии объекта сравне­
ния (например, к конкретному животному) в силу вышеуказанной специфики
фильтруемых метафорой свойств. Поэтому объект сравнения выступает в ме­
тафоре не по своему прямому назначению, то есть это не просто •лев• как
представитель фауны, а воплощение силы, ловкости и могущества;
• в том случае, когда метафора сопоставляет не единичные объекты, а некоторые
их множества, в которых объекты связаны осмысленными отношениями, про­
странство объектов сра1внения должно быть изоморфно пространству основ­
ных объектов по системе указанных отношений.
На эти тезисы опирается предлагаемая модификация классической методики со­
поставления объектов, применяемой, например, в оценочной решетке Келли
[Kelly, 1955]. При проведении эксперимента была использована система MEDIS
[Алексеева, Воинов и др., 1989; Воинов, Гаврилова, 1994]. Эта система позволяет
планировать, проводить и обрабатывать данные произвольного психосеманти­
ческоrо эксперимента. Помимо классической парадигмы многомерного шкалиро­
вания, система MEDIS включает в себя некоторые возможности теста репертуар­
ных решеток. В частности, она позволяет работать со стимулами двух сортов так называемыми элементами и конструктами (с единственным исключением:
конструкты в системе MEDIS - в отличие от классического теста репертуарных
решеток - монополярны). Естественно, выбор базового инструментария суще­
ственно повлиял на описываемую экспериментальную реализацию методики.
В качестве предметной области был выбран мир языков программирования. В про­
странство базовых понятий (выступавших в методике в качестве элементов) бы­
ло включено несколько более или менее популярных языков программирова­
ния, принадлежащих к следующим классам:
• языки искусственного интеллекта;
• традиционные процедурные языки
• так называемые •макроязыки•, обычно реализуемые в оболочках операционных систем, текстовых редакторах и т. д.
В качестве метафорических прос'Jlранств выбраны мир животных и мир транс­
порта. Объекты этих миров выступали в методике в качестве (монополярных)
конструктов, На первом этапе эксперимента каждьJЙ из респондентов · выпол-
5 .' 1 . · Латентны е с труктуры з н аний и психосем антика
1 73
нял классическое попарное субъективное шкалирование элементов. На воп­
рос, -.Есть·ли что-либо общее между данными язьrками программирования•, рес­
понденту предлагалось ответить одной из следующих альтернатив.
/JA!
/JjJ.
???
Нет
НЕТ!
r
1
2
3
4
5
Объекты оч е н ь-бли зки
Между об ъектам и есть что-то об щ ее
Неоп ределенны й ответ
О бъекты различны
О бъекты сове ршенн о несов мести мы
Данные этого этапа (отдельно для каждого из респондентов) подвергались об­
работке методами многомерного шкалирования (см . выше) и представлены на
рис. 5.4.
Результатом такой обработки является некоторое евклидово пространство не­
большого числа измерений, в котором исходные оценки различий представлены
геометрическими расстояниями между точкам». Чем лучше эти расстояния соотi
ветствуют исходным различиям, тем более адекватным считается результат обра­
ботки в целом . При этом буквальное совпадение расстояний и числовых кодов
ответов, естественно, не является обязательным (хотя оно и возможно в некото­
рых модельных экспериментах). Более важным оказывается ранговое соответ­
ст вие расстояний исходным оценкам . А именно, в идеальном случае все расстоя­
ния. между точками, .соответствующие (например) ответам •дА I • в исходных
данных, должны бьпь меньше (хотя бы и на доли процента масштаба шкалы) всех
расстояний, соответствующих ответам •да•, и т. д.
В реальном эксперименте идеальное соответствие невозможно в принципе, так
как целью обработки является сжатие, сокращение размерности данных, что ог­
раничивает ·ч исло координат ных осей результирующего пространства . Тем не
менее алгоритм шкалирования пытается - насколько это возможно - миними­
зировать ранговое несоответствие модели исходным данным.
Геометрическую модель шкалирования можно интерпрет ировать по-разному:
• во-первых, можно выяснить·смысл координатных осей результирующего про­
с транст ва .. Эти оси по сути своей аналогичны факторам в факторном анализе,
что позволяет использовать соответствующую парадигму интерпретации, де­
тально разработанную в эксперимент альной психологии. В данном случае
можно считать, что выявленные факторы играют роль базовых категорий, или
базовых (латентных) конструктов, с помощью которых респондент (как ·пра­
вило, неосознанно) упорядочивает свою картину мира (точнее, ее проекцию на
данную предметную область);
• во-вторых; можно проанализировать компактные группировки стимулов
этом nрост ранстве, отождествив их с некоторыми существенными (хотя 'и
скрытыми о т ин троспекции) таксономическими единицами, реально при­
сутствующими в модели мира эксперта. Сущест венно , что делается попы тка
интерпретировать кластеры; полученные по модели шкалирования, а не по
исходным числовым кодам различий. Это вытекает из предположения, что
в
1 74
Гла ва 5 • Н о в ые тенде н ции и при кладн ые аспекты и нже н ерии з на ний
информация, не воспроизводимая главными (наиболее нагруженными) ,фак•
торами, является «шумом•, сопутствующим любому (а особенно психологи­
ческому) эксперименту.
Рисунок 5.4 отражает традиционную классификацию языков программирова­
ния и легко поддается вербальной интерпретации. Например, на рисунке r9ри­
зонтальная ось соответствует делению языков программирования на. « языки ис­
кусственного интеллекта• (левый полюс шкалы) и « традиционные яз.ь1 ки
программирования• (правый полюс). Вертикальная ось отражает 1шассифика­
цию языков программирования в зависимости от уровня - языки высокого
уровня (нижний полюс) и языки низкого уровня или системные яз.ык.и (верхний
полюс).
у
• AssemЫer
• С++
• Pвscal
.с
• Fortran
• Prolog
• Smalltalk
• LISP
х
• Dbaselll+
• Clipper
• Basic
• Multi-Edit Масго
• DOS Batch
.
Рис. 5.4. Класс ификация языков прог раммирования
Основная экспериментальная процедура - попарное сравнение некоторых объек­
тов и выражение степени их сходства (несходст ва) на числовой оси или выделе­
ние пар близких объектов из предъявленной триады - сама по себе накладывает
больmое количество ограничений на выявляемую структуру, в частности:
1 . Из-за выбора стимульноrо материала (выбор объектов ост ается за инженером
по знаниям).
2. Из-за несовершенства шкалы измерений.
3. В связи с рядом допущений математического аппарата. Но главное, что полу­
ченная структура знаний чаще всего носит академический характер, то есть
отражает объективно существующие, но легко объяснимые, как бы лежащие
на поверхности закономерности.
Это связано с психолрrической установкой самого эксперимеJПа, во время кото­
рого эксперта как бы проверяют, экзаменуют и он, естественно, стремится да·вать
правильные ответы.
На следующем этапе эксперимента респонденту nредлаrалось сопоставить каж­
дый из языков программирования с каждым из метафорических персонажей. Как
и на первом этапе, пары предъявлялись в равномерно-случайном порядке (ана.r.10-
1 75
5А :-Л атентные структуры знаний и пс и хосе м ант ика
гичном расписанцю кругового турнира в спортивных играх). Инструкция для со·
поставления выглядела следующим образом:
Попробуйте оценить выразительную силу данной метафоры: .ЛИСП - это слон•
или .с++ - это. яхта •.
,
Результирующая таблица числовых кодов оценок (идентичная оцено�ной решет­
ке Келли) была также обработана методами многомерного шкалирования про­
граммы М�ДИС. Результаты представлены на рис. 5.5 и 5.6.
у
• Multl-Edit Мвсrо
'
□ Pcen
• Basic
□ Кот .
• DOS Вatch
□П х
ету
8 Dbaselll+
□ Обезья на
• AssemЫer
□ Л иса
• Prolog
•
Pascal
8 LISP
□ Павл ин
□ Тиrр
) Зая ц
□ Волк
8 Smalltalk
□ Ле в
4 Fortran
,с
□ Конь
8 Clipper
□ Слон
х
• С++
Рис. 5.5. Метафорическая классификация я з ыков програ ммирования (ми р животных)
у
• Pascal
1 Вasic
□ IТ'влеrа
;:� Велосипед
□ Поезд
• Fortran
□ Автомобиль • С++
□ Па роход
□ Яхта
8 DOS Batch
.с
8 Smalltalk
• Prolog
8 Dbaselll+
□ Самолет
• Clipper
8 LISP
8 Multi-Edit Macro
□ Метро
□ Слон
□ Авто&iс
□ Грузовик
l
х
8 Clipper
Рис. 5.6. Метафорическая классификация языков п рограммирования (мир тр анспо рта)
При интерпретации удалось выявить такие латентные понятия и структуры, как
•степень. изощренности языка• (шкала Х рис. 5.5), •сила• (шкала У рис. 5.5),
•универсальность• (шкала У рис. 5.6), •скорость• (шкал;� Х рис. 5.6) и др.
Кроме этого, полученные рисунки позволили выявить скрытые предпочтения эк·
сперта и существенные характеристик и объектов, выступ<Ц)mих в виде стиму­
лов -:- •силу• �зыка С ( •с,лон• ); скорость С++ (•яхта•); •старомодность• Форт­
рана (•телега•) и пр.
1 76
Глава 5 • Н овы е тенден ции и пр икл адн ые асп екты инжене рии э н ани й
В применении к реальному процессу извлечения знаний это обстоятельство ста­
новится принципиальным, так как позволяет на самом деле отделить те знания,
благодаря которым эксперт является таковым (уровень В), от общезначимых; ба­
нальных (для экспертов в данной предметной области) знаний (уровень А), кото­
рые возможно и не стоят того, чтобы ради них создавать собственно экспертную
систему.
Однако можно ожидать, что во многих (если не в большинстве) случаях выявлен­
ные латентные структуры могут полностью перевернуть представления инжене­
ра по знаниям о предметной области и позволить ему существенно углубить базу
знаний. Введение мира метафор - это некая игра, а игра раскрепощает сознание
эксперта и, как все игровые методики извлечения знаний (п. 4.2), является хоро­
шим катализатором трудоемких серий интервью с экспертом, без которых сегод­
ня невозможна разработка промышленных интеллектуальных систем.
5 . 2 . Метод реп е ртуа р ных решеток
5 . 2 . 1 . Осно вные п онятия
Среди методов когнитивной психологии - науки, изучающей то, как человек по­
знает и воспринимает мир, других людей и самого себя, как формируется целост­
ная система представлений и от ношений конкретного человека, особое место за­
нимает такой ме тод личност:ной психодиагностики, как метод репертуар11ых ре­
шеток (•repertory grid� ).
Впервые метод был сформул·и рован автором теории личностных конструктов
Джорджем Келли в 1955 r. Чем шире набор личностных конструктов у субъекта,
тем более многомерным, дифференцированным является образ мира, человека,
других явлений и предметов, то есть тем выше его когнитивная сложность [ Гав­
рилова, 1988).
Репертуарная решетка представляет собой матрицу, ко торая заполняется либо
самим испытуемым, либо экспериментатором в процессе обследования или бесе­
ды. Столбцу матрицы соответст вует определенная группа объектов, или, иначе,
элементов. В качестве объектов могут выступать люди, предметы, понятия, отно­
шения, звуки, цвета - все, что интересует психодиаrноста. Строк и матрицы
. представляют собой конструкты биполярные признаки, параметры, шкалы,
альтернативные противоположные отношения или способы поведения.
Конструкты либо задаются исследователем, либо выявляются у испытуемого с
помощью специальных приемов и процедур выявления. Вводя понятие конст­
рукта, Келли объединяет дее функции: функцию обобщения (установления
сходства) и функцию противопоставления. Он предлагает несколько определе­
ний понят ия «констру�т •. Одно из них:
"'"7'"
Конструкт - зто'некоторый п ризнак или свойство, п о которому iJ,Ja или несколько объек­
тов сходны между собой и, следовательно, отличны от третьего объекта или нескольких
других объектов.
5.2 . 1 Метод репертуарных решето к
· 1 77
НапримеJ>, , Выделение из трех предметов . •диван. кресло, стул• двух •диван и
кре� .выявляет конструк.т •мягкость мебели•. КелJJИ в своих работах подчер.- .
кивает биполярность конструктов. Он считает, что, утверждая что-нибудь, мы
всегда одновременно что-то отрицаем. Именно биnолярность конструктов делает
возможным построение репертуарной решетки. Например, север - юг - это ре­
ферентная ось: элементы, которые в одном контексте являются -.севером•, в дру­
гом становятся, -•югом•.
Возможности конструкта ограничены. Они могут быть применены только к неко­
торым объектам. Это- нашло свое отражение в понятии -.диапазона пригодности•
конструкта. Английские психологи Фраж:елла и Баннистер [Франселла, Бан­
нистер, 1987] счиtают правило •диапазона пригодности• отличительной чертой
техники ·репертуарных решеток. Под диапазоном пригодности можно понимать
область предс тавлений человека о мире, понятия которой можно соотнести с
конкретной референтной осью выделяемого конструкта. Психологически осмыс­
ленный результат получится тол,ько в том случае, если элементы, используемые в
репертуарной решетке� будут попадать в -.диапазон пригодности• конструктов
испытуемого.
Конструкты - не изолированные образования. Они взаимодей�твуют друг с дру­
гом, причем характер этого взаимодействия не случаен, а носит целостный сис­
темный характер.
В процессе �аполн�н� репертуарной решетки испытуемый должен оценить каж­
дый объект по каждому конструкту или каl\ИМ-то другим образом поставить в .
соответствие элементы конструктам.
Определение репертуарная означает, что элементы выбираются по определен­
ным правилам так, чтобы они соответствовали какой-либо одной области и все
вместе были связаны осмысленным образом (коmекстом) аналогично репертуа­
ру ролей в пьесе. Предполагается, что, изменяя репертуар элементов, можно •На­
страивать• мет одики на выявление конструктов разных уровней общности и от­
носящихся к разным системам.
При переводе с английского языка термин матрица не используется, поскольку
репертуарная решетка не всегда является матрицей в строгом смысле этого тер­
мина: в ней на пересечении строк и столбцов не обязательно стоят числа, не все­
гда выдерживается прямоугольный формат, строки могут быть разной длины.
Второй смысл этого определения заключается в том, что в технике репертуарных
решеток часто элементы задаются в виде обобщенных инструкций, репертуара
ролей, на место которых каждый конкретный человек мысленно подставляет сво­
их знакомых людей или конкретные предметы, если в качестве элементов заданы
н_азвания предм етов.
По всей видимости, репертуарные решетки лучше считать специфЮiеской разно­
видностью структурированного интервью. Обычно мы исследуем систему конст­
руктов другого человека в ходе разговора с ним. В процессе беседы мы постепенно
начинаем понимать, как он видит мир, что с чем связа�о, что из чего . следует, что
для чего важно, а что нет, как он оценивает других людей, события и ситуации.
1 78
Глава 5 • Нов ые тенде н ци и и при кладны е �сп е кты и н же н ер_ии знани.й
Решетка формализует этот процесс и дает мaтeмaти.1Jec�oe :ftбoc.lfe:J39;JIИ@ i(l�3fЙ
между конструктами данного человека, позволяет более детально изучир, от�
дельные подсистемы конструктов, подметить индивидуальное, специфическое в
структуре и содержании мировоззрения человека.
Важное положение техники репертуарных решеток: ориентация на выя�ление
собственных конструктов испытуемого, а не навязывание их ему извне.
Гибкость и эффективность репертуарных решеток, качество и количество полу­
чаемой информации делают их пригодными для решения широкого круга задач.
Методики этого типа используются в различных областях практической деятель­
ности: в педагогике и социологии, в медицине, рекламе и дизай�е. Репертуарные
решетки оказались методом, идеально приспособленным для реализации в виде
диалоговых программ на компьютере, что также способствовало их широкому
распространению. Достоинства и преимущества данного метода полностью рас­
крываются тогда, когда есть возможность, проведя исследование, быстро обрабо­
тать результаты и проанализировать их с тем, чтобы уже при следующей встрече
с испытуемым можно было уточнить и проверить возникшие предположения, со­
ставить и провести репертуарную решетку другого типа, а если это необходимо, и
дополнить прежнюю, I:Iзменив репертуар элементов или выборку конструктов.
5.2.2. Методы выявления конструкто в
Метод ми н им ал ьного контекста
Метод минимального контекста или метод триад наиболее часто используется
для выявления конструктов. Элементы представляются в группах по три. Это
минимальное число, которое позволяет определить сходство и различие.
Испытуемому предъявляются три элемента из всего списка и предлагается на,
звать какое-нибудь важное качество, по которому два из них сходны между собой
и, следовательно, отличны от третьего. После того как экспериментатор запишет
ответ, испытуемого просят назвать, в чем конкретно состоит отличие третьего
элемента от двух других (если испытуемый не указал, какие именно два элемента
были оценены как сходные между собой, то его просЯJ' сделать это). Ответ на этот
вопрос и представляет собой противоположный полюс конструкта. Испь1туемо .!
му предъявляется столько триад элементов, сколько сочтет нужным эксперимен­
татор. Специфических правил не существует. Все зависит лишь от nеличиnы вь1борки, то есть от числа конструктов, подлежащих исследованию.
Прим е р 5.3
Имеется список и з названий фруктов. Берется триада •яблоко-груша-апельсин• . Рес­
пондент выделяет два сходных объекта - •яблоко и груша;;.; качество, определяющее
сходство, - •отсутствие аллергической реакции у респондента•, отличие третьего
объекта - «аллергичность;;., Так выявлен личностный конструкт «аллерrичность/от­
сутствие та1<овой;;..
�.-2. ,меrод репертуарных решеток
1 79
Други е метод ы выявл ени я конст рукто в
Фра�с�ла и Баннистер I Франселла, Баннистер, 1987] ·описывают ме тоды, кото­
рые такж«1 используют триады:
• последовательный метод;
• метод самоидентификации;
• метод ролевой персонификации.
В двух последних методах в триаду включается элемент •Я сам•.
Келли предложил использовать триады для выявления конструктов, посколь­
ку этот метод отражал его теоретические представления о том, как конструкты
впервые возникают. Однако в связи с тем, что у испытуемого выявляются уже
сложившиеся конструкты, не обязательно использовать непременно три элемен­
та. Триада не является единственным способом выявления противоположного
полюса. · · .
Для выявления конструктов можно использовать два элемента (выявление кон­
структов при помощи диад элементов) или более, чем три, как это делается в.ме­
тоде полного контекста [Франселла, Баннистер, 1987].
Часто используемый метод - техника лестничного спуска Хинкла:
• конструкты извлекаются .ст.андартным методом;
• по поводу отдельного конструкта задается вопрос .к какому полюсу данного
конструкта вы бы хотели быть отнесены?•;
• затем: •Почему вы предпочитаете этот полюс?•, •Что противостоит этому? •.
Таким образом, получается новый конструкт, более обобщенный, чем исходный .
Процесс повторяется, и выделяется иерархия конструктов.
5 . 2 . 3 . Анализ репертуарных решето к
Анализ репертуарных решеток позволяет определить силу и направленность
свя:зей между конструктами респондента, выявить наиболее важные и значимые
пар�метры (rлубицные конструкты), лежащие в основе конкретных оценок и от­
ношений, построить целостную подсистему конструктов, позволяющую описы­
вать и предсказывать оценки и отношения человека.
'
Ан ел и а .едини ч но й р е пертуа р но й реш ет ки
Можно использовать форму кластерного ·анализа для группировки конструктов.
Этот алгоритм структурирует конс трукты в линейный порядок, так что конст­
рукты, находящиеся близко в пространстве, также оказываются близки в порядке.
Этот алгоритм имеет преимущество при демонс трации, так как представление
просто реорганизует решетку, ;показывая соседства конструктов и элементов.
Таким образом, формируются две матрицы- одна для элементов, другая для ·
конструктов. Кластеры определяются выбором наибольших значений в этих мат -
1 80
Глава 5 • Н овые тенденции и прикладные ас пекты инженер ии знаний
рицах - то есть на�более св;Язанных составляющих матрицQ,J, - до т�х пор пока
все элементы и конструкты не оказываются включенными в кластерное дерево.
Программа производит иерархическую кластер �зацию системы конструктов экс­
перта и представляет извлеченные знания.
Кроме тоrо, для каждого конструкта имеются численные значения в решетке как
вектор величин, связанных с расположением элементов относительно полюсов
данного конструкта. С этой точки зрения каждый конструкт может быть пред­
ставлен как точка в многомерном пространстве, а его плоскость определяется
числом связанных с ним элементов. Естественной мерой отношений между кон­
структами является, следовательно, расстояние между ними в этом многомерном
пространстве. Два конструкта с нулевым расстоянием между ними - это конст­
рукты, по отношению к которым элементы структурируются совершенно одина­
ково. Следовательно, можно считать, что они используются одинаково. В каком­
то смысле это эквива,!):ентные конструкты.
Для неэквивалентных конструктов можно анализировать их пространственные
отношения, определяя ряд осей как проекцию каждого конструкта на ось, наи­
более уд-1.r�енную от них, проекцию на вторую ось, связанную с оставшимися
расстоя1-1 иями, и т. д. Это метод анализа главных компонент пространства
констру1:тов. Он связан с факторным анализом семантического пространства,
использованного в изучении семантического дифференциала. Метод анализа
главных компонент позволяет'пре;цставить элементы и конструкты так, что меж·�
ду ними могут быть выявлены взаимосвязи. Возможно построить логический
анализ репертуарной решетки, используя конструкты как предикаты относи­
тельно элементов.
Ан ализ нескольких репертуар н ых ре ш еток
'Довольно часто возникает ситуация, когда требуется сравнить несколько репер­
туарных. решеток. Анализ серии репертуарных решеток, заполняемых одним и
тем же человеком в разные моменты времени, позволяет следить за динам�кой
конструктов и оценок, строить траектории изменения состояния человека в сис­
теме его собственных субъект�вных шкал.
Проанализируем несколько репертуарных решеток, заполняемых разными людьми.
Аиализ пар системиых коиструктов используется для измерения согласия и по­
нимания между людьми. Для этого дsа эксперта, имею�е разные точки зрения,
создают и заполняIРт решетки по общей области знаний. При этом каждый неза­
висимо от другого выбирает элементы, выявляет конструкты и оценивает их. За­
тем каждый делает две пустые копии своей решетки, оставляя элементы и конст­
рукты без значений их оценки. Обе эти решетки заполняются партнерами. При
этом одна заполняется так, как он сам себе это представляет, а вторая так, как он
представляет себе заполнение оригинальной решетки· ее автором. Сравнение пар
решетЬк помогает достигнуть соглашения и понимания между дsумя людьми.
Существуют 'три способа сравнения двух решеток.
1. Сцепление решеток, имеющих общие элементы, и их последующая 'обработка
одним из описанных алгоритмов, как если бы они составляли одну большую
5.2. Метод репертуарных решеток
181
решетку. Таким образом, можно исследовать взаимодействие идей через про­
верку' СМёШаlfНЫХ кластеров КОНСТРУКТОВ ИЗ разных решеток.
2. Дщшый путь требуе� наличия двух решеток с одинаковыми именами элемен­
тов и конструктов и показывает расхождения между ними через измерение рас­
стоя �:�ия между одними и теми же именами. Результать1 показьшают согласие
в понимании и выявляют различия между двумя решетками, основанными на
.
одинаковых именах и конструктах.
3. Данный , способ также использует две решетки с одинаковыми именами эле­
ментов и конструктов, находит наиболее сильно изменяющиеся элементы и
конструкты и удаляет их из решетки. Таким образом, определяются базовые
элементы и конструкты, которые показывают согласие и понимание.
Анализ групп системных конструктов. Анализируется серия репертуарных реше­
ток, полученная от группы людей, использовавших одинаковые элементы. Срав­
нивается каждая пара и показывается «групповая сеть�, которая отражает связи
сходных конструктов внутри группы. Создается решетка, отражающая конструк­
ты, которые понимаются большинством группы, и это служит основанием даль­
нейшего анализа. Каждый конструкт, неиспользованный в рамках группы, оцени­
вается· по силе связанности с другими конструктами.
5 . 2.4.. Автоматизированные методы
Данный параграф посвящен обзору некоторых наиболее известных методов и
систем приобретения знаний на основе метода репертуарных решеток, частично
из работ [Осипов, 1 990; Молокова, 1 992; Осипов,1 997].
Впервые автоматизированное создание репертуарных решеток и извлечение из
экспертов конструктов было реа.11изовано в системе PLANET [Gaines, Shaw, 1 984;
S�aw, Woodward, 1 988]. Дальнейшим развитием системы PLANET является ин­
тегрированная среда KITTEN, поддерживающая ряд методов извлечения знаний.
Буза Д. в системе ETS [Boose, 1985] использовал метод репертуарных решеток
для выявления понятийной системы предметной области. Потомками ETS явля­
ются система NeoETS и интегрированная среда для извлечения экспертных зна­
ний AQUINAS [Boose, Bradshaw, Shema, 1 988].
Известно большое число прототипов ЭС, для создания которых использовалась
ETS. Среди них:
1. Советчик по выбору инструментария для разработчиков ЭС.
2. Консультант по язь�кам программирования.
3. Анализатор геологических данных.
4. Советчик по отладке Фортран-программ.
5. Консультант по СУБД и др.
Однако область применения ETS ограничена извлечением экспертньхх знаний
для таких несложных задач анализа, которые не требуют для своего решения про­
цедурных, каузальных и стратегических знаний.
1 82
Глава 5 • Н овые тенденции и при клад н ые ас пекты · и нжен ери и з н аний
ETS взаимодействует с экспертом в диалоговом режиме, интервьюируя ero и по­
могая анализировать создаваемую БЗ. В архитектуре ЕТS ,могут быть выделены
подсистемы: извлечения элементов; выявления конструктов; построения репер­
туарной решетки; построения графа импликативных связей; генерации продук­
ционных правил; тестирования БЗ; коррекции БЗ; генерации БЗ для различных
инструментальных средств создания ЭС . .
В диагностической системе MORE [Кahn, Nowl;ш, McDermott, 1985} использо­
. ваны принципы, сходные с теми, которые лежат в основе обеих описацных выше
систем. Здесь впервые использовано несколько различных стратегий интервью.
Техника интервью, использованная в М ОRE, направлена на выявление. следую­
щих· сущностей:
• гипотезы - подтверждение которых имеет своим результатом диаmоз;
• симптомы - наблюдение которых приближает последующее принятие гипо­
тезы;
• условия - некоторое множество событий, которое не является непосре:Цстве,н- , .
но симптоматическим для какой-либо гипотезы, но которое может иметь диаг­
ностическое значение для некоторых других событий;
• связи - соединение сущностей;
• пути - выделенный тип связи, который соединяет гипотезы с симптомами.
В соответствии с этим в системе используются следующие стратегии интервью:
дифференциация гипотез, различение симптомов, симптомная обусловленность,
деление пути и некоторые другие.
Стратегия дифференциации гипотез направлена на поиск симптомов, которые
обеспечивают более точное различие гипотез. Наиболее мощными в этом смысле
являются те симптомы, которые наблюдаются при одном диагностируемом собы­
тии.
Стратегия различения симптомов выявляет специфические характеристики симп­
тома, которые, с одной стороны, идентифицируют его как следствие некоторой
гипотезы, с другой - противопоставляют другим.
Стратегия симптомной обуслоВllенности направлена на выявление негативных
симптомов, то есть симптомов, отсутствие которых имеет больший диагностичес­
кий вес, чем их присутствие.
Стратегия деления пути обеспечивает нахождение симптоматических·событий,
которые
лежат на пути к уже найденному симптому. Если такой симпто� суще­
·
ствует, то он имеет большее диагностическое значение, чем уже найденный.
· В системе KШTON [Diderich, Ruhman, Мау, 1 987] (см. п. 4.6.4) дли приобретения
знаний используются два источника: эксперт его знаниями; полученными
практике; книжные знания, докум_енты, описания, инструкции ( эти знания хоро­
шо структурированы и фиксированы традиционными средствами). Для извлече­
ния знаний из первого источника в KRITON применена техника интервь�, ис­
пользующая стратегии репертуарной решетки разбиения на ступени. Стратегия
разбиения на ступени направлена на выявление наследственной структуры пред-
с
на
_.S .З.'- ')(r:�равлени е знаниями
183
метной области. Акцент делается на выявлении структуры родовых и видовых
понятий (супертипов ). При этом типы, выявленные на очередном шаге работы
стратегии, становятся базисом для последующего ее применения.
В системе применен прием переключения стратегий: если при работе стратегии
репертуарной решетки при предъявлении тройки семантически связанных поня­
тий эксперт не в состоянии назвать признак, отличающий два из них от третьего,
система запускает стратегию разбиения на ступени и, задавая эксперту вопросы о
понятиях, связанных с предыдущими отношениями •род - вид.-, предпринимает
попытt<у выяснения таксономической структуры этих понятий с целью выявле­
ния признаков,' их различающих. ' .
В России существенные результаты в применении репертуарных решеток в ин­
женерии знаний были получены под руководством Г. С. Осипова в рамках про­
екта SIMER+ MIR (см. п. 4.6.5).
5 . 3 . У пр авл ен ие знан ия ми
5.3-. 1 . Что такое «управление знаниями»
Следует иметь в виду, что знаниями в контексте данного параграфа называют не
только знания, но и данные по определениям в главе 1 данного учебника.
Понятие •управление знаниs,ми• (КМ - Knowledge Management) появилось в се­
редине 90-х годов в крупных корпорациях, где проблемы обработки информа­
ции приобрели особую остроту и стали критическими. При этом стало очевид­
ным, что основным узким местом является обработка знаний, накопленных
специалистами компании, так как именно знания обеспечивают преимущество
перед конкуреn:тами. Часто информации в компаниях накоплено даже больше,
чем они в состоянии обработать. Различные компании пытаются решать этот
вопрос по-раз1юму, но при этом каждая компания стремится увеличить эффек­
тивность обработки знаний [Macintosh, 1997].
Ресурсы знаний различаются в зависимости от отраслей индустрии и приложе­
.ний, но, как правило, включают руководства, письма, новости, информацию о
зак·аэчиках, сведения о конкурен\'ах и данные, накопившиеся в процессе разра- ·
ботки. Для применения КМ-систем используются разнообразные технологии:
• электронная почта;
• базы и хранилища данных (Data Wharehouse);
• системы групповой поддержки;
• броузеры и системы поиска;
• корпоративные сети и Интернет;
• экспертные системы и базы знаний; интеллектуальные системы.
Традиционно проектировщики систем КМ ориентировались лишь на отдельные
группы потребителей - главным образом менеджеров. Более современные _КМ­
системы спроектированы уже в расчете на целую организацию.
1 84
Глава 5 • Новые тенденции и при кладн ые ас пекты и нженери и з нан ий
Хран ил ища да нн ых, которые работают по принципу центр ального ct<Jiaд �. был�
одним из первых инструментариев КМ. Как правило, хранилища .содержат, мно­
голетние версии обычной БД, физически размещаемые в той же самой базе. Kor·
да все данные содержатся в едином хранилище, изучение связей между отдель­
ными элементами может быть более плодотворным.
При этом активы знаний могут находиться в различных местах: в базах данных,
базах знаний, в картотечных блоках, у специалистов и могут быть рассредоточе­
ны по всему предприятию. Слишком часто одна часть предприятия повторяет
работу другой части просто потому, что невозможно найти и использовать зна­
ния, находящиеся в других частях предприятия.
Управление знаниями - это совокупность процессов, которые упра вляют создание м ,
распространением, обработкой и испол ьзование м знаний в нутри предприятия.
Необходимость разработки систем КМ обусловлена следующими причинами:
• работники предприятия тратят слишком много времени на поиск необходи­
мой информации;
• опыт ведущих и наиболее квалифицированных сотрудников используется
только ими самими;
• ценная информация захоронена в огромном количестве документов и данных,
доступ к которым затруднен;
• дорогостоящие ошибки повторяются из-за недостаточной информированности и игнорирования предыдущего опыта.
Важность систем КМ обусловлена также тем, что знание, которое не использует­
ся и не возрастает, в конечном счете становится устаревшим и бесполезным, так
же, как деньги, которые сохранены без того, чтобы стать оборотным капиталом, в
конечном счете теряют свою стоимость, пока не обесценятся. Напротив, знание,
которое распространяется, приобретается и обменивается, генерирует новое зна·
ние.
5 . 3 . 2. Упра влен и е знаниям и корпоративная
памят ь
Большинство обзоров концепции управления знания ( КМ) уделяет �нимание
только первичной обработке корпоративной информации типа электронной по­
чты, программного обеспечения коллективной работы или гипертекстовых баз
данных (например [Wiig, 1 996]). Они формируют существенную часть из необхо­
димой, но определенно не достаточной технической инфраструктуры для управ­
ления знаниями.
Одним из новых решений по управлению знаниями является понятие корпора­
тивной памяти (corporate memory), которая по аналогии с человеческой памятью
позволяет пользоваться предыдущим опытом и избегать повторения ошибок.
Корпоративная память фи ксирует информ ацию из различных источнико в nредпри�тия и
делает эту и нформацию доступной специалистам для решения производственных задач.
1 85
5. 3 . 1 Управление знан иями
Корпоративная память не позволяет исчезнуть знаниям выбывающих специали­
стов (1ход на пенсию, увольнение и пр.). Она храни�: большце объемы данных,
информации и знаний из различных источников предприятия. Они представ­
лены в различных формах,. таких как базы данных, документы и базы знаний
(рис. 5.7).
Неявные "8Нные и знания
Знания
в rолове
данные
в rолове
В ыявление
Извnечен111е + Формализация
г-----
---------
1
&Д
1
,--..............,
:
!РБД I
1
1
1
ок l
------,
__,.__
&З
gj
i
1
1
.о :
В,�с 1111 111
с:
l д
1
1
1
1
._____,
______.
1_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 1
1
Явные данные и знания
Рис. 5.7. Данные и знан ия в системах корпоратив ной па мяти
Введем два уровня корпоративной памяти (так называемые явные и неявные зна­
ния [Nonaka, Takeuchi, 1 995)).
Уровень 1. Уровень материальной или явной информации - это данные и знания,
.
которые мor'y't быть найдены в документах организации в форме . сообщений, пи­
сем, статей, справочников, патентов, чертежей, видео- и аудиозаписей, про­
rраммноrо обеспечения и т. д.
Уjювень 2. Уровень персональной или скрытой информации - это персоналыrое
знание; неотрывно связанное с индивидуальным опытом. Оно может быть пере­
дано через прямой контакт - •с глазу на глаз.-, через процедуры извлечения зна­
ний · (см. главу 3). Именно скрытое знание - то практическое знание, которое яв­
ляется ключевым при принятии решения и управлении технологическими про­
цессами.
В действи;ельности эти два типа информации, подобные двум сторонам одной и
той же медали, одинаково важны в структуре корпоративной памяти (см. рис. 5.7).
При разработке с_истем КМ можно выделить следующие этапы:
1 . НаkОПЛ;ение." 'Стихийное и бессистемное накопление информации в организа­
ции.
1 86
Гл ава 5 • Новые те н де н ции и п рикладн ы е аспекты ин же н ерии зн ан ий
2. Извлечение. Процесс, идентичный традиционному извлечению знаний для ЭС
(см. главы 2 и 3). Это один из наиболее сложных и трудоемких этапов. От его
успешности зависит дальнейшая жизнеспособность системы.
3. Структурирование. На этом этапе должны быть выделены основные понятия,
выработана структура представления информации, обладающая максималь­
ной наглядностью, простотой измен�ния и дополнения.
4. Формализация. Представление структурированной информации в форматах
машинной обработки, то есть на языках описания данных и знаний.
5. Обслуживание. Под процессом обслуживания понимается корректировка фор­
мализованных данных и знаний (добавление, обновление): <<Чистка�, то есть
удаление устаревшей информации; фильтрация данных и знаний для поиска
информации, необходимой пользователям.
Если первые четыре этапа обычны для инженерии знаний, то последний являет­
ся специфичным для систем управления знаниями.
Как уже было сказано, он распадается на три более мелких процесса:
• Корректировка формализованных знаний (доt'>авление, обновление).
• Удаление устаревшей информации.
• Фильтрация знаний для поиска информации, необходимой по.7;1ьзователю, вы­
деляет компоненты данных и знаний, соответствующие требованиям конкрет­
ного пользователя. При помощи той же процедуры пользователь может узнать
местонахождение интересующей его информации.
Рассмотренная выше классификация не является единственной, но она позволя­
ет понять, что происходит в реальных системах управления знаниями.
5 . 3 . 3 . Системы OMIS
Автоматизированные системы КМ, или Organizational Memory Information Sys­
tems (OMIS), предназначены для накопления и управления знаниями предприя­
тия [Kuehn and Abecker, 1 998]. OMIS включают работу как на уровне 1 - с явным
знанием компании в форме баз данных и электронных архивов, так и на уровне
2 - со скрытым знанием, фиксируя его в некотором (более или менее формаль­
ном) представлении в форме экспертных систем [Wiig, 1 990] или БД.
OMIS часто используют вспомогательные справоЧ'Ные системы, так называемые
hel рdеsk-приложения.
Основные функции OMIS:
• Сбор и систематцческая организация информации из различных источников в
централизованное и структурное информационное хранилище.
• Интеграция с существующими автоматизированны.ми системами [ Conklin,
1996]. На техническом уровне это означает, что корпоративная память должна
быть непосредственно связана с помощью интерфейса с инструментальными
5.3 . 'УnраВ11ен ие . знаниями
1 87
· средствами, котор�е в настоящее время используются в организации·(напри­
мер, текстовые процессоры, электронные таблицы, системы).
• Обеспечение нужной информации по запросу (пассивная фор�а) и при необхо­
димости (активная форма). Слишком частые ошибки - это следствие недо­
статочной информированности. Этого невозможно избежать с помощью пас­
сивной информационной системы, так как служащие часто слишком заняты,
чтобы искать информацию, или просто не знщот, что нужная информация
существует. Корпоративная память может напоминать служащим о полезной
информации и быть компетентным партнером для совместного решения за­
дач.
Конечная цель OMIS состоит в том, чтобы обеспечить доступ к знанию всякий
раз, когда это необходимо. Чтобы обеспечить это, OMIS реализует активный под­
ход рас;пространения знаний, который не полагается на запросы пользователей, а
автоматически обеспечивает полезное для решения задачи знание. Чтобы предот­
вращать информационную перегрузку, этот подход должен быть совмещен с вы­
сокой выборочной оценкой уместности. Законченная система должна действо­
вать как интел.л.ектуш�ьный помощник пользователю.
Использование корпоративной памяти часто преследует более умере}'Jные цели,
чем использование ЭС. Это связано с тем, что технологии обработки данных (баз
данных и гипертекстовых систем) применяются гораздо шире, чем технологии
систем, основанных на знаниях. OMIS сохраняют и обеспечивают выдачу по за­
просу нужной информации, но оставляют ее интерпретацию и оценку в специ­
фическом контексте задачи главным образом пользователю.
С другой стороны, корпоративная память расШИJ?Яет эти технологии работой со
знаниями, чтобы улучшить качество решения задач. Так OMIS включает под­
системы объяснений, которые позволяют непосредственно отвечать на вопросы:
•Почему?• и •Почему нет?•. В простой базе данных или гипертекстовой системе
пользователи должны были бы искать нужную информацию для ответа на такие
вопросы непосредственно, а дЛЯ этого необходимо отфильтровать большое коли­
чество потенциально нужной информации, которая, однако, не будет применять­
ся в специфическом случае.
Наконец, OMIS не только выдает информацию, но должна также быть всегда го­
товой воспринимать новую информацию от ее пользователей.
Рисунок 5.8 представляет архитектуру для OMIS и корпоративной памяти (част­
ично из работы [Borghoff and Parescbl, 1 998]). Ядром системы является Информа­
ционное хранилище (Infomшtion Depository). Рисунок также дает представление о
некоторых видах информации, которая включается в корпоративную память.
Если. хранилища данных содержат в основном количественную информацию, то
хранилища знаний больше ориентированы на качественный материал. КМ-сис­
темы генерируют системы из широкого диапазона данных, хранилищ данных,
статей новостей, внешних баз, WWW-страниц.
1 88
Глава 5 • Н овые тенденции и при клад ные ас пекты и нж:е нерим - з нани й
•
ь о
н
\и терфейс n оn э �я 1
И нформационное хранмnище
Данные
Структура БД,
м етаоnисания
11
. Знания
Документы
Описания
документации
(дескрипторы)
Структура �БЗ ,
- понятийные
сrруктурь,
о е
н
урове нь
ч ски й
О тоn rи
БЗ с прав илами,
Фактоrрафические
Документаnьные
фрей мами,
БД,
ертежи ,
семантичеасимк
БД,
ч
реля ционные БД,
сетями, пра вила
рефераты и т. д.
справочники
в ы вода
Содержатеnьны й уровень
И нте рфейс разра&ОN и ков
Рис. 5 .8. Архитектура OMIS
Программный инструментарий для OMIS включает как оригинальные разра­
ботки, например KARAТ [Tschaitschian, 1997], так и стандартные средства, на­
пример, LOTUS NOTES обеспечила один из первых инструментариев хр�ения
качественно и документальной информацией. Однако сегодня в связи с бурным
развитием Интернета, КМ-системы все чаще используют WеЬ-технологи_ю.
5 . 3 . 4 . Особенност и разработки OM IS
Так как разработка систем корпоративной памяти - это прежде всего программ­
ный проект, то для нее применимы традиционные технологии разработки боль­
ших программных систем. В каждом программном проекте первым шагом в раз­
работке является анализ требований, в котором должны быть найдены ответы на
следующие вопросы:
• Какие задач1и должны подцерживаться?
• Какая информация необходима, чтобы решить эти задачи?
• Какой тип подцержки желателен пользователями?
• Каков уровень затрат на разработку?
• Какие изменения о�идаются в будущем?
5 .3. Уп равление знаниями
1 89
При поиске ответов на эти вопросы следует учитывать:
1 . Человеческий фактор. Основная причина неудач ранних опытных проектов
OMIS заключалась в том, что разработчики игнорировали реальные потреб­
ности, способности и цели пользователей системы [Malsch et al., 1 993; Kuehn
et al., 1994].
2. Стоимостной анализ. Во-первых, ядро проекта должно ориентироваться на
критические процессы, «страдающие:�, от недостатка информационной поддерж­
ки. Во-вторых не следует перегружать начальную систему слишком большим
количеством услуг, которые могут быть желательны, но не обещают быстрое
возвращение инвестиций.
3. Эволюция знаний. Электронная поддержка особенно ценна в областях, под­
вергающихся быстрым изменениям, так как на таких предприятиях трудно
обеспечить доступ к оперативной современной информации. В системах ОMIS
часто используют различные новые технологии обработки знаний, не имею­
щие пока общепринятых русскоязычнь1х терминов и связанные с получением
нового знания из анализа данных, например <<открытие или разведка знаний�,
(Knowledge Discovery) и «разработка данных:�, (Data Mining). Разведка зна­
ний представляет собой новое и быстро развивающееся направление, занима­
ющееся <<Нетривиальным извлечением точной, ранее неизвестной и потенци­
ально полезной информации из данных:�, [Piatetsky-Shapiro, Frawley, 1 99 1 ].
В методах разведки данных используются различные подходы к анализу тек­
ста и числовых данных, плюс специальный инструментарий статистического
анализа.
4. Чувствительность к контексту для естественно-языковых запросов.
5. Система должна <<Понимать:�, контекст поступающих запросов. К примеру, она
должна различать термины «размножение животных:;. и «размножение доку­
ментов:�>.
6. Гибкость.
7. Система должна иметь возможность обрабатывать знания в различной форме
и по разным темам в контексте рабоrы данного предприятия.
8. Интеллектуальность.
9. Система должна накапливать информацюо о своих пользо1щтелях и о знани­
ях, которые она получает во время работы. Таким образом, со временем ее воз­
можность <<Продуманно:�, предоставлять пользователям знания должна совер­
шенствоваться.
До последнего времени при разработке OMIS остается целый ряд исследователь­
ских вопросов [Kuehn and Abecker, 1 998].
• Проблема обобщения моделей данных, словарей понятий или тезаурусов, онто­
логий. Основание для объединенной эксплуатации данных, документов и фор­
мального знания - построение объединенных метамоделей данных и знаний.
Полезны были бы процедуры автоматического порождения тезауруса из суще­
ствующих массивов документов. Объединенная онтология/тезаурус может
использоваться, чтобы улучшить поиск, фильтрацию и маршрутизацию до­
кументов.
1 90
Гл а ва 5 • Н ов ы е тенден ци и и п ри кл адн ые асп е кты и нж е н ерии . зна н ий
• Проблема обь.единения дощческо�о вывода· �. инфi)рмацщпшоzо nоl,Щ{а. 091>1:ЩJt:::
пенная эксплуатация формальных и неформальных представлений знаний и
· данных - это последовательное сближение логических методов и методов ин­
формационного поиска и индексации данных.
• Соединение деловых процессов и управления знаниями. Окончательная цель со­
стоит в том, чтобы обнаруживать информацион!'lую потребность ·в течение
выполнения' производственного процесса и определять уместное знание в спе­
цифическом контексте задачи. Первый прагматический шаг в этом направле­
нии описан в работе [Нinkelmann и Кieninger, 1 997], где авторы предлагают
использовать информацию контекста задачи для информационной фильтра­
ции.
Корпоративная память интегрирует знания, чтобы в решении новых задач опе­
реться на предварительно накопленный опыт. Таким образом, можно избегать
повторения ошибок, опыт может расширяться систематически: и. информацион­
но-емкие процессы работы могут быть �ыполнены более эффективными спосо­
бами. В отличие от экспертных систем первичная цель систем OMIS - не под­
держка одной специфической задачи, :,\ лучшая эксплуатация. необходимого об­
щего ресурса - знаний.
В настоящее время существует значительный интерес к КМ со стороны промыш­
ленных компаний, которые осознают высокий прикладной потенциал корпора­
тивной памяти для решения целого ряда практических задач обработки инфор­
мации. С другой стороны, не многие из проектов идут далее стадии прототипа,
что очевидно показывает, что компании стараются избегать затрат и риска вло­
жения капитала в новые технологии, которые еще не нашли широкого распрост- .
ранения.
5 . 4 . В изуальное проектирован ие баз знаний
как инструмент познания
Визуальные методы спецификации и проектирования баз знаний и разработка
концептуальных стру�тур являются достаточно эффективным гносеологич�ким
инструментом или инструментом познания Uonassen, 1993]. Использование ме­
тодов инженерии знаний в качестве дидактических инструментов и в качестве
формализмов представления знаний способствует более быстрому и более полно­
му пониманию структуры знаний данной предметной области, что особенно ценно
для новичков на стадии изучения особенностей профессиональной деятельности.
Методы визуальной инженерии знаний можно широко использовать в различ­
ных учебных заведениях - от школ до университетов - как для уг.11ублеиия nро­
цесса понимания, так· и для контроля знаний. Большинство учеников и· студен­
тов овладевают навыками визуального структурирования в течение нескольких
.
.
часов.
5·.4 . ·Визуальное проектирова ние баз зна ни й ка к и нструме нт по знани я ·
5.4.· 1 . От ·понятийных карт к семантичес ким сетям
В параграфе 3.1 было предложено определение поля знаний, которое позволяет
инженеру по знаниям трактовать форму представления поля достаточно широ­
ко, в частности семантические сети или понятийные карты (concept maps) (см,,
параграф 1 .3) являются возможной формой представления. Это означает, что
сам процесс 'построения семантических сетей помоrа�т осознавать познавательные структурьi.
с
ПdЛ
)
Комната
,'-........ . ...
.... .
Телевизор)
Эл вктронная . (
. . . . . . . ·►
техн и ка
Диван
Кресло
(
Книrа
)
Рис. 5.9 . П р имер п онятийной карты
Проrраммь1 визуализации являюrея ·инструментdм; позволяющим сделать види­
мыми семантические сети памяти человека. Сети состоят из узлов и упорядочен­
ных соотношений или связей, соединяющих эти узлы. Узлы выражают понятия
или предположения, а связи описывают взаимоотношения между этими узлами.
Поэтому разработка семантических сетей подразумевает анализ структурных
взаим�действий между отдельными понятиями предметной,области.
В процессе .создания семантическ.их сетей эксперт и аналитик вынуждены анали­
зировать структуры .своих собственных знаний, что помогает им включать новые
знания в с:rруктуры уже. имеющихся знаний. Результатом этого является более
осмысленное использование приобретенных знаний.
Визуалыще спецификации в форме сетей могут использоваться новичками и эк­
спертцми. .В КаЧКТВе инструментов ДЛЯ ОЦенi<и ИЗМеНеНИЙ, ПрОИЗОШеДШИХ В ИХ
м:ыiплен�и. Если согласиться, что семантическая сеть является достаточно пол­
ным дредставл�нием памяти человека, то процесс обучения с этой точ,<и зрения
можно ра,ссматривать как реорганизацию семантической памяти.
1 92
Глава 5 • Н овы е те нден ции и прикладные ас пекты инже нерии знани й
Kozma [Kozma, 1992], один из разработчиков программы организации семанти­
ческой сети Learning Tool, считает, что эти средства являются инструментами
познация, усиливающими и расширяющими познания человека. Разработка се­
мантических сетей требует от учеников:
• реорганйзации знаний;
• исчерпывающего описания понятий и связей между ними;
• глубокой обработки знаний, что способствует лучшему з;,шоминанию и извле­
чению из памяти знаний, а также повышает способности применять знания в
новых ситуациях;
• связывания новых понятий с существующими понятиями и предс��!3Jlениями,
что улучшает понимание;
• пространственного изучения посредством пространственного представления
понятий в изучаемой области [Fisher, Faletn, Paterson, Lipson, Thorton &
Spring, 1990].
Полезность семантических сетей и карт понятий, пожалуй, лучше всего демонст­
рируется их связями с другими формами мышл"ения высшего порядка. Они тес­
но связаны с формальным обоснованием в химии [Schreiber & Abeg, 199 1 ] и спо. собностью аргументировать свои высказывания в биологии [Briscoe & LeMaster,
199 1 ; Mikulecky, 1 987]. 'Гакже было показано, что семантические сети имеют
связь с выполнением исследований [Goldsmith, Johnson & Acton, 1 99 1 ] .
5.4 . 2 . &аза знаний как познавательный
инструмент
Когда семантическая сеть создается как прообраз базы знаний, разработчик дол­
жен фактически моделировать знания эксперта. Особенно ГJiубокого понимания
требует разработка функциональной структуры.
Определение структуры Е СЛИ-ТО области знаний вынуждает чеtко форму­
лировать принципы принятия решения. Нельзя считать, что просто разработка
поля знаний системы обязательно приведет к получению полных функциональ­
ных знаний в данной области.
Разработка экспертных систем стала использоваться как инструмент познания
сравнительно недавно. Lippert [Lippert, 1988], который является одним из пио­
неров применения экспертных систем в качестве инструментов познания, ут­
верждает, что задания по созданию небольших базисов правил являются очень
полезными для решения педагогических проблем и структурирования з.наний
для учеников от шестого класса до взрослых. Изучение при этом становится
более осмысленным, так как ученики оценивают не только сам процесс мышле­
ния, но также и результаты этого процесса, то есть полученную базу знаний. Со­
здание базы знаний требует от учеников умения отделять друг от друга факты,
переменные и правила, относящиеся к связям между составляющими области
знаний.
5 . 4 . В и зуал ьное про е ктирова н и е ба з
з н аний ка к и нструмен т п о з на ния
1 93
Н апример, Lai [Lai, 1989] установил, что после того, как студенты-медики созда­
дут медицинскую экспертную систему, они повышают свое умение в плане арrу­
ментации и получают более глубокие знания по изучаемому пред!'.iету. Шесть
студентов-первокурсников физического факультета, которые использовал и экс­
пертные системы для составления вопросов, принятия решений, формулировки
правил и объяснений относительно движения частицы в соответствии с законами
классической физики, получили более глубокие знания в данной области благо­
даря тщательной работе, связанной с кодирован и ем информа ц и и и обработкой
большого матер и ала для получения ясного и связного содержания, а следователь­
но, и большей семантической глубины [Lippert & Finley, 1 988].
Таким образом, создание базы знаний экспертной системы способствует более
глубокому усвоению знаний, а визуальная спецификация усиливает прозрач­
ность и наглядность представлений.
Когда компьютеры используются в обучении ка1, инструмент познания, а не 1,ак
контрольно-об учающие системы: (обучающие компьютеры), они расширяют воз­
можности автоматизи рованных обучающих систем (АОС), одновременно раз­
вивая мыслительные способности и знания учеников. Результатом такого со­
трудничества учащегося и компьютера является значительное повышение зф­
фективн�ти обучения. Компьютеры не моrут и не должны упр�влятБ процессом
обучения. Скорее, компьютеры должны использоваться для того, чтобы помочь
ученикам приобрести знания.
В данном параграфе будет описываться автоматизированное рабочее место (АРМ)
инженера по знаниям KEW (Knowledge Engineering Workhench) [Гаврилова,
1995; Гаври лова, Воинов, 1995- 1997] , который наряду с такими проrраммаМJ;i,
как SemNet [Fisher 1 990, 1992], Learning Tool [ Kozma , 1 9.8 7], TextVision
[Kommers, 1989] или Inspiration, дает возможность ученикам, экспертам или
анал итикам связать между собой изучаемые ими поняти я в многомерные сети
представлен и й и описать пр и роду связей между всеми входящими в сеть поня­
тиями.
Последняя версия KEW, созданная совместно с Воиновым А. В., получила пер­
вую премию на выставке программных систем IV Национальной конференции
по искусственному интеллекту в 1994 r. в разделе программных инструментари­
ев разработки интеллектуальных систем. KEW демонстрирует жизнеспособ­
ность технологии автоматизированного проектирования интеллектуальных сис­
тем (АПРИ С ) или САКЕ (Computer Aided Knowledge Engineering), впервые
описанной в работе [ Га13рилова, 1 992 ] .
KEW предназначен для интеллектуальной поддержки деятельности инженера по
знаниям на протяжении всего жизненного цикла разработки экспертной системы,
включая стадии - идентификации проблемы:, получения знаний, структурирова­
ния знаний, формализации, программной реализации, тестирования.
Центральным блоком KEW является графический структуризатор знаний KNOST
(KNOwledge STucturer): Система KNOST поддерживает последовательную
графическую реализацию ОСА (см. параграф 3.4) и автоматическую компиля­
цию БЗ из графической специфи кации.
1 94
Глава 5 • Новые те нде нции и п ри кл адны е ас п е кт ы и нжен ери и зн а н и й
Панель
концептуальной
структуры
Нет
... _(:pe,iiн••
С�>елн••
,
�},:\�<У .·::::: : ·:,·-.
Рис . 5. 1 О. И нтерфе й с АРМа инже н ера п о знани ям
Интерфейс KNOST состоит из трех основных частей (рис. 5. 1 0):
• панель концептуальной структуры;
• панель гипертекста;
• панель функциональной структуры.
Панель концептуальной структуры предназначена для графического структури­
рования знаний. Она позволяет определить понятия и обозначить связи между
ними в форме концептуальной структуры Sk .
В панель гипертекста можно поместить любой комментарий, связанный с объек­
том, определенным на панели концептуальной структуры понятий.
Основное назначение панели функциональной структуры S 1 - представить на­
глядно в форме строк таблицы причинно - следс1:венн_ь1е и другие функционал,0-
5. 5 . П роектирование гиперм едиа БД и адапт ивных обучающи х сист е м
1 95
ные взаимосвязи между понятиями концептуальной структуры, на основании
которых эксперт принимает решения. Столбцы таблицы формируются простей­
шей операцией drag-and-drop из понятий на панели концептуальной структуры.
После того как модели S k и Sr созданы, KNOST gвтоматически компилирует базу
знаний на ПРОЛОГе из созданной графической спецификации и моделирует ра­
боту экспертной системы. Это удобно для быстрого наглядного прототипироца­
ния ЭС и для отладки БЗ совместно с экспертом.
5 . 5 . П роектирование гипермедиа БД
и адаптивных обучающих систем
5 . 5 . 1 . Гипертекстовые системы
Первые информационные системы н а основе гипертекстовых (П) моделей по­
явились еще в середине 60-х [ Engelbart, 1 968], но подлинный расцвет наступил в
80-е годы после появления первых коммерческих П систем для ПЭВМ GUIDE ( 1986 r.) и HyperCard ( 1 987 r.). В настоящее время П технология явля­
ется стандартом de facto в области АОС и сверхбольших документальных БД
[Nielsen, 1990; Агеев , 1 994] .
П од гипер текстом пони м ают технол оги ю фор м иро вани я инф о р м ационны х м асс и во в в
в иде асс о циати в ных сетей , эл е ментам и или узлам и кото ро й выступают фраг менты те к­
ста, рисун ки, диаграмм ы и пр .
Навигация по таким сетям осуществляется по связям между узлами. Основные
функции связей [ Conklin, 1 987] :
• перейт и к новой теме;
• присоединить комментарий к документу;
• соединить ссылки на документ с документом, показать на экране графическую
информацию (рисунок, чертеж, график, фотографию и пр.);
• запустить другую программу и т. д.
Учитывая широкое использование rрафовых структур в моделировании, П мо­
жет приобретать черты более сложных моделей, например сетей Петри, диаграмм
состояний и др.
В настоящее время не существует стандартизированной технологии разработки
4Хорошо структурированного• П, хотя важность коrнитивно-наrлядной и 4Про­
зрачнойэ- структуры П очевидна.
1 96
Гла ва 5 • Н о вые те нден ции и п ри к лад н ые ас пе кты ин женерии знаний
В качестве рабочего упрощенного алгоритма составления П можно предложить
следующий (в п. 5.5.3 будет представлен более сложный вариант).
Инструкц.-.я по разработке гипертекстового приложения
1. Дайте название воображаемому документу, например «Учебник по ку­
линарии�, «Справочник абитуриента� и пр.
2. Представьте, что вся информация должна быть сгруппирована как в хо­
рошем учебнике, то есть в виде глав и параграфов. Основное условие
для глав, параграфов и подпараграфов - сбалансированность, то есть
примерно равная величина.
3. Проставьте перекрестные ссылки между понятиями внутри параграфов,
придерживаясь принципа <<чем меньше - тем лучше�.
4. Добейтесь баланса аудио, видео и графической информации.
5. Предоставте возможность возвращения на шаг назад или на более высо­
кий уровень иерархии.
6. Отобразите иерархическое положение текущей страницы. Например,
если мы находимся в подпараграфе, то необходимо вывести название
текущей главы и параграфа.
7. Еще раз проверьте гипертекстовое содержание, в котором отражены все
главы, параграфы и подпараграфы. Из лIQбой страницы приложения дол­
жен быть доступ к этому содержанию.
8. Все необходимые гипертекстовые ссылки лучше располагать не в самом
тексте, а разместить их в одном месте на странице, например в конце
страницы.
9. Ссылки, по которым пользователь уже заходил, должны выделяться дру­
гим цветом.
5 . 5 . 2 . От м ультимедиа к гипермедиа
Мультим едиа ( ММ) се годн я пони мае тся как и нте г р и ров анная комп ьютерная ср еда , п о ­
з в ол я ющая и спол ьз овать наряду с тради ци онн ым и с р едствами в заи моде йст вия чел ов е ка
и ЭВ М ( алфа ви тн о-цифров ой и/или графи ческий ди спле й, принте р , кла виатура ) но в ые
воз можн ости : з вук (жи вой чел о вече ски й гол ос, муз ыку и др . ) , в идеор оли ки ( цветн ые ху­
доже ственн ы е и до кум е н тальн ы е клип ы), озвученную мул ьти плик ацию и т. д.
Когда элементы ММ объединены ·на основе сети гипертекста, можно говорить о
гипермедиа (ГМ). Основной сферой применения ГМ сегодня являются автомати­
зированные обучающие системы (АОС) или электронные учебники. Размещение
в узлах сети не только текстовой и цифровой информации, но и графиков, видео­
клипов, фото и музыки обогащает гипертекст и увеличивает занимательность и
наглядность электронных учебников. В последние годы ММ активно внедряется
5.5. Про е кт и ро ван ие гиnерме диа БД и ада пт и в ных обучающи х с и стем
1 97
и·в интеллектуальные системы [Nielsen, 1 990], особенно в системы-консультанты,
как эффективное средств о увеличения наглядности и понятности рекомендаций,
выдаваемых системой. Использование анимации, звука и видео существенно об­
легчает усвоение учебного материала по структурированию знаний и снижает
уровень коrnитийных усилий учащихся при одновременном уменьшении време­
ни, необходи�оrо на изучение данной проблематики.
Основной предпосылкой интереса к rипермедиа-системам является фактически
беспрецедентный усп ех глобальной сети Интернет и WWW-технолоrии.
Другим факт о р о м появления ГМ можно считать мощный прорыв на рынке
машинных н осителей информации со стороны фирм, про изводящих компакт­
аудиодиски (PHILIPS, SONY, NIMBUS) в виде CD-ROM (Compact Disc Read
Only Memory), позволяющих хранить до 600 Мб инф о рмации , тем самым от­
крывая дверь для обработки BLOB (Binary Large Objects) - больших двоичных
объектов, например оцифрованных видеоизображений.
Тем не менее существует целый ряд проблем , с которыми сталкиваются разра­
ботчики ММ-систем, независимо от того, ориентированы они на Интернет-при­
ложения или на автономные учебники на CD-ROM:
• отсутствие методологии и технологии структурир ования разнородной информации;
• отсутствие единых стандартов на системы кодирования и обрабопш;
• сложные аппаратные и программные решения проблем аналого-цифровых
преобразований и синхронизации полнощсранноrо видео.
Сейчас не существует единой методологии, а тем более технологии разработки
ГМ систем, такое состояние характеризуется как •no science, rather art•, то есть
•не наука, а искусство• . Однако первые подступы к созданию технологии уже
сделаны [Кирмайкл, 1994; Reisman, 199 1 ] , и разработки в этой области продол­
жают активно развиваться.
Традиционно процесс разработки ГМ включает:
Фаза 1 - проектировани� и разработка структуры и отдельных фрагментов rипермедиа-приложения, включая звуковые и видеоролики, программное окружение. 1 фаза - наиболее трудоемкий по времени и человеческим ресурсам период.
Эту фазу осуществляет команда, состоящая из:
• менеджера;
.
•
•
•
•
•
•
'
'
.
специалиста по системам обучения;
эксперта предметной области;
дизайнера-графика;
системного аналитика;
1.
сценариста;
программиста.
Фаза 2 зависит от тог о, на какой вариант приложения рассчитана система.
1 98
Гл а в а 5 • Н ов ы е т е нденции и при кл ад н ые ас пекты и н же н ерии зн а н ий
Для Интернет-приложений разрабатываются W еЬ-страницы на языке HTM L с
включением оцифрованных в специальных форматах звука, изображений, ани­
мации и видео. При эrом могут использоваться специальные пакеты, например
Dreamwever или FrontPage.
Для изготовления СD-дисков используется как НТМL-формат, так и специаль­
ные программные средства (authoring languages and systems), как, например
Toolbook или Macromedia Director.
Фаза 3 включает прототипирование CD-ROM на специальном устройстве WORM
(Write Once Read Many) и его тестирование либо размещение приложения на
Интернет-сайте.
Фаза 4 - это тиражирование и производство готовых CD ROM.
5 . 5 . 3 . На пути к адаптивным обучающим
системам
Инструментом познания согласно концепции параграфа 5.4 можно считать и про- .
цесс проектирования структуры гипертекста. Ранее нами [Гаврилова, 1996-99]
был предложен подход, трактующий структуру (граф) гипертекста ( Г:Т) как «ске­
лет• поля знаний, то есть наиболее информационно-нагруженный элемент поля
знаний. Именно этот граф отражает структуру знания, которую можно назвать
rиперзнания. Усвоение этой структуры является важнейшим компонентом про­
цесса обучения. Очевидно, чем более будет конкретная сrруктура ГТ соответство­
вать индивидуальной когнитивной структуре, тем эффективнее будет идти про­
цесс обучения. Фактически это означает, что обучение и тренинг будут организо­
ваны не через навязывание конкретных когнитивных структур обучаемому и
ломку старых представлений, а через проекцию нового знания на каркас индиви­
дуального опыта и наращивание уже имеющихся когнитивных структур. Та�ая
адаптация к индивидуальным познавательным структурам может существенно
повысить эффективность обучающих систем.
Предлагаемый подход позволяет представить поле знаний предметной области в
виде релевантной гиперструктуры HS, узлами которой являются концепты А,
выделяемые экспертами как «опорные•, то есть принципиально значимые. Свя­
зи или отношения R используются для переходов между узлами. Такая трактов­
ка является естественным развитием моделей представления знаний типа семан­
тических сетей, которые на современном этапе считаются наиболее адекватными
человеческой структуре памяти [Величковский, 1982; Шенк, Хантер, 1 987] . Ес­
тественно, что такие концептуально-когнитивные структуры отличаются резкой
индивидуальностью, связанной с личностными, интеллектуальными и профес­
сиональными различиями носителей знаний. В некотором смысле такая �трук­
тура является когнитивной моделью индивида.
Предлагаемый подход согласуется с концепцией мулътидеревьев [Furna, Zacks,
1994], реализующей множественное представление ПО. Модель пользователя,
сформированная по этому принципу, будет отражать «модель мира• данного
конкретного пользователя в виде rиперrрафа, узлы которого, в свою очередь, мо­
гут быть раскрыты в виде rиперструктур более низкого уровня. Фактически это
6. 5 . Прое кти рова ние г ип ермедиа БД и ада птивн ых обуча ющи х систе м
1 99
соответствует субъективным концептуальным структурам в памяти. Часто в про­
блематике АОС используют понятие •сценария•. Традиционно под сценарием
понимается описание содержательного, логического и временного взаимодей­
ствия структурных единиц программы, с помощью которых реализуется автор­
ская цель [Бойкачев, Конева, Новик, 1 994].
Очевидно, что в rипермедиа учебных приложениях естественным представлени­
ем сценария является граф гипертекста. При этом важно добиваться, чтобы этот
сценарий соответствовал (был релевантным) представлениям как учителей, так
и учеников.
Релевантная rт-структура п р едста вляет стратифи ци р о в анную се ть HS=<A , R > , отража ­
ющую ие рархи ю по н ят ий п р едметной о бласти в фор ме , соотв етст вующей п р офессио ­
нальн ым пред ста влениям э кс пе рто в и н е вы з ыв ающе й ко гнити в н о го дисс онанса у
пол ьзо вател я .
Для формирования стратифицированного множества вершин А можно исполь­
зовать модификацию алгоритмов объектно-структурного анализа ОСА (пара­
граф 3.4).
Алгоритм ссОСА-гипер»
1 . Сформулировать цель и собрать от экспертов всю доступную информа­
ц ию.
2. Определить количество страт N, подлежащих формированию.
3. Из информации, полученной от экспертов и из литературы, выбрать все
значимые основные объекты и понятия {А} и разместить их по стратам,
_ сформировав опорные метаузлы ТТ структуры.
4. Детал изировать концепты, пользуясь нисходящей концепцией (topdown).
5. Образовать метапонятия по концепции (Ьottom-up) ..
6. Исключить повторы, избыточность и синонимию.
7. Обсудить понятия, не вошедшие в структуру ТТ с экспертом и включить
их или исключить.
8. Выявить основные отношения {R} и спроектировать эскиз ТТ структу­
ры.
9. Провести обследование потенциальных пользователей с целью выявле­
ния их коrнитивных, представлений о данной ПО, а также формирова­
ния модели пользователя.
1 0. Привести в соответствие эскиз ТТ и представления пользователя.
1 1 . Сформировать ряд сценариев обхода ТТ с целью упрощения навигации
и учета необходимых сценарных связей и включить их в структуру.
200
Глава 5 • Н овые тенд енции и п рикладные асп е кты инжене рии з наний
Данный алгорю:м выявляет канонический или основной сценарий, альтернатив­
ные сценарии формируются на основании либо иного опыта преподавания, либо
с учетом категории пользователей.
Последовательное применение данного подхода и визуальных методов проекти­
рования позволило сформировать ГРАФИТ-технологию и реализовать ее в ряде
программных продуктов ВИКОНТ (ВИзуальный Конструктор Онтологий), ПЕ­
ГАС (ПроЕктирование Гипср-Активных Схем) [Гаврилова и др., 1 998-2000]
(рис. 5. 1 1 ).
Графические технологии
(ГРАФИТ)
Эксперт
в предметной
области
Визуальный
конструктор
(ВИКОНТ)
\Преподаватель
Програмная среда
для построения
активных гиперсхем
(ПЕГАС)
Студент
Графический навигатор
для обучения с помощью
активных гиперсхем
(ГРднr)
Рис . 5. 1 1 . ГРАФ И Т-технология визуального п р оекти рова ния ГТ
При разработке гипермедиа-приложений необходимо также учитывать фактор
сбалансированности з вуковых и видеоузлов опорной Пструктуры, то есть
аудио- и видеофрагменты должны равномерно распределяться на сети. Для это­
го в технологию ГРАФИТ введено понятие «раскраски1> узлов, что позволяет на­
глядно оценить сбалансированность сети по аудио- и видеонагрузке. Алгоритм
«ОСА-гипер1> учитывает необходимость анализа не только исходной информа­
ции, но и навигационных возможностей:
• перемещение на экран назад;
• возврат к началу;
• возврат к началу секции;
5.5. Прое ктирование гипермедиа БД и адаптивных обучающих систе м
1
. 20 1
• просмотр структуры; .
• озвучивание экрана;
• включение видео;
• помощь;
• перемещение на экран вперед.
{
Особенно ценно в реализации гр�фической навигации то, что в произвольный
момент пользователь может посмотреть структуру сценария и понять, в каком
месте он сейчас находится.
Данный подход использован при создании П АОС в области инженерии знаний
для систем дистанционного обучения (Gavrilova, Stash, Udaltsov, 1998). Системы
обучения в области ИИ имеют пока небольшую историю, хотя при отсутствии
учебников по данным дисциплинам эти электронные учебники особенно необхо­
димы. Известны лишь единичные работы в нашей стране и за рубежом - «База
знаний для разработчиков ЭС�> [Молокова, Уварова, 1 992 ] и КАRТТ (Knowledge
Acquisition Research and Teaching Tool) [Liebovitz, Bland, 1994].
При проектировании любой П структуры нетривиальной задачей является вы­
деление «опорных�> концептов - вопрос, практически не освещенный в литера­
туре. В работе [ Гаврилова, Червинская, 1993] представлен обзор различных ме­
тодов извлечения знаний, частично включающих и исследования по выявлению
значимых концептов. Можно предложить использовать для этой цели методы
многомерного шкалирования, позволяющие выявлять структуру индивидуаль­
ных ментальных пространств, анализируя попарные связи понятий предметной
области (см. п. 5.1).
Эти методы использовались и ранее для изучения семантических пространств
памяти [Терехина, 1 988; Петренко, 1 988; Cook, 1985], однако можно использовать
новый подход, ориентированный на анализ не только осей ментальных про­
странств с выявлением соответствующих конструктов, но и точек сгущения поня­
тий, называемых «аттракторами�> для выявления метапонятий или концептов.
В дальнейшем эти концепты образуют узлы {А} релевантной П структуры, кото­
рую можно фактически трактовать как модель пользователя UM (user model):
UM = {А, R}.
Более широкие исследования [Voinov, Gavrilova, 1 993; Воинов, Гаврилова, 1 994]
показали, что психосемантические методики (см. п. 5. 1), обогащенные новыми
элементами (использование метафорических планов), могут способствовать вы­
явлению имплицитных структур знаний, не поддающихся выявлению другими
методами.
202
· Глава 5 • Н овые тенд ен ции и при кл ад ные ас пе кты инжен ерии з нани й
Использование UM как rиперструктуры в гипертекстовых АОС позволяет созда­
вать •гибкие• релевантные сценарии, ориентированные на когнитивные особен­
ности определенньiх групп пользователей. Последнее замечание можно также от­
нести к разработке систем rипермедиа. Очевидно, что глубокое и конструктивное
изучение человеческого фактора в области computer science может существенно
раздвинуть ограничения современных интеллектуальных и обучающих систем.
Программный
инструм�нтарий
разработки с�стем,
основанных
на знаниях
о Технологии разработки программного обеспечения - цели, принципы,
парадигмы
о Методологии создания и модели жизненного цикла интеллектуальных
систем
о Языки программирования для ИИ и языки представления знаний
□ Инструментальные пакеты для ИИ
□ WоrkВепсh-системы
6. 1. Технологии· разработки программного
обеспечения - цели, принципы,
п1;1радигмы
6. 1. 1. Основные понятия процесса разработки
программного обеспечения (ПО)
Как известно, технология ( от греческого технос - мастерство, логос - слово, на­
ука) - это наука о мастерстве.
Под технологией программирования понимается (Бруке, 1979) совокупность з наний о
способах и средствах достижения целей в области программного обеспечения ЭВМ, в
том числе и таких, которые ранее никем не достигались.
В широком смысле технология разработки ПО должна обеспечивать последова­
тельный подход к созданию программных систем. Наиболее очевидная цель в
204
Глава 6 • Программный инструментарий разработки систеч
разработке ПО состоит в соблюдении установленных заказчиком требовс1:н�й
при реализации системы. Однако у заказчика редко имеются полные и последова­
тельные епределения требований. Обычно и заказчик и разработчик не до конца
понимают проблему, и требования совершенствуются в процессе разработки сие-.
темы. Необходимо отметить и факт изменения требований в течение жизненного
цикла программной системы.
Изменения являются посто,янным фактором разработки ПО. Для того чтобы
преодолеть их разрушающий эффект, в качестве целей технологии разработки
ПО принимаются следующие четыре свойства программных систем [Ross et al.,
1975]:
1. Модифицируемость. Необходимость модификации ПО обычно возникает по
двум причинам: чтобы отразить в системе изменение требований или чтобы
исправить ошибки,.внесенные ранее в процессе разработки.
2. Эффективность системы подразумевает, что при функционировании опти­
маль_ным образом используются имеющиеся в ее распоряжении ресурсы: вре­
мя и память.
3. Надежность системы ПО означает, что она должна предотвращать концепту­
альные ошибки, ошибки в проектировании и реализации, а также ошибки, воз­
НИl(ающие при функционировании системы.
4. Понимаемость. Последняя цель технологии ПО - nонимаемость - является
мостом между конкретной проблемной областью и соответствующим решени­
ем. Для того чтобы система была понимаемой, она должна быть •прозрачной•.'
Цели технологии разработки ПО, рассмотренные выше, не могут лишь пассивно
признаваться. Наоборот, по мере выполнения работ· необходимо придерживаться
определенного набора принципов, которые обесцечивают достижение этих це­
лей. В качестве таких принципов обычно выделяют [Ross et al., 1975; Буч, 1992)
абстракцию, сокрытие информации, модульность, локализацию, единообразие,
полноту и подтверждаемость.
Абстракция является одним из основных средств для управления сложными сис­
темами ПО. Суть абстракции состоит в выделении существенных свойств с игно­
рированием несущественных деталей. По мере декомпозиции решения на отдель­
ные компоненты каждая из них становится чае1рю абстракции на соответствующем
уровне. Абстрагирование применяется и к данным, и к алгоритмам. На любом
уровне абстракции могут фиксироваться абстра�ные типы данных, 1,аждый из
которых характеризуется множеством значений и множеством операций, приме­
нимых к любому объекту данного типа. ·
Сокрытие или упрятывание информации имеет целью сделать нещ>стущ1ыми де­
тали, которые могут повлиять на остальные, более существенные части системы.
Упрятывание информации обычно с{(рывает реализацию объекта или операции
и, таким образом, позволяет фиксировать внимание на более высоком уровне
абстракции. Кроме того, сокрытие проектных решений нижнего уровн,я оберега­
ет стратегию принятия решений верхнего уровня от влияния деталей.
6.1. Технологии разработки программного обеспечения
205
Абстракция и сокрытие информации способствуют модифицируемости и пони­
маемости систем ПО. На каждом уровне абстракции допускается применение
лишь определенного набора операций и делается невозможным применение лю­
бых операций, нарушающих логическую концепцию данного уровня, за счет чего
повышается надежность программной системы.
Модульность является следующим фундаментальным свойством, помогающим
управлять сложностью систем ПО. Она реализуется целенаправленным конст­
руированием. В самом общем плане модули могут быть функциональными (про­
цедурно-ориентированными) или декларативными (объектно-ориентирован­
ными). Связность модулей определяется как мера их взаимной зависимости.
В идеале должны разрабатываться слабо связанные модули. Другой мерой, при­
менимой к модульности, является прочность, которая определЯ€Т, насколько
сильно связаны элементы внутри модуля.
Локализация помогает создавать слабо связанные и весьма прочные модули. По
отношению к целям технологии разработки ПО принципы модульности и лока­
лизации прямо способствуют достижению модифицируемости, надежности и
понимаемости.
Абстракция и модульность считаются наиболее важными принципами, исполь­
зуемыми для управления сложностью систем ПО. Но они не являются достаточ­
ными, потому что не гарантируют получения согласованных и правильных сис­
тем. Для обеспечения этих свойств необходимо привлекать принципы едино­
образия, полноты и подтверждае.мости.
Принципы технологии разработки ПО не должны применяться случайно - не­
обходимо выполнять структуризацию системы определенным образом и, что са­
мое важное, qоскольку происходит деление системы на модули, применять со­
гласованные критерии декомпозиции. Можно выделить три основных подхода к
разработке ПО, обеспечивающие такие критерии: нисходящее структурное про­
ектирование [Йордан, 1979J; проектирование, структурированное по даниым
Uackson, 1975], и обьектно-ориентированное проектирование [Booch, 1986].
Нисходящее структурное проектирование определяет декомпозицию системы
путем оформления каждого шага этого процесса в виде модуля. Это приводит к
созданию функциональных программных модулей.
Проектирование, структурированное по данным, является альтернативой нисхо­
дящей методологии. При этом сначала определяются структуры данных, а затем
на их основе определяется структура программных модулей. Таким образом,
здесь делается попытка сначала четко определить реализацию объектов, а за­
тем сделать их структуру видимой в функциональньiх модулях, обеспечиваю­
щих операции над объектами.
Методы нисходящего прьектирования императивны по своей природе. Они зас­
тавляют концентрировать внимание на операциях, мало заботясь о проектирова­
нии структур данных. Методы проектирования, основанные на структурирова­
нии по данным, находятся как бы на другом конце спектра. Они концентрируют
внимание на объектах, а операции трактуют глобальным образом.
206
Глава 6 • Программный инструментарий разработки систем
В идеале разработчикам ПО хотелось бы использовать подход, позволяющий
строить решения прямо в соответствии с имеющимся представлением проблемы.
Кроме того, как и в естественном языке, желательна сбалансированность объек­
тов и операций на уровне принимаемых решений.
Такой подход получил название обьектно-ориентированного [Booch, 1986]. Здесь
учитывается важность трактовки объектов ПО как активных элементов, причем:
каждый объект наделен своим собственным набором допустимых операций. Лег­
ко убедиться, что объектно-ориентированная парадигма поддерживает основные
принципы технологии разработки ПО.
6.1.2. Модели процесса разработки ПО
Под жизненным циклом разработки ПО традиционно понимается упоря доченная со­
вокупность этапов, обеспечивающих соэдание качественного прогр а ммного продукта.
В общем случае в жизненный цикл разработки вк лючаются следующие стадии: техни­
ческое задание, эскизный проект, технический проект, рабочий проект и внедрение.
В литературе существует множество нареканий на несовершенство данного раз­
биения [Липаев и др., 1983], но смысл его в целом достаточно ясен - борьба со
сложностью процесса разработки программных продуктов за счет структуриза­
ции этапов и локализации на каждом из них только тех задач, которые могут и
должны решаться именно здесь. Если перечисленные выше этапы укрупнить,
останутся стадии проектирования, реОАизации и сопровождения.
Проектирование предполагает составление формальных и/или формализова}l­
ных спецификаций.
РеОАuзация - преобразование этих спецификаций в программный код ( автома­
тическое и/или автоматизированное).
Сопровождение - тестирование разработанной системы, ее внедрение и последу­
ющую модификацию, которая, в свою очередь, может вернуть весь процесс к ста­
дии проектирования ,(перепроектирование).
Ключевой стадией в жизненном цикле процесса разработки ПО является проек­
тирование. Ошибки и просчеты, допущенные здесь, - самые «дорогие•. Поэтому
основные усилия в области технологии программирования направлены на авто­
матизацию проектирования программных комплексов. При этом базисными по­
нятиями являются модель программы и модель системы.
Существуют различные подходы к разработке таких моделей [Миллс, 1970].
Однако с точки зрения целей настоящей книги нас будут интересовать, в первую
очередь, те из них; которые имеют непосредственное продолжение в инструмен­
тальных средствах и интегрированных инструментальных средах. Поэтому
ниже основное внимание будет уделено моделям программ, которые использу- ,1.
ются в так называемых WorkBench-cиcтeмax (наиболее близким по семантике к
этому термину является словосочетание «станок для производства ПО•).
Одну из таких моделей предлагает W/O (Warnier/O") методология [Orr et al.,
1977]. Она объединяет методологию Warnier по использованию логических
6.1. Технологии разработки программного обеспечения
207
структур данных и логических конструкций программ и систем и методолоmю
DSSD (Data Structured System Development) Орра, базисом которой является
аксиома о логическом соответствии между эвристической структурой программ
и данных, обрабатываемых этими программами. На практике такая методология
предполагает, ·что в распоряжении проектировщика системы имеется представи­
тельный набор процедурных шаблонов для достаточно широкого класса програм­
мируемых задач.
В настоящее время DSSD-методолоrия •переросла• из методологии разработки
программ в методологию разработки систем. При этом выделены явно уровень
программирования (programming level) и системный уровень (system level).
Применяются в DSSD два концептуальных представления - диаграммы входов
(Entity diagrams), обеспечивающие определение системного контекста, и моди­
фицированные W/О-диаграммы (AssemЬly-line Diagrams), специфицирующие
функциональное развитие системы [McClure, 1979].
Следующим подходом к созданию моделей программ (по идее достаточно близ­
ким к W/O-методолоmи) является логическое моделирование Гэйна [Cane et al.,
1979]. Сам метод ориентирован на создание систем обработки данных. Логичес­
кая модель системы проектируется в процессе последовательного применения
следующих семи этапов: описание природы предметной области с помощью диа­
грамм потоков данных (Data Flow Diagram); выделение первичной.модели дан­
ных (списка элементов данных в каждом информационном узле); проверка того,
что DFD действительно отражает структуру данных, хранимых в системе; сведе­
ние полученной на предыдущем этапе информации в двумерные таблицы, кото­
рые в дальнейшем нормализуются; коррекция DFD с учетом результатов норма­
лизации предыдущего этапа; разбиение полученной в результате выполнения
пр,едыдущих этапов модели на •процедурные единицы� (procedure units), а так­
же опре.деление деталей каждой процедурной единицы. После выполнения этих
этапов принимается решение о необходимости прототипирования системы на
целевом языке.
И наконец, третьим в ряду подходов к созданию модели проектируемой про­
граммы является метод Йордана (Yourdon) (Yourdon et al., 1979; Yourdon, 1989).
Он включает два компонента: инструментальные средства и методики. Ориенти­
рована методология Йордана на проектирование систем обработки данных. Под
инструментальными средствами здесь понимаются различные диаграммы, ис­
пользуемые при описании моделей требований и моделей архитектуры проекти­
руемой информационной системы. Самые известные из таких диаграмм - диа­
граммы потоков данных DFD. Однако их недостатком является отсутствие
средств описания отношений между данными и их •поведения• во времени. Вот
почему в инструментальные средства метода Йордана на сегодняшний день кро­
ме DFD включены ЕRD-диаrраммы (Entity Relationship Diagrams) и SТD-диа­
rраммы (State Transition Diagrams).
Методики в методе Йордана помогают перейти от бланка на бумаге и/или экран­
ной формы к хорошо организованной системной модели. ПервоначальнQ эти ме­
тодики базировались на традиционном top-down проектировании. В настоящее
208
Глава 6 • Программный инструментарий разработки систем
время здесь используется метод событийного разбиения (event partitioning) .. При
этом сначала создается контекстная диаграмма верхнего уровня (top level context
diagram), где определяются системные ограничения и интерфейсы с внешним
•миром•. Затем с помощью техники интервью формируется список событий из
внешней среды, на которые система должна реаmровать. Такой подход обеспечи­
вает простой базис дЛЯ формирования •сырой• DFD. Несколько DFD-реакций
могут быть объединены в реакцию более высокого уровня. Критерие� такого
объединения является наличие узлов, связанных общими данными. По существу,
событийное разбиение не что иное, как метод объектно-ориентированного проек­
тирования.
Проблемы, возникающие при использовании метода ЕRD-диаrрамм, связаны,
прежде всего, с трудностями интеграции компонентов при разработке всей систе­
мы. Вот почему в последнее время этот метод был обобщен за счет введения ин­
тегрированной базы данных. При этом ЕRD-метод трансформируется в струк­
турную методологию, основные этапы которой сводятся к разработке ERD
(здесь выделяются как собственно сущности с их типами, так и связи, тоже с их
типами); определению кардинальности (cardianality) - однозначности-много­
значности типов связей; преобразованию ERD по определенным правилам в со­
ответствующий файл и структуру БД. В процессе такого преобразовация каж­
дый тип сущности трансформируется в отношение, а тип связи - в особое (stand
alone) отношение или объединяется с другими отношениями в зависимости от
кардинальности типа связи. Разработка прикладных программ на основе сфор­
мированного файла и структуры базы данных является заключительным этапом
в этом подходе.
Последним методом, который кратко рассматривается в данном подразделе, яв­
ляется метод структурного проектирования (Structured Design) [Yourdon et al.,
1979]. Структурное прое�тирование сделалось действительно мощным и активно
используемым на практике подходом за счет того, что к моделям и методам были
добавлены оценки результато1t проекn1рования. Здесь предлагаются все проект­
ные решения располагать в 3-мерном пространстве (содержание - сложность связность). И утверждается, что хорошими проектными решениями будут лишь
те, которые при заданном содержании имеют минимальную сложность и 'макси­
мальную связность. По существу, этот критерий отражает уже обсуждавшиеся
выше понятия абстраmруемости, модульности, сокрытия информации, связнос­
ти и т. п. Конкретным примером воплощения структурного подхода является
сводопадная• или •каскадная• (waterfall) модель разработки систем ПО [Balzer
et al., 1983].
Технология программирования уже прошла достаточно долгий путь развития, и
сейчас происходит переоценка е� фундаментальных исходных посылок Первым
кандидатом для такой переоценки стала традиционная точка зрения на процесс
разработки ПО, как на процесс, основанный на понятии жизненного цикла. Рас­
тущее единодушие спеццалистов состоит в том, чтg данная точка зрения должна
быть заменена та�юй, которая в большей степени соответствовала бы разработ­
кам, подцержив'аемым автоматизированными средами.
S. 1 . Технологии разработки программно го обеспечения
209
В качестве примера смены парадигм можно отметить спиральную модель процес­
са разработки МО (рис. 6. 1), предложенную Боэмом [Boehm, 1986], суть которой
состоит в том, что отдельные фазы процесса «прокручиваются• на постепенно
повышающихся уровнях иерархии.
Увеличение стоим ости
Определение ситуации,
аnьтернатив, оrраничений
Планирование сл едующих фаз
и верификация результ атов
Оценка альтернатив,
раэреwение рисков
Разработка и верификация
продукrа сп едующе rо ур овня
Рис. 6 . 1 . С пиральная модель Б оэ ма
/
Результато.м разработки при этом становится не только программный код, но и
его представление на более высоком уровне, что особенно важно в тех случаях,
когда ПО эволюционизирует. Естественно, что такая модель предполагает нали­
чие более гиб1шх механизмов взаимодействия между потребителями и разработ­
чиками и соответствующих инструментальных средств.
В Европе это направление ассоциируется, прежде всего, с проектированием ПО
на основе объектно-ориентированных методологий, среди которых наиболее по­
пулярными являются технология MERISE и методология Шлайера- Мэллора
(Shlaer-Mellor) [Andre. et al., 1994; Shlaer .et al., 1992).
В рамках данного подхода проектирование рассматривается как процесс, проте­
кающий в пространстве трех измерений: «статика•- «динамика•-«алrоритмы•
(рис. 6.2).
Жизненный цикл при этом похож на виток в спирали Боэма, но включает другие
стадии. Первая из них связана. с осью •Статика• и предполагает идентификацию
и описание объектов, атрибутов и отношений, которые требуются для специфи­
кации проектируемой системы. Вторая стадия служит для описания поведения
каждого объекта в ответ на внешние запросы и дает в качестве результата сово­
купность жизненных циклов всех введенных объектов. Затем проектируются ал-
21 0
Гла в а 6 • Программный инструментарий разра бот ки систем '
горитмы реализации действий, специфициров::щных на предыдущей стадии, и,
наконец, на четвертой стадии осуществляется валидация спроектированной сис­
темы на полноту и функциональное соответствие исходной задаче. Последняя
стадия можЕ:т потребовать нового витка в модели жизненного цикла.
Алrоритмы
Ди намика
Рис. 6 . 2 . Проектирова н ие в м етодол огии Shlaer-Mellor
Таким -образом, мы рассмотрели основные модели процессов разработки систем
4Традицонного» программного обеспечения и теперь переходим к анализу соот­
ветствующего инструментария.
6 . 1. 3 . Инструментальные средства
под.цержки разработки систем ПО
Технология программирования в целом и средства поддержки разработки ПО, в
частности, развиваются настолько быстро, что даже простое перечисление основ­
ных инструментальных систем заняло бы в этой книге слишком много места. Вот
почему ниже мы остановимся кратко лишь на нескольких проектах в области: тех­
нологии программирования, которые интересны в контексте данного издания.
Любая развитая технологическая система должна поддерживать все основные
этапы создания проектируемого программного комплекса. Для достижения этой
цели в общей структуре типовой техиологической системы поддержки разработ ­
ки (рис. 6.3) обычно выделяют базу данных проекта; подсистему автоматизации
проектирования и программирования; подсистемы отладки, документирования и
сопровождения, а также подсистему управления ходом выполнения проекта.
6. 1 . Технол огии разработки программного обеспечения
21 1
'Исходные и промежуточные спецификации
програ ммы, те сты, задания и т. д.
------------------------◊ -----------------------Подсисте ма
управления
Подсисте ма
разработки
и реализа ции
Подсисте м а
докум ентирова ния
----------------------,-◊ ------------------------•
Докуме н та ция, результаты работы
подсистем, резу1:1ыаты прогонов и т. д.
Рис . 6.3. Общая структура типовой технологической системы подде ржки разработки
Развитые библиотечные системы поддержки разработки используются в настоя­
щее время во всем мире во всех сколько-нибудь серьезных программных проек­
тах. Но в подавляющем большинстве случаев такие системы достигли уровня
удобства работы с ними квалифицированных программистов. Нас же, прежде
всего, интересуют системь1 и проекты, в которых имеются тенденции к экспли­
цитному представлению техно.логических знаний, даже если они и не базируют­
ся на идеях и методах ИИ.
Один из таких проектов - Gandalf [Haberman et al., 1986] - ориентирован на ав­
томатизированную генерацию систем разработки программного обеспечения.
Исследования, выполняемые в рамках проекта Gandalf, касаются трех аспектов
поддержки проектирования ПО: управление проектом, контроль версий и инкре­
ментное программирование, а также интеграция их в единую среду. Управление в
Gandalf-cpeдe базируется на предположении, что разрабатываемый проект дол­
жен трактоваться как множество абстрактных типов данных, над которыми могут
выполняться лишь определенные операции. Средством, реализующим данную
концепцию, явилась система SDC (Software Development Control), представляю­
щая собой набор программ, первоначально реализованных на языке Shell в систе­
ме UNIX, а позднее переведенная на язык С.
21 2
Глава 6 • Программный инструментарий разработки систем
Исследования в области контроля версий были начаты еще Л. Коопридером на
базе проекта FAFOS [Habermann et al., 1 976], где изначально анализировались
возможности создания семейства операционных систем. Была разработана нота­
ция для описания взаимодействия между подсистемами, для описания различ­
ных версий подсистем (исходного и объектного кода, документации и т. п.) и для
описания действующих на этапе разработки механизмов (компиляция, редакти­
рование связей и т. п.). Затем был создан специальный язык lntercol как средство
описания взаимосвязи и версий модулей в системе. И наконец, в систему были
встроены знания о том, как конструировать систему из частей, не заставляя зани­
маться этим пользователя. В развитие этих работ была создана система SUCE, в
рамках которой отслеживались различия между реализациями (версиями, кото­
рые действительно дают код для ряда спецификаций) и композициями (версия­
ми, определяющими новые подсистемы как группы существующих подсистем).
В системе LOIPE (Language-Oriented Incremental Programming Environment) ин­
крементная компиляция выполняется на уровне отдельной процедуры. Достоин­
ством такого подхода является то, что при коррекции процедуры на уровне ло­
I<альных объектов или типов перекомпилируется только она. Если же меняется
спецификация, то перекомпилируются и все зависящие от нее процедуры. Поль­
зователь:.:кий интерфейс с LОIРЕ-системой базируется на подсистеме синтакси­
чески-ориентированного редактирования ALOE (А Language-Oriented Editor).
Целью разработки этой подсистемы было исследование возможности создания и
· использования синтаксически-ориентированных редакторов в качестве базиса
для сред программирования.
Анализ литературы последних лет по технологии программирования показыва­
ет, что новой ветвью в технологии промышленной разработки и реализации
сложных и значительных по объему систем программного обеспечения явля­
ется САSЕ-технология (Computer Aided Software Engineering) [БУТЕ, 1 990].
Первоначально САSЕ-технология появилась в проектах создания промышлен­
ных систем обработки данных. Это обстоятельство наложило свой отпечаток и
на инструментальные средства САSЕ-технологии, где самое серьезное внимание
уделялось, по крайней мере в ранних САSЕ-системах, поддержке проектирова­
ния информационных потоков. В настоящее время наблюдается отход от ориен­
тации на системы обработки данных, и инструментальные средства САSЕ-тех­
нолоrии становятся все более универсальными.
Все средства поддержки САSЕ-технологии делятся на две большие группы: CA ­
SE- Too/Кits и CASE- WorkBenches. Хороших русских эквивалентов этим терми­
нам нет. Однако первые часто называют 4инструментальными сундучками» (па­
кетами разработчика, технологическими пакетами), а вторые - 4станками для
производства програм� (технологическими линиями).
По определению [ВУТЕ, 1 990} . CASE-Too/Кit - колл е кция инте грированных програ мм­
ных средств, обеспечивающих аатоматическое ассистирование в ре ш ении задач одно­
го ти па в процесс е создания программ.
21 3
6, 1 . Технологии разработки программного обеспечения
Такие пакеты используют общее «хранилище» для всей технической и управля­
ющей информации по проекту (репозиторий), снабжены общим интерфейсом с
пользователем и унифицированным интерфейсом между отдельными инстру­
ментами пакета. Как правило, CASE-ToolКit концентрируются вокруг поддерж­
ки разработки одной фаз'ы производства программ или на одном типе приклад­
ных задач.
Все вышесказанное справедливо и по отношению к CASE-WorkBench. Но здесь,
кроме того, обеспечивается автоматизированная поддержка анализа решаемых
задач по производству программного обеспечения, которая базируется на общих
предположениях о процессе и технологии такой деятельности; поддерживается
автоматическая передача результатов работ от одного этапа к другому, начиная со
стадии проектирования и кончая отчуждением созданного программного продук­
та и его сопровождением.
Та ким образом, · CASE- WorkBench является естественным «замы канием» технологи и
разработки , реализации и сопровождения п рограммного обеспечения.
В настоящее время «типовая,> система поддержки САSЕ-технологии имеет функци­
ональные возможности, представленные на рис. 6.4.
САSЕ-средства
Анализ и
проектирование
Обработка
экранных форм
и/или файлов
документов
Моделирование
проектных
решений
Прототипировани
Обнаружение
ошибок
Генерация кода
из спецификаций
Сопровождение и
перепроектирование
Программирование
Тестирование
Документирование
Выполнение
Управление
проектом
Документаторы
Анализаторы
программы
Реструктуризаторы
Подсистемы
перепроектирования
Проектировани
БД и файлов
Планирование
Контроль
Управление
Отчетность
Рис. 6.4. Ф ун кциональ1-1ые возможности типовой системы п одцержк и САS Е-технологии
Как следует из этой Н-диаграммы, в САSЕ-среде должны поддерживаться все ос­
новные этапы разработки и сопровождения процессов создания программных
систем, Однако уро�ень такой поддержки существенно различен. Так, например,
если говорить об этапах анализа и проектирования, большинство инструмен­
тальных пакетов поддерживает экранные и отчетные формы, создание прототи-
21 4
Глава 6 • Пр ограммн ый инструм ентарий разработки систем
пов, обнаружение ошибок, Значительная часть этих средств предназначена для
ПЭВМ. Многие поддерживают таI<ие широко используемые методологии, как
структурный анализ DeMarco или Gane/Sarson, структурное проектирование
Yourdan/Jackson и некоторые другие. Существуют специализированные пакеты
разработчиков для создания информационных систем, например AnaTool (Ad­
vanced Logical Software) для Macintosh; CA-Universe/Prototype (Computer Asso­
ciates lnternational) для ПЭВМ. Имеются САSЕ-среды и для поддержки разра­
ботки систем реального времени.
В среде разработчиков ПО существуют две оценки данного подхода: часть из них
считает, что САSЕ-технология кардинально меняет процессы разработки и эксп­
луатации ПО, другие отрицают это и оставляют за инструментальными сред' ствами CASE лишь функцию автоматизации рутинных работ [БУТЕ, 1 989] . Од­
нако анализ литературы показывает, что CASE средства все-таки «сдвигают»
технологии разработки ПО с управления выполнением проектов в сторону мето­
да прототипизации. И этот сдвиг, на наш взгляд, чрезвычайно важная тенденция
в современной технологии программирования.
6 . 2 . Методологии создания и модели
жизненного цикла интеллектуальных
систем
В настоящее время в области разработки и реализации интеллектуальных систем
сложилось следующее положение: с одной стороны, квалификация коллективов
разработчиков здесь, как правило, достаточно высока, чтобы считать классичес­
кие положения технологии разработки ПО, обсуждавшиеся выше, естественным
компонентом работы. С другой стороны, жизненно важными технологические ас­
пекты создания интеллектуальных систем становятся, лишь когда такие системы
выходят на уровень промышленных разработок. Создание и внедрение интеллек­
туальных систем общения с промышленными базами данных, систем машинного
перевода нового поколения, интеллектуальных систем автоматического синтеза
программ и особенно экспертных систем, по существу, и выдвинуло проблему
технологической поддержки разработок в области ИИ на передний план [SIG­
SOFT, 1 986] .
На фоне вышеописанной ситуации обращает на себя внимание тот факт, что име­
ются только единичные примеры инструментальных систем, которые бы поддер­
живали некоторую четко провозглашенную технологию разработки ПО и опира­
лись бы на достаточно развитые системы представления знаний [Ramamoorthy
et al., 1 987]. Учитывая это, в данном параграфе рассматриваются �технологичес­
кие аспекты и методологии создания интеллектуальных систем в свете введен­
ных выше понятий технологии программирования, а в следующих - инструмен­
тарий для разработки систем ИИ.
Стиль программирования систем искусственного интеллекта существенно отли­
чается от стиля программирования с использованием обычных алгоритмических
6.2. Методологии создания жизненного цикла интеллектуальных систем
21 5
языков.· При этом почти каждая подобласть области ИИ характеризуется своим
собственным стилем программирования, не всегда адекватным для других прило­
жений. В табл. 6. 1 приведены некоторые характерные отличия между обычными
программными системами системами ИИ [Ramamoorthy et al., 1987] .
и
Табпица 6 . 1 . Отличия систем ИИ от обыч н ых п рограммных систем
Характеристика
программирование
Тип обработки
Методы
Задан ие шагов решения
Искомое реше н ие
Уп равлен ие и да нн ые
З наниs�
М одифи кации
Программирование
в СИИ
Символьная
Эвристичес к ий поиск
Нея вное
Удовлетворител ьное
Перемешан ы
Неточ н ые
Часты е
Традиционное
Числовая
Алгоритм
Точ ное
Оптимальное
Разделен ы
Точ н ые
Редкие
Но ввиду все возрастающего использования систем ИИ в конкретных приложе­
ниях, к ним начинают предъявляться практически те же требоваnия, что и к тра­
диционным проrрам�ным комплексам и системам. В связи с этим становится
весьма актуальной поддержка жизненного цикла программ в ИИ. К основным
этапам в этом случае относятся инженерия требований, тестирование на прото­
типах и сопровождение.
Как и в случае обычных программных систем, разработка системы ИИ должна
начинаться с формулирования полных, непротиворечивых и однозначш,а требо­
ваний к ней [Basili et al., 1 984 ] . При проектировании должны использоваться
принципы технологии разработки ПО - такие, например, как сокрытие инфор­
мации, локализация и модульность. Предполагается, что система должна проек­
тироваться как композиция уровней. Любой уровень должен быть чувствителен
лишь к нижележащим уровням. Такое проектирование упрощает не только реа­
лизацию, но и тестирование.
Тестирование ПО ИИ отличается от тестирования обычных систем, так как для
первых характерно недетерминированное поведение вследствие использования
стратегии разрешения конфликтов, зависящей от параметров периода исполне­
ния программы. Поэтому единственным эффективным способом тестирования
систем ИИ является прототипизация.
Фаза сопровождения, включающая выполнение самых различных модификаций
системы, является важнейшим этапом процесса разработки любой системы, но
имеет свою специфику для систем ИИ. Здесь база знаний - наиболее динамич­
ный компонент и меняется в течение всего жизненного цикла. Поэтому сопро­
вожден�е интеллектуальных систем - серьезная проблема. Но именно вопросам
сопровождения уделяется мало внимания, хотя в обычном программировании
имеются средства, которые могли бы быть адаптированы и для случая П0 ИИ.
Это, например, системы управления версиями, системы управления конфигура­
цией и системь� модифицирующих
запросов.
.
1
21 6
Гла ва 6 • Пр?граммный инструментарий ра зработки систем •
Та1шм образом, создание ПО систем, основанных на знаниях, имеет 'Как общие
моменты с разработкой традиционнь1х систем ПО, так и свою специфику, кото-рая явным образом должна отражаться в соответствующих моделях жизненного
цикла.
В недавнем прошлом полигоном для создания и испытания таких моделей явля­
лись экспертные системы (ЭС).
В ходе работ по созданию ЭС практически сложилась определенная технология,
включающая следующие основные этапы: идентификацию, концептуализацию,
формал.изацию, реал.изацию и тестирование [ Попов, 1 987; Уотерман, 1 989] .
На этапе идентификации определяются задачи, подлежащие решению, выявля­
ются цели разработки, ресурсы, наличие экпертов, готовых и способных передать
свои знания проектируемой ЭС, категории и требования б удущих пользователей.
Концептуал.изация необходима для проведения содержательного анализа пред­
метной области, в процессе которого вьщеляются используемые понятия и их взаи•
мосвязи, определяются методы решения задач, и подробно обсуждалась в преды­
дущих главах.
На этапе формал.изации определяются способы представления всех типов знаний,
специфицируются выделенные ранее ilонятия, фиксируются способы интерпре­
тации знаний, моделируется работа системы, и оцениваются полученные резуль­
таты.
Этап реал.изации предполагает создание программной обстановки, в которой бу­
дет функционировать будущая система, и наполнение экспертом базы знаний, а
на этапе тестирования эксперт и инженер по знаниям в интерактивном режиме,
используя, в частности, объяснения, проверяют компетентность ЭС.
В заключение на этапе тестирования проверяется пригодность ЭС для конечных
пользователей.
Понятно, что процесс создания ЭС не сводится к строгой последовательности
выполнения вышеперечисленных этапов. В ходе разработки происходят много­
численные возвраты к предыдущим этапам и решения, принятые там, пересмат­
риваются. Все это существенно снижает общую эффективность разработки конк­
ретной системы и позволяет сделать вывод о том, что модель жизненного цикла,
соответствующая такой технологии, имеет мало шансов на промышленное ис­
пользование.
Это, конечно, не означает, что ЭС, разработанные в рамках такой методологии,
практически бесполезны или их проектирование вообще невозможно. Обычно
таким образом создаются небольшие автономно функционирующие ЭС первого
поколения.
Промышленная технология создания ЭС включает три фазы ( или, если быть
точнее, технологии): проектирование, реал.изацию и внедрение� Жизненный цикл
разработки, охватываемый этой технологией или совокупностью технологий,
состоит из 6 этапов: исследование выполнимости проекта;разработка общей кон ­
цепции ЭС; разработка и тестирование серии прототипов; разработка и испыта­
ние головного образца; разработка и проверка расширенных версий системы; при­
вязка системы к реал.ъной рабочей среде.
'
6.2. Методол огии создания жизненного цикла интеллектуальных систем
21 7
На фазе проектирования проект инициализируется, формируется группа разра­
бЬтчиков, определяются требования к будущей ЭС, проводятся исследования
выполнимости проекта и вырабатывается общая концепция будущей системы.
Остальные фазы данной технологии, по мнению [Микулич, 1990], ближе к тех­
нологии Уотермана (Waterman) и направлены на реализацию разработанной
концепции в виде серии прототипов, последовательно приближающихся к тре­
буемой ЭС. Последний из прототипов и приобретает статус головного образца,
который устанавливается будущим· пользователем в реальную операционную
среду.
Нетрудно понять, что первые два этапа промышленной технологии соответству­
ют этапу идентификации; следующие три - этапам концептуализации, форма­
лизации, реализации и тестирования. Новым и вместе с тем естественным для
промышленной технологии является здесь этап привязки системы к реальной
рабочей обстановке.
Недостатком и той и друrой технологии ящ1яется то, что в действительности это
лишь более или менее структурированный набор методических рекомендаций, к
отдельным элементам которого, в лучшем случае, привязаны те или иные инст­
рументальные средства. И можно сказать, что сегодняшнее состояние здесь бли­
же к описательному, чем к естественно-научному. А это влечет за собой наличие
инт�рпретаций методологических рекомендаций, которые могут быть настолько
различными, что теряется сама идея технологии. Таким образом, самым важным
на данном этапе является создание операциональных моделей технологии разра­
ботки интеллектуальных систем. И здесь, по нашему мнению, хорошим приме­
ром могут послужить М6дели экспертизы, уже разработанные в рамках исследо­
ваний по приобретению знаний.
Приобретение знаний, как уже неоднократно отмечалось выше, является ключе­
вой задачей во всех технологиях построения систем, основанных на знаниях
(СОЗ). Существует распространенный принцип, согласно которому производи­
тельность СОЗ находится в прямой зависимости от количества знаний, содержа­
щихся в системе [Feigenbaum, 1977]. Более 15 лет, с момента появления извест­
ной nporpaммы.ТIERESIAS. [Davis, 1984], исследователи в области ИИ рассмат­
рив,µот приобретение знаний как задачу переноса знаний эксперта в БЗ системы,
что чрезвычайно важно для создания действующей системы. Но в настоящее
время работы в области приобретения зцаний становятся важными и с точки
зрения использования полученных здесь результатов для создания интеллекту­
альных технологий разработки самих СОЗ.
Первое поколение методик для СОЗ базировалось на подходах двух типов: по ­
этапном и прототипном.
Поэтапный подход связан с представлениями о жизненном цикле [Buchanan
et al., 1983; Guida et al., 1989] и соответствующей поддержке его основных стадий.
В прототипном подходе первого поколения [Grover, 1983; Wielinga et al., 1988]
процесс приобретения знаний может не отрабатывать все стадии, так как основ­
ным предположением здесь была возможность раскрытия структуры области экс­
пертизы на раннем этапе проектирования на основе сравнительно небольшого
21 8
Глава 6 • Программный инструментарий разработки систе м
анализа. Во втором поколении СОЗ-методик признана сложность процесса при­
обретения знаний, преодоление которой видится· в моделировании экспертизы.
В данной области были предложены такие методики, как онтологический анализ
[Alexander et al., 1987], концептуальные графы Sowa [Clancey, 1 985), подходы, ос­
нованные на обобщенных (родовых) задачах [Chandrasekaran, 1 985], и концепту­
альное моделироваlfие, например КАDS-методолоrия [Breuker et al., 1 986). Ме­
тодики приобретения знаний обсуждаются в огромном числе работ и, в част­
ности, в предыдущих главах настоящей книги. Не имея места для их сколько­
нибудь полного анализа, сошлемся здесь лишь на обзоры [Wielinga et al., 1 988;
Молокова, 1 992; Осипов, 1993] и перейдем к инструментальным средствам под­
держки разработки интеллектуальных систем.
6 . 3 . Языки программирования для ИИ
и языки предстааления знаний
Обсуждение технологических аспектов разработки сложных программных сис­
тем, проведенное выше,
' показьmает, что наиболее проработанным этапом здесь
является реализация программных проектов. По идеям и методам этот этап близок к автоматизации программирования - одной из основных проблем использо­
вания средств вычислительной техники. Здесь уже в течение многих лет приме­
няется обширный арсенал языков программирования высокого уровня, ориен­
тированных на удобную и эффективную реализацию различных классов задач, а
также широкий спектр трансляторов, обеспечивающих получение качественных
исполнительных программ. Все шире используются на современном этапе и ме­
тоды автоматического синтеза программ. Уже стало обычным применение языко­
во-ориентированных редакторов и специализированных баз данных. И можно
сказать, что в рамках технологии программирования уж� практически сформиро­
валась концепция окружения разработки сложных программных продуктов, ко­
торая и определяет инструментальные средства, доступные разработчикам.
Необходимость использования средств автоматизации программирования при­
кладных систем, ориентированных на знания, и в частности ЭС, была осознана
разработчиками этого класса программного обеспечения ЭВМ уже давно. По су­
ществу, средства поддержки разработки интеллектуальных систем в своем разви­
тии прошли основные стадии, характерные для систем автоматизации програм­
мирования.
Оценивая данный процесс с сегодняшних позиций, можно указать в этой области
две тенденции. Первая из них как бы повторяет •классический• путь развития
средств автоматизации программирования: автокоды - языки высокого уровня языки сверхвысокого уровня - языки спецификаций. Условно эту тенденцию мож­
но назвать восходящей стратегией в области создания средств автоматизации
разработки интеллектуальных систем. Вторая тенденция, нисходящая, связывает­
ся со специальными средствами, уже изначально ориентированными на опреде­
ленные классы задач и методов ИИ. В конце концов, обе эти тенденции, взаимно
,
6. 3. Языки пр ограмми ровани я для ИИ и языки представлен ия знаний
21 9
обогатив друг друга, должны привести к созданию мощного и гибкого инструмен­
тария интеллектуального программирования. Но для настоящего этапа в этой
области, по нашему мнению, характерна концентрация усилий в следующих на­
правлениях:
1 . Разработка систем представления знаний (СПЗ) путем прямого использоват
ния широко распространенных языков обработки символьной информации и,
все чаще, языков программирования общего назначения.
2. Расширение базисных языков ИИ до систем представления знаний за счет спе­
циализированных библиотек и пакетов.
3. Создание языков представления знаний (ЯПЗ), специально ориентированных
на поддержку определенных формализмов, и реализация соответствующих
трансляторов с этих языков.
На начальном этапе развития ИИ языков и систем, ориентированных специально
на создание прикладных систем, основанных на знаниях, не существовало.
С одной стороны, в то время еще не оформился сам подход, в котором централь­
ное место отводилось бы изложению теории в форме программ, а с другой - сама
область ИИ только зарождалась как научное направление. Немаловажным было
и то, что появившиеся к тому времени универсальные языки программирования
высокого уровня казались адекватным инструментом для создания любых, в том
числе и интеллектуальных, систем. Однако сложность и трудоемкость разработ­
ки здесь настолько велики, что практически полезные интеллектуальные системы
становятся недоступными для реализации. Учитывая вышесказанное, были раз­
работаны языки и системы обработки символьной информации, которые на не­
сколько десятилетий стали основным инструментом программирования интел­
лектуальных систем.
До недавнего времени наиболее популярным базовым языком реализации сис­
тем ИИ вообще и ЭС, в частности, был ЛИСП [McCarthy, 1 978]. Ниже кратко
рассматривается эволюция ЛИСПа, а затем обсуждаются альтернативы этому
языку, существовавшие и существующие в области реализации систем, ориенти­
рованных на знания. Результаты этого краткого обзора суммированы в виде схе­
мы развития средств автоматизации программирования интеллектуальных сис­
тем н� рис. 6.5. Подробнее эти вопросы обсуждаются в работе [Хорошевский,
1 990а, Хорошевский, 1 990Ь].
Как извес�;но, язык ЛИСП был разработан в Стэнфордепод руководством Дж. Мак­
карти в начале 60-х годов и не предназначался вначале для программирования
задач ИИ. Это был язык, который должен был стать следующим за ФОРТРАНом
шагом на пути автоматизации программирования.
По первоначальным замыслам новый язык должен был иметь средства работы с
матрицами, указателями и структурами из указателей и т. п. Предполагалось, что
первые реализации будут интерпретирующими, но в дальнейшем будут созданы 1
компиляторы. Как отмечает сам автор языка в обзоре [McCarthy, 1 978], к счастью,
для столь амбициозного проекта не хватило средств. К тому же к моменту созда-
220
Глава 6 • Программный инстру ментарий разработки систем
ния первых ЛИСП-интерпретаторов в практику работы на ЭВМ стал входить
диалоговый режим, и режим интерпретации естественно вписался в общую струi<"
туру диалоговой работь1.
1 990
т
С++
'
Frame2
1 980
Concurrent
PROLOG
____ --�cL9-�-i
�--__
i Lisp-mach -'
Smalltalk-V
:
111 Lisp
i:
:t - - -- -Ceneration
:
- -- -- - - - - - _ _ _ ,
Smalltalk-80
r ·· - - . - - ·· 1
�-==--= �-:: ::.:.; �� -.F..13.!: _i
·
L1sp
--- ,
;- -Q-�- - - ,· �г-;г -KRL
:
Пилот
1 970
; Pascal i I РЕТЛ/2�
Simula/67
:
; ML1ps ; , г ·· - - - · - ·· ,
.-+---+--+-+----< Frame
�
1 Qlisp
��������:
<р-ЯЗЫ
- К-·;
l-�
: --·-
•••• • • • • • • • • • • • • • • • • • •1
г - - - - -L - - - - - - - - - -
___ __
Maclisp
lnterlisp
11 Lisp
,
Ceneration
--т-----__
1
:
:
L - - - - - - - -
i
.
р _ .,
·· -
--· - г · - .
1
:
PLANNER ,____..
:! - L
O
B
: SNO
r ..,. ..:. _ _ _ _ _ _ _ _ _ _ _
.. . -:
i
I
: �?_������--·:, ___,:
,,. .
Базисн.
РЕФАЛ 1
._,..____,..._,!
,---
�-- - :
PROLOG
Lisp 1 .5
1
1
1
,
� ----------!
1 - ,- - - - - - - - - - . _ ,
IPL-V
1 960
эвм
Языки высокого уровня
Ассемблеры
Рис. 6.5. Э волюция средств представления зн а ний
Примерно тогда же окончательно сформировались и принципы, пол"оженные
в основу языка ЛИСП: использование единого спискового представления для
6.3. Языки программирования для И И и языки представления знаний
221
программ и данных; применение выражений для определения функций; скобоч­
ный синтаксис языка. Процесс разработки языка завершился GОзданием _версии
ЛИСП 1.5 [McCarthy, 1978], которая на многие годы определила пути его разви­
тия;
На протяжении всего существования языка было много попыток его усовершен­
ствования за счет введения дополнительных базисных примитивов и/или управ­
ляющих структур. Однако, как правило, все эти изменения не прививались в ка­
честве самостоятельных языков, так как их создатели оставались в �лисповской•
парадигме, не предлагая нового взгляда на программирование.
После разработки в начале 70-х годов таких мощных ЛИСП-систем, как MacLisp
и Interlisp { Moon, 1 973; Teitelman, 1 974], попытки создания языков ИИ, отлич­
ных от лиспа, но на той же парадигме, по-видимому, сходят на нет. и дальней­
шее развитие языка идет, с одной стороны, по пути его стандартизации (таковы,
например, Standart Lisp, Franz Lisp и Common Lisp ), а с другой - в направлении
создания концептуально новых языков для представления и манипулирования
знаниями, погруженных в ЛИСП-среду [Barr et al., 1 982].
К концу 80-х годов ЛИСП был реализован на всех классах ЭВМ, начиная с пер­
сональных компьютеров и кончая высокопроизводительными вычислительны­
ми системами. Новый толчок развитию ЛИСПа дало создание ЛИСП-машин,
которые и в настоящее время выпускаются рядом фирм США, Японии и Запад­
ной Европы.
Из предыдущего может сложиться впечатление, что язык Л ИСП (а вер�ее его
современные диалекты) - единственный язык ИИ. В действительности,' конеч­
но, это не так. Уже в середине 60-х годов, то есть на этапе становления лиспа,
разрабатывались языки, предлагающие другие концептуальные основы. Наибо­
лее важными из них в области обработки символьной информации являются, по
нашему мнению, СНОБОЛ [Griswold, 1 978], разработанный в лабораториях
Белла, и язык РЕФ АЛ [Турчин, 1 968], созданный в ИПМ АН СССР.
Первый из них ( СНОБОЛ) - язык обработки строк, в рамках которого впервые
появилась и была реализована в достаточно полной мере концепция поиска по
образцу. С позиций сегодняшнего дня можно сказать, что язык СНОБОЛ был
одной из первых практических реализаций развитой продукционной системы.
Наиболее известная и 'интересная версия этого языка - СНОБОЛ-IV [Грисуолд
и др., 1 980]. Здесь, на наш взгляд, техника заданЮI образцов и работа с ними суще­
ственно опередили потребности практики. Может быть именно это, а также поли­
тика активного внедрения ЛИСПа помешали широкому использованию языка
СНОБОЛ в области ИИ.
В основу языка РЕФ АЛ положено понятие рекурсивной функции, определенной
на множестве произвольных символьных выражений. Базовой структурой дан­
ных этого языка являются списки, но не односвязные, как в ЛИ С Пе, а двунаправ­
ленные. Обработка символов ближе, как мы бы сказали сегодня, к продукционно­
му формализму. При этом активно используется концепция поиска по образцу,
характерная для СНОБОЛа. Таким образом, РЕФ_АЛ вобрал в себя лучшие чер-
222
Глава 6 • П рограммный инструментарий разработки систем
ты наиболее интересных языков обработки символьной информации 60-х годов.
В настоящее время можно говорить о языке РЕ ФАЛ второго [Климов и др., 1 987]
и даже третьего поколения. Реализован РЕФ АЛ на всех основных типах ЭВМ и
активно используется для автоматизации построения трансляторов, для построе­
ния систем аналитических преобразований, а также, подобно ЛИСПу, в качестве
инструментальной среды для. реализации языков представления знаний [Хоро­
шевский, 1983].
В начале 70-х годов появился еще один новый язык, способный составить конку­
ренцщо Л ИСПу при реализации систем, ориентированных на знания, - язык
ПРОЛОГ [Clocksin et al., 1 982 ] . Он не дает новых сверхмощных средств програм­
мирования по сравнению с ЛИСПом, но поддерживает другую модель организа­
ции вычислений. Подобно тому, как ЛИСП скрыл от программиста устройство
памяти ЭВМ, ПРОЛОГ позволил ему не заботиться (без необходимости) о пото­
ке управления в программе. ПРОЛОГ предлагает такую парадигму мышления, в
рамках которой описание решаемой задачи представляется в виде слабо структу­
рированной совокупности отношений. Это удобно, если число отношений це
слишком велико и каждое отношение описывается небольшим числом альтерна­
тив. В противном случае ПРОЛОГ-программа становится весьма сложной для
понимания и модификации. Возникают и проблемы эффективности реализации
языка, так как в общем случае механизмы вывода, встроенные в ПРОЛОГ, обеспе­
чивают поиск решения на основе перебора возможных альтернатив и декларатив­
ного возврата из тупиков. ПРОЛ О Г разработан в Марсельском университете в
197 1 г. [Colшeгauer, 1 983]. Однако популярность он стал приобретать лишь в на­
чале 80-х годов, когда благодаря усилиям математиков был обоснован логичес­
кий базис этого языка, а также в силу того, что в японском проекте вычислитель­
ных систем V поколения ПРОЛОГ был выбран в качестве базового для машины
вывода. В настоящее�время ПРОЛОГ завоевал признание и на американском кон­
тиненте, хотя уступает в популярности ЛИСПу и даже специальным продукци­
онным языкам, широко используемым при создании ЭС.
Мы рассмотрели языки общего назначения для задач ИИ. Вместе с тем в рамках
развития средств автоматизации программных систем, ориентированных на зна­
ния, были языки, сыгравшие важную роль в эволюции основных языков ИИ.
В первую очередь среди . них необходимо выделить языки, ориентированные на
программирование поисковых задач. Это ПЛЭНЕР и различные его модифика­
ции [ Пильщиков, 1983], КОННАЙВЕР [Sussшan et а\., 1 976], а также языки, вы­
росшие из потребностей известной планирующей системы QA4 [ Sacerdoti et
al., 1976]. Все эти языки функционируют в ЛИСП -среде и создавались I<ак расши­
рения базового языка. Для них, кроме свойств ЛИСПа, характерны следующие
черты: представление данных в виде произвольных списковых структур; разви­
тые методы сопоставления образцов; поиск с возвратами и вызов процедур по об­
разцу. Заметим, что в конечном счете ни один из них не стал универсальным язы­
ком программирования ИИ. Однако выработанные здесь решения были
использованы и в ЛИСПе, и в ПРОЛОГе, и в современных продукционных.язы­
ках. Важно и то, что языки этой группы способствовали переосмыслению самого
6.3. Языки программирования для .ИИ и язы ки представления знаний
223
понятия проrраммь1. В области ИИ это .послужило толчком к развитию объектно­
ориентированного программирования и разработке языков представления зна­
ний первого поколения.
В 70-х годах в программировании вообще и программировании задач ИИ, в част­
ности, центр тяжести стал смещаться от процедурных к декларативным описа­
ниям. К этому же времени в ИИ сформировались и концепции представления
знаний на основе семантических сетей и фреймов. Естественно, что появились и
специальные языки программирования, ориентированные на поддержку этих кон­
цепций. Но из десятков, а может и сотен языков представления знаний (ЯПЗ)
первого поколения лишь несколько сыграли заметную роль в про­
граммной поддержке систем предс.тавления знаний. Среди таких ЯПЗ явно вы­
деляются KRL, FRL, KL-ONE и некоторые другие [Хорошевский, 1990]. Харак­
терными чертами этих ЯПЗ были: двухуровневое представление данных (абст­
рактная модель предметной области в виде иерархии множеств понятий и
конкретная модель ситуации как совокупность взаимосвязанных экземпляров
этих понятий); представление связей между понятиями и закономерностей
предметной области в виде присоединенных процедур; семантический подход к
сопоставлению образцов и поиску по образцу.
Суммируя вышесказанное, можно отметить, что на первом этапе была сформи­
рована значительная коллекция методов представления знаний и соответствую­
щих ЯПЗ. Все это способствовало формированию новой стадии исследований в
области ИИ, которая характеризуется переходом от экспериментальной про­
граммной проверки идей и методов к созданию практически значимых инстру­
ментов. .
В силу ограниченного объема книги мы не сможем здесь рассмотреть даже наи­
более распространенные языки и системы представления знаний. Поэтому ниже
приведены лишь некоторые замечания относительно одного из самых распрост­
раненных ЯПЗ - OPS5 ( Official Production System, version 5) [B.rownston et al.,
1985], который претендовал в начале 80-х годов на роль языка-стандарта в обла­
сти представления знаний для ЭС.
OPS5 - один из многочисленных на сегодняшний день ЯПЗ для ЭС, поддержи­
вающих продукционный подход к представлению знаний. ОРS5-программа, в
общем случае, содержит секцию деклараций, где описываются используемые
объекты и определяются введенные пользователем функции, и секцию продук­
ций, основу которой составляют правила. ОРS5-объекты описываются с помо­
щью фреймов-экземпляров, прототипы которых задаются в виде определенных
структур данных, опирающихся на небольшое число встроенных типов. Во вре­
мя исполнения программы обрабатываемые данные помещаются в. рабочую па­
мять, а правила - в память продукций. Модуль вывода решений в ОРS5-системе
состоит из трех основных блоков: ()111ОЖдествления, где осуществляется поиск
подходящих правил; в'Ыбора исполняемого правила из конфликтного множества
правил и собственно исполнителя. выбранного правила. Непосредственно в OPS5
поддерживается единственная стратегия вывода решений - вывод, управляе­
мый целями. Вместе с тем OPS5 - достаточно гибкий язык, в котором имеются
, 224
Глава 6 • Программны й инструментари й разработки с и стем
явные средства не только для описания данных, но и средства определения уп­
равления над этими данными.
Анализ формализмов представления знаний и методов вывода решений позво­
ляет сформулировать следующие требования к ЯПЗ:
• наличие простых и вместе с тем достаточно мощных средств представления
сложно структурированных и взаимосвязанных объектов;
• возможность отЬбражения описаний объектов на разные виды памяти ЭВМ;
• наличие гибких средств управления выводом, учитывающих необходимость
структурирования правил работы решателя;
• «п розрачность� системных механизмов для программиста, предполагающая
возможность их доопределения и переопределения на уровне входногоязыка;
• возможность эффективной реализации.
Конечно, перечисленные требования во многом противоречивы. Но удачные язы­
ки и системы представления знаний, как правило, появляются лишь тогда, когда в
рамках разумного компромисса учтены все эти требования.
6.4. Инструментальные пакеты для И И
Развитые среды автоматизации программирования на базе языков символьной
обработки являются необходимым технологическим уровнем систем поддержки
разработки прикладных интеллектуальных систем. Как правило, такие среды
покрывают (и то частично) подсистему автоматизации проектирования и про­
граммирования. Вот почему следующим этапом в развитии инструментальных
средств стала ориентация на среды поддержки разработок интеллектуальны х
систем .
Анализ существующих инструментцльных систем показывает, что сначала в об­
ласти ИИ более активно велись работы по созданию интеллектуальных систем
автоматизированного синтеза исполнительных программ. И это естественно,
если иметь в виду, что инструментарий ИИ является, по существу, эволюцион­
ным развитием систем автоматизации программирования. При этом основная
доля мощности и интеллектуальности такого инструментария связывалась не с
его архитектурой, а с функциональными возможностями отдельных компонен­
тов той или иной технологической среды. Большое значение при разработке ин­
струментария для ИИ уделялось и удобству сопряжения отдельных компонен­
тов. Пожалуй, именно здесь были получены впечатляющие результаты и именно
здесь наиболее широко использовались последние достижения теории и прак­
тики программирования, такие, например, как синтаксически-ориентирован­
ное редактирование и инкрементная компиляция. Вместе с тем подавляющее
большинство современных инструментальных систем «не знают,> , что проекти­
рует и реализует с их помощью пользователь. И с этой точки зрения можно ска­
зать, что все такие системы являются не более чем «сундучками� с инструмента­
ми, успех использования которых определяется искусством работающего с ними
мастера. Примерами подобных сред служит подавляющее большинство инстру-
6.4. И нструментальные пакеты для И И
2-2 5
ментальных пакетов и систем-оболочек для создания экспертных систем типа
EXSYS [EXSYS, 1985) , GURU [MDBS, 1986] и др. [Harmon, 1987]. Однако не
они определяют на сегодняшний день уровень достижений в этой области.
К первому эшелону большинст�о специалистов относит системы ART [ART,
1984], КЕЕ [Florentin, 1 987) и Knowledge Craft [CARNEGIE, 1987] . Заметим, что
в последнее время в класс самых мощных и развитых систем вошла и среда G2
[ САТALYST, 1993]. Все эти системы, во-первых, отличает то, что это, безусловно,
интегрированные среды поддержки разработки интеллектуальных (в первую
очередь, экспертных) систем. И вместе с тем для этих систем характерно не эклек­
тичное объединение различных полезных блоков, но тщательно сбалансирован­
ный их .отбор, что позволило сделать первые шаги от автоматизации програм­
мирования систем ИИ к технологическим системам поддержки проектирования
сначала экспертных, а затем и других интеллектуальных систем.
Остановимся чуть подробнее на двух системах из •большой тройки• - ART и
КЕЕ, а в заключение кратко охарактеризуем систему G2. Сравнение основывает­
ся, главным образом, на работах [Wall et al., 1986; Richer, 1986; Gillmore et al.,
1985] и на информации, полученной от дилеров этих систем.
В середине 80-х годов система ART была одной из самых современных интегри­
рованных сред ( ИС), поддерживающих технологию проектирования систем, ос­
нованных на правилах. В ней существует ясное и богатое разнообразие типов пра­
вил. Различные типы правил элегантно вводятся с помощью мощного механизма
•точек зрения• (Viewpoint). Этот механизм фактически является очень близким
к системе, основанной на истинности предположений (truth maintanance system)
[de Кleer, 1989], которая, по-видимому, является развитием идей KEEWorlds+ в
системе КЕЕ. По существу, ART является пакетом разработчика. При этом воз­
можные ограничения в использовании ART вызваны не свойствами самой систе­
мы, а философией базового метода представления знаний.
ART объединяет два главных формализма представления знаний: правила для
процедурных и фреймоподобные структуры для декларативных знаний. Глав­
ным является формализм продукционных правил. Декла�ативные знания опи­
сываются через факты и схемы [schemata] и в некоторых случаях через образцы
[patterns ]. Кроме факторов числовой неопределенности, которые связываются с
индивидуальными фактами, в ART различаются факты, которые явно принима­
ются за ложные, и факты, истинность которых неизвестна. Возможно использо­
вание логических зависимостей, которые позволяют изменить факты позже,
если обнаружится, что они1 на самом деле оказались ложными. Механизм View­
point допускает образование нескольких конкурирующих миров, где пробуются
альтернативные решения.
Схема предусматривается в ART в качестве макроформы для выражения таксо­
номических знаний в структурированном виде, но ни метод, ни активные значе­
ния или выход в базовый язык в этом декларативном представлении не допус­
каются. ART обеспечивает 11 системно-определенных свойств, наследование
которых поддерживается системой автоматр:чески. Допускается множествен­
ное наследование. Однако средства задания активных значений, указания ограни-
226
Глава 6 • Программный инструментарий разработки систем
чений на слот и привязки процедурных знаний к слотам здесь отсутствуют. .Та­
ким образом, роль компонента, основанного на фреймах, является чисто опи­
сательной. Ограничения и значения по умолчанию могут быть обеспечены в
правилах, хотя их было бы легко устано�ить.непосредственно с помощью процедур­
но-ориентированноrо фреймового . формализма. Наследование, определяемое
пользователем, не допускается, но тоже может быть смоделировано посред­
ством правил [Wall et al., 1 986). Согласно концепции фирмы Inference Corpora­
tion это является преимуществом, так как статическое наследование предус­
матривает мощную прекомпиляцию эффективного кода.
Продукционные знания описываются с помощью правил пяти впдов: правила
выводов, продукционные правила, гипотетические правила, правила ограниче­
ний и правила полаrаний. Правила вывода добавляют факты в базу знаний, в m
время как продукционные правила изменяют факты в рабочей памяти (напри­
мер, значение атрибута объекта). Гипотетические правила позволяют в ART ис­
пользовать возможности формирования гипотез и представляются в следующей
форме: . ЕСЛИ это случилось, ТО рассматривать это как гипотезу•. Правила ог­
раничений описывают ситуацию, которая никогда не может появиться при пра­
вильной точке зрения на действительность. Правила полаrаний используются
для предположений (которые принимаются за правильные) о точках зрения (ги­
потезах). При подтверждении гипотезой некоторого условия она принимается за
правильную, объединяется со всеми породившими ее гипотезами и становится
новым корнем в древовидной структуре. Другие, несовместимые, гипотезы отбра­
сыщ1ются.
Вызов процедур, определенных пользователем, может быть использован как в ле­
вых, так и в правых частях правил ART. Образцы (patterns) используются в ус­
ловной части правил. Они должны быть сопоставлены с фактами рабочей памя­
ти. Образцы могут включать переменные и логические связки, обеспечивающие
сочетание фрагментов модели (И, ИЛИ, НЕ, СУЩЕСТВУЕТ, ДЛЯ ВСЕХ).
ART предлагает традиционные модели вывода: •ОТ фактов к цели• и .от цели к
фа1пам•. Они могут объединяться в мощный механизм истинности, основанный
на предположениях, который допускает аргументацию типа ЧТО ЕСЛИ. Кроме
того, в составе ART используются и классические правила типа OPS.
Графическое окружение ART хорошо развито. Интерфейс ARTStudio включает в
себя базу знаний с демонстрацией гипотез, утилиты отладчика запускаемых про­
грамм, систему подсказок, доступную в любое время, систему меню -и графичес­
кий пакет ARTist (ART Image Syntesis Tool ) с оконным редактором. ART предла­
гает редактор базы знаний, но не дает редактора схем, ·подобного внутреннему
графическому редактору КЕЕ [Wall et al., 1 986; Richer, 1 986) , обсуждаемому
ниже. Как указывается в работе [Gillmore et al., 1985], это может стать причиной
ошибок при .глубоком• редактировании разрабатываемых баз знаний.
ARTist позволяет создавать доступные правилам меню и управлять окнами поль­
зовательского интерфейса, а также создавать сами окна. Графические конструк­
ции описываются с помощью схем и ссылаются на правила. Это обеспечивает
функционирование по принципу управления обращениями к данным.
6.4. Ин струментальные пакеты для ИИ
227
ART часто представляют в качестве лучшей ис ДЛЯ создания экспертных сис­
тем, но следует понимать, что хорошо эта среда отвечает лишь всем требованиям
подхода поверхностных знаний. ;Благодаря компилятору правил система вывода
в ART является быстрой по своей природе. Главные стратегии структуры управ­
ления поиском решений обеспечиваются, и некоторая гибкость в управлении по­
иском остается инженеру по' знаниям. Чисто декларативные та1<сономические
фреймы языка интегрируются с системой правил, но в ART не существует дей­
ствительно процедурных фреймов, которые могли бы позволить объединить
предметные описания с продукционными. В этом отношении объектно-ориенти­
рованное программирование с образцами и возможностями моделирования мог­
ло бы быть более полезным. Нельзя сказать, что подход, основанный на моделях,
не осуществим в ART. Однако кажется, что другие ИС более эффективны для
этих целей.
Первые версии ART опирались на язык ЛИСП, последние реализованы непо­
средственно на С. Это увеличивает эффективность периода исполнения ART.
Введены в новые версии и некоторые другие усов�ршенствования. Они касаются
в основном выразительной силы формализма, основанного на фреймах, и увели­
чивают аде1<ватность ART по отношению к методу аргументации, основаl'шому
1-1а модели. Имеется информация, что в ART включен и объектно-ориенти­
рованный подход.
Теперь рассмотрим основные свойства системы КЕЕ и типы задач, I<оторые
•подходят� для �той среды. КЕЕ фактически является большим набором хоро­
шо интегрированных ИИ-парадиrм. Этот па1<ет включает продукционные пра­
вила, основанный на фреймах язык с наследованиями, логически-ориентирован­
ные утверждения, объектно-ориентированные парадигмы с сопутствующими
сообщениями и обеспечивает доступ в базовую LISР-систему. Кроме того, КЕЕ
предлагает средства для организации и объединения знаний в специфические
I<омпоненты и явного структурирования процесса аргументации. Преимущества
КЕЕ заключаются также в мощности и дружественности пользовательского интерфейса.
Главное отличие между формализмом представления знаний КЕЕ и ART заклю­
чается в способе, которым эти ИС связывают фреймы и правила. КЕЕ является
средой, в основе которой лежат фреймы, в то время как в ART - правила. Фрей­
мы в КЕЕ называются элементами (units) и вводятся в более широком смысле,
чем в ART. Здесь фреймы могут иметь процедурную роль и дают возможность
построения поведенческих моделей объекта и моделей экспертизы. С этой целью
к слотам могут привязываться активные значения и методы. Активные значения
могут выборочно активизировать системы правил. Таким образом, язык фрей­
мов КЕЕ позволяет представлять поведение независимых сложных компонент в
рамках подхода, основанного на модели, что обеспечивает разделение знаний на
проблемно-ориентированные фрагменты. При этом каждый компонент знаний
может быть активирован по требованию.
Описание объектов и правил в КЕЕ представляется в виде иерархий фреймов.
Доступны два основных отношения: классы/подклассы и классы/примеры. Каж-
228
Глава 6 • Программный инструм е нтарий разработки систе м
дый объект представляется слотами; в системе различаются индивидные ( соб­
ственные) и коллективные слоты. Первые используются для описания атрибутов
и свойств класса, рассматриваемого в качестве объекта, а вторые описывают родо­
вые свойства членов класса. Слоты могут иметь различные аспекты, которые, в
свою очередь, могут иметь множественные значения. На них могут накладывать­
ся ограничения, которые могут использоваться в качестве автоматических утилит
для проверки целостности знаний. Этим КЕЕ отличается от ART, где ограниче­
ния могут выражаться только с помощью правил. Со слотами могут быть связаны
активные значения. Формализм продукционных правил в КЕЕ тоже хорошо раз­
работан. Использование переменных и вызов LISР-функций допускается как в
исполняемых, так и в условных частях.
КЕЕ предлагает несколько методик для моделирования рассуждений. Конечно,
при этом имеется базовый поисковый механизм, но КЕЕ позволяет также транс­
формировать неявные знания во фреймы и в решетки наследования, что дает
средства для моделирования операций аргументации.
КЕЕ (версия 3.0) обеспечивается системой, основанной на предположении ис­
тинности выполнения, называемой KEEW orld. Согласно заявлениям фирмы
IntelliCorp, она обеспечивает поддержку фундаментальных методов поиска в
пространстве состояний. Мощность КЕЕ проявляется при решении задач, где
процесс аргументации может трансформироваться, выполняться и управляться
с помощью фреймовых компонент. Решетка наследования фреймов позволяет
установить несколько видов зависимостей между объектами. Система снабжена
возможностями автоматического восстановления неявной информации. Утверж­
дается, что эта информация может быть представлена фреймами [Fikes et а!.,
1985]. КЕЕ обеспечена эффективными возможностями восстановления и авто­
матической проверки информации. Для этой цели существует логический язык
TellandAsk, который используется для определения и восстановления фактов в
базе знаний КЕЕ.
Пользовательский интерфейс КЕЕ очень гибкий и тщательно проработанный.
Он включает мощный редактор, программу просмотра базы знаний, поясняющие
сообщения и т. д. Известно, что он превосходит по мощности интерфейс ART
[Wall et а!., 1986; Richer, 1986]. КЕЕ обеспечивает по.7,1ьзователя графическими
средствами KEEpictures и Activelmages для построения графических представле­
ний. Последние могут быть привязаны к фреймовым слотам, и тогда изменение
значения слота приводит к изменению «картинки,> .
Следует отметить и недавнюю эволюцию системы. К Е Е 2. 1 не имел гипотети­
ческой системы или системы, основанной на предположении об истинности вы­
полнения. В КЕЕ 3.0 эти новые возможности доступны. А его открытая архите1<­
тура является важным фактором в процессе настройки и расширения, так как
части КЕЕ написаны в самом КЕЕ. С одной стороны, это полезно для подтверж­
дения гибкости КЕЕ и способности к развитию. С другой - это может привести
к неэффективности исполняющей системы. Дополнительно фирма IntelliCorp
уже разработала пакет специализированных программ для КЕЕ. Одна из таких
программ - SIMKIТ. Она спроектирована для поддержки моделирования в КЕЕ.
6.4. Инструментал ьные пакеты для И И
229 '
Таким образом, КЕЕ является развитой системой, основанной на фреймах, где
хорошо сбалансированы формализмы представления как декларативных, так и
процедурных знаний. Доступны в системе и методы явного управления и струк­
турирования процесса аргументации. Благодаря этому КЕЕ является подходя­
щим для решения задач в рамках подхода, основанного на модели.
Важнейшими при разработке интеллектуальных прикладных систем являются
вопросы формирования и отладки баз знаний. Но здесь КЕЕ, ART и многие дру­
гие инструментальные пакеты, к сожалению, идут по пути обычных систем авто­
матизации программирования. Пользователю предоставляется мощный графи­
ческий редактор правил, используемь1й для начального ввода продукций И
коррекции их в процессе отладки, и средства графической трассировки вывода
решений, которые должны позволить инженеру знаний ориентироваться во взаи­
модействии сотен и тысяч правил.
Инструментальная среда G2 - разработка фирмы Gensym Corp. - является раз­
витием известной: экспертной системы реального времени PICON. По утвержде­
нию официального дилера этой фирмы в России Э. В. Попова, G2 является самой
мощной из сред для систем реального времени среди всех инструментов данного
класса. Система G2 реализована на всех основных вычислительных платформах,
включая рабочие станции Sun, НР9000, RS/6000 и ПЭВМ, работающие под уп­
равлением Windows NТ. Возможна работа с системой в режиме клиент-сервер в
сети Ethernet.
Основные функциональные возможости G2 связаны с поддержкой процессов сле­
жения за множеством (порядка тысяч) одновременно изменяющихся параметров
и обработкой изменений в режиме реального времени; проверкой нештатных си­
туаций на управляемых объе1сrах и принятием решений как в режиме ассистиро­
вания оператору, так и в автоматическом режиме. Функциональные возможнос­
ти системы обеспечиваются быстрым выполнением распараллеливающихся
операций, доступными в режиме on-line данными, блоками темпорального выво­
да (включая ссылки на прошлое поведение и поведение управляемого объекта во
времени, интеграцию с подсистемами динамического моделирования и проце­
дурными знаниями о времени), специальной техникой вывода решений в режиме
реального времени (включая стандартные forward и backward рассуждения, а · так­
же event-driven выводы, сканирование датчиков для определения ситуаций, тре­
бующих немедленного вмешательства в процесс управления, механизмы фо1<уси­
рования на определенном подмножестве знаний с использованием метазнаний и
мощной подсистемой real-time truth maintenance)'. Все это дает возможность при­
кладным системам, разработанным с использованием G2, поддерживать на RISС­
архитектурах обработку 1 000 правил/с реального уровня сложности.
Указанные параметры производят серьезное впечатление, и, хотя доступной тех­
нической информации по системе G2 явно недостаточно для окончательных
выводов о ее применимости во всем спектре заявленных приложений, можно
предположить, что система G2 действительно была одной из первых инструмен­
тальных сред, поддерживающих разработку интегрированных интеллектуальных
систем.
230
Глава 6 • Программный инструме нтарий разработки систем
В заключение настоящего параграфа остановимся на первых попытках интел­
лектуализации инструментальных средств. Следует сразу сказать, что здесь дос­
таточно четко просматриваются два направления: снизу (применение методов
ИИ для разработки программного обеспечения) и сверху (переход к системам
поддержки разработки баз знаний, основывающихся, в свою очередь, на метазна­
ниях).
Результаты, полученные с использованием методов ИИ в различных областях
человеческой деятельности, привели разработчиков МО к идее использования
интеллектуальных систем в программировании. Проект «Ассистент программи­
ста>> в Массачусетском технологическом институте и проект « Пси�> в Стэнфорд­
ском университете были первыми шагами в этом направлении [Waters, 1985;
Green, 1977]. В этих проектах предпринимались попытки промоделировать зна­
ния программиста, используемые для понимания, проектирования, реализации
и сопровождения ПО. Предполагалось, что эти знания могут быть использованы,
например, экспертной системой для частичной автоматизации процесса разра­
ботки ПО, однако существенных результатов в этой части, по-видимому, получе­
но не было.
Методы ИИ могут значительно увеличить мощность существующих инструмен­
тальных средств и в области разработки, оценки и проверки требований. Дей­
ствительно, часто пользователь не знает тех возможностей и особенностей, кото­
рые он хотел бы иметь от программной системы, и процесс разработки требований
напоминает процесс приобретения знаний. Понятно, что при этом соответствую­
щие инструментальные средства могут использоваться при формировании
пользователем своих требований. Вот почему ниже приводится краткий обзор
средств приобретения знаний и сопровождения баз знаний, дополняющий анало­
гичный материал предыдущих глав, но с акцентом на инструментальных компо­
нентах.
Исторически впервые автоматическое извлечение из экспертов конструктов и
создание репертуарных решеток, необходимых для построения поля знаний [Гав­
рилова и др., 1988], было реализовано в системе PLANET [Shaw, 1982; Shaw et al.,
1984]. Ряд алгоритмов и программ PLANET был впоследствии использован при
создании системы ETS [Boose, 1985а; Boose, 1985Ь; Boose, 1985с; Boose, 1986],
обеспечивающей не только автоматическое создание репертуарной решетки, но и
преобразование ее в традиционные для ЭС формы представления БЗ. Потомками
ETS являются система NeoETS [Boose et al., 1986] и интегрированная среда для
извлечения экспертных знаний AQUINAS [Boose et al., 1987] . Дальнейшим раз­
витием системы PLANET является интегрированная среда KIТTEN [Gaines et al.,
1986; Gaines et al., 1987), поддерживающая ряд методов извлечения знаний.
Перечисленные выше системы поддержки процессов приобретения знаний, как
правило, ориентированы на отдельные фазы всего технологического цикла. Од­
ной из методологий, ориентированных на «интегрированные;,, средства поддержки
разработки, справедливо считается KADS, рассмотренная в параграфе_ 4.5. В этой
системе сделана, пожалуй, первая попытка объединения достижений «клас­
сической;,, технологии программирования и методов ИИ. В дальнейшем эта
6.5. WоrkВепсh-сист емы
23 1
тенденция стала проявляться все более определенно, и лидерство, в конечном
счете, перешло I< инструментальным системам нового поколения, основное отJ.Iи­
чие которых состоит в том, что они опираются на знания о технолоr:ии проекти­
рования, реализации и сопровождения интеллектуальных систем. В настоящее
время попытки создания таких инструментальных систем наблюдаются в WorkBench, рассматриваемых ниже.
6. 5. WorkBench-cиcтeмы
Си стемы т и па WorkBench в контексте автомат изации про·гра мм и рования - .это и нтег­
рированные и нструментальные с истемы, поддержива ю щи е весь ц икл с оздан и я и с о­
провожден и я п рограмм.
К основным характеристикам WorkBench-cиcтeм относятся:
1 . Использование определенной технологии проектирования на протяжении всего
жизненного цикла целевого продукта.
2. Вертикальная интеграция инструментальных средств, обеспечивающая связи
и совместимость по данным между различными инструментами, используе­
мыми на разных стадиях создания целевой системы.
3. Горизонтальная интеграция моделей и методов, используемых на одной и той
_ же стадии проектирования.
4. Сбалансированность инструментария, то есть отсутствие дублирующих компонентов, «необходимость и достаточность• каждого инструмента.
Одна из систем данного типа разрабатывалась в рамках проекта VIТ AL [VIТAL,
1990) . Отдельные стадии методологии поддерживаются здесь следующими сред­
ствами: анализ - подсистемой КАТ (Knowledge Acquisition ToolКit); проеr<ти­
рование - подсистемой FTDT ( Functional and Technical Design Tool); кодирова­
ние знаний - языком представления знаний; проверка и верификация - V & VT
(Validation and Verification Tool) ; поддержка и отладка - VT (Visualization
Tool).
WorkBench VITAL - тесно связанная с методологией система, пригодная для
промышленного применения. Обеспечивается это средствами трансформации
баз знаний в процедурное представление и развитыми средствами визуализации
для поддержки навигации по большим базам знаний.
В целом проект VITAL был достаточно амбициозным по своим целям и задачам,
но, учитывая финансирование его в рамках европейской научной программы
ESPRIT и задел основных исvолнителей, вполне реальным.
Проект VIT AL, если так можно сказать, определил философию разработки
WorkBench-cиcтeм. Ниже, в качестве примеров, рассматриваются две Work­
Bench-cиcтeмы, KEATS [Motta et al., 1988) и Shelly [Bouchet et al., 1 989), где эта
философия нашла некоторое реальное воплощение.
232
Глава 6 • П рограммный инструментарий разработки систем
Система KEATS (Knowledge Engineer's Assistant); [Motta et al., 1988; Motta et al.,
1 989} первоначально представляла собой набор инструментов, созданных для по­
мощи инженерам знаний в проведении анализа предметных знаний и разработки
концептуальной модели ПО (вот тут говорится про предметную область! ! !).
В первой версии системы, называемой KEATS-1 [Motta et al., 1 988], были реали­
зованы редактор текстов CREF (Cross Reference Editing Facility) и графический
редактор GIS (Graphical lnterface System), а также фрейм-ориентированный язык
описания знаний KDL (Knowledge Description Language) и интерпретатор про­
дукционных правил COPS (Context Oriented Production System).
Редактор текстов CREF помогает инженерам знаний провести анализ докумен­
тов, имеющих текстовую форму, и допускает установление связей между фраг­
ментами типа «ссылается•, «обобщает•, «заменяет•, «предшествует•.
Графический редактор GIS позволяет инженеру знаний быстро построить пред­
ставление концептуальней модели ПО (то же самое). Элементами графического
представления могут быть как фрагменты, выделенные посредством компонента
CREF, так и произвольные объекты исследуемой ПО (то же самое). Различаются
два вида графических элементов: классы (изображаются овалом) и примеры
(изображаются прямоугольником). Разные типы отношений между элементами
показываются разными стрелками. В КЕАTS- 1 такое графическое представление
автоматически транслируется в текст на языке KDL. Поддерживается и обратное
отображение.
В работе [Motta et al., 1 989) были проанализированы ограничения CREF и GIS
как инструментальных средств приобретения знаний. Анализ текстовых доку­
ментов в CREF и построение концептуальной модели ПО (то же самое), поддер­
живаемое G IS, являются хотя и разными, но тесно связанными видами деятель­
ности. Но поскольку в КЕАTS-1 они обеспечиваются разными программными
системами и автоматического интерфейса между ними нет, то построение кон­
цептуальной модели, элементами которой были бы сущности, выделенные в про­
цессе анализа, требует от инженера по знаниям дополнительных усилий. Поэто­
му естественно иметь такую инструментальную поддержку, которая позволяла
бы инженеру знаний строить концептуальную модель, исходя из информации, со­
держащейся в текстовых документах. Требуемая инструментальная поддержка
была реализована в пdдсистеме ACQUIST системы KEATS-2 [Motta et al., 1989).
Рассмотрим функциональные возможности ACQUIST подр9бнее. Выделение
фрагментов здесь реализуется посредством указания (с помощью мыши) на
область текста и задания имени понятия, релевантного отмеченному тексту. Име­
на понятий высвечены в виде элементов меню на том же экране, что и анализиру­
емый текст. Нескольким фрагментам может быть поставлено в соответствие одно
и то же понятие. Понятия могут быть заранее' перечислены инженером знаний
или генерироваться непосредственно в процессе анализа текста. В последнем слу­
чае возможно «заводитм имена понятий вручную либо воспользоваться лекси­
ческим анализатором.
6.5. WоrkВепсh-системы
233
В ACQUIST лексический анализ может выполняться над множеством указанных
пользователем текстов. Имеется возможность задать фильтр для отсеивания
слов, не представляющих интереса, который реализуется как обычный текстовый
файл, где перечислен ы такие «неинтересные,> слова. На понятиях может быть за­
дана иерархическая структура. Пользователь ACQUIST может объединить в
одну группу близкие с его точки зрения понятия и дать название этой группе.
Группы понятий, в свою очередь, могут быть подвергнуты дальнейшему обобще­
нию.
ACQUIST позволяет связывать фрагменты, понятия, группы с помощью встро­
енных связей и связей, определенных самим пользователем. Для того чтобы ин­
женер знаний имел целостное представление о той структуре, которую он, уста­
навливая связи, создает, в ACQUIST имеется возможность построить «карту>>
текущей структуры. Для одного и того же множества понятий, групп и фрагмен­
тов может быть построено много карт, каждая из которых соответствует некото­
рому <,взгляду>> на отношения между элементами. Пользователь им·еет возмож­
ность не только просмотреть графическое представление, но и непосредственно
манипулировать его элементами. В частности, можно определять связи, переме­
щать графические объекты и подструктуры и т. п.
Сохраняемые версии результатов анализа называются здесь теориями. ACQUIST
позволяет одновременно загрузить нескою,ко теорий и при необходимости пере­
ключаться от одной теории к другой. По желанию пользователя различные тео­
рии могут б ыть слиты. ACQUIST со:щан с испою,зованием методологии объект­
но-ориентированного программирования: фрагменты, понятия и группы реали­
зованы как объекты.
Новая версия системы КЕАTS, которая была развитием предыдущей, разработа­
на в лаборатории когнитологии Открытого университета Великобритании и
финансировалась British Telecom. Corp. По определению авторов, КЕАTS - про­
граммное окружение, поддерживающее построение систем, основанных на знани­
ях. Основное назначение -- поддержка разработки ЭС на критических стадиях приобретение и кодирование знаний, отладка БЗ [Motta et al., 1989].
Данная система поддерживает не только отдельные методы моделирования, но и
обеспечивает интегрированную программную поддержку взаимосвязанных мо­
делей знаний. Основные компоненты KEATS: A CQUIST - средство фрагмен­
тирования текстовых источников :шаний, которое позволяет разбить текст или
протокол беседы с экспертом на множество взаимосвязанных, аннотирован­
ных фрагментов (гипертекст) и создать концепты (понятия); FLIK - фреймово­
ориентированный язык представления знаний; GIS - графический интерфейс,
используемый как для создания гипертекстов и концептуальных моделей с по­
мощью ACQU IST, так и для проектирования фреймовых систем на основе языка
FLIK; ERI - базисный интерпретатор правил, обеспечивающий прямой и об­
ратный вывод по продукциям; TRI - визуализирующий интерпретатор правил,
демонстрирующий трассу выполнения продукций в виде мозаичной таблицы, а
234
Глава 6 • П ро граммный и нструментарий разработки с истем
также графически отражающий активные правила, фреймы и 1<:онфликтное мно­
жество; Tahles - интерфейс манипулирования таблицами, который может ис­
пользоваться вместе со всеми моделями знаний, поддерживаемыми в KEATS;
CS - язык описания и распостранения ограничений; TMS - немонотонная сис­
тема сопровождения истинности, тесно связанная с ERI, FLIK и CS, а также
TMV - графичесr<:ий интерфейс ,подсистемы TMS, обеспечивающий визуализа­
цию на И/ИЛИ дереве значения истинности или :Ложности заключений в зави­
симости от посылок.
В системе КЕАTS концептуальные модели могут создаваться с помощью методов
�сверху-вниз� и �снизу-вверх�. Первый подход используется при четко опре­
деленной задаче и наличии специфической модели в ПО (то же самое), например
в задачах диагностики. Специфическая моде:11ь может быть сразу же отражена в
виде таблиц и концептуальных моделей и имплантирована в будущую ЭС с помо­
щью GIS и Tahles. Когда приобретение знаний основывается не на четr<:о опреде­
ленной модели ПО, а, например, на протоколе опроса эксперта, используется вто­
рой подход. Текстовые данные анализируются и фрагментируются с помощью
ACQUIST, и выделяются концепты. Созданная модель затем визуализируется с
помощью GIS.
Интеллектуальная система Shelly [Bouchet et al., 1989] является представителем
следующего поr<0ления программной поддержки КАDS-методологии. Она спо­
собна не только обеспечивать выполнение работ, предусматриваемых методоло­
гией, но и советовать инженеру знаний, когда и как выполнять ту или иную рабо­
ту, а также объяснять, почему это необходимо. Система Shelly разрабатывалась
как интегрированная программная среда, поддерживающая весь процесс созда­
ния ЭС, если он осуществляется в соответствии с КАDS-методологией. И про­
цесс разработки самой системы Shelly является примером практического ее при­
менения.
Согласно КАDS-методолоrии, рассмотренной в п. 4.5, необходимо провести анализ
четырех тиnов знаний, относящихся соответственно к уровням стратегий, задач,
выводов и предметной области. К уровню стратегий относятся знания, обеспечи­
вающие гибкость разрабатываемой системы, ее способность решать разнообраз­
ные проблемы, выбирая или формируя подходящие стратегии. Для системы
Shelly такими проблемами являются: управление деятельностью инженера зна­
ний, разрабатывающего прикладную ЭС; слежение за процессом разработки ЭС;
выдача советов, подсказок, объяснений по требованию пользователя.
Знания стратегического уровня, необходимые для решения этих проблем, пред­
ставляют собой набор правил, задающих условия начала и завершения каждого
вида работы, предусмотренной КАDS-методологией. Иерархия видов работ, а
также описания тех работ, выполнение которых поддерживается Shelly, состав­
ляют знания уровня задач. К уровню выводов относятся знания о rсонкретных
действиях, с помощью rюторых может быть выполнена та или иная работа. Уро­
вень предметной области составляют описания тех объектов, над которыми мо­
гут выполняться действия, относящиеся к уровню выводов. При этом различа-
6.5. WоrkВ епсh-системы
235
ются объекты, используемые в КАDS-методологии ( « понятие�,, , «метакласс•
и т. п.), объекты, обусловленные программной реализацией методологии ( «фраг­
менн , <<связь• и т. п.), и объекты, обусловленные природой интерфейса ( «OI<HO!>,
«текст�,, и т. п.).
Основное проектное решение при создании систем ы Shelly состоит в том, что
каждому виду деятельности здесь соответствует свое инструментальное средство
AST (Activity Support Tool).
Центральным модулем в Shelly является управляющий модул ь « Advice & Gui­
dancei,, . Он предназначе н для информирования пользователя о текущем состоя­
нии р азработки его прикладной ЭС; обеспеч ивает ответы на конкретные вопросы
пользователя; рекомендует пользовател ю дальнейшие действия и активирует со-_
ответствующий модуль AST; предупреждает пользователя о нарушении им
КАDS-методологии.
Модуль «Advice & Guidance• может функцио нировать в двух режимах, различа­
ющихся степенью сложности. Первый, простой режим, «локального совета�,, , ак­
тивируется посредством явного запроса, поступившего от пользователя. Во вто­
ром режиме пользователь может получить рекомендации относительно того, как
наиболее эффективно работать с Shelly. Система будет постоянно следить за дея­
тельностью пользов ателя и при необходимости предупредит его и объяснит,
по ч ему рекомендуется выполнять ту или иную работу.
Рабо ч ую память Shelly составляют база знаний, базы данных о разрабоп<ах Э С и
база внешних форм. В базе знаний хранятся описания объектов КАDS-методо­
логии и соответствующих видов деятельности. Каждый вид деятель но ст и пред­
ставлен фреймом со следующим набором слотов
Пример 6 . 1
<текст>
цель: <текст>
когда: <текст>
<текст>
как:
вход: <объект КАDS-методологии>
выход: <объект КАDS-методологии>
связа11 с:
<вид деятельности>
поддерживается:
AST
описание:
Кроме того, в базе знаний имеется набор правил, позволяющих управлять про­
цессом разработки прикладной Э С.
При мер 6 . 2
ЕСЛИ <деятельность!> п о проекту Х = «завершена�,, И
<деятельность2> по проекту Х = «завершена�,,
ТО возможно начать <деятельностьЗ> по проекту Х.
236
Глава 6 • П рограммный инструмента ри й разработки систем
В базах данных о разработках ЭС представлены примеры объектов КАDS-мето­
дологии, построенные на конкретном предметном материале, а т,акже информа­
ция о текущем статусе каждого вида деятельности ( •завершена•, •начата•, .«не
начата•).
Понятно, что фрагментарный обзор WorkBench-cиcтeм, приведенный выuiе, не
дает полного представления обо всех их функциональных возможностях. Одна­
ко для нас важна, прежде всего, тенденция развития инструментальных средств
поддержки разработки интеллектуальных систем, состоящая в том, что уже име­
ются положительные примеры WоrkВеnсh-инструментария, ориентированного
на весь жизненный цикл создания систем, основанных на знаниях.
П ример разработки
систем ы ,
основаннои
на знаниях
□ П роду кци онно-фре й м о в ы й ЯПЗ PILOT/2
□ Психодиагности ка - п р и мер п ред мет ной о бл асти для п о ст роен ия
э ксп ертных систем
□ Раз р аботка и ре али за ци я психодиа гно стич е с ко й ЭС «Cattell»
7. 1 . П родукци онно - ф р е й м о вый Я ПЗ PI LOT/2
В любом языке программирования можно выдел ить три составляющие: декла­
ративную (описания данных), процедурную ( правила преобразования данных)
и инференциальную (правила управления компонентами процедурной, а иногда
и декларативной составляю щих). Не исключение в этом смысле и языки пред­
ставления знаний, но их специфика в том, что описан и я здесь в основном струк ­
турные, а данные могут быть активными за счет присоединенных процедур, обес­
печивающих <!:Вычисление• их значений; правила преобразования данных ориен­
тированы скорее на то, чтобы явно специфицировать, что должно быть получено,
не концентрируя без необходимости внимание программиста на том, как дости­
гается результат. Но самое большое отличие ЯПЗ от других языков в инферен­
циальной компоненте, которая реализует некоторую (чаще всего в,строенную)
f
стратегию поиска решения. Такой подход предполагает, что при выполнении
Я ПЗ-проrрамм всегда существует •арбитр• , функцией которого является оцен­
ка -«текущей ситуации• и выбор пути движения от нее к целевой.
В разных ЯПЗ имеются различные средства определения декларативной, проце­
дурной и инференциалъной составляющих. Отличия же здесь связаны, в первую
очередь, с использованием того или иного подхода к представлению знаний.
В качестве примера развитых средств продукционно-фреймового программиро­
вания баз знаний ниже обсуждается Я П З PILOT/2, разработанный в рамках про­
екта PiES WorkBench [Кhoroshevsky, 1 994Ь] . Его специ фика в том, что здесь вве-
238
Глава 7 • Пример разработки систем ы , основанной на знаниях
· дены явно достаточно мо щные средства прогр аммирования и нференпиальной
составляющей и выразительные описания образцов, а также удобны й и открытый
для расширения набор операторов преобр азования данных в основной и внешней
п амяти.
\
7 . 1 . 1 . Структура ПИЛОТ-программ и управление
выводом
В общем сл учае РILОТ-проrрамма содержит две основные (декларативная и про­
цедурная) и две вспомогательные (включение файлов и переопределение стро1,)
компоненты. Декларативная часть состоит из эл ементов, специфицирующих пе­
ременные, прототипы фунrщий и/или процедур, а также необходимые базы зн а­
ний . Продукционная часть состоит из секций, которые, в свою очередь, содержат
продукции. Инференциальная составляющая присутствует в ЯПЗ PI LOT/2 не­
я вным образом в виде встроенного <<арбитра;,,, алгоритм работы rюторого описы­
вается ниже, и, кроме того, определяется средствами настро й к и и перепрограмми­
рования такого �арбитра;,, .
Разбиение н а секции и правил а и специальные услов ия в виде секционных и пра­
виловых р азрешений необходимы дл я того, что'бы обеспечить многоуровневое
управление выполнением РILОТ-программ. Как известно [Форсай т, 1987), <<ар­
битр:�> продукционной системы функционирует следующим образом: сначала для
всех продукций проверяются- условия применимости и из тех продукций, для ко­
торых эти условия истинны , формируется конфликтное множество. Из этого
множества по определенному критерию выбирается исполняемая проду кция; она
реал изуется (то есть отрабатывается ее правая часть) , и цикл управления работой
· •арбитра• повторяется, пока конфл иктное множество на некотором шаге не ста­
нет пустым (тогда работа продукционной системы завершается естественным об­
разом) или функционирование не будет прервано явным образом, например с
помощью специального действия из прав�й части исполняемой продукции
(в этом случае работа продукционной системы завершается принудительно).
Понятно, что работа такого •арб итра;,, имеет смысл лишь в тех случаях, когда про­
дукций немного (десятки), а в конфликтном множестве продукций мало (едини­
цы). В противном случае функционирование системы неэффективно и требуют­
ся специальные алгоритмы, чтобы •арбитр• не тратил все время толы,о на себя.
К настоящему времени разработаны и опробованы на практике различнь_уе стра­
тегии увеличения эффе ктивности работы •арбитра • [de Кleer, 1 989 ) , которые
используются и в данном случае. Но не менее важно иметь гибкие средства описа­
ния этих стратегий с уровня входного языка. Тогда пользовател ь, в зависи мости
от требований его задачи, сможет отказаться от стандартных стратегий и описать
свою собственную, которая адекватна его конкретному случаю.
Для описан ия страте ги й управления выводом решений в ЯПЗ PILOT/2 служ ат
секционное и правиловое разрешения. Каждое из них является последовательно­
стью фильтров, с помощью которых формируется и/или изменяется конфл юп­
ное множество продукций. Для понимания того, как пользоваться этими фил ьт-
7 . 1 . Продукцио нно-фреймо в ы й ЯПЗ PIL0T/2
239
рами, необходимо знать стратегию встроенного •арбитра• PI LOT/2. Поэтому
ниже приводится алгоритм его работы,. специфицирующий схему, представлен­
ную на рис. 7. 1.
Апrоритм работы встроенноrо «арбитра» ЯПЗ PI LOT/2
wh i l e ( уровень-О ! = NULL ) {
« выбра ть и з « повестки -дня» секцию для вы п ол нения » ;
« сформирова ть на уровне- 1 мн- во п равил этой секции» ;
« выполнить фил ьт р ацию мн- в а правил на уровне- 1 по фла гу активна/
не.а ктивна» ;
« выполнить фил ьтрацию мн-ва оста вшихся правил на основании выч исления
истинности секционно го разрешения » ;
« сформирова ть на уровне-2 множество активных п равил » ;
f o r ( каждо го п ра вила на уровне-2 ) {
« вычислить з начение истиннос у и левой части » ;
i f ( з начение и стинности правила == TRUE )
«добавить п равило в конфл . мн-во на уровне-3 » ;
фил ьтрацию мн - ва оставшихся на уровне - 3 п р авил н а основании
выч исления истинности п равиловых р аз решений » ;
« сформирова ть на уровне-4 множество готовых к выполнению п равил » ;
i f ( на уровне-4 осталось одно прав ило
« в ыполнить данное п равило» ;
else {
« выполнить случайный выбор исполняемо го правила и з множества
правил на уро вне - 4 » ;
« выполнить данное п равило» :
« выполнить
Приведенный алгоритм прозрачен и не н уждается в особых комментариях. Заме­
тим лишь, что фильтр •активна/неактивна• реализован как встроенная проверка
флагов активности продукций текущей секции. Первоначально (при запуске сек­
ции) •арбитр1-> считает, что все продукции секции активны, но в процессе вы­
полнения их состояние может измениться за счет применения соответствующих
действий. Фильтр секционного разрешения тоже прог