Интеграция wiki-технологии и онтологического моделирования в

реклама
Интеграция wiki-технологии
и онтологического моделирования в задаче
управления знаниями предприятия1
Муромцев Д.И., Горовой В.А., Малинин А.А., Гаврилова Т.А., Злобин А.Н., Катков Ю.В.
Введение
Сегодня многие предприятия стремятся к построению собственных порталов.
Под интернет-порталом принято понимать веб-сайт, предоставляющий пользователю различные
интерактивные сервисы, работающие в рамках общего веб-сайта, например, почта, поиск, новости,
форумы, обсуждения, голосования и т. д.. Следует отметить, что бизнес-процессы многих
современных предприятий немыслимы без использования web-технологий: сотрудники
используют корпоративные порталы для ежедневной работы, хранения документов и файлов,
передачи знаний и опыта новым сотрудникам компании, публикации новостей и составлении
отчетов.
Эффективность работы с порталом зависит от нескольких факторов. Прежде всего, это тип
портала и его приспособленность для совместной деятельности, осуществляемой сотрудниками,
поддержанная средствами Web 2.0. Обычно выделяют два вида организации порталов:
горизонтальный и вертикальный. Горизонтальным называется портал, не зависящий
от корпоративной информационной системы предприятия. То есть такой портал должен иметь
собственную базу пользователей, авторизацию, и т. д. Вертикальным порталом называется webсайт, интегрированный в корпоративную информационную систему (КИС) компании. Интеграция
может быть осуществлена на уровне входа на портал (к примеру, в качестве корпоративной
службы идентификации может использоваться LDAP или Kerberos сервер) или на более низких
уровнях (например, интеграция интернет-магазина с системой бухгалтерского и складского учета)
[4].
Во многих компаниях произошел переход от функционального управления к процессному,
а значит, большую роль стали играть горизонтальные, кросс-функциональные связи. Более того,
в тех организациях, где определяющими являются скорость реагирования на развитие рынка
и «управление талантами» (ИТ-компании, СМИ, креативные агентства), в противовес
иерархической модели управления набирает популярность так называемая «плоская», где связи
1
Работа частично поддержана грантом РФФИ 8-07-0062-а
строятся согласно требованиям бизнеса, а не по четкой иерархии начальник — подчиненный.
В этом случае в каком-то конкретном проекте специалист может даже занять место выше своего
руководителя. Если подобную кальку организационной структуры наложить на технологии, легко
увидеть, что требованиям по обеспечению таких связей «каждый с каждым» и «каждый
со многими» отвечает именно Web 2.0 [6].
Когда на конференции IBM Academic Days, проходившей в Цюрихе 13-14 мая (https://www950.ibm.com/events/ade/08europeade.nsf), зашел разговор о том, какие навыки для сотрудников
компаний будут наиболее ценны в 21-ом веке, то одним из таких навыков был названо умение
работать совместно (collaboration). Wiki-порталы, IM-клиенты (такие как Jabber, ICQ), RSSподписки — прочно завоевали свою нишу среди инструментов, позволяющих людям эффективно
выполнять совместную работу. Они широко используются в корпоративном мире. В авангарде
компаний, применяющих эти средства для организации повседневной работы, находятся
высокотехнологичные компании, такие как Яндекс, Google, Borland и другие. Секрет
популярности этих инструментов заключается в том, что они позволяют сотрудникам компаний
с одной стороны эффективно делиться знаниями, а с другой — быстро их получать. Поиск
информации занимает существенную часть рабочего времени работников интеллектуального
труда (по некоторым оценкам, до 38% [7]). Благодаря описанным выше инструментам, это время
можно расходовать на порядок эффективнее.
В компаниях, где корпоративная культура поощряет обмен знаниями, на внутрикорпоративных
wiki-порталах можно найти много ценной информации, о наличии которой в случае отсутствия
подобного инструмента можно было бы только догадываться. Важным аспектом является также
удобство использования этих средств. Для большинства сотрудников высокотехнологичных
компаний (да и вообще для многих опытных пользователей) среда из вики-страниц, блогов, RSSлент является привычным окружением как для поиска и анализа информации, так и для общения.
К сожалению, это преимущество является одновременно и главным недостатком: человеку
не привычному к такой среде сложно в ней ориентироваться и эффективно работать. Эта проблема
является одной из основных в течение всего времени существования информационных
технологий.
Результаты исследования Forrester показали, что в период с 2007 по 2013 год ежегодные затраты
компаний на Enterprise 2.0, т.е. на внедрение Web 2.0 технологий в корпоративном секторе, будут
возрастать в среднем на 43% и достигнут в 2013 величины равной 4,6 млрд. долларов. Уже в 2008
году компания в США численностью не менее 1000 человек потратит на Enterprise 2.0 в среднем $
110 млн. Соответственно, ожидается и резкое возрастание инвестиций в эту область [9]. Среди
основных видов социально-сетевых ресурсов, используемых в Enterprise 2.0 — блоги, форумы, IM,
RSS, Wiki. Сотрудничество и информационный обмен — главное в Enterprise 2.0. При этом целью
внутреннего (закрытого) приложения Enterprise 2.0 в компании является возможность
эффективного использование коллективного разума всех сотрудников для повышения её
конкурентоспособности на быстро развивающем рынке [8].
Как уже отмечалось, Web 2.0 технологии страдают разнородностью и несовместимостью.
Несмотря на высокое удобство отдельных инструментов совместное их применение трудно
регламентируется и контролируется. Создание контента опережает его осмысление
и семантическую обработку. Таким образом, возникает проблема гиперактуализации контента
и соответствующая инфраструктура доступа к знаниям не справляется с потоком генерации новых
знаний.
Задачи управления знаниями
Жизненный цикл знаний (ЖЦЗ) в любой организации можно свести к циклической схеме,
состоящей из следующих задач [1]:
1. Диагностика,
2. Приобретение,
3. Распределение и реализация,
4. Использование.
Этап диагностики или анализа потребностей включает определение требований к процессам
диагностики источников знаний, владельцев информации, оценку стоимостных характеристик.
На этапе приобретения решаются наиболее трудоемкие задачи поиска и генерации новых знаний
в организации. При этом очень важно учитывать и отслеживать как внутренние, так и внешние
источники знаний. Задачи распределения и реализации связаны, прежде всего, с превращением
структурированной информации в машинные форматы, позволяющие осуществлять выявление
концептов, построение иерархических структур, семантическую обработку, поиск знаний и т.д.
Наконец, использование подразумевает целенаправленное распространение знаний внутри
организации, включая сотрудничество, оценку, поддержку и ликвидацию знаний.
Для каждого из этапов ЖЦЗ существуют как отдельные инструменты, так и интегрированные
системы, решающие перечисленные выше задачи. Эти инструменты и системы формируют ИТинфраструктуру для систем УЗ в организации. В таблице 1 показана возможность применения
различных направлений в ИТ для реализации задач УЗ.
Таблица 1. Технологии для поддержки систем УЗ
Поиско-
On-line
Совместная
Сетевые Блоги
Web
вые
инстру-
работа, Wiki
сооб-
-зак-
и фо-
RSS
Мгно-
Ар-
венные
хи-
системы
менты,
щества
румы
вклю-
лад-
сообще-
ки
ния
вы
чая
mind
mapping
Диагнос-
+
+
Приобре- +
+
тика
+
+
тение
Распре-
+
+
+
+
+
+
+
+
+
+
+
деление
и реализация
Исполь-
+
зование
Современные инструменты инженерии знаний
и онтологический инжиниринг
Основная задача инженерии знаний — получение и структурирование знаний специалистов
для последующей разработки баз знаний. Выделяют два основных вида методов извлечения
знаний: коммуникативные и текстологические [2]. Последние, как правило, на практике
применяются реже, в силу того, что коммуникативные методы обычно эффективнее.
Коммуникативные методы, свою очередь, можно разделить на пассивные, где ведущую роль
играет эксперт, и активные, где инженер по знаниям берет инициативу на себя. Одним из самых
эффективных способов извлечения знаний является интервью. Следует отметить принципиальную
проблему коммуникативных методов: они не масштабируемы. Их применение требует личного
участия в процессе высококвалифицированного сотрудника — инженера по знаниям. Трудно
представить компанию, состоящую на половину из инженеров по знаниям (при этом вторая
половина проводит большую часть времени общаясь с первой).
Центральным понятием на стадиях получения и структурирования знаний является
так называемое поле знаний (поле знаний — это условное неформальное описание основных
понятий и взаимосвязей между понятиями предметной области, выявленных из системы знаний
эксперта, в виде графа, диаграммы, таблицы или текста) [3]. В последние годы для получения поля
знаний эффективно применяются визуальные карты памяти (MindMaps)[4]. На рынке есть
множество программных средств, как свободно распространяемых, так и коммерческих,
позволяющих создавать Mind Maps, например:
– FreeMind
– XMIND
– NovaMind
– MindMapper
– MindMeister
– OpenMind
Секретом популярности визуальных карт памяти является их когнитивная эргономичность —
люди способны глядя на них быстро воспринять и осознать представленную информацию. Кроме
того, перечисленные выше инструменты, предоставляют очень удобный интерфейс для эксперта,
при помощи которого знания извлекаются очень эффективно. Однако подобные программы
являются лишь средствами прототипирования настоящих баз знаний.
В случаях, когда нужно извлечь более формализованные знания, важны типы связей, ограничения
и другие аспекты. Визуализация карт памяти становится недостаточной, и тут на помощь
приходят онтологии. Для создания онтологий существует множество инструментов, среди
которых можно выделить бесплатный Protégé и коммерческий полнофункционалый редактор
Top Braid Composer (www.topquadrant.com). Международным стандартом де-факто для описания
онтологий в настоящий момент является OWL [11]. Большинство современных редакторов
онтологий поддерживают этот формат. Некоторые инструменты для создания визуальных карт
памяти позволяют экспортировать создаваемые карты в формат OWL.
Онтологии и wiki: синергетический эффект
Wiki является идеальной основой для on-line инженерии знаний. В компаниях с корпоративной
культурой, поощряющей коллективный разум, люди хорошо мотивированы на то, чтобы делиться
знаниями со своими коллегами и таким образом помогать своей компании получать конкурентные
преимущества. В особенности это важно для инновационных рынков, где знания очень быстро
устаревают и постоянно изменяются. Wiki позволяет своим пользователям максимально
оперативно делиться новыми знаниями, предоставляя для этого удобный интерфейс. Буквально
в один клик можно добавить новую информацию, которая сразу будет доступна всем остальным
пользователям wiki-портала.
Одно из основных преимуществ wiki — возможность создавать, редактировать и удалять «что
угодно, кому угодно и когда угодно» (конечно, это не совсем так, современные wiki-движки
позволяют создавать ACL — access control lists, и таким образом осуществлять контроль доступа
и предоставлять разные права различным пользователям). Из этого основного достоинства wiki,
позволяющего пользователям оперативно делиться знаниями и вносить свой вклад
в коллективный разум, следует и основной недостаток: со временем wiki-портал может
превратиться в хаос гипертекста, в котором сложно что-либо найти и извлечь какие-либо знания.
Эта проблема может проявляться, например, в том, что в организациях с матричной структурой
сотрудники из разных отделов могут вести совершенно разные wiki-cтраницы, посвященные
одним и тем же проектам, и долгое время даже не подозревать о существовании альтернативных
страниц в другом wiki-кластере.
В решении описанной выше проблемы могут помочь онтологии, которые находятся на уровень
выше в иерархии представления знаний (см. рис. 1). Онтологии позволяют создавать более
концептуально-ясные и целостные модели предметных областей. Если привязать wikiсодержимое к онтологии, то можно избежать проблем с плохой структурой портала, т.к.
она в этом случае будет настолько хорошей, насколько хороша онтология, которая ее задает.
Важно при этом спроектировать такой интерфейс, чтобы он не усложнил работу пользователей,
размещающих свои знания в wiki.
Рис. 1. Уровни представления: знания и IT
В качестве одного из решений подобной задачи, возникающей на стадии создания wiki-портала
предприятия, можно предложить следующий сценарий:
1. Эксперты в предметной области создают онтологию совместно с инженерами по знаниям
2. Онтология передается в качестве входных данных инструменту, содержащему внутри себя wikiдвижок
3. С помощью этого инструмента для каждого концепта автоматически создается wiki-страница,
в которую эксперт вносит информацию об описываемом понятии
4. Конечные пользователи видят онтологию, представленную в виде графа и могут осуществлять
навигацию и по концептам, и по wiki, и видеть содержимое wiki-страницы, соответствующей
выбранному понятию.
В результате выполнения описанного выше сценария, предприятие получает хорошо
структурированный wiki-портал и онтологию (а скорее всего их набор), описывающую различные
виды его деятельности. Эти же технологии успешно можно применять в системах e-learning [5].
В настоящее время авторы совместно с группой коллег ведут работу над прототипом инструмента
OntolingeWiki, позволяющего применять изложенный сценарий. В качестве технологической
основы для разработки новой системы используется Ontolinge-KAON, позволяющий генерировать
порталы на основе онтологий (поддерживается формат OWL) [10]. Рисунок 2 иллюстрирует
реализацию фрагмента онтологического образовательного портала университета для учебного
курса «Оптика».
Рис. 2 Страница портала OntolingeWiki
Выводы
В ближайшее время на первые роли в корпоративных системах выйдут инструменты Enterprise 2.0.
Объем инвестиций в это направление говорит о востребованности таких систем для бизнеса.
Симбиоз онтологического инжиниринга и wiki-технологии позволит значительно повысить
степень структурированности содержимого, создаваемого пользователями. Системы,
реализующие эту идею, могут эффективно применяться как для инженерии знаний на стадии
создания корпоративных wiki-порталов, так и в качестве полноценного развитого инструмента
для управления знаниями предприятия.
Литература
[1] Гаврилова Т.А., Муромцев Д.И. Интеллектуальные технологии в менеджменте. СПб: Изд-во
ВШМ СПбГУ, 2007.
[2] Гаврилова Т.А., Хорошевский В.Ф. Базы знаний интеллектуальных систем. Учебник.- СПб,
Изд-во «Питер», 2001.
[3] Гаврилова Т.А., Червинская К.Р., Яшин А.М. Формирование поля знаний на примере
психодиагностики // Журнал Известия АН СССР. Техническая кибернетика. - 1988, N 5. - с. 72-85.
[4] «Интернет-портал» www.wikipedia.org
[5] Колбасова Д.Д., Гаврилова Т.А., Онтологический подход к формированию адаптивного
универсального портала знаний университета // Cборник трудов
VI международной научно-
методической конференции "Дистанционное обучение - образовательная среда XXI века”, Минск.
- стр. 314-317.
[6] Костылев И., Опять двойка, или Что делать с Web 2.0 корпорациям, Intelligent Enterprise, №1
(177), 28/01/2008
http://www.iemag.ru/articles/detail.php?ID=6440
[7] Соболева Н., Мнение, журнал “BUSINESS EDUCATION REVIEW”, 2007 г., N 1, c. 31 (
http://www.treko.ru/show_article_894)
[8] Enterprise 2.0: Да, не оскудеет рука дающая.
http://habrahabr.ru/blog/pure_content/43453.html
[9] Global Enterprise Web 2.0 Market Forecast: 2007 To 2013.
http://www.forrester.com/Research/Document/Excerpt/0,7211,43850,00.html
[10] Vladimir Gorovoy, Tatiana Gavrilova. Technology for ontological engineering lifecycle support.
//International Journal “Information Theories & Applications” Vol.14 / 2007 – p. 19–25.
[11] Web Ontology Language (OWL).
http://www.w3.org/2004/OWL/
Скачать