Sviatogor

реклама
Международный семинар
Образный компьютер
Киев, 15.03.2011 г.
Вычисление смысла текстов
естественного языка:
онтологический подход
Л.А.Святогор, В.П.Гладун
Институт кибернетики им. В.М.Глушкова НАН Украины, Киев
E-mail: aduis@rambler.ru
Битва спартанцев с персами (отрывок)
Десять греческих фаланг царя Леонида перегородили
узкое, как горлышко кувшина, ущелье. Высокие горы и
волны Эгейского моря не оставляли персидскому войску
другого пути, однако это не заботило Ксеркса: он имел
пять тысяч солдат против трёхсот спартанцев.
Грозная стена греческих воинов застыла монолитным
утёсом, тесно сомкнув щиты и ощетинившись крепкими
пятиметровыми копьями, основания которых солдаты
чётных рядов намертво врыли в каменистую землю.
Остальные обнажили мечи-ксифосы.
Утреннее солнце уже осветило теснину ущелья и его
лучи заиграли золотой цепью на вызолоченных пластинах
доспехов, на лезвиях мечей, на бронзе шлемов и боевых
масок спартанцев. Лёгкий морской ветер гордо колыхал
конские хвосты в наголовниках и, ввинчиваясь в ущелье,
2
Введение - 1
О терминах «вычисление» и «Смысл».
«Вычислимо то, что формализуемо».
Смысл – ментальная категория психологии и
нейропсихологии; “«объект»” лингвистики.
Этимология:
«мысль – замысел –
со-мысль – смысл»
3
Введение - 2
Текст ЕЯ = коммуникативная функция:
«Автор – Текст – Потребитель»
Определение (широкое):
Под Смыслом текста понимают замысел
автора, закодированный в синтаксисе,
семантике и грамматике ЕЯ.
Вербализованный Смысл объективен.
Он представляет собой текст ЕЯ, который в
предельно сжатой, неизбыточной форме
(лишённой эмоциональных, стилистических и
других особенностей – И. Штерн) выражает
знание автора о действительности.
4
Замысел 1 – Текст – Смысл 2
Смысл-1
Цель коммуникации
Смысл-2
ТЕКСТ ЕЯ
Вербальный
смысл
5
РАЗДЕЛ І
Лингвистические и когнитивные
интеллектуальные вычисления
6
В докладе и за пределами
1. Когнитивные выч.
2. Онтологии
3. Онтол-й Смысл (ОС)
4. Процедура выч. ОС
5. Пример
ИСКУССТВЕННЫЙ ИНТЕЛ-Т
(по Лефевру)
СВЯЗНОСТЬ и Компьютерное
ПОНИМАНИЕ
«АНТИ»-ЛОГИКА
ИНТЕНСИОНАЛЬНО-ЭКСТЕНСИОНАЛЬНАЯ СТРУКТУРА
ФРАКТАЛЬНАЯ ОНТОЛОГИЯ
ИМЯ
(вопросы)
7
Лингвистическая модель “Смысл – Текст”
И. Мельчука (1999)
• Проблема машинного перевода
• Предложение = законченная «мысль».
• Компоненты модели:
• синтаксические + семантические +
морфологические + предикатные
структуры минус система знаний.
• Эта модель – не конструктивна.
Лингвистическая модель “Смысл – Текст”
«Косте удалось победить»
«Этот мужчина по имени Костя
каузирует действовать (т.е.
активизирует) Игрек, являющийся его
ресурсами, с целью победить Икса в Игрек,
и это, наряду с Зет, не зависящим от
Кости, - каузирует победу Кости, которая
имеет место однократно до момента
речи».
9
Лингвистические вычисления
Лингвистические знания + внеязыковые знания =
= новый подход.
От вербализации замысла (семантического
кодирования текста ЕЯ) – к его пониманию
(семантическому восстановлению).
Задача: изучение процессов обработки текстов ЕЯ –
включая морфологический, синтаксический и
семантический анализ, – их понимания и синтеза
текстов. В результате формируется глубинная
структура текста, которая соотносится со знаниями,
хранящимися в системе, для понимания смысла
исходного текста. (Г. Четвериков)
10
Когнитивные вычисления - 1
Когнитивная парадигма: методология исследований и
моделирования феномена сознания в
искусственном интеллекте и гуманитарных
дисциплинах (И. Штерн).
(1) Моделирование механизмов логического вывода,
аргументации, рассуждения, понимания, принятия
решений;
(2) Поиск моделей для репрезентации знаний;
(3) Процессы извлечения знаний;
(4) ? = Генерирование новых знаний (не-вывод).
11
Когнитивные вычисления - 2
Целью когнитивных исследований является
«построение интегральной картины процессов
языкового общения, мышления и
интеллектуального поведения человека».
Знания – как средство, результат и инструмент
когнитивных процессов.
Прорыв – «вычисление смысла текстов» (Ф. ДжонсонЛэрд, 1988 г.)
12
Предпосылки вычисления смысла
Для решения задачи требуется:
Формализовать гносеологическую
категорию «Смысл»;
Дать конструктивное определение;
Соединить смысл со знанием;
Связать смысл с пониманием.
13
Вычисление смысла: коммуникативная
идея
В Начале было слово…
Интенция автора =? донести свою мысль до
партнёра.
Коммуникативные когнитивные вычисления –
Это информационная технология обработки языковых
(текстовых) сообщений, целью которой является
выявление в тексте таких когнитивных структур,
которые направлены на извлечение смысла
сообщения и его понимания на основе знания языка,
знаний о языке и внеязыковых знаний, общих для
партнёров по коммуникации.
14
Понимается то, что имеет смысл
Понимание
Смысл
Замысел
Фрагмент
знаний
Континуум
знаний - 1
Континуум
знаний - 2
= Смысл есть не что иное, как фрагмент общего
знания.
15
= Понять сообщение – значит извлечь его смысл.
Синтаксис, семантика, прагматика
«АВТОР – ТЕКСТ – ПОТРЕБИТЕЛЬ»
АВТОР – ТЕКСТ
Замысел
Язык
Знания
(Стиль)
Ментальность
+
ТЕКСТ – ПОТРЕБИТЕЛЬ
Морфология
Синтаксис
Семантика
(Смысл)
(Стиль)
(Формат)
Реальность
Интенции
Язык
Знания
Смысл =
Понимание…
Прагматика
16
Семиотика и гносеология
Семиотика
Текст
Синтаксис
Знания
Семантика
Смысл
Прагматика
Понимание
17
РАЗДЕЛ ІІ
Системы репрезентации знаний
ОНТОЛОГИЧЕСКИЕ СЕТИ
Explain avay
18
Модели знаний
Модели знаний:
= тезаурусы ЕЯ
= фреймы
= аксиоматические и продукционные системы
= формальные грамматики
= именованные множества (?)
= семантические сети;
= лексические онтологии.
А) Абстрактные онтологии: Как мы изучаем и
обобщаем Мир ?
SUMO, Дж.Совы, Микрокосмос, РуТез и др.
19
Онтология Mikrokosmos (%)
ВСЁ
СОБЫТИЕ
ОБЪЕКТ
ОРГАНИЗАЦИЯ
Правительственная
роль
Политическая
роль
ОТДЕЛЬНАЯ
СУЩНОСТЬ
ГЕОГРАФИЧЕСКАЯ
СУЩНОСТЬ
МАТЕРИАЛ
Геополитическая
сущность
Религиозная
роль
ЧАСТЬ
СТРОЕНИЯ
Географическая
метка
Коммуникационная
роль
Сущность
окружающей среды
Деловая роль
Роль
обслуживания
Правительственная
организация
Финансовая роль
Политическая
организация
Издательская
роль
Частная
организация
Прибыльная
организация
СТРОЕНИЕ
Водный объект
Жилище
Геологическая
сущность
Фабрика
Офис
ПРОСТРАНСТВО
Неприбыльная
организация
Текучая среда
Твердый материал
Роль защиты
Семейная роль
НЕОСЯЗАЕМЫЙ
ОБЪЕКТ
МЕСТО
СОЦИАЛЬНАЯ
РОЛЬ
Академическая
роль
МЫСЛИМЫЙ ОБЪЕКТ
МАТЕРИАЛЬНЫЙ ОБЪЕКТ
СОЦИАЛЬНЫЙ ОБЪЕКТ
СВОЙСТВО
Открытая
местность
Метал
Химическая смесь
Элемент материи
20
Предметные онтологии
Б) : Что мы рассказываем о мире ?
Описание мира в терминах объектов, ситуаций,
процессов материального мира. Используется
лексикон естественных наук, культуры и бытового
общения. (Ю.Д. Апресян: «научная» и «наивная»
картины мира).
Для общения характерны: дискурсивный
характер, произвольная классификация, нечёткие
утверждения, интенциональность, эмоциональность,
использование подтекста.
21
Предметные онтологии (%)
Материя
= концепты (лексические
понятия ЕЯ) и отношения;
= иерархия понятий;
= система интерпретации
на ЕЯ.
ПрО
«На стадии концептуализации
эта иерархическая структура
превращается в пирамиду знаний»
(Т. Гаврилова, К. Червинская, 1992)
22
Формальное определение онтологии
(%)
Формально-концептуальная система
репрезентации знаний – Онтология:
О = < Х, R, D >,
где:
Х – множество концептов,
R – множество отношений,
D – система интерпретаций и определений
термов Х, R .
Множество значений для R – конечно.
Онтология = семантическая aRb сеть с
добавлением интерпретирующей системы.
23
Иерархическая Трёхуровневая Онтология: ИО*3
Три уровня
Концепты
Интерпретац
Замыкание
на словарьЕЯ
Верхний уровень:
-категории ВУ;
-таксономические связи;
-иерархия категорий.
a
b
Средний уровень:
z
-концепты СУ;
-атрибуты СУ;
-ассоциативные связи.
Нижний уровень:
Структуры неформального общения
Структуры ПрО
-концепты и значения
-атрибуты НУ
-ассоциативн. связи
-термины ПрО.
Пирамидальная семантическая сеть, построенная на концептах и
отношениях. Отражает знания верхнего, среднего и нижнего уровней.
24
Верхний уровень ИО*3 (по В.И. Вернадскому) %
Вещество
Состояние
Структура
Косное
вещество
Локализация
Энергия
Свойство
Вид
Материя
Организм
Живое
вещество
Биосфера
Ноосфера
Среда
Человек
Организация
Таксономия. Фундаментальные представления о Мире и
формирование научных направлений. Основные категории и
разделы представления знаний в физических и др. науках
Деятельность
25
Фрагмент сети среднего уровня ИО*3 (%)
Биосфера
среда
организм
виды
популяция
Жизненный
цикл
поверхн
гео
воздушн.
водная
растения
эволюция
рождение
климат
течения
животные
размнож.
развитие
ресурсы
температура
птицы
Борьба
за
существ.
деградац.
катаклизмы
гибель
...
ресурсы
...
Пример. Описательный континуум общих знаний. Раскрывает категории верхнего уровня.
Разрабатывается инженером по знаниям и экспертами.
26
Нижний уровень онтологии (%)
= актуальная бытовая лексика (кухня, дуб,
ручей, турист, сновидение, свидание …);
= дискурсивная лексика;
= профессиональная лексика ПрО (Закон
Ома, цепь, напряжение, генератор, частота …).
27
Интенсионально-экстенсиональные
отношения (%)
Иерархия понятий реализуется через вертикальное отношение:
ИНТЕНСИОНАЛ <=> ЭКСТЕНСИОНАЛ
ИМЯ понятия
Генератор
класса
<=>
Инфраструктура
Элементы
класса
Описатели
класса
примеры
признаки
28
Конструкт онтологии: “понятие” (%)
Интенсионал
ЭкстенСионал
Класс (Кластер)
1
2
Представители класса
Объём
ПОНЯТИЕ
Attr1 (what)
Attr2 (why)
Описатели класса
Содержание
ПОНЯТИЕ раскрывается через его примеры
(классификация) и индивидуальные характеристики
(атрибуция) – в единстве интенсионала и
экстенсионала, объёма и содержания
29
Конструкт онтологии: “определение”
Родовое понятие РП
П1
ПОНЯТИЕ Х
П2
1
2
Представители Х
ОПРЕДЕЛЕНИЕ
g
g
g
g
d
d
Признаки генетич. и
дискриминационные
Структура определения: « Х это такое РП, которое
состоит из 1, 2, … и характеризуется набором
признаков g, d »
30
Онтология как граф
ULTIMA RATIO REGIS
(Ришелье)
Р. Шенк (1980):
«Метаязыком для внутренней смысловой
репрезентации текстов является граф
концептуальных зависимостей, который
отображает смысловую структуру
ситуации».
ИО*3: это концептуальный
ориентированный граф с пирамидальной
структурой. Отображает смысловую
структуру знаний. Все пути ведут к
вершине «Материя».
31
Заключение. Преимущества ИО*3:
= инструмент концептуального
представления единой системы знаний;
и кроме того:
= среда формализации смысла;
= инструмент для извлечения смысла;
= средство машинного представления и
машинной обработки текстовых знаний.
32
РАЗДЕЛ III
ОНТОЛОГИЧЕСКИЙ СМЫСЛ
Смысл – фрагмент знания
33
Ментальный характер смысла (%)
За пределами специальных дисциплин
смысл понимается как ментальная
категория личности.
Каждому городу нрав и права,
Каждый имеет свой ум голова…
(Г. Сковорода)
34
Что такое «смысл»? Мнения специалистов (%)
Психология. Оценка поведения разумного существа.
(Хокинс, Широчин, Балл, Лефевр).
Лингвистика. Категория семантики языка, которая
отвечает за согласованность лексики с внешним миром.
(Демьянков, Мельчук).
Нейролингвистика. Проекция языковых единиц на
ментальные модели знания. Узуальный и окказиональный
смысл. (Мельников).
Нейрофизиология, нейрокибернетика. Описание
отдельной ситуации вербализуется стандартной «базовой
семантико-синтаксической структурой», синтезируемой в
нейронной субстанции, и рассматривается как элемент
знания. (БСС: Кисленко). Формирование понятий в
Пирамидальных структурах памяти. (РПС: Гладун,
Величко, Рабинович).
35
36
Цель исследования = СМЫСЛ
Наша задача: вывести понятие «Смысл» из
ментальной (интуитивной) категории в
конструктивную (вычислимую).
Выделить когнитивную структуру.
«Рассматривая понимание естественного
языка как оперирование смыслом, прежде всего
надо разрешить принципиальные проблемы,
связанные с определением сущности
структуры смысла».
(И.Б. Штерн)
37
Центральная идея
Смысл есть фрагмент
структурированного знания.
Знание генерируется через идеи;
оформляется, передаётся и усваивается
– через смыслы (образы?)
38
Смысл и Текст
Смысл - это фрагмент внеязыковой
действительности, отражённый в
сознании человека или в памяти интеллекта.
В Искусственном интеллекте задача
извлечения знаний из текстов конкретизуется
как «понимание и выделение смысла текста»
(Т. Гаврилова и К. Червинская, 1992)
39
«Последний довод короля»
Ultima ratio regis. (Ришелье)
«Сам текст на естественном
языке является лишь проводником
смысла, а замысел и знания автора
лежат во вторичной структуре
(смысловой структуре или
макроструктуре) текста»
(Т. Гаврилова и К. Червинская, 1992)
40
Базовые определения - 1
Определение 1. Конструктом
К1
К2
смысла является пара
взаимосвязанных концептов
онтологии – фундаментальная
триада.
(М.С. Бургин)
Концепт1 – связь - Концепт2 –
(связь)
41
Базовые определения - 2
Подграф
онтологического графа ИО*3,
выделенный начальным и финальным
концептами, называется смысловой
траекторией начального концепта.
Определение 2.
Определение 3. Значением начального
концепта является ключевое слово
текста. Значением финального
концепта служит вершина онтологии.
42
Траектория смысла на графе
онтологии ИО*3
о
оо
о
ооо
оо
о о
о
о
о о
43
Формальное определение
онтологического смысла
Определение 4.
Онтологический смысл – это
проекция дискретизированного текста
Тд на онтологию ИО*3.
Онтология:
ИО*3 = < К, О, И >;
(Концепты, отношения, интерпретация)
Смысл:
СМ = Тд  ИО*3.
44
Единая среда смысловой коммуникации
Что нам даёт смысловая траектория?
Погружает смысл в среду знания и одновременно
вводит в ту же среду текст.
ЗАМЫСЕЛ 1 
ТЕКСТ  СМЫСЛ 2 =
ЗНАНИЕ
ОНТОЛОГИЯ
КЛЮЧЕВОЕ
СЛОВО
СМЫСЛОВАЯ
 ТРАЕКТОРИЯ
45
Текст = носитель знания и смысла
Тд =:
Набор ключевых слов – «это набор опорных
точек, по которым развёртывается текст
при кодировании в память и осознаётся при
декодировании,
это семантическое ядро цельности».
(Гаврилова и Червинская, 1992)
46
Смысл Слова и смысл Текста:
определения
Онтологический смысл ключевого слова это смысловая траектория = подграф
онтологического графа, ведущая от
активного слова к финальному концепту.
Онтологическим смыслом текста (дискурса)
является полная совокупность смысловых
траекторий всех ключевых слов текста.
Графический портрет текста
является формальным компьютерным
представлением смысла в среде знаний.
47
Особенности онтологического
смысла
Онтологический смысл:
– имеет формальное определение,
– представлен на метаязыке знаний,
– конструктивен = вычислим,
– является функцией текста,
– воспроизводим - с точностью до набора
ключей и выбранной онтологии,
– представлен в многомерной лекси ческой координатной системе словаря ЕЯ.
48
Постановка задачи
Дано:
1. Концептуальный граф, соответствующий
некоторой узкой области знаний (Онтология
Древнего мира: Онт = < Х, R, D > );
2. Конкретный текст из Корпуса текстов по
выбранной тематике;
3. Множество значимых слов заданного текста,
совпадающих с концептами онтологии (Тд);
Необходимо:
1. Построить на концептуальном графе множество
смысловых траекторий = подграфов
концептуального графа, которые начинаются в
начальном концепте и оканчиваются в вершине
графа:
( ОнтСм = Тд  Онт).
49
РАЗДЕЛ IV
ПРИМЕР ОНТОЛОГИЧЕСКОГО АНАЛИЗА
ТЕКСТА ЕЯ
(отрывок художественного рассказа)
50
Битва спартанцев с персами (отрывок)
Десять греческих фаланг царя Леонида перегородили
узкое, как горлышко кувшина, ущелье. Высокие горы и
волны Эгейского моря не оставляли персидскому войску
другого пути, однако это не заботило Ксеркса: он имел
пять тысяч солдат против трёхсот спартанцев.
Грозная стена греческих воинов застыла монолитным
утёсом, тесно сомкнув щиты и ощетинившись крепкими
пятиметровыми копьями, основания которых солдаты
чётных рядов намертво врыли в каменистую землю.
Остальные обнажили мечи-ксифосы.
Утреннее солнце уже осветило теснину ущелья и его
лучи заиграли золотой цепью на вызолоченных пластинах
доспехов, на лезвиях мечей, на бронзе шлемов и боевых
масок спартанцев. Лёгкий морской ветер гордо колыхал
конские хвосты в наголовниках и, ввинчиваясь в ущелье,
51
Битва спартанцев с персами (2)
качал спелые травы и кусты на склонах, отчего казалось,
что греческое войско умножено тысячекратно…
NB: Со стороны персов, темнеющих до горизонта
однородной и серой тучей кожаных колпаков и лесом
копей, вперёд выступили лучники в кожаных доспехах.
Туго натянув тетивы и устремив почти в зенит стрелы, они
замерли, словно статуи. Мощные бронзовые мускулы
обнажённых рук воинов выпятились буграми предельного
нечеловеческого напряжения… Всё замерло.
Тактика врага прояснялась. ENB
Деспот подал сигнал. Солнце закрылось от тысяч стрел,
тень упала на ряды защитников, их обитые кожей и
украшенные металлическим орнаментом щиты мгновенно
превратились в причудливых ежей. Залп немедленно
повторился, однако видимого урона грекам не принёс.
52
Битва спартанцев с персами (3)
Лучники расступились, и вперёд с криком и воем
бросилась лёгкая пехота Ксеркса, избалованная
победами в открытом поле – равной ей не было в мире.
Казалось, эта дикая лавина в необузданном беге сметёт,
растопчет и растворит всё на своём пути… Замелькали
ножи, дротики и кованые палицы, зазвенели мечи; пыль
окутала нападавших. Кровь и стоны раненых, безумные
крики и удары железа обозначили начало жестокой битвы.
Вскоре вал нападающих схлынул – задние ряды
нападающих теснили передних, но не могли пробиться
вперёд из-за горы убитых и раненых. Отважные
спартанцы стояли нерушимо: точно так же тесно были
сомкнуты их ряды, и солнце тускло отсвечивало на щитах
воинов… (конец отрывка)
53
Абзац для анализа
Со стороны персов, темнеющих до
горизонта однородной и серой тучей
кожаных колпаков и копей, вперёд
выступили лучники в кожаных доспехах.
Туго натянув тетивы и устремив почти в
зенит стрелы, они замерли, словно
статуи. Мощные бронзовые мускулы
обнажённых рук воинов выпятились
буграми предельного нечеловеческого
напряжения… Всё замерло.
Тактика врага прояснялась.
54
Список значимых слов для анализа
1.
2.
3.
4.
5.
6.
7.
8.
Персия
Горизонт
Туча
Копьё
Лучник
Доспехи
Тетива
Стрела
9.
10.
11.
12.
13.
14.
15.
16.
Статуя
Мускулы
Руки
Воин
Напряжение
Покой
Тактика
Враг
55
Граф онтологии - 1
материя
вещество
неживое
энергия
живое
биосфера
ноосфера
общество
организация
Организация
Древнего Мира
Государства ДМ
инфраструктура
деятельность
Организация
Соврем. Мира
Общественное
устройство ДМ
Деятельность ДМ
Деятельность СМ
Война ДМ
Торговля ДМ
Оружие Д М
персия
копьё
лук
доспехи
тетива
стрела
56
Граф онтологии-2
материя
вещество
состояние
природа
жидкость
Пр. среда
Пространство
сила
живое
неживое
вода
энергия
биосфера
ноосфера
напряжение
инфраструктура
общество
человек
деятельность
организация
анатомия
искусство
война
тело
армия
борьба
скульптура
воин
туча
горизонт
руки
мускулы
статуя
враг
тактика
57
Траектории анализа - 1
Персия – Государство д.м. – Организация д.м. – Организация –
Общество – Ноосфера – Живое вещество – Вещество – Материя
Горизонт – Пространство – Природная среда – Природа – Неживое
вещество – Вещество –Материя
Туча – Вода – Жидкость – Состояние – Неживое вещество –
Вещество – Материя
Копьё – Оружие д.м.– Война д.м.– Деятельность д.м. –
Деятельность – Общество – Ноосфера – Живое вещество –
Вещество – Материя
Лучник – Лук – Оружие д.м.– Война д.м.– Деятельность д.м. –
Деятельность – Общество – Ноосфера – Живое вещество –
Вещество – Материя
Доспехи – Защита – Оружие д.м.– Война д.м.– Деятельность д.м. –
Деятельность – Общество – Ноосфера – Живое вещество –
Вещество – Материя
Тетива – Лук – Оружие д.м – …
Стрела – Лук – Оружие д.м – …
58
Траектории анализа - 2
(Они) – Субъекты или Объекты …
Статуя – Скульптура – Искусство – Деятельность – Общество –
Ноосфера – Живое вещество – Вещество - Материя
Мускулы – Тело – Анатомия – Человек – Общество – Ноосфера –
Живое вещество – Вещество - Материя
Руки – Тело – Анатомия – Человек – Общество – Ноосфера – Живое
вещество – Вещество - Материя
Воин – Армия – Война – Деятельность – Общество – Ноосфера –
Живое вещество – Вещество - Материя
Напряжение – Сила – Энергия – Материя
(Всё) – Совокупность – Мера – Вещество – Материя
Замерло = Покой – Состояние – Мера – Вещество – Материя
Тактика – Борьба – Война – Деятельность – Общество – Ноосфера
– Живое вещество – Вещество – Материя
Враг – Война – Деятельность – Общество – Ноосфера – Живое
вещество – Вещество – Материя
59
Концепты связности
Материя
Вещество
Неживое вещество
Общество
Оружие д.м.
Война д.м.
Лук
Лук
Деятельность
Общество
Тело
Деятельность
Материя
Состояние
Война
Война
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
60
Усеченные Траектории
Персия – Государство д.м. – Организация д.м. –
Организация – Общество – Ноосфера – Живое
вещество – Вещество – Материя
Горизонт – Пространство – Природная среда –
Природа – Неживое вещество – Вещество
Туча – Вода – Жидкость – Состояние – Неживое
вещество
Копьё – Оружие д.м.– Война д.м.– Деятельность
д.м. – Деятельность – Общество
Лучник – Лук – Оружие д.м
Доспехи – Защита – Война д.м
Тетива – Лук
Стрела – Лук
61
Усеченные Траектории
(Они) – Субъекты или Объекты …
Статуя – Скульптура – Искусство –
Деятельность
Мускулы – Тело – Анатомия – Человек –
Общество
Руки – Тело
Воин – Армия – Война – Деятельность
Напряжение – Сила – Энергия – Материя
(Всё) – Совокупность – Мера – Вещество
Покой – Состояние
Тактика – Борьба – Война
Враг – Война
62
Онтологический смысл
материя
Материя
Вещество
Живое вещ-во
жв
ноо
Ноосфера
Общество
общ
Организац орг
сил
нв
сос
пр
прс
ждк
дея
чел
Орг-я
ордм
дм
пр
Гос годм
дм
энер
вещ
дедм
вод
вдм
одм
защ
лук
Пер Гор Ту Ко Луч
сия нт ча пьё ник
5
иск ана
вой
ску тел
ар
Дос Те Стр Ста Мус
пех тив ела туя кул
бор
Ру Во Нап Так Вра По
ка ин ряж тик г кой
63
Цепочки онто-смысла (длина)- 1
Материя
Вещество
Жив. вещ.
Ноосфера
Общество
Организац.
Орг-я. д.м.
Госуд.д.м.
ПЕРСИЯ
Вещество
Нежив. вещ.
Природа
Природ. Ср.
Пространст.
ГОРИЗОНТ
Нежив. вещ.
Состояние
Жидк.
Общество
Вода
Деятельн.
Деят. д.м.
Война д.м.
Война д.м.
Оружие д.м. Оружие д.м. Защита дм.
Лук
ТУЧА
КОПЬЁ
ЛУЧНИК
ДОСПЕХИ
64
Цепочки онто-смысла - 2
Материя
Общество
Энергия
Деятельн. Человек
Деятельн. Сила
Состояние
Искусство Анатомия
Война
Война Война
Скульптура Тело
Тело Армия
Борьба
Лук Лук
ТЕТИ СТРЕ СТАТ МУСК РУКИ ВОИН
ВА ЛА
УЯ УЛЫ
НАПРЯ ПОКОЙ ТАК- ВРАГ
ЖЕНИЕ
ТИКА
65
Диаграмма онтологического смысла
(длина информативного вклада)
8
5
5
4
2
3
2
1
1
4
3
1
Пер Гор Ту Ко Луч Дос Тет Стр Ста Мус Ру
сия нт ча пьё ник пех ива ела туя кул ки
3
1
2
1
Во На- По Так Вра
г
ин пря кой ти
ка
жен
ие
66
Постановка задачи- 2
Критерий:
Экспертная оценка (?)
Сходимость:
Монотонная зависимость от длины текста (?)
Устойчивость:
Плохо обусловленная система
Основная проблема:
Не в решении сформулированной задачи, а в
построении онтологии
67
Условия компьютерного понимания
Компьютерное понимание достигается за счёт:
= Создания в базе знаний компьютера
онтологии Мира (ИО*3)
= Погружения текста в онтологию
(активизации концептов ключевыми
словами)
ТЕКСТ
= Построения траекторий
Онтологического смысла
68
Заключение. Что нам даёт новая
парадигма?
Cogito – ergo sum.
Вижу смысл - следовательно
понимаю.
Понимаю – значит структурирую мир.
Конец
69
Подарок А. Волошину.
Конфуций
«Если имена неправильны, то слова не имеют
под собой оснований.
Если слова не имеют под собой оснований, то
дела не могут осуществляться.
Если дела не могут осуществляться, то ритуал
и музыка не процветают.
Если ритуал и музыка не процветают,
наказания не применяются надлежащим образом.
Если наказания не применяются надлежащим
образом, народ не знает, как себя вести.
Поэтому благородный муж, давая имена,
должен произносить их правильно, а то, что
произносит, правильно осуществлять».
70
Спасибо за внимание!
Л.А.Святогор, В.П.Гладун
Институт кибернетики им. В.М.Глушкова
НАН Украины, Киев
E-mail: aduis@rambler.ru
www: aduis.com.ua
ПРЕЗЕНТАЦИЯ-1
Новая информационная технология
Предложены:
= новый концептуальный подход к
семантическому анализу текстов ЕЯ, основанный на
активизации знаний,
= новая информационная технология.
Суть новой компьютерной технологии
заключается в том, что из текста ЕЯ извлекаются
ключевые слова, подаются на вход онтологии ИО*3,
возбуждают смысловые траектории; совокупность
траекторий образует онтологический смысл.
Онтологический смысл может быть уточнён
путём повторного обращения к тексту (в режиме
диалога) и приведен к грамматическому виду
(интерпретирован на ЕЯ).
72
ПРЕЗЕНТАЦИЯ-2
Возможные применения новой ИТ
= в Базах знаний – для обработки корпуса текстов и
представления массива текстов в сокращённом смысловом
формате;
= в Интернет – индексация, классификация и поиск;
= в Виртуальных лабораториях – для создания единой
среды знаний;
= в Ситуационных центрах – для «проигрывания»
ситуаций на онтологическом графе ПрО. Создание
ситуационных планшетов для ЛПР;
= в Системах поддержки принятия решений – для
экспресс-анализа смысловой ценности потока документов.
Computer Science. Компьютерный смысл создаёт
основу машинного понимания текстов ЕЯ.
73
Инструментальные
средства семантического анализа
Дополнительный слайд.
Автор
Текст
{Фраза}
Лингвистический {Ключ}
процессор
Фрагмент
дерева
Поиск
Фрагмент текста
Вопрос
Диалоговый
процессор
Смысловой
процессор
Подграф
смысла
Лексический
(ЕЯ) смысл
Онтология
знаний =
Концептуальный
граф
Компьютерный
(формальный)
смысл
Потребитель
Транслятор
"смысл-текст"
Вопрос
Обратная связь - уточнение смысла
Ответ
74
В: Ресурс текста… убрать в запас
Прикладные задачи (в запас)
• Перевод
• Пересказ
• Конспект
• Тезисы
Мыслительные
преобразования
Лингвистические
преобразования
Потребности обработки ЕЯ текстов
• Извлечь директивы
• Извлечь факты
• Извлечь тему
• Понять содержание
• Аннотация
76
Заключение ІV.
СМЫСЛ = Шаг от искусства к ремеслу
«Вне контекста не возникают смыслы»
А.Д. Крисилов, 2010
Смысл имеет ментальное происхождение.
«Смысловым содержанием фраза
наполняется в психическом процессе»
А.И. Шевченко
Смысл имеет машинную интерпретацию.
«Смысловое содержание фразы и текста
выявляется в онтологическом процессе
машинного понимания».
77
Авторское определение
Объективность смысла
Смысл рождается в интеллектуальной среде
субъективно и ментально.
Однако
вербализованный смысл отделён от автора и
объективен. Он приобретает все свойства
информации.
Смысл существует сам по себе как
инвариант, который выясняется во
время перевода или пересказа
текста».
(Гаврилова и Червинская, 1992)
78
Понимание в нейропсихологии
Понимание есть осознанный ментальный
процесс осмысления внешней информации и
усвоения новых знаний =
в результате которого в памяти человека под
воздействием внешнего кода активизируются
нейроструктуры, отражающие
действительность и опыт индивидуума, и
образуются новые связи.
Понимание в психологии измеряется реакцией.
79
РАЗДЕЛ VI
МАШИННОЕ ПОНИМАНИЕ
«Понять» – значит уловить смысл
80
81
Понимание в нейролингвистике
В нейролингвистике – возбуждение в памяти
моделей реальности (языковых или
образных). Выделение единиц:
= узуального смысла (совпадающего с
априорным);
= окказионального смысла (закрепление
новых связей) 
82
Понимание в искусственном
интеллекте
Понимание реалии – это «постижение
её смысла через конституирующие её
контексты».
К семантическому анализу текста
подходят, «рассматривая понимание
естественного языка как оперирование
смыслом»
(И.Б. Штерн, 1997)
83
Понимание как категория прагматики
Понимание текстовых сообщений должно стать
конструктивной и машино-ориентированной
категорией.
Машинное понимание текста ЕЯ означает
реставрацию фрагмента действительности в
компьютерной базе знаний.
ОПРЕДЕЛЕНИЕ:
«Машинным пониманием естественноязыковых текстов называется процесс
построения смысловых траекторий ,
возбуждаемых текстом на графе
онтологии».
84
ПРИМЕР Онтологического смысла
« Два войска сошлись на рассвете.
Вперёд выступили лучники. В воздух взмыли,
заслоняя раннее солнце, сотни тысяч стрел.
Щиты спартанцев превратились в ежей, и они,
теснее сомкнув ряды, обнажили свои мечи и
ощетинились длинными копьями.
Легковооружённые пехотинцы Ксеркса
бросились вперёд. Первые валы нахлынули на
золотые щиты врага. Шум, крики боя, стоны
раненых повисли над полем. Ноги воинов
скользили в крови, топтали,не разбирая живых и
мёртвых… Битва разгоралась, ширилась, словно
сгущался кровавый закат. Победа ускользала». 85
Компьютерное понимание сюжета-2
конфликт
война
армия
кампания
войско
воин
битва
оружие
древнее
пехота
меч
лучники
копьё
конница
тактика
стрела
современное
атака
рана
кровь
смерть
победа
поражение
86
РАЗДЕЛ VI
О СВЯЗНОСТИ
ТЕКСТА ЕСТЕСТВЕННОГО ЯЗЫКА
Связность как уровень интеграции смысла
87
Связность текста
В лингвистике
Связность по изложению. Развитием
сюжета управляет внутренняя логика автора. Для
связности он применяет приёмы композиции с учётом
действующих лиц, пространственно-временных
отношений, ситуаций.
Связность по смыслу. Различают сюжетные
и кореферентные связи. (Рубашкин, год).
88
Связность текста
(комментарий)
В онтологическом смысле
Траектории смысла двух разных слов замыкаются
на онтологической пирамиде в некотором концепте,
лежащем на определённом уровне иерархии. Чем
ниже уровень обобщения у концепта замыкания, тем
конкретнее смысловая связь между двумя словами,
тем выше их связность. Универсальным абстрактным
объединителем смыслов выступает «Материя».
Далее – Презентация и применение
89
Дополнительный слайд. Мой Мир
Я смотрю на вещи, на окружающий
меня Мир и Космос – и вижу вокруг одни
лишь Имена… Это пустыня, песчинками
которой служат Имена.
Я пытаюсь связать две песчинки вместе –
и наталкиваюсь на колючки. Колючки – это
Смыслы.
DIXI
90
Траектория смысла на графе
онтологии ИО*3
о
оо
о
ооо
оо
о о
о
о
о о
91
Скачать