1 Методика преобразования текста на естественном языке в объектно-атрибутную семантическую сеть НИУ ВШЭ, Московский институт электроники и математики Петрова С. Б. Салибекян С. М. Тиновицкий К. Д. КОНФЕРЕНЦИЯ «НЕЙРОКОМПЬТЕРЫ И ИХ ПРИМЕНЕНИЕ» (17 МАРТА 2015 Г.) Семантический объектно-атрибутный граф Class Stage Atr Atr Состояние Subj Act Свойство 1 Obj Объект Class Субъект SubAtr Atr1 Atr2 Atr3 Свойство 2 Stage SubAtr Atr1 Atr2 Atr3 2 Семантические атрибуты ОА-графа 3 Elem – элемент множества; Excl – исключение из множества (от англ. exclude); Class – класс объекта; Name – имя объекта; SetMemb – член множества; Action – действие (состояние) объекта; Subj – субъект действия; Obj – объект действия (выражается дополнением); Recipient – адресат (тот, для кого совершается действие); Track – ссылка на описание пространственно-временных отношений; MoveType – тип движения (пешком, на машине, и т.п.); Time – указатель на описание момента времени, привязанного к локативу; Place – описание места; State – состояние объекта; …… Структура семантического ОА-графа Описание множества объектов Объекты Элементы множества Объекты Описание множества свойств Элементы множества Состояния, свойства Трассы (множество локативов) Точки трассы Локативы Измерения и числа Свойства и состояния Описание множества чисел Элементы множества чисел Измерения (числа) Пространственно-временные и причинно-следственные отношения 4 Пример описания пространственновременных отношений предложения «Он увидел машину через окно.» 5 Пример описания пространственновременных отношений (ОА-граф) Set Set Set Elem Elem Elem Class Class Atr Set Track Elem Subj Action Obj Look ZeroPoint Atr Track Track Set Elem Elem Action Action nil nil SetOrder Direction AxisPoint Forward Elem State ОБЪЕКТЫ Car Window Person Set Class Atr 6 Elem State Elem State СВОЙСТВА ПРОСТРАНСТВОВРЕМЯ Формат семантикоморфологического словаря 7 Мнемоника Толкова ния ... Сем. св. Часть речи 1 Род 1 Сущ. Муж. Семантические свойства Сем. св. Сем. св. Мнемоника Толкова ния ... Часть речи 2 Род 2 Сущ. Муж. ОПИСАНИЕ ЛЕКСЕМЫ Класс Объект 1 Класс 1 Объект Класс Объект 2 Класс 2 Семантические свойства Сем. св. Сем. св. Объект МОРФОЛОГИЧЕСКИЕ СВОЙСТВА СЕМАНТИЧЕСКИЕ СВОЙСТВА Преобразования текста в ОА-граф СЕМАНТИЧЕСКИЙ ОА-ГРАФ ОБЪЕКТ (СЕМ) СВЯЗЬ СПИСОК СЛОВОФОРМ ИЗ ПРЕДЛОЖЕНИЯ УДАЛЕННОЕ ОПИСАНИЕ СЛОВОФОРМЫ 8 Сцепка толкований словоформ Прил. Сем. св. Сущ Сем. св. Признак 1 Признак 2 Сущ Сем. св. Свойство Признак 1 Признак 2 9 Фазы для преобразования русского языка 10 Числительное.Составное – Число Наречие.Меры и степени + Глагол Наречие.Меры и степени + Наречие Существительное.Собирательное – Множество Существительное.Конкретное + Число – Множество Существительное.Измерение + Число – Измерение Прилагательное + Существительное Местоимение.Притяжательное + Существительное Предлог.Пространственные + Локатив.Место –Полутрек.Место Предлог.Временные + Время – Полутрек.Время Глагол + Трек Расфоркивание толкований словоформ 2 3 1 11 2 4 2 4 2 5 2 5 3 4 3 4 3 5 3+5 4 5 СЦЕПКА СЛОВОФОРМ 6 1 6 1 6 Семантические атрибуты для согласования толкований словоформ - Зрение; Слух; Чувства (зрение, слух, обоняние, осязание, вкус); Вместилище (то, что может вмещать в себе что-то); Движение; Статика; Физический объект; Абстрактное понятие; Множество; Топология; Временной интервал; Измерение длинны; Измерение времени; Преобразование; Географический объект; Процесс; …… 12 Пример использования атрибутов для согласования толкований словоформ Атрибут первого слова Атрибут второго слова Смысл 13 Пример Глагол статики Физический объект Находиться за объектом «Прятаться за деревом» Глагол динамики Движимый физический объект Движение «Следовать за одного объекта гидом» за другим Глагол процесса Временной интервал Длительность действия «Я сделаю это за две недели.» Глагол мнения Роль Мнение, что кто-то выступает в роли кого-то «Принимать за умного» Выводы 14 разработан формат семантического ОА-графа, состоящего из 4 уровней, каждый из которых разделяется на 3 подуровня, и описывающий смыл, заложенный в тексте; разработана псевдофизическая логика (правила описания и вывода знаний о пространственновременных отношениях) выделены некоторые признаки для семантического согласования слов; разработана общая методика семантического анализа ЕЯ и методики для русского языка. 15 Спасибо за внимание!