Тема 3. КОМПЬЮТЕРНАЯ КОГНИТОЛОГИЯ СЕМИОТИЧЕСКИХ СИСТЕМ ОСНОВНЫЕ РАЗДЕЛЫ ТЕМЫ 3.1. Вербальное сознание — лекция 1. 3.2. Ассоциативный эксперимент — лекция 2. 3.3. Когнитивный эксперимент — лекция 3. ФАКУЛЬТАТИВНЫЕ РАЗДЕЛЫ ТЕМЫ ДЛЯ САМОСТОЯТЕЛЬНОГО ИЗУЧЕНИЯ 3.4. Язык и сознание — лекция 1. Лекция 2. АССОЦИАТИВНЫЙ ЭКСПЕРИМЕНТ ТЕХНОЛОГИЯ АССОЦИАТИВНЫХ ЭКСПЕРИМЕНТОВ АССОЦИАТИВНЫЙ ОПРОС СПОСОБ ИНТЕГРАЦИИ ДАННЫХ АССОЦИАТИВНОГО ОПРОСА РЕЧЕМЫСЛИТЕЛЬНАЯ ДЕЯТЕЛЬНОСТЬ ЧЕЛОВЕКА ИНСТРУМЕНТАРИЙ ИССЛЕДОВАНИЯ Основные публикации Ю.Н.Филиппович, Г.А.Черкасова, Д.Дельфт Ассоциации информационных технологий: эксперимент на русском и французском языках. / Серия «Компьютерная лингвистика». Вступ. Статья Н.В.Уфимцевой. М.: МГУП, 2002. — книга в комплекте с CD ROM — С. 5–102. ТЕХНОЛОГИЯ АССОЦИАТИВНЫХ ЭКСПЕРИМЕНТОВ Первые ассоциативные вербальные эксперименты были использованы для исследования речевого поведения людей и описаны в 1901 году немецкими исследователями А.Тумбом и К.Марбе {слова-стимулы} испытуемый {слова-реакции} психология лингвистика устройство его вербального сознания особенности языка Современная практика Технология ассоциативного вербального эксперимента - основной инструмент психолингвистики и когнитологии Результат ассоциативных экспериментов словарь-тезаурус семантические связи слов семантические поля модель языковой способности модель языковой системы носителя языка образы взаимопонимания • пол, • возраст, • образование, • профессия ... Сферы использования Преподавательская деятельность (изучение языков и контроль знаний обучающихся) Авторская деятельность (написание текстов учебных материалов, подготовка публичных выступлений) Реклама Информационный поиск Машинный перевод Примеры ассоциативных словарей Kiss G., Armstrong C., Milroy R. The Associative Thesaurus of English Ю.Н.Караулов, Г.А.Черкасова, Н.В.Уфимцева, Е.Ф.Тарасов, Ю.А.Сорокин. Русский ассоциативный словарь M. Sánchez Puig, Yu. Karaúlov, G. Cherkásova. Normas asociativas del español y del ruso Н.В.Уфимцева, И.А.Стернин, Х.Эккерт, В.И.Милехина, В.М.Топорова. Ассоциативные нормы русского и немецкого языков. Н.В.Уфимцева, Г.А.Черкасова, Ю.Н.Караулов, Е.Ф.Тарасов. Славянский ассоциативный словарь: русский, белорусский, болгарский, украинский Ю.Н.Филиппович, Г.А.Черкасова, Д.Дельфт, Ассоциации информационных технологий Примеры ассоциативных словарей Ю.Н.Караулов, Г.А.Черкасова, Н.В.Уфимцева, Е.Ф.Тарасов, Ю.А.Сорокин. Русский ассоциативный словарь СПОСОБ ИНТЕГРАЦИИ ДАННЫХ АССОЦИАТИВНОГО ОПРОСА (1) формальные правила лингвистического конструирования АВС: 1) одинаковые слова-реакции разных респондентов являются эквивалентными это позволяет для каждого слова-стимула построить частотное поле его реакций, и для каждого слова-реакции – частотное поле его стимулов Оружие (пр.) ОРУЖИЕ: холодное 9; массового поражения, ружье 5; огнестрельное, ядерное 4; война, стреляет, убийства 3; безопасность, мощное, пистолет, смертельное, смерть, старинное, убийцы 2; абсолютное, автомат, армия, Бальзак, винтовка, военное, возмездия, врага, в руках, выстрелило, газовое, грозное, дерево, железо, зонтик, именное, и пушка, кинжал, командира, кровь, любви, массового уничтожения, мести, мое, мортира, МП, на складе, нож, опасно, опасное, орудие, перестройки, перо, пищаль, продавать, пролетариата, прощай, прятать, разоружение, самозащиты, секретное, сильный, слово, сложить, смерти, спортивное, ствол, стрельба, стрелять, твое, холодная, черный 1; 105+67+3+52 Оружие (обр.) ОРУЖИЕ* огнестрельное 93; применять 10; сдать 9; пистолет, пушка 7; пулемет 6; заряжать, стрельба 5; булыжник, кинжал, носить, сдавать, ствол 4; Калашников, слово, шпага 3; автомат, бросать, войска, вооружен, древнее, копье, ликвидировать, орудийный, патрон, ружье, убийство 2; армия, атаковать, атом, атомная бомба, атомный, байки, бандит, битва, боец, болванка, бомба, борьба, бумага, везти, вершина, военный, воин, Вторая мировая война, выбросить, выстрел, град, дубина, защитник, инструмент, клинок, конструктор, личный, лук, наше, нужно, оборона, отнять, отобрать, птица, ракета, ржавое, самоубийство, склад, смертельный, создавать, солдат, спрятать, танк, убивать, убийца, уничтожить, хранение, хранить, цели, цепь, чистить, юмор, ядерный, ядро 1; 81+247 СПОСОБ ИНТЕГРАЦИИ ДАННЫХ АССОЦИАТИВНОГО ОПРОСА (2) формальные правила лингвистического конструирования АВС: 2) одинаковые слова-реакции и слова-стимулы, в том числе и разных респондентов, также являются эквивалентными это позволяет искусственно «удлинить» и «замкнуть» стимульно-реактивные цепочки, преобразовать иерархические связи между стимулами и реакциями в сетевые. арбалет 1 1 стрельба 1 1 борьба 12 орудие 1 война охота 2 1 1 1 1 пушка 5 операция топор 3 1 7 кровь армия пистолет 1 2 1 оружие ружье 2 1 5 1 10 ствол перо 1 1 СПОСОБ ИНТЕГРАЦИИ ДАННЫХ АССОЦИАТИВНОГО ОПРОСА (3) МАКЕТ КОГНЕМНОГО СЛОВАРЯ АССОЦИАТИВНЫХЦЕПОЧЕК АРБАЛЕТ. Мир вне человека: Время:История. Рецепт. Сравн. Старинное оружие в форме лука. <старинный; оружие; форма; лук><арбалет> = <2: старинный1 двор1 ствол1 орудие1 арбалет, старинный1 двор1 ружье1 стрельба1 арбалет; 1: оружие1 стрельба1 арбалет; 2: форма1 спорт1 стрельба1 арбалет, форма1 война1 стрельба1 арбалет; 1: лук3 стрела1 стрельба1 арбалет> 6=0+1+3+2+0 <арбалет> <старинный; оружие; форма; лук> = <3: арбалет 1орудие1 работа1 стол1 старинный, арбалет 1стрельба5ору-жие1 зонтик1старинный, арбалет 1стрельба1огонь7камин2ста-ринный; 5: арбалет1орудие1пистолет7 оружие, арбалет 1орудие4 пушка7 оружие, арбалет 1орудие 8убийство2 оружие, арбалет 1орудие1 выстрел 1 оружие, арбалет 1стрельба 5оружие; 10: арбалет 1орудие1 работа1 фигура1 форма, арбалет 1орудие 1пистолет 1милиция 2форма, арбалет 1орудие 1работа 1отличная 1форма, арбалет 1орудие 1работа 1служба 2форма, арбалет 1орудие 2лопата 1солдат 6форма, арбалет 1орудие 4пушка 1солдат 6форма, арбалет 1стрельба 5оружие 1армия 2форма, арбалет 1стрельба 7 пистолет 1милиция 2форма, арбалет 1стрельба 1кровь 3сдать 1форма, арбалет 1стрельба 1огонь 1сердце 1форма; 7: арбалет 1орудие 1работа 2мука 1лук, арбалет 1орудие 4труд 1мука 1лук, арбалет 1орудие 1выстрел 1стрела 7лук, арбалет 1орудие 1пистолет 2―> стрельба 4лук, арбалет 1орудие 4пушка 1 стрельба 4лук, арбалет 1орудие 1топор 1капуста 1лук, арбалет 1стрельба 4лук> 25=0+2+4+19+0 СПОСОБ ИНТЕГРАЦИИ ДАННЫХ АССОЦИАТИВНОГО ОПРОСА (4) «ПРОСТРАНСТВЕННО-ВРЕМЕННАЯ СТРУКТУРНОСТЬ» Предположение об «эргодичности» двух процедур многократный длительный опрос одного респондента однократный симультанный опрос многих респондентов Основное допущение событийно-статистического моделирования речемыслительной деятельности Речемыслительная деятельность субъекта (респондента) и «типового (усредненного) носителя языка» – это дискретные стационарные случайные эргодические семиотические (вербальные) процессы смены в фокусе их «умного зрения» (центре внимания) мыслей-знаков (вербальных единиц) – многомерная случайная величина R(s, t) = [rj(si, tk)], где: i =1--I — стимулы; j = 1--J, — реакции; k = 1--K, — моменты испытаний. РЕЧЕМЫСЛИТЕЛЬНАЯ ДЕЯТЕЛЬНОСТЬ ЧЕЛОВЕКА Субъект … {МЗi-m} … {МЗi-1} {МЗi} tвосприятия … {ЯЕi-m} … {МЗi+1} … tсоздания {ЯЕi-1} {ЯЕi} {ЯЕi+1} … … {МЗi+k} Время t {ЯЕi+k} … текст • «Событийность в большом» — квантитативный анализ: формирование (организация) корпуса текстов, отбор и определение статистических параметров ЯЕ. • «Событийность в малом» — это анализ «линеарности» построения и динамики развития текста и составляющих его ЯЕ. • «Пространственно-временная структурность» — это представление текста в виде связанных между собой синтагматическими и парадигматическими отношениями ЯЕ. СОПОСТАВЛЕНИЯ ТЕКСТ — АВС Текст или его фрагмент АВС в целом или какая-либо ее часть ближайшая, удаленная на К шагов стимульно-реактивная окрестность элементов пропозиции ЯЕ текста (пропозиция предложения) стимульно-реактивная цепочка длины L Ряска – это зеленое «одеяло» водоемов. ЯЕ текста (слово) <зеленый; одеяло; водоем><ряска> = <зеленый 1 лягушка 7 болото 1 ..., зеленый 1 газ 1 болото 1 ..., зеленый 10 крокодил 3 болото 1 ..., зеленый 1лягушка 2 пруд 1... 4; одеяло 1ночь 1туман 1болото 1..., одеяло 1ночь 1рассвет 1болото 1... 2; водоем 3 лягушка 7 болото 1..., водоем 1море 1болото 1..., водоем 10 озеро 2 болото 1 ..., водоем 2 река 1болото 1..., водоем 6 вода 1болото 1..., водоем 3лягушка 2 пруд 1 ..., водоем 2 река 1пруд 1..., водоем 1речка 1пруд 1 ..., водоем 4 рыба 1 пруд 1... 9> 15=0+0+13+2+0 f Слово-стимул Слово-реакция Синтагм. отн. 8 ОПЕРАТОР ЭВМ СЛОВОСОЧЕТАНИЕ 4 ОПЕРАТОР ЯЗЫКА СЛОВОСОЧЕТАНИЕ 3 ОПЕРАТОР ПОЛЬЗОВАТЕЛЬ ВИД-РОД 3 ОПЕРАТОР ЧЕЛОВЕК ВИД-РОД 2 ОПЕРАТОР ПРОГРАММИСТ 1 ОПЕРАТОР КИНОСТУДИЯ ЧАСТЬ-ЦЕЛОЕ 1 ОПЕРАТОР КОМАНДА СИНОНИМ СЛОЖНОЕ СЛОВО Парадигм. отн. РОД-ВИД ИНСТРУМЕНТАРИЙ ИССЛЕДОВАНИЯ Области и практические задачи: индексирование, реферирование, создание онтологий, информационный поиск, обучение языку, редактирование, библиометрия и др. Основные инструменты гиперболические распределения — законы Ципфа и Бредфорда: i(k,r) = рk (r+v)-b, где: b, k, v – const r – ранг слова i(k,r) – частота слова • • • • • Ji = bkJi-1 = bki-1J1, где: i = 1, 2, ..., k; k = 1, 2, ..., m; J1 — количество областей в ядре; bk > 1 — множитель Бредфорда для разбиения J названий на k групп. Методы и технологии: дистрибутивно-статистический анализ компонентного анализа частотно-семантический метод методы многомерного анализа кластерный анализ. ОБОБЩЕННАЯ МОДЕЛЬ ДАННЫХ ДЛЯ АНАЛИЗА «ПРОСТРАНСТВЕННО-ВРЕМЕННОЙ СТРУКТУРНОСТИ» ТЕКСТА И АВС Матрица связности языковых единиц (слов) или ассоциативная матрица функции «силы связи» fij = F(ЯЕi, ЯЕj). Слово (частота) ... ЯЕi = а (fа ) ... ... ЯЕj = b (fb ) ... fаb ... ...