проблема сегментации устного дискурса и когнитивная система

реклама
ПРОБЛЕМА СЕГМЕНТАЦИИ УСТНОГО ДИСКУРСА
И КОГНИТИВНАЯ СИСТЕМА ГОВОРЯЩЕГО*
А.А. Кибрик (Институт языкознания РАН), В.И. Подлесская (РГГУ),
Ю.В. Дараган (МГУ им. М.В. Ломоносова), З.В. Ефимова (РГГУ),
Н.А. Коротаев (РГГУ), А.О. Литвиненко (МГУ им. М.В. Ломоносова),
В.Л. Цуканова (РГГУ), Москва
kibrik@comtv.ru
vera@pdlssk.mccme.ru
* Исследование выполнено при поддержке гранта РГНФ № 04-04-00220а.
Дискурс – это наиболее общий термин, включающий разные формы использования языка:
устную речь и письмо, диалог и монолог, любые жанры – рассказ, телефонный разговор,
спортивный репортаж и т.п. Как любое целенаправленное поведение, дискурс имеет структуру.
Лингвисты традиционно предпочитают изучать письменный текст, т.к. он более доступен и
удобен для наблюдения, чем устная речь. В письменном тексте глобальная структура эксплицитно
выражена в виде абзацев и более крупных фрагментов, а локальная структура передается
пунктуацией. Между тем, исходной формой использования языка является устная речь, и она не
может не учитываться в лингвистических и когнитивных исследованиях.
Поскольку непосредственное обращение только к звуковой форме устной речи
недостаточно для аналитических целей, возникает задача транскрибирования устной речи. Такая
транскрипция должна передавать наиболее важные компоненты устной речи в графическом виде.
Одна из центральных проблем любой транскрипции устной речи – проблема сегментации.
Дискурс порождается говорящим не в виде плавного потока, а в виде последовательности квантов,
пульсаций, толчков. Такие кванты мы называем элементарными дискурсивными единицами
(ЭДЕ). ЭДЕ далее организуются в более крупные иерархические объединения, в соответствии с
коммуникативным намерением говорящего. В докладе мы собираемся рассмотреть лишь вопрос
об объеме ЭДЕ и о границах между ними. Как и в любом целенаправленном поведении, в большей
части случаев границы между квантами очевидны, но есть существенная доля случаев, когда
отождествить границы ЭДЕ оказывается нелегко. Наш основной исследовательский вопрос:
какими когнитивными факторами обусловлена сегментация на ЭДЕ? Настоящее исследование –
часть проекта по изучению устных детских рассказов о сновидениях, но для данного доклада
важно лишь то, что это устная русская речь. Сегментация на ЭДЕ графически отображается в виде
деления на строки.
Типичная ЭДЕ совпадает по объему с предикацией (элементарным предложением, clause).
Согласно гипотезе У. Чейфа, ЭДЕ – это вербализация «фокуса сознания» говорящего, т.е.
совокупности информации, которую селективное человеческое сознание может одновременно
удерживать в активном состоянии. Поскольку знания хранятся в основном в предикативной
форме, минимальный квант дискурса типично совпадает с предикацией. Однако существует
несколько типовых случаев, когда ЭДЕ по объему менее одной предикации.
1. Вынесенный топик. Говорящему необходимо одновременно активизировать и новый
референт, и событие, в котором данный референт участвует, и он выносит именную группу,
обозначающую референт, «влево» от предикации, в позицию так называемого топика, а в саму
предикацию включает местоименный дублет референта. (Ср. строки 1, 4 в таблице ниже.)
2. Парцелляция. Часто бывает, что говорящий не включает в предикацию какую-то ее
составляющую, особенно сирконстант, а вербализует эту составляющую позже в виде отдельной
ЭДЕ.. Это может иметь по крайней мере две когнитивных причины: (а) избыточное количество
новой информации для одной ЭДЕ (б) в процессе выбора просодического оформления предикации
говорящий временно упускает из виду какой-то ее элемент, но еще имеет возможность
«пристроить» этот элемент апостериори. (Ср. строки 20, 25 в таблице.)
3. Разрыв. Говорящий начинает формулировать предикацию и в процессе обнаруживает,
что один из начальных элементов этой предикации требует уточнения. В этом случае предикация
может быть разорвана на две ЭДЕ, между которыми вклинивается другая ЭДЕ:
/Утром —
когда \мама мне обычно даёт ...(0.6) /попить,
— ..(0.2) /она мне дала /б-бутылку,
4. Сильный фальстарт. Говорящий начал вербализацию ЭДЕ, но в процессе осознал, что
принятый план не соответствует его глобальным задачам. Это может происходить по двум
основным причинам: (а) ошибка планирования: ЭДЕ формулируется не в нужной точке дискурса
(б) неудачно пропозициональное содержание самой ЭДЕ, и в результате говорящий полностью
отказывается от ЭДЕ и строит новую от начала. (Ср. строки 22, 23 в таблице.)
5. Регуляторные ЭДЕ. Это ЭДЕ, состоящие исключительно из дискурсивных маркеров –
специальных слов, регулирующих дискурсивный процесс между говорящим и адресатом.
/Потом || ....(3.4) ну –потом мы там ....(3.1) чего-то на \физкультуре были,
\играли там.
....(1.5) \Вот ..(0.1) <чего-то’>.
….(2.4) /Ну-у там вот \так.
Бывают также случаи, когда ЭДЕ содержит более одной предикации. Этот эффект
возникает, когда один из предикатов когнитивно ослаблен и фактически является фазовым,
модальным или цитационным маркером. Независимо от этого другой предикат может быть
частично номинализованным, например инфинитивным, – в этом случае событие
концептуализируется как объект и предикация уже не является полноценной. (Ср. строку 5 в
таблице.)
ЭДЕ, бóльшие, чем предикация, возникают также в результате слабого фальстарта: в
отличие от сильного фальстарта, говорящий отказывается лишь от части текущей ЭДЕ. При этом в
одной ЭДЕ может оказаться более одного предиката. (Ср. строку 17 в таблице.) Немного похож на
слабый фальстарт феномен быстрой подстановки: говорящий не находит удовлетворяющую его
вербализацию составляющей, и подставляет на ее место акцентированный заместитель (\это, это
\самое, \такой, \как его и т.п.). (Ср. строки 10, 18 в таблице.)
Разрабатываемая в рамках проекта система транскрипции устного дискурса позволяет
регистрировать и восстанавливать главные динамические события, происходящие в когнитивной
системе говорящего в процессе порождения дискурса.
Пример одного рассказа, с указанием на описанные выше и некоторые другие явления:
1.
2.
3.
ээ(0.4) С /другом с моим ..(0.1) \самым
\лучшим,
..(0.3) (\Санёк.
...(0.7) Он у меня там \<в школе>.)
4.
5.
..(0.4) мы с ним /пошли,
.…(1.5) и мы /стали копать ..(0.3) там ..(0.4) у
себя \яму,
6.
7.
чтоб \сделать себе \шалаш,
...(0.5) ну \столбы чтоб поставить,
8.
...(0.6) и /нашли чего-то такое \железное.
9.
.…(1.2) /Выкопали,
10. ...(0.7) а там-м \это..(0.3) лежат всякие такие
/\сокро-овища /сокровища_
11. ...(0.6) И мы ..(0.2) /набрали этих сокровищ,
12. ..(0.4) но не \все.
13. ...(0.6) Остальное /закопали,
14. ….(1.7) и’ /пошли \домой.
15. ..(0.1) /Принесли \домой.
16. ...(0.8) А потом мы \п-пошли там ….(1.2) в
Вынесенный топик
Парентеза: вставление
предложения внутрь другого
предложения
База вынесенного топика
Два предиката в ЭДЕ:
фазовый маркер и
инфинитив
Постпозитивные уточнения
с характерным слабо
падающим тоном в главном
акценте ЭДЕ
Конечная ЭДЕ
повествовательного
предложения с сильно
падающим тоном в главном
акценте
Неконечная ЭДЕ с
восходящим тоном в гл.
акценте
Быстрая подстановка
Хезитация, не приводящая к
17.
18.
19.
20.
21.
22.
23.
24.
25.
какой-то й= ...(0.5) ювелир= =ный /магазин с
родителями,
.…(1.1) и-и они /сдали эти || ...(0.6) /\ну-у
...(0.8) /сдали вот эти ю= ..(0.3) =велир=~
...(0.6) и \это..(0.3) мы получили \деньги.
.…(1.0) И-и /\мы-ы с Саньком ..(0.1) тогда
/пошли,
...(0.6) в \магазин,
чего-нибудь \покупать,
..(0.4) а-а ==
...(0.5) и Са= ==
и я \проснулся.
На самом там ..(0.2) интересном \месте.
слабому фальстарту
Слабый фальстарт
Быстрая подстановка
Парцелляция
Сильный фальстарт
Сильный фальстарт
Парцелляция
Скачать