ПРОБЛЕМА СЕГМЕНТАЦИИ УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ СИСТЕМА ГОВОРЯЩЕГО SEGMENTATION OF SPOKEN DISCOURSE AND THE SPEAKER’S COGNITIVE SYSTEM Авторы Authors А.А.Кибрик (Институт A.A.Kibrik (Institute of языкознания РАН) В.И.Подлесская (РГГУ) Ю.В.Дараган (МГУ) З.В.Ефимова (РГГУ) Н.А.Коротаев (РГГУ) А.О.Литвиненко (МГУ) В.Л.Цуканова (РГГУ) Linguistics, RAN) V.I.Podlesskaya (RSUH) Ju.V. Daragan (MSU) Z.V. Efimova (RSUH) N.A.Korotaev (RSUH) A.O.Litvinenko (MSU) V.L.Cukanova (RSUH) Дискурс Дискурс - это процесс употребления языка Синонимы: речь, диалог, коммуникация В данном докладе устный дискурс Жанр - рассказ Корпус детских рассказов о сновидениях Discourse Discourse is the process of language use Synonyms: speech, dialogue, communication In this study: spoken discourse The genre : story A corpus of children’s night dream stories Проблема устного дискурса The problem of spoken discourse Устный дискурс является первичной формой существования языка: в филогенезе в онтогенезе для многих языков единственная форма даже для наиболее письменных языков самая частотная форма Spoken discourse is the primary form of language existence: in phylogenesis in onthogenesis for many languages is the only variety even for the most written languages is the most frequent variety Проблема репрезентации The problem of representation Чтобы быть In order to be an The natural form of объектом научного изучения, устный дискурс должен быть репрезентирован Естественная форма репрезентации графическое представление (транскрипция) object of scientific analysis, spoken discourse needs to be represented representation is a graphic representation, that is, a transcription Проблема транскрипции The problem of transcription Необходима систематическая, последовательная транскрипционная система позволяющая разным транскрайберам принимать идентичные решения имеющая оптимальный уровень детализации A systematic, consistent system of transcription is in order, such that: different transcribers would make identical decisions an optimal level of detail is chosen Проблема сегментации The problem of segmentation Дискурс - это один из Discourse is among основных видов человеческого поведения Любое целенаправленное поведение имеет структуру, в частности, состоит из сегментов Между соседними сегментами нужно уметь провести границу the main kinds of human behavior Any goal-oriented behavior has a structure, in particular, consists of segments Boundaries between adjacent segments need to be identified Сегментация дискурса Discourse segmentation Дискурс порождается не в виде плавного потока, а как серия толчков, пульсаций, квантов (Chafe 1994) Мы называем такие кванты элементарными дискурсивными единицами (ЭДЕ) Discourse is produced not as a smooth flow but as a series of pulses, or quanta (Chafe 1994) We call these quanta Elementary Discourse Units (EDUs) Criteria of the unity of an EDU Когнитивный (Chafe 1994): ЭДЕ отражает фокус сознания говорящего, т.е. объем информации, которую говорящий может одновременно поддерживать в активном состоянии Семантико-синтаксический: ЭДЕ типично (но не всегда!) соответствует одной предикации Просодический: ЭДЕ оформляется как просодическая единица - с точки зрения тона, громкости, паузации и т.д. Cognitively (Chafe 1994): An EDU represents the speaker’s focus of consciousness, that is, the amount of information the speaker is able to maintain activated at one time Semantically and grammatically: an EDU typically (but not always!) corresponds to one clause Prosodically: an EDU is shaped as a prosodic unit in terms of intonation, loudness, pausing, etc. Исследовательские вопросы Research questions Каковы классы What are the classes случаев, в которых ЭДЕ не совпадают с предикациями? Как можно объяснить такие случае рассогласования? of instances when EDUs do not coincide with clauses? How can one explain these cases of disagreement? Классы ЭДЕ, не равных предикации Classes of EDUs differing from clauses В нашем корпусе от 2/3 до 3/4 ЭДЕ совпадают с предикациями Однако есть несколько классов ЭДЕ, меньших или больших, чем предикация Мы остановимся на «малых» ЭДЕ Мы обсудим основные их типы и предложим для каждого из них интерпретацию - лежащие в основе когнитивные процессы говорящего In our corpus, 2/3 to 3/4 of all EDUs coincide with clauses But there are several classes of EDUs that are either smaller or larger than a clause We are going to focus on “small” EDUs We are going to discuss their major types and offer an interpretation of the speaker’s underlying cognitive processes ЭДЕ, меньшие чем предикация EDUs smaller than a clause 1. Вынесенный топик Left-dislocated topic z26:27-28 ....(1.7) А с= || ...(0.5) /двойняшки, And the twins, ....(2.0) /они’ ..(0.2) \’огораживали, they were fencing, Когнитивная интерпретация A cognitive interpretation Говорящий намеревается одновременно активировать новый референт и новое событие Ограничение одной новой идеи (Chafe 1994) диктует, что эти два элемента должны быть помещены в разные ЭДЕ The speaker intends to simultaneously activate a new referent and a new event The One-New-IdeaConstraint (Chafe 1994) dictates that they must be put in different EDUs 2. Парцелляция Parcellation z21: 1-4 /Мне /приснилось, I dreamed, что /я /ехала на \поезде. that I was riding in a train. В котором /была ...(0.6) зелёная \–поля-ана, In which there was a green meadow, с-c /гриба-ами и ..(0.2) \пнями всякими. with mushrooms and various stumps. Когнитивная интерпретация A cognitive interpretation На планируемую предикацию приходится слишком много новой информации Говорящий отделяет обстоятельство, определение или сочиненную ИГ в особую постпозитивную ЭДЕ Это запланированная парцелляция There is too much new information per clause The speaker chops off an adjunct NP, a coordinate NP, or an attributive element into a separate postposed EDU This is planned parcellation 2'. Спонтанная парцелляция Improvised parcellation (afterthought) z51:15-16 ..(0.4) и мн= || и /мне нужно было /зайти значит в \номер. and I needed to enter the room. мм(0.4) Для-а \чего-то. For something. ....(1.1) Ну я даже не \знаю для \чего. Well I don’t even know what for. ....(1.1) \Гостиничный. Of the hotel. Типичная просодическая особенность A typical prosodic feature Начальная ЭДЕ интонационно оформлена как завершенная и часто имеет интонацию конца предложения The initial EDU is intonationally complete and often has a sentence-final intonation Когнитивная интерпретация A cognitive interpretation После завершения ЭДЕпредикации говорящий обнаруживает, что необходимо добавить к данной предикации еще какой-то элемент информации Морфосинтаксическая структура этой уже готовой ЭДЕ позволяет говорящему добавить запоздалое приложение, как если бы оно было изначально запланировано After finishing a clausal EDU, the speaker finds it important to add another piece of information to that clause The morphosyntactic structure of the already completed EDU allows the speaker to add an afterthought appendix “as if” it was planned originally 3. Разрыв Split z49:1-4 Один раз ..(0.2) /\мы-ы — One time we — ..(0.3) ''(0.1) <мм(0.1)> ...(0.6) три /брата, three brothers, –Серёжка –Лёшка и /я, Serezhka, Leshka, and myself, — ..(0.5) с дядей /Сашей поехали на \рыбалку. — with uncle Sasha went fishing. Когнитивная интерпретация A cognitive interpretation Формулируя ЭДЕ, говорящий обнаруживает, что некоторые из ее элементов могут быть непонятны адресату В этом случае он вставляет дополнительную ЭДЕ после уже произнесенной части первой ЭДЕ Такая вставная ЭДЕ бывает предикацией, а бывает и меньше предикации While formulating an EDU the speaker finds out that some of its elements may be unintelligible to the addressee Then s/he can wedge an extra EDU after the already uttered part of the first EDU Such an inset EDU can be a clause, but also can be smaller than a clause 4. (Cильный) фальстарт (Strong) false start n32:29-30 ..(0.4) ’И подх= == And appro= == И-и ..(0.2) /’он ’’(0.3) спускается ко \мне. And he comes down to me. Когнитивная интерпретация A cognitive interpretation Начав порождение After having begun ЭДЕ, говорящий осознает, что выбранная вербализация неточна Он бросает начатую ЭДЕ и начинает формулировать ЭДЕ заново Это локальный фальстарт producing an EDU, the speaker realizes that the chosen verbalization does not fit S/he gives up, and begins the formulation of the EDU from scratch This is a local false start 4'. Фальстарт планирования False start – timing error z56:1-5 /Мы с мамой поех= == I and mom wen= == …(0.8) \Это, Okay, /мы с мамой поехали в == I and mom went to == …(0.5) Мне приснился /сон, I dreamed, будто мы с \мамой поехали в \Аме-ерику. that I and mom went to America. Когнитивная интерпретация A cognitive interpretation Говорящий начинает формулировать ЭДЕ, но до ее завершения осознает, что данная ЭДЕ преждевременна, и другая информация должна быть сказана раньше Таким образом, ЭДЕ не впишется в семантическую структуру дискурса, если будет сказана в данном месте Говорящий бросает ЭДЕ, порождает одну или более других ЭДЕ, и после этого вербализует данное содержание в новой ЭДЕ The speaker begins to formulate an EDU, but before it is completed s/he realizes that it is premature and some other information is in order Therefore, the EDU would not fit into the semantic structure of discourse at this point The speaker gives up, proceeds with one or more other EDUs, and later on verbalizes the given content in a different EDU 5. Дискурсивные маркеры Discourse markers n57: 1-6 ээ(0.3) К /нам домой позвонила-а учительница по /русскому, To our home called the teacher of Russian, ..(0.3) \вот, okay, и-и /спросила, and asked, /приедем мы, if we come, ..(0.1) ’или \нет. or not. .... (1.2) –Вот. Okay. Когнитивная интерпретация A cognitive interpretation The speaker does not ЭДЕ не содержит пропозиционального содержания, а является сигналом: provide any propositional information but rather signals: Динамики порождения Dynamics of discourse дискурса, например production, e.g. завершения фрагмента completion of a chunk дискурса и готовности and readiness to proceed перейти к следующему (вот) His/her current mental Текущего ментального condition, such as being состояния говорящего, unready to choose например неготовности verbalization выбрать вербализацию (это) Текущей эмоции говорящего, His/her sudden emotion, such as surprise например удивления ЭДЕ, большие чем предикация EDUs larger than a clause (а) Ослабленный (б) Сериализация главный глагол Attenuated Serialization main verb n67: 22-23 ..(0.1) ну вот ..(0.3) /подойти <помоему> \меня она /попросила, so I guess she asked me to come up, ...(0.4) говорит «/Пойди \помоги ей¡». says “Go help her”. Количественные данные Quantitative data Количество ЭДЕ в корпусе: 3480 Number of EDUs in corpus: 3480 ЭДЕ = пред. EDU = clause ЭДЕ < пред. EDU < clause ЭДЕ > пред. EDU > clause 71% 22% 7% Количество типов малых ЭДЕ Quantity of small EDUs by type тип type % Топики Topics 0.5 Парцелляции Parcellations 5 Разрывы Splits 0.5 Фальстарты False starts 6 Дискурсивные маркеры Discourse markers 4 Прочее Other 6 ИТОГО TOTAL 22 Выводы Conclusions ЭДЕ типично EDUs typically coincide совпадают с предикациями Есть, однако, несколько частотных классов случаев, когда такое соответствие нарушается В этом случае ЭДЕ могут оказываться как меньше, так и больше предикации with clauses However, there are several common classes of cases when such correspondence is not there An EDU can both be smaller and larger than a clause Выводы (продолжение) Каждый из таких классов случаев адекватно регистрируется благодаря систематической транскрипции русского устного дискурса Conclusions (continued) Each such class of cases is aptly registered by the systematic transcription of spoken Russian discourse Выводы (окончание) Каждый из таких классов случаев получает когнитивное объяснение в терминах намерений говорящего, его планов и ожиданий, временной динамики, модели адресата, процессов активации и эмоций Conclusions (completed) Each such class of cases can receive a cognitive explanation in terms of the speaker’s intentions, planning, expectations, temporal dynamics, modeling the addressee, activation processes, and emotions Спасибо за внимание. Как и за другие Ваши когнитивные процессы Thank you for your attention. As well as for your other cognitive processes