2. Словоформа и лексема.

реклама
Слово
Лексемы и словоформы
Проблема слова «слово»
Что называется словом в естественном
языке? Самые разные вещи:
 «В этом стихотворении ровно сто слов»
 «До реформы орфографии это слово
писалось с ером» или «Это слово мне
незнакомо»
 «Лексический минимум первого года
обучения – тысяча слов»
Словоупотребление – единица
текста
«В этом стихотворении ровно сто слов»
 Также (word) token, единица измерения
корпусов
 Последовательности символов в тексте,
отделенные друг от друга пробелами и
знаками препинания
Словоупотребление



Чем больше количество
словоупотреблений, тем
представительнее корпус
Word per million, occurences per million –
частотная характеристика исследуемого
объекта в корпусе
Также – например, измерение скорости
речи
Словоформа – единица языковой
компетенции
«До реформы орфографии это слово
писалось с ером»
«Второго слова в пятой строчке
стихотворения Катулла я не понял»
 Wordform, word form, форма слова
 В простом случае – последовательность
букв
Где? Не в тексте
Словоформа – единица языковой
компетенции


В более сложном случае - «звуков» или
звукотипов (ментальных символов
хранения словесных артикуляций по СВК)
Также, например, единица измерения
словника (пока) неизвестного языка
(конкорданс)
Лексема – единица словаря
«Лексический минимум первого года
обучения – тысяча слов»
 Lexical item, словарный вход
 Хаспельмат: пользователь словаря не
ожидает найти в словаре слово sleeps, но
ожидает найти там слово sleep
Лексема – единица словаря




Однако это определение для нелингвиста (дан
словарь)
Оно также зависит от структуры словаря –
sleeplessly отдельная лексема, но в словаре в
статье sleepless
Что попадает в словаре в разные статьи, а что в
одну?
Впрочем, это не чисто типографский вопрос –
хотя и связано с лексикографической традицией
(ср. арабские словари), так как коррелирует с
вопросом о ментальном лексиконе
Лексическое и грамматическое
значение

Топор, топора, топору... топоры,
топоров, топорам... – что можно сказать
про значение этих «слов»
эти «слова» имеют одинаковое
лексическое значение, различаясь лишь
грамматическими значениями
Лексическое и грамматическое
значение

Топор, топорик, топорный – что можно
сказать про значения этих «слов»
- эти слова имеют разное лексическое
значение
- при этом два первых слова имеют
одинаковое грамматическое значение
Лексическое значение


Различие между грамматическим и
лексическим значениями кажется
интуитивно ясным
Однако мы уже знаем, что набор
грамматических значений изменяется от
языка к языку
Лексическое значение
Якобсон (о Боасе): грамматическое – это
то, что говорящий на языке не может не
выразить. В русском языке у
существительных
грамматическое значение –
число, падеж
лексическое значение –
уменьшительность

Словоизменение и
словообразование



Словоизменение – остаемся в пределах
одной лексемы; словообразование – связь
между лексемами
Традиционно – разные части речи не
могут принадлежать одной лексеме,
однако...
... проблема абсолютно продуктивных
дериваций (например, причастия)
Словоизменение и
словообразование


Основная проблема – грамматологический
подход (обязательность) vs. многие другие
подходы, в том числе экспериментальный
(продуктивность)
Все обязательное продуктивно, но не все
продуктивное обязательно
Парадигма (oh no, not again!)
Парадигма (в узком смысле) – определенным
образом упорядоченный набор словоформ,
объединенных общим лексическим значением
(т.е. принадлежащих одной лексеме).
 Впрочем, иногда говорят и о слообразовательной
парадигме определенной лексемы, например:
- приставочная парадигма глагольной основы (с
какими приставками она сочетается)

Лексема ~ словоформа



Совокупность словоформ с одинаковым
грамматическим значением
В этом смысле утверждение Хаспельмата:
словоформа эквивалентна паре лексема + набор
грамматических значений
«Простейшая» задача автоматического анализа
текста) – по словоформе получить лексему и
набор грамматических значений; по лексеме и
набору грамматических значений построить
лексему
Лексема



Абстрактная сущность – «мешок»
словоформ, объединенных общим
лексическим значением
NB: не совпадает с понятием словарной
статьи, словарного входа или начальной
формы
Словарная статья – описывает лексему
Начальная форма – называет ее
Лемма
Также: начальная форма, исходная форма
Чтобы назвать лексему, неудобно перечислять
все входящие в нее словоформы
 Вместо этого чаще всего используется одна из
словоформ. Какая?
у существительных? у глаголов?
 Выбор в значительной степени произволен
 Теоретически может использоваться и не
словоформа, а основа – но это менее удобно
носителю языка

Лемма vs. Начальная форма



Термин «лемма» в лингвистике имеет легкий
компьютерный привкус
Но под начальными или исходными формами
можно также понимать опорные формы – набор
форм, однозначно задающих
словоизменительный тип (большинства) лексем
данной категории
В этом случае понятия исходной (начальной)
формы и леммы оказываются различными
Ментальный лексикон


В экспериментальной лингвистике
лексема может соотноситься с единицей
хранения языка (ментальный лексикон)
Существуют, однако, модели, в которых
такой единицей является морфема
коррелирует с вопросом о минимально
значимой единице языка – значимой для
кого, для говорящего или для лингвиста
«Почему не говорят?»


Сложная загадка: почему не говорят, что
словоформа – последовательность
символов, которые могут встретиться
между пробелами?
Очень сложная загадка (contra
Хаспельмат): почему не говорят, что
словоформа – это лексема плюс (полный)
набор грамматических значений?
Скачать