Коряков Ю.Б. Так ли нам нужен флот? Проблема "язык или диалект" и попытка лексикостатистического подхода Язык или диалект? • Один из вечных вопросов лингвистики. • Причем последствия такого решения могут выходить и далеко за её пределы. Для чего? Лингвисты сами постоянно оперируют, используют или ссылаются на понятие «язык», но всячески открещиваются от попыток определить, чем он отличается от диалекта • Когда нас интересует «точка» – всё равно как называть: язык бесермян, говор/язык села такого-го, китайский язык • Когда же рассматривается цельное множество, важны как относительная иерархия, так абсолютный вес идиомов в сравнении с другим множествами. Для чего? • В прикладной аспектах: – – – – для подсчёта индексов типа LDI, ILD; программы по сохранению языков; выработка литературных норм; создание стройной терминологии, чтоб не было «диалект Х диалекта Y диалектной группы Z» • Инвентаризация объектов: – сколько языков в стране, регионе, семье/группе, в мире? сколько языков описано в какой-либо работе: – для составления баз данных (Ethnologue, Glottolog, Linguasphere); – присвоение ISO-кодов; – при рисовании карт. Для чего? • Часто это нужно не самим лингвистам, а другим областям: – Демографам/статистикам – для проведения переписей – Этнографам – для понимания/описания этнических процессов • Да просто: как должна называться статья в «Языках мира» – язык, диалект или "язык/диалект" ? Требования к критериям • Каким требованиям должен отвечать критерий определения яз/д-т, чтобы можно было ответить на вышепоставленные вопросы? Требования к критериям • • • • Универсальность Постоянство во времени Непротиворечивость Генетическая последовательность Требования: Универсальность • Критерий должен быть применим к любой паре идиомов. • Наиболее важное требование: про любой идиом мы должны уметь сказать является он самостоятельным или нет. Требования: Постоянство во времени • Отнесение идиома к тому или иному языку не должно быстро меняться. • Т.е. понятно, что со временем языки развиваются, и, скажем, два диалекта через 500-1000 лет могут стать разными языками. • Но если новые языки могу возникнуть в любой момент, то это неудобно. Требования: Непротиворечивость • Один идиом может относиться только к одному языку. • Не должно быть так, что при использовании одного критерия один и тот же диалект входит и туда, и туда. Требования: Генетическая последовательность • Генетически родственные диалекты не должны резаться на разные языки. • Не должно быть, скажем, так: Критерии • две основные группы критериев: • внешние (социо-этно-политические) • внутренние (структурные). • Лучше не использовать термины «субъективные» и «объективные»: разное понимание. Внешние критерии (социо-этно-политические) Наиболее популярны в отечественной лингвистике: • Эдельман, Алпатов, Мечковская, и др. На западе в меньшей степени. Внешние критерии (социо-этно-политические) • Обычная логика: смотрим реальные различия – они плохо соотносятся с принятыми границами языков. Вывод: нужно использовать внешние критерии. • Иной вариант: внешние критерии не работают – значит надо использовать языковые различия. Внешние критерии (социо-этно-политические) Часто считаются как более важные по сравнению с чисто языковыми: • Алпатов В.М.: «Таким образом, на основе лишь лингвистических данных различить диалект и язык невозможно» Внешние критерии (социо-этно-политические) • • • • Общая наддиалектная норма Этническая ориентация Мнение носителей Политический фактор Общая наддиалектная норма Два идиома считаются диалектами одного языка, если у них: • общий письменный стандарт (литературная норма), независимый от других языков (нем. Dachsprache — «язык-крыша»); • или общее наддиалектное койне. Общая наддиалектная норма • Не применим к бесписьменным регионам. • Общая письменная традиция часто объединяет довольно далеко разошедшиеся идиомы: итальянские, немецкие, арабские, китайские «диалекты»; • или даже слабо родственные языки: латынь в средние века. Общая наддиалектная норма • У разных частей одного идиома могут оказаться разные «крыши»: • белорусский Смоленщины, западнополесские, торлакские (3 крыши), нижнесаксонские Нидерландов/Германии. Общая наддиалектная норма • Используя этот критерий, мы всё равно ориентируемся на степень близости между идиомами: норма ведь наддиалектная. • Если баски, бретонцы или эльзасцы пользуются лит.французским – мы ведь не называем их языки диалектами французского. • Σλαβικά διάλεκτος в Греции: греки-славофоны. • Т.е. всё равно нужно определить, где граница между языком и диалектом. Общая наддиалектная норма • Изменчивость. Как только возникает отд. лит. норма – получается отд. язык. • Черногорский, славянские микроязыки, региональные языки в Европе, … Общая наддиалектная норма Выполнимость критериев: • Универсальность — ✘ • Постоянство во времени – ✘ • Непротиворечивость – ~ • Генет. последовательность — ✘ Этническая ориентация • Если носители обоих идиомов относятся к одному этносу, значит это один язык, если к разным — разные: • Один народ = один язык (то, на чём говорят русские – это русский язык; белорусы – белорусский). Этническая ориентация • Однако определение народа является ещё более сложным: скорее, одним из параметров для классификации народов является языковой, а не наоборот. • Связь между этносом и языком довольно искусственна, она характерна либо для: родо-племенного строя: племя ⇔ язык «социалистических» наций: нация ⇔ язык Этническая ориентация Во многих регионах: • либо вообще нет чёткого этнического самосознания (часть Зап.Европы, арабские страны, ..) • либо соответствие между «народами» и языками отсутствует (Индия, Лат.Америка, ..). Этническая ориентация • Но даже там где оно есть, постоянны общепризнанные нарушения: • 1 народ ⇒ несколько языков: • Россия: мордва, аварцы, • Европа: французы, ирландцы, грузины, греки • 1 язык ⇒ несколько народов: • Россия: карачаево-балкарский, кабардиночеркесский • Европа: немецкий, английский, сх Этническая ориентация • В пределах одного народа м.б. много самоназваний, и наоборот, одно самоназвание может использоваться для нескольких народов. ханты: χɑnti / kɑntəɣ / хандэ адыгейцы / кабардинцы: adɨɣə курды: Kurd, Kurmancî и др. • Чему тогда следовать? Этническая ориентация Выполнимость критериев: ☑ • Универсальность — ✘ • Постоянство во времени – ☑ • Непротиворечивость – ~ • Генет. последовательность — ✘ Мнение носителей • Спрашиваем у носителя, на каком языке он говорит – так и считаем. Но… Мнение носителей • Знание о «собственно языке» и его границах с другими языками не является частью наивной картины мира. • Спрашивать у носителя про «собственно язык» – это всё равно, что спрашивать сколько у него в языке падежей или какая используется морфосинтаксическая стратегия. Либо он не знает, либо повторит то, что выучил в школе, услышал по радио и т.д. • Большинству "неразвитых" обществ это не важно и многие просто говорят "наш/обычный/простой язык". • Поэтому мнение носителей в целом малозначимо. Мнение носителей Примеры самоназваний = «наш/обычный язык» : • тутэйши / по-просту – Полесье • našinski – горане (торлакское наречие) • naš jezik – молизские хорваты • qatô:k ("наш язык") – язык мочо (майяские языки) • lishán didán ("наш язык") – еврейско-арамейские языки • ombeayiiüts ("наш язык") – язык уаве (Мексика) • nou ling ("наш язык") – индо-португальский креол • ŋyeshaŋ ("наш язык") – язык мананг (Непал, ТБ языки) • meänkieli ("наш язык") – финский диалект в Швеции • и т.д. Мнение носителей • В пределах языка/народа м.б. много самоназваний, и наоборот, одно самоназвание может использоваться для нескольких языков. • пушту: пашто, пахто, пухто, пушту, .. • (см. также примеры выше про народы) Мнение носителей Мнение о языках легко формируется государством и сми. • Молдавский/румынский язык в Молдавии: в 2004 г. 17% назвало своим родным языком румынский, а 60% – молдавский. • Черногорский язык: 22% в 2003, 37% в 2011. • Боснийский/босняцкий/босанский язык. Мнение носителей Как говорят многие носители: • «Ты лингвист, ты и скажи нам, диалект это или язык». Мнение носителей Выполнимость критериев: • Универсальность — ✘ • Постоянство во времени – ~ • Непротиворечивость – ✘ • Генет. последовательность — ~ Политический фактор Законы могут влиять на … 1. названия гос.языков и тем самым самоиндентификацию носителей (сх, молд, индонез.) 2. признание тех или иных идиомов (региональными) языками (Европейская хартия) 3. непризнание языков языками (Китай) Политический фактор 1. Названия языков часто определяются гос.актами, что может повлиять на самоиндентификацию носителей: • молдавский и румынский языки в советское время считались разными языками, сейчас в Молдавии используются то одно, то другое название; • малайский язык в Индонезии официально именуется индонезийским, в Малайзии используются оба названия: «малайский» и «малайзийский»; Политический фактор 2. Признание тех или иных идиомов (региональными) языками (Европейская хартия) • не все страны хотят её принимать (Франция) • идиом м.б. признан в одном гос-ве языком, а в другом оставаться диалектом (лимбургский в Нидерландах и Бельгии) Политический фактор 3. Непризнание языков языками. • Однако в одних случаях лингвисты обращают внимание на мнение государства (Китай), в других считают его реактивным (Грузия – мегрелы, сваны) . «Язык — это диалект с армией и флотом» • Шутливая фраза, популяризованная Максом Вайнрайхом, имеет мало смысла. Есть много государств с армиями (США, Бразилия, арабские страны), диалекты которых ничуть не становятся языками, и наоборот. • Единственный её возможный смысл: когда возникает новое государство, местный идиом может быть провозглашён отдельным языкам (иногда со сменой названия): Югославия, Индонезия. • Обратный случай: Молдавия. Сводная таблица требований критериев Критерии Требования Универсальность Постоянство во времени Непротиворечивос ть Генет. последовательност ь Этн. Мнение Полити Лит. ка норма общнос носител ть ей ✘ ✘ ✘ ✘ ✘ ☑ ~ ✘ ~ ~ ✘ ~ ✘ ✘ ~ ✘ Примеры сложных ситуаций • На практике используется некоторое мозаичное переплетение разных критериев. В одних случаях мы ориентируемся на то, в других на это. • Но нередко консенсус среди лингвистов признаёт наличие отд. языка, даже когда ни один из внешних критериев не работает. Пример: славяне Юж.Косова группа этн. перепись самоназвание языка язык, перепись горане горане, бошняки горански, нашенски горанский, бошняцкий, сербский средчане (жупляне) бошняки, сербы нашенски, жупски / сретечки боснийский, сербский подгоране (прекокамцы) бошняки нашенски боснийский рафчане албанцы рафчански, нашенски сербский хрватски хорватский яневцы Черногория • В 2011 году: • 45% считало себя черногорцами • 37% назвало свой язык черногорским. • Эти цифры меняются с каждым годом: Примеры сложных ситуаций Этн. Мнени Полит Мнени Критерии Лит. е ика е норм общно сть носите лингви а Язык лей стов Мегрельский ✘ ✘ ✘ ✘ ☑ Андийские ✘ ✘ ✘ ✘ ☑ Цаконский ✘ ✘ ✘ ✘ ☑ • Во всех этих случаях играют роль только лингвистические различия. Внутренние критерии (структурные) • Опираются на фактические различия между идиомами. Должны быть независимы от мнения людей. • Требуется сначала определить признаки сравнения, а затем пороговый уровень отличий. • Возможны несколько подходов. Внутренние критерии (структурные) • Сравнительно-исторический метод • Взаимопонятность • Измерение структурных различий Сравнительноисторический метод • Сравнительно-исторический метод – хорош для определения степени близости диалектов и границ между ними. • Позволяет определить относительные различия, но не даёт ответа на вопрос, где начинается уже отдельный язык. • Можно использовать как дополнительный к другим способам. Взаимопонятность • Наиболее популярный лингвистический критерий: если носители разных идиомов достаточно хорошо понимают друг друга (говоря каждый на своем идиоме), значит они говорят на диалектах одного языка, если же нет — на разных языках. Взаимопонятность • На практике осложняется многими другими факторами: предварительное знакомство с языком собеседника, тема общения, само желание или нежелание понимать собеседника и прочее. Поэтому этот структурный критерий становится социально обусловленным. • Кроме того, нередки ситуации «полукоммуникации», когда каждый из собеседников говорит на родном языке, но при этом свободно воспринимает язык собеседника. Взаимопонятность • Сложен в применении: обычно определяется на глазок. • Существует сложные методики, которые требуют значительных усилий и всё равно не убирают до конца субъективности. Измерение структурных различий • Можно предположить, что степени взаимопонятности соответствует степень структурных различий. • Однако, как их измерить? • Неизвестно универсального способа сравнить разницу в грамматике для всех языков в мире. • Остаётся лексика. Измерение структурных различий • Но лексики тоже много и всю её сравнивать тоже будет не универсально. • Остаётся базовая лексика. • И здесь наиболее оптимально использовать 100-словный список Сводеша, по которому уже накоплен большой опыт сбора и большое количество собранных списков. Лексикостатистика Гипотеза: • Предположим, что есть такой порог, что если процент совпадений (ПС) по списку базовой лексики между двумя идиомами ниже его, то их можно считать двумя разными языками, если выше – диалектами одного языка. Лексикостатистика • • • • Идея не новая: Сводеш / Вурм: 80% Кауфманн (индейские языки) Предлагаемая ниже система призвана привнести некоторый порядок в этот хаос, как некогда Линней – в систематику живых существ. Лексикостатистика • Для проверки нужны много качественно собранных и обработанных списков. • Лучший источник: Глобальная лексикостатистическая база данных (GLD) — http://starling.rinet.ru/cgi-bin/main.cgi?root=new100&encoding=utf-rus созданная силами московских компаративистов под руководством Г.Старостина и А.Касьяна. На февраль 2016 включала списки по 412 языкам из 87 групп и продолжает развиваться. • Использовались также другие источники, но они менее надёжны. Лексикостатистика • Попробуем определить этот порог. • Возьмём ПС для 130 пар близкородственных идиомов (ПС > 80). • Расположим их по двум осям: y – процент совпадений x – наше представление о том, между какими парами есть взаимопонимание. Для части пар мы заранее не знаем – серая зона. серая зона – мы не знаем, языки это или диалекты. Сравнение • Итак, мы видим, что границу между диалектами и языками (если не брать во внимание пары в серой зоне) можно провести между 90 и 89 %. • Возможно лучше считать 89-90% переходной зоной и учитывать в таких случаях дополнительные факторы. Соотношение 2 типов «языка» и терминология Традиционный "язык" и лингвистический "язык " могут соотноситься тремя способами: • языктрад > языклинг (макроязык) • язык = язык • языктрад < языклинг (язык. кластер) языктрад > языклинг • Один традиционный «язык» на самом деле состоит из нескольких языков. • Может употребляться термин «макроязык», чтобы показать их социальное единство: • арабские, китайские, даргинские, хантыйские, греческие, итальянский… Итальянский • Чётко разбиваются ретороманские, причём фриульский объединяется с венетским. • Хорошо выделяются: • сев.-итальянский ареал • тосканский язык • южно-итальянский язык Итальянский Североитальянский (без «н») представляет собой типичный диалектный континуум. Приблизительно его можно разделить на 3 части: • Запад: пьемонтско-лигурийский • Север: ломбардский • Юго-восток: эмильянороманьольсковенетско-фриульский Эмильянская зона Романьольсконижневенетская зона Верхневенетскофриульская зона Обско-угорские языки • Выделяются три хантыйских языка: – северный – южный – восточный • Мансийский: континуум из трёх компонентов Китайские языки Критерии за разные языки Лит. Норма ~ Этн. общность ✘ Мнение носителей ~ Политика Лексикостатисика ✘ ☑ ☑ Мнение лингвистов ~ Взаимопонимание • Один из камней преткновения. • Даже по традиционным методам неоднозначно. • Взаимопонимание отсутствует. • Лексикостатистика даёт огромные расхождения: больше чем для германских или романских. • Однако данных по отдельным идиомам пока очень мало, поэтому сказать сколько именно языков пока нельзя. Другие случаи • Пары с ПС < 90 % (т.е. языки): греческие языки: отдельно цаконский, каппадокийский, фарасский; другие пока не посчитаны; арабские языки – ПС между меккским и ливанским «д-тами» = 83%, требуется дальнейшее изучение. языктрад < языклинг • Несколько традиционных языков на самом деле являются диалектами/наречиями одного языка. • Этот случай более тяжело воспринимается как лингвистами, так и носителями. • По сути он не так важен, как первый случай. языктрад < языклинг • Таксономически в таких случаях вводиться несколько иная терминология: ПС языктрад < языклинг пример < 90% языковой кластер коми язык 90-95% наречие «язык» комизырянский > 95% диалект диалект ижемский Скандинавские языки • Состоят из двух языковых кластеров (=языков): островной кластер с двумя традиционными «языками» (=наречиями): исландским и фарерским континентальный кластер с тремя «языками»: норвежским, шведским, датским (вкл. букмол) Восточнославянские языки • Наиболее близки оказываются белорусский и украинский (ПС = 95), а у русского усреднённый ПС с ними = 88,7. • Т.е. можно говорить о белорусскоукраинском языковом кластере с двумя «языками». Другие примеры • Пары с ПС > 90 % (т.е. диалекты): 96: коми-зырянский / пермяцкий 96: ульчский / орокский 95: украинский / белорусский 95: кетский / югский 93: корякский / алюторский 91: чешский/словацкий Сложные ситуации • Диалектный континуум • Пиджинизация и смешанные языки • Сильное иноязычное или межъязычное влияние: количество заимстований извне или между сравниваемыми идиомами зашкаливает (балканороманские) Выводы • Существует две сущности под названием «язык»: собственно язык – набор лингвистических характеристик, сидящий в голове у носителя социальный язык – это проекция собственно языка, на которую наложены другие факторы, типа этнического сознания, лит. языка, политики и т.д. Выводы • Не существует единых критериев для решения проблемы «язык или диалект». • Поэтому, утверждая, что некий идиом является именно языком или именно диалектом, необходимо оговаривать, какой «язык» имеется в виду и на основании каких критериев делается этот вывод. Это значит, что на вопрос «язык или диалект?» нельзя ответить просто «да» или «нет», не оговаривая, что имеется в виду. Выводы • Для разных целей может быть востребовано то или иное понимание языка. Для целей, описанных в начале, важно скорее структурное понимание. • Но «социальный язык» тоже очень интересен и должен изучаться. • Присылайте вопросы и предложения: ybkoryakov@gmail.com СПАСИБО!