А. Я. Шайкевич* (Москва) ДИАХРОНИЯ В ЧАСТОТНОМ СЛОВАРЕ A b s t r a c t. Diachrony in the frequency dictionary. This paper is aimed at the analysis of chronological tables in five frequency dictionaries (Russian and French). Information in those tables to a great extent depends on the length of the periods reflected therein. Shortterm periods are important for content analysis and sociology, and only seldom — for linguistics. Longer periods give information relevant both to linguistics and humanities at large. The restructuring of the corpus which served for compilation of the frequency dictionary influences the chronological changes as well. К л ю ч е в ы е с л о в а: лингвостатистика; частотные словари; русский язык: русская проза Составители частотных словарей обычно подчеркивают прикладную ценность своих трудов. Чаще всего ссылаются на педагогические задачи, особенно на важность учета частоты в преподавании иностранных языков. Впрочем, первый частотный словарь русского языка (Josselson 1953), адресованный преподавателям, опирался на корпус в 1 млн словоупотреблений (1830—1950 гг.) и представлял диахронические данные по трем периодам. Развитие электроники облегчает создание корпусов текстов, одновременно меняются конечные цели, ради которых создаются частотные словари. Во главу угла ставится уже не прикладная задача отбора лексики для студентовиностранцев, но фундаментальная задача описания языка во всем разнообразии жанров, стилей и периодов развития. Первым замечательным образцом такого рода был «Dictionnaire des fréquences» (P., 1971). Соответствующий корпус в 70 млн словоупотреблений включает тексты художественной литературы от 1789 до 1964 г. В итоговых таблицах отражены четыре хронологических среза. Цель настоящей статьи — понять, какого рода информацию могут дать более или менее продолжительные периоды, представленные в таблицах частотного словаря. Начнем с самого краткого периода в один год, показанного в таблице «Хронологические изменения частот слов в “Независимой газете”» в «Статистическом словаре языка русской газеты (1990-е годы)» (Шайкевич и др. 2008) 1. 1 В таблицах даются относительные частоты слов: в Табл. 1, 9—13 на 1 млн словоупотреблений, в Табл. 2—8 — на 100 000 словоупотреблений. Институт русского языка им. В. В. Виноградова РАН 119019 Москва, ул. Волхонка, 18/2; cfrl@rli.ru 560 А. Я. Шайкевич Таблица 1 1. суд Кремль СМИ экстремист, -изм Березовский холдинг 2. Ельцин СССР Генерал Революция Коммунизм Гениальный дурак интеллигент диссидент ДВР ГКЧП 3. Лебедь Зюганов Явлинский Дудаев Грачев 4. секвестр Диана 5. доллар Рубль 6. Примаков Косово Степашин МВФ Пушкин импичмент 7. Путин Касьянов Гусинский подводный гимн вертикаль дзюдо 8. президент выборы соперник 1996 402 166 111 40 25 5 1212 425 319 150 76 30 31 24 18 17 13 480 452 205 119 75 ... 5 527 475 112 1 11 92 103 10 2 2 7 26 16 18 2 2638 1222 69 1997 411 187 165 32 65 11 811 309 235 132 40 27 19 24 17 16 5 130 100 65 28 16 46 24 559 562 159 1 12 78 103 13 2 1 9 25 18 15 ... 2376 551 32 1998 472 192 183 69 104 33 757 260 239 121 39 20 11 14 15 13 4 158 147 100 15 11 8 8 756 717 358 166 63 157 110 66 27 3 14 36 17 16 1 2474 874 44 1999 547 234 215 107 113 39 605 244 216 109 35 11 11 10 10 6 3 59 122 102 12 14 1 6 635 482 520 401 327 247 213 108 334 29 19 24 16 14 ... 2086 1211 46 2000 627 347 292 124 122 73 296 268 185 110 26 14 7 10 8 2 2 30 110 95 11 3 2 5 679 475 88 152 42 110 76 10 1448 180 164 116 62 61 7 2605 1038 60 Диахрония в частотном словаре Чечня боевик 9. балет Книга вы ну милый 10. олигарх дефолт 11. перфоманс перформанс PR пиар 1996 725 206 64 471 1100 193 39 ... – 9 1 1 1997 616 61 97 265 963 161 30 4 5 1 1 1998 335 48 93 269 937 131 25 71 13 4 3 4 ... 561 1999 560 200 109 217 730 104 19 34 33 1 3 2 1 2000 731 295 182 244 704 98 13 120 22 ... 2 5 11 Информация табл. 1 заинтересует прежде всего историков, социологов и политологов, которые отметят рост (1.1) или падение (1.2) частоты, пики частот в отдельные годы (1.3—1.7), двухвершинное распределение, связанное с ритмом президентских выборов (1.8). Слова, объединенные в группе 1.9, свидетельствуют о колебаниях частот в связи со структурными и стилистическими изменениями внутри «Независимой газеты». Лингвист обратит внимание на резкий подъем частоты в 1998 г. у слов олигарх и дефолт. Наконец, собственно лингвистический интерес представляет освоение недавних заимствований в группе 1.11. Обратимся теперь к таблицам частот, где столбцы соответствуют десятилетиям. Примером явится частотный словарь прозы XIX в., разрабатываемый в Институте русского языка РАН (Шайкевич 2012б). Начнем со слов, у которых хронологические колебания минимальны. Таблица 2 за по дорога лошадь квартира, комната, дверь, стена, пол, окно, стол 1820 449 479 58 41 1830 486 480 54 43 1840 443 464 44 38 1850 424 433 41 48 1860 475 446 43 41 1870 476 483 34 33 1880 459 462 41 42 1890 497 489 48 37 229 256 269 231 251 194 202 250 Такая стабильность вполне ожидаема у предлогов, но удивительна у следующих за ними знаменательных слов — свидетельство замечательного постоянства прозы. 562 А. Я. Шайкевич Таблица 3 1. нежели поутру другой день 2. вроде вообще из-за точно маленький все-таки все равно тон пальто 1820 29 18 20 1 8 11 16 21 6 5 3 - 1830 20 8 14 3 9 15 27 28 10 7 5 ... 1840 11 7 11 5 19 14 40 38 13 10 7 2 1850 5 6 14 9 24 19 44 45 28 11 13 5 1860 5 3 12 9 24 22 45 36 41 16 17 6 1870 3 3 8 9 21 25 40 41 42 16 17 4 1880 3 1 7 12 26 30 74 43 35 17 17 8 1890 1 1 9 14 23 33 99 71 38 20 20 12 Движение частот, отраженное в этой таблице, более или менее совпадает с нашими ожиданиями, но едва ли будет учтено обычными словарями. Хронологические изменения частоты становятся особенно выразительными при изучении пар (или целых групп) синонимов: Таблица 4 1820 1. чтобы, бы, между, ли, же, али, перед, через 1055 чтоб, б, меж, ль, ж, аль, пред, чрез 298 2. собой, мной, тобой, рукой, головой 26 собою, мною, тобою, рукою, головою 179 3. я, ты, мы, вы 4059 мой, твой, наш, ваш 1274 4. прежде 55 раньше 2 5. беспрестанно 17 постоянно 2 6. довольно 66 достаточно 3 7. добрый 87 18 хороший 1830 1840 1850 1860 1870 1880 1890 1204 1257 1250 1295 1421 1257 1286 345 250 240 236 225 102 107 61 104 133 138 116 108 146 151 3527 981 36 1 13 2 38 2 60 17 100 3712 722 41 2 20 9 52 4 55 32 68 3999 637 42 3 18 12 49 4 43 37 65 3792 580 45 5 9 13 42 9 39 35 61 3290 576 47 7 3 10 40 6 49 37 62 2835 510 32 15 2 10 25 11 39 42 55 3204 499 20 21 2 11 24 8 40 50 Диахрония в частотном словаре 1820 8. ибо 70 потому что 27 так как 11 9. весьма 57 совершенно 34 чрезвычайно 5 очень 75 10. возразил, -а 16 отвечал, -а 132 ответил, -а 1 11. ныне 6 нынче 2 теперь 137 сейчас 22 12. надобно 55 надо 12 нужно 12 придется, 5 пришлось приходится, -лось 1 13. и 4090 да (союз) 169 а 619 14. вот 103 ну 56 просто 8 значит 19 15. ли 232 563 1830 21 52 12 16 30 10 83 17 114 1 28 8 139 15 27 39 24 1840 15 75 20 28 56 15 146 15 85 2 5 8 165 35 32 48 44 1850 8 94 22 24 58 18 214 34 140 8 1 16 148 47 27 71 29 1860 12 82 31 26 57 10 183 13 69 23 5 15 203 66 13 92 46 1870 17 74 34 26 42 11 162 15 79 47 8 14 196 57 9 99 32 1880 10 69 32 10 28 4 127 7 29 39 3 12 176 61 4 86 52 1890 8 60 32 9 29 5 134 9 45 55 2 10 186 72 1 99 51 7 1 3812 304 519 168 63 17 14 266 10 7 4115 371 777 252 98 34 15 231 10 7 3933 304 791 225 168 35 32 213 12 8 4284 340 911 251 197 35 39 195 16 9 4438 372 1037 239 165 31 38 209 22 17 4441 272 1011 223 141 29 33 153 21 16 5013 249 1025 243 184 34 44 153 Таблицы 3 и 4, рассмотренные выше, так или иначе соотнесены с диахронической или жанрово-стилистической окраской слов, которая могла быть замечена лингвистами. Такова, например, тенденция сокращения доли притяжательных местоимений в общей частоте местоимений 1 и 2 лица (от 24 % в 1820-е гг. до 13 % в 1890-е гг.) 2. Некоторые тенденции обусловлены не движением языка, а движением литературы. Нижеследующие таблицы ограничены сферой прозы как таковой (без драмы), лингвистический материал выступает в ней лишь как средство, подчиненное задачам разработки темы, построения сюжета, ориентации на тот или иной стилистический регистр. 2 Не связано ли это с постепенным избавлением от галлицизмов? 564 А. Я. Шайкевич Таблица 5 1. итак между тем наконец признаюсь имя дочь, сын мальчик, девочка 2. баба мужик 3. о! бедный 4. сердце любовь страсть слеза 5. где-то, как-то, кто-то, что-то, почему-то 1820 27 43 83 11 51 130 8 3 6 55 50 131 77 16 53 1830 13 51 89 9 60 92 13 5 8 48 56 163 109 24 52 1840 11 36 129 10 26 67 29 18 23 29 48 100 61 15 54 1850 6 30 82 8 20 52 22 12 26 17 23 72 58 11 40 1860 5 31 82 4 24 57 21 18 33 27 24 56 46 15 32 1870 4 27 71 5 26 60 27 13 21 30 28 65 36 9 31 1880 4 21 50 2 24 58 29 19 29 18 25 55 37 9 32 1890 3 16 45 1 27 62 44 20 24 24 22 60 38 9 36 42 72 107 119 132 132 140 182 Монотонные тренды — не единственная возможность в лексической динамике литературы. Можно представить себе пик частоты слова или группы слов, приходящийся на одно или два десятилетия, или двухвершинное распределение в пределах изучаемого периода, ср.: Таблица 6 великий русский над, под, вокруг вода, ветер, земля, берег, море, небо, солнце, огонь 1820 54 62 176 1830 81 110 242 1840 20 45 176 1850 14 24 149 1860 20 44 171 1870 37 46 162 1880 38 37 189 1890 26 31 226 187 248 184 130 111 129 196 275 В русской прозе XIX в. довольно часто наблюдается распределение с одной вершиной, приходящейся на середину столетия, ср. 3: 3 Частоты -то даны без неопределенных местоимений типа что-то, где-то; частота -с не включает да-с, нет-с, ну-с. Диахрония в частотном словаре 565 Таблица 7 1. гостиная 2. перебил,-а прибавил,-а 3. впрочем 4. же даже 5. насчет про 6. уж -то -с 1820 6 1 8 18 331 72 5 15 37 46 1 1830 9 4 20 29 361 84 9 24 88 33 19 1840 10 9 22 51 483 145 8 35 147 154 59 1850 22 13 41 54 483 194 14 47 164 205 78 1860 14 8 31 43 593 189 17 59 167 240 97 1870 10 8 31 41 560 239 20 80 132 249 65 1880 14 4 15 29 456 155 13 46 107 176 40 1890 12 5 18 21 490 140 12 38 110 162 33 Создается впечатление, что русская литература, с 1840-х гг. качнувшаяся в сторону разговорности и простонародности, к 1880-м гг. пресытилась этими приемами. (Частица -с уходит из языка вообще.) Общие лексические тенденции прозы XIX в. отражаются и в творчестве отдельных писателей. Характерен случай Достоевского (Шайкевич и др. 2003): Таблица 8 1. а бедный бледный вдруг все равно давеча даже значит наконец о! сердце слеза 2. ведь именно особенно конечно разумеется 3. едва чуть 4. отвечать ответить 1844—49 657 76 34 173 9 1 183 7 240 30 205 101 157 47 23 49 25 44 35 100 8 1856—65 886 49 22 154 9 29 371 31 134 30 95 46 248 85 60 59 82 15 52 115 11 1866—72 842 31 20 318 27 53 415 22 129 71 66 27 222 78 55 92 47 20 61 51 38 1873—80 1050 24 13 390 28 43 376 27 78 91 103 31 201 122 50 91 37 7 30 30 49 566 5. пока покамест 6. отчего почему 7. теперь сейчас 8. надо надобно нужно 9. как будто как бы А. Я. Шайкевич 1844—49 4 22 47 28 334 35 13 7 97 200 21 1856—65 7 17 22 47 310 52 112 11 20 143 25 1866—72 24 11 8 61 309 97 115 5 12 66 114 1873—80 44 3 8 63 309 95 121 6 12 36 140 По большей части движение частот у Достоевского повторяет общие тенденции прозы. Исключением выступает междометие о!, максимально представленное в поздних романах писателя. Видно, как постепенно кристаллизуются лексические маркеры Достоевского (вдруг, давеча, как бы). В новейшем частотном словаре (Ляшевская, Шаров 2009), построенном на базе национального корпуса русского языка и охватывающем период 1950— 2007 гг., столбцы хронологических таблиц соответствуют двадцатилетиям, ср.: Таблица 9 1. ты, твой вы, ваш 2. он, его она, ее 3. человек мужчина женщина мужик баба 4. сказать говорить думать, подумать спросить, спрашивать 5. работа(ть) идти, пойти стоять, встать сидеть, сесть 6. жена, муж 7. товарищ господин 1950—1969 6391 6024 22413 9664 3237 203 582 100 139 5314 2595 1988 1846 1193 2833 1315 1442 575 721 151 1970—1989 6466 5230 21018 9651 2800 268 657 223 177 4686 2241 1827 1492 1055 2568 1081 1330 737 528 254 1990—2007 7024 4495 19574 10749 2476 391 804 286 177 3600 2048 1667 1435 961 1950 899 1176 1018 221 246 Диахрония в частотном словаре 567 Табл. 9 указывает как на социолингвистические процессы (9.1, 9.3, 9.7), так и на языковые приметы собственно литературных сдвигов, будь то в сфере строения прозы (9.4, 9.5) или в выборе тем и сюжетов (9.2, 9.6). В табл. 10 доминирует именно фактор тем и сюжетов. Таблица 10 1. война, бой, фронт армия, батарея, взвод, военный, госпиталь, дивизия, землянка, окоп, полк, раненый, тревога, тыл, штаб боец, командир, командующий, комбат, красноармеец, лейтенант, майор, разведчик, солдат, старшина немец(кий), фюрер, фашист автомат, бомба, граната, гусеница, орудие, пулемет, пуля, пушка, снаряд, танк 2. лагерь, лагерный, тюрьма барак, заключенный, зэк, конвой, нары, следователь 3. начальник, начальство приказ, приказ(ыв)ать бригадир, выступить, доклад, заведующий, председатель, разрешить, секретарь, указание 4. инженер, рабочий, чертеж наука(-чный), профессор, ученый геолог, изобретатель, лаборатория, музей, прибор, сыворотка, экспедиция 5. берег, ветер, волна, камень, куст, лес(ной), озеро, река, снег, солнце, трава деревня(-енский), изба, колхоз, печь, село, сено, хата картошка, каша, хлеб 1950—1969 960 1440 1970—1989 690 820 1990—2007 410 490 1530 1060 520 910 880 420 440 170 340 350 380 280 120 140 150 390 340 580 290 250 370 230 170 240 280 640 140 500 80 260 460 200 140 3100 2370 1710 880 620 300 360 300 220 В табл. 11 представлен целый комплекс социальных, литературных и собственно лингвистических процессов. 568 А. Я. Шайкевич Таблица 11 1. деньги, баксы, богатый, доллар, купить, продать, рубль, сумма 2. банк, бизнес, босс, клиент, офис, партнер, секретарша, товар, фирма 3. Бог, божий, господь, грех, молитва, монастырь, священник, церковь гроб, могила, покойник, похороны(-ить), прах, ритуал 4. бар, бокал, бутылка, вино, водка, выпить, выпивка, закуска, застолье, кафе, коньяк, кофе, пиво, пьяный, ресторан, рюмка, шампанское 5. квартира, балкон, ванная, гостиная, лифт, подъезд, прихожая, спальня, туалет, уборная, этаж коммуналка 6. вообще проблема ситуация абсолютно, буквально, вариант, демонстрировать, естественно, коллега, конкретный,-о, контроль, минимум, нормальный, плюс, практически, реакция, специально, тип, элита 7. дерьмо, задница, козел, сволочь, сука, тварь, хрен б..., г..., ж..., х... 1950—1969 670 1970—1989 910 1990—2007 1380 126 107 470 470 695 865 160 270 340 830 1120 1750 440 630 1200 — 240 37 19 350 5 337 70 57 580 14 4 456 153 121 940 111 173 313 12 38 89 Упоминавшийся выше «Dictionnaire des fréquences» дает следующее разбиение на хронологические столбцы: 4 Замечательный пример эволюции немаркированного (и потому почти не упоминаемого в литературе) случая в нечто социально маркируемое. Диахрония в частотном словаре 569 Таблица 12 1. avoir de, du 2. cependant pourtant 3. manière façon 4. ouvrage œuvre travail 5. face visage 6. mère maman 7. tu,toi vous 8. adieu bonheur, heureux, malheur(eux) fortune douleur, triste larme, pleurer 9. ciel dieux 10. baron, comte, cour, duc, duchesse, empereur, marquis, noble, prince, roi nom, nommer 11. beau bon, doux âme, cœur, sein 12. nation, peuple 13. non, pas mais déjà chose 14. bureau camarade certain exactement, justement chance geste type 1789—1848 18453 64445 482 203 416 112 259 172 279 151 151 473 25 3080 6697 236 1849—1879 18501 62031 407 312 236 212 97 230 319 275 219 726 86 3978 7128 188 1880—1918 18424 63010 287 363 214 226 69 332 336 316 268 504 93 3701 5483 85 1919—1964 18152 63254 278 402 259 265 75 340 350 249 441 479 123 3904 4679 57 1322 225 480 358 508 332 837 149 402 349 439 373 724 110 375 367 397 288 657 62 249 214 304 165 2682 842 965 703 1983 825 6701 4098 501 1111 46 46 380 58 36 64 24 1565 688 982 559 1429 371 7787 4083 482 1283 75 47 380 66 57 121 64 966 590 888 470 1523 330 8720 4431 605 1352 91 109 426 155 69 223 69 719 478 741 353 1113 281 9704 5169 708 1390 105 107 696 213 110 242 136 570 А. Я. Шайкевич 1789—1848 15. comprendre, expliquer, penser, pensée, savoir conscience 16. problème réalité, réel 17. blanc, bleu, noir, rouge arbre, bois, eau, froid, jardin bras, jambe, main cheveu, lèvre, œil, yeux, tête fenêtre, maison, mur manger, table dame, femme, fille, madame mari enfant 18. argent guerre, paix anglais, français état, gouvernement liberté, libre objet, sujet 1849—1879 1880—1918 1919—1964 2923 126 25 152 676 3110 137 37 137 1469 3682 217 65 234 1305 4309 334 173 398 966 1120 1173 1511 1738 1476 1665 1088 1352 1795 711 270 2371 1065 535 2387 1117 576 1864 898 421 1976 179 664 202 434 546 838 483 607 2647 253 859 126 295 385 483 311 304 2381 210 812 161 367 396 456 311 332 1537 117 613 322 598 580 564 417 577 Создается впечатление, что в эволюции французской прозы (в отличие от русских таблиц) перепады частот играли меньшую роль. Большей оказывается лексическая стабильность. Ясно виден контраст двух средних периодов с предшествующим и последующим. Впрочем, выделенные здесь периоды оказываются слишком продолжительными, что сужает круг потенциальных интерпретаций. Кажется, что оптимальная периодизация для подобного рода таблиц должна включать два уровня. На нижнем (более дробном) уровне периоды составляли бы 10—15 лет 5, на высшем уровне границы между периодами определялись бы эмпирически по максимальным лексическим контрастам между периодами низшего уровня. Частотные словари русского языка еще далеки от того, чтобы отразить лексическую эволюцию за один или два века. Однако уже сейчас можно приступать к сравнению частотных словарей разных периодов 6. Первый опыт в 5 В порядке гипотезы предложим для русской прозы такие границы между периодами нижнего уровня: 1821, 1841, 1856, 1881, 1905, 1917/18, 1931, 1940, 1956, 1990/91. 6 Общие принципы сравнения частотных словарей еще не разработаны. Диахрония в частотном словаре 571 этом роде отражен в публикации (Шайкевич 2012a), где частотный словарь русской прозы 1851—80 гг. сравнивался со словарем Ляшевской и Шарова. Обнаружено примерно две тысячи слов, чья частота в середине XIX в. статистически значимо превышала их частоту во второй половине XX в. Некоторые контрасты такого типа показаны в следующей таблице. Таблица 13 вы, ваш вздор ерунда возле подле довольно достаточно благодарить бы ли мать мама наоборот напротив вверх вниз, -у вернуться воротиться бандит вроде всерьез выяснить(ся) 1851—80 9460 116 2 81 96 446 52 169 3909 2150 714 67 13 176 51 114 161 118 2 95 1 7 1950—2007 4900 10 42 216 11 159 103 40 2968 1288 554 447 106 36 128 255 442 6 59 270 36 95 ах али весьма видать впрочем возразить да (союз) вообще нормальный вариант проблема барин лошадь извозчик кучер водитель машина верста километр ванная фильм трусы 1851—80 1950—2007 512 158 132 10 241 86 243 76 432 231 175 66 3790 1289 227 395 7 103 2 53 1 116 261 11 438 130 86 13 105 9 — 73 31 602 143 26 ... 77 ... 50 — 75 — 29 Следует помнить, что хронологические таблицы частотных словарей фиксируют факт изменения (или сохранения) частот. Интерпретация фактов — дело дальнейшего анализа. Конечно, есть случаи, когда объяснение лежит на поверхности. Тривиальными окажутся частоты у слов верста и километр. К чисто технологическим причинам сведется динамика частот слов лошадь, извозчик, кучер, водитель, машина. Слом социальной системы объяснит падение частоты слова барин и всей группы 10 в табл. 12. Общеевропейская экспансия абстракций станет фактором, объединяющим в одну группу слова с растущей частотой: вроде, вообще, нормальный, вариант, проблема, type, problème. Параллелизм социального развития у народов Европы 572 А. Я. Шайкевич позволит в одном ракурсе рассматривать сокращение частоты вы и vous, появление «детских» синонимов (мама и maman) у слов мать и mère. Менее очевидны (а иногда и загадочны) изменения частот у слов, не привязанных к определенной тематике. Почему сокращается частота слов бы и ли? Чем объяснить рост частоты у вниз и вверх? Что стоит за перетасовкой частот в группах синонимов? В любом случае для ответов на такие вопросы потребуется обращение к исходному корпусу текстов, что не всегда осуществимо в настоящее время. В более отдаленной перспективе можно ожидать прогресса и в самих частотных словарях, желательно включать в них не только слова, но и какие-то словосочетания, чаще разводить омонимию и полисемию. Литература Ляшевская, Шаров 2009 — Ляшевская О. Н., Шаров С. А. Частотный словарь современного русского языка, М., Азбуковник, 2009. Шайкевич 2012а — Шайкевич А. Я. Лексика русской прозы XIX в. на фоне Национального корпуса русского языка // Вестник РГГУ. Сер. «Филологические науки. Языкознание / Московский лингвистический журнал». 2012. 14. 8(88). С. 110—129. Шайкевич 2012б — Шайкевич А. Я. Лексическая динамика русской прозы XIX в. (Поколения прозаиков). М., 2012. Шайкевич и др. 2003 — Шайкевич А. Я., Андрющенко В. М., Ребецкая Н. А. Статистический словарь языка Достоевского, М.: Языки славянских культур, 2003. Шайкевич и др. 2008 — Шайкевич А. Я., Андрющенко В. М., Ребецкая Н. А. Статистический словарь языка русской газеты (1990-е годы), М.: Языки славянских культур, 2008. Dictionnaire des fréquences. P.: Didier, 1971. Josselson 1953 — Josselson H. H. The Russian word count and frequency analysis of grammatical categories of Standard Literary Russian. Detroit: Wayne University Press, 1953.