Утверждаю ________________________________ Зав. кафедрой ________________________________ Утверждено Ученым советом филологического факультета МГУ имени М.В. Ломоносова ________________________________ ________________________________ Председатель Совета д.ф.н. проф. М.Л. Ремнева Программа курса «Компьютерные технологии в филологии» по направлению подготовки 032700 «Филология» уровня подготовки высшего профессионального образования магистратуры с присвоением квалификации (степени) «магистр» II. Шифр дисциплины III. Цели и задачи дисциплины. А. Цели дисциплины. Внедрение компьютерных технологий в научно-исследовательскую практику магистрантов-лингвистов с целью углубления и интенсификации исследовательского процесса. Б. Задачи дисциплины. 1) Ознакомление магистрантов с основными областями компьютеризации лингвистических исследований. и задачами 2) Ознакомление магистрантов с основными видами информационных технологий, использующих и облегчающих лингвистический анализ; с проблемами разработки и совершенствования лингвистического обеспечения индустриальных информационных систем; с основными видами такого обеспечения и современным состоянием его разработки. 3) Ознакомление с основными функциями и возможностями средств создания и исследования лингвистических баз данных, в том числе корпусов текстов; а также с лингвистическими анализаторами; формирование основных навыков работы с ними. IV. Место дисциплины в структуре ООП: А. Информация об образовательном стандарте и учебном плане: — тип образовательного стандарта и вид учебного плана: учебный план АИС "Учебный план учебного комплекса МГУ", ММ_ФИЛОЛОЛОГИЯ — направление подготовки (в соответствии с образовательным стандартом): 032700.68 "Филология" Б. Информация о месте дисциплины в образовательном стандарте и учебном плане: — базовая часть; — тип: обязательный, профессиональный цикл — курс: 1 год обучения в магистратуре филологического факультета МГУ; — семестр: 1 В. Перечень дисциплин, которые должны быть освоены для начала освоения данной дисциплины: "Информатика", курс дисциплин по специальности "Современный русский язык" и "История русского языка". Г. Общая трудоемкость (в ак. часах и зачетных единицах); 72 час, 2,00 зачётных единиц Д. Форма промежуточной аттестации: коллоквиумы, рефераты, лабораторные работы, письменные работы; V. Формы проведения: семинары: 36 часов самостоятельная работа: 36 часов — формы текущего контроля (обсуждение прочитанного, коллоквиумы, проверка заданий, рефераты и др.); Итоговая форма контроля: зачет VI. Распределение трудоемкости по разделам и темам, а также формам проведения занятий с указанием форм текущего контроля и промежуточной аттестации: Трудоемкость (в ак. часах) по формам занятий (для дисциплин) и видам работ (для практик) Аудиторная работа (с разбивкой по формам и видам) № п/п Наименование разделов и тем дисциплины / Наименование разделов (этапов) практики Лекции Раздел I. Практические занятия (семинары) / Полевые работы 4 Лабораторная работа / Камеральная работа Самостоя тель-ная работа 4 12 12 компьютерных технологий в лингвистике. Электронные базы данных и корпуса текстов, доступные для исследования. Раздел III. возможности стандартных и специализированных средств обработки текстов, создания и исследования баз данных. Проверка выполненны х заданий. Коллок виум 8 8 Обсуждение прочитанного Проверка выполненны х заданий. 12 12 Обсуждение прочитанного Проверка выполненны х заданий. Проблемы разработки лингвистических анализаторов. Индустриальная обработка языковых данных и место в ней лингвистического анализа. Раздел IV. Функциональные Обсуждение прочитанного Коллок виум Области компьютеризации лингвистических исследований. Раздел II. Результаты применения Формы контроля VII. Содержание дисциплины по разделам и темам (этапам) – аудиторная и самостоятельная работа: 1. Раздел I. Области компьютеризации лингвистических исследований. Ознакомление магистрантов с общим кругом областей и проблем компьютерного моделирования и анализа материала естественного языка. 1.1. Название темы Общие проблемы компьютерного моделирования и анализа материала естественного языка. Содержание темы Анализ соотношения онтологии естественного языка и средств и приёмов формального отображения его устройства в алгоритмах вычислительных устройств. Особенности моделирования синхронных срезов и диахронных процессов языка. 1.2. Название темы Построение и анализ синхронных и диахронных текстовых и речевых корпусов. Содержание темы Обобщение опыта создания и использования текстовых корпусов в целях их лингвистического анализа. Принципы отбора и маркировки текстов, организации текстовой базы и системы манипулирования лингвистическими данными. 1.3. Название темы Построение и анализ синхронных и диахронных словарных баз данных. Содержание темы Анализ задач, средств и приёмов создания и использования баз данных по русским и английским словарям различных типов. 1.4. Название темы Разработка и реализация на компьютере математических моделей языкового существования-развития. Содержание темы Выявление и анализ проблем разработки и использования компьютерных математических моделей синхронии и диахронии языка. 1.5. Название темы Разработка и приложение комплекса математических средств анализа устройства текста с помощью компьютера. Содержание темы Анализ мирового опыта и собственных разработок лаборатории общей и компьютерной лексикологии и лексикографии (ЛОКЛЛ филфака МГУ) в области математического анализа текстов. 1.6. Название темы Авторские корпуса текстов и их использование в лингвистическом и литературоведческом анализе. Содержание темы Принципы отбора и маркировки текстов, текстологические и др. проблемы. 1.7. Название темы Создание и анализ БД по психолингвистическим экспериментам по выявлению уровня и характера знания лексики носителями русского языка Содержание темы Анализ методики сбора данных по указанным экспериментам, создания на их основе БД, её пополнения общеязыковыми данными и квантитативносистемного лингвистического анализа. Раздел II. Результаты применения компьютерных технологий в лингвистике. Электронные базы данных и корпуса текстов, доступные для исследования. 2.1. Название темы. Лингвистически ориентированные продукты в Интернете. Содержание темы Обзор электронных конкордансов, корпусов текстов, лексикографических баз данных и пр., имеющихся в Интернете. 2.2. Название темы. Национальный корпус русского языка: состав, типы информации и функциональные возможности. Содержание темы 2.3. Название темы. Специализированные корпуса текстов (на материале электронных корпусов ЛОКЛЛ МГУ) - анализ принципов и целей создания, результатов и возможностей их использования. Содержание темы «Полистилевой корпус современного русского языка; «Компьютерный корпус русских газет конца 20 века" (ККРГК 20 века); корпус «Стихи и драматургия Пушкина», «Корпус художественных произведений А.П.Чехова». 2.4. Название темы Специализированные неологические БД, их использование для вскрытия закономерностей лексико-семантической и словообразовательной эволюции русского языка. Содержание темы Анализ принципов создания БД по новым словам «Корпуса русских газет конца 20 века» и результаты её использования при анализе закономерностей развития русской лексики. БД лексических неологических данных по словарю «Новые слова и значения» (1984). 2.5. Название темы Использования БД при анализе закономерностей исторического развития лексики и.-е. языков. Содержание темы БД по «Словарю древнерусского языка». БД по «Этимологическому словарю славянских языков». БД по глоттохронологическому списку индоевропейских языков. БД по «Хронологическому морфемно-словообразовательному словарю русского языка» (ХМССРЯ). 2.6. Название темы Использование БД для изучения синонимии. Содержание темы Базы данных по «Словарю синонимов» русского языка А.П.Евгеньеой (1975) и английскому словарю синонимов «Webster’s New Dictionary of Synonyms» и результаты их использования при анализе закономерностей устройства лексической синонимии этих языков. 2.6. Название темы «Тезаурусные» базы данных. Содержание темы БД на основе «Тезауруса синонимов русской речи»; БД на основе «Семантического словаря русского языка». 2.7.Название темы Исследование грамматических особенностей и вариантов словоизменения с помощью БД «Грамматический словарь русского языка» А.А. Зализняка Содержание темы Получение частотных словарей на основе данной БД. Исследование с их помощью системы частей речи, вариантов русского словоизменения и ударения. 2.8.Название темы Разработка и компьютерная реализация модели эволюции лингвистических систем (на основе «Модели жизненного цикла языкового знака»). Содержание темы Анализ проблем разработки системной теории эволюции знаковых единиц и ансамблей в Языке Человека, формализация и квантификация основных параметров, подбор математического аппарата, постановка вычислительных экспериментов и их интерпретация. Раздел III. Проблемы разработки лингвистических анализаторов. Индустриальная обработка языковых данных и место в ней лингвистического анализа. 3.1. Название темы Информационный поиск (ИП) в Интернете. Содержание темы Анализ проблем лингвистического обеспечения ИП 3.2. Название темы Машинный перевод (МП). Содержание темы Анализ лингвистических проблем МП. 3.3. Название темы Интеллектуальный поиск информации (ИПИ) в текстовых массивах (data mining) Содержание темы Анализ лингвистических проблем ИПИ 3.4. Название темы Системы распознавания устной речи Содержание темы Анализ лингвистических проблем построения и использования систем распознавания устной речи 3.5. Название темы Автоматическая классификация и распознавание текстов различных типов. Содержание темы Анализ проблем автоматической классификации и распознавания текстов различных типов (индивидуальная, гендерная и жанровая специфика) 3.6. Название темы Контекстуальные словари (КС) и экспертные системы для сбора контекстуальной информации по снятию многозначности лексических единиц Содержание темы Анализ опыта разработки контекстуальных словарей на русском и английском материале. Принципы разработки экспертных систем для ускорения разработки КС. 3.7. Название темы 3.8. Основные компоненты и виды лингвистических анализаторов. Автоматический морфологический анализ и синтез. Содержание темы Анализ проблем разработки и использования лемматизаторов и морфологических анализаторов в анализе данных русского языка. 3.9. Название темы Автоматический морфемный анализ. Содержание темы Анализ проблем разработки и использования морфемных анализаторов в приложении к данным русского языка. 3.10. Название темы Разработка денотативно-смысловых анализаторов Содержание темы Анализ проблем разработки и использования тезаурусов в денотативносмысловом анализе данных русского языка 3.11. Название темы Разработка семантико-синтаксических анализаторов. Содержание темы Анализ проблем разработки и использования лексико-семантических и формальных синтаксических признаков в разработке алгоритмов синтаксического анализа текстов русского языка. 3.12. Название темы Разработка устно-речевых анализаторов. Содержание темы Анализ проблем разработки и использования устно-речевых анализаторов 3.13. Название темы Разработка комплексных лингвистических анализаторов и экспертных лингвистических систем. Содержание темы Анализ систем МП как примера комплексных лингвистических анализаторов. Использование экспертных лингвистических систем при решении индивидуально-автороведческих проблем, распознавании гендерных, жанровых и иных характеристик текстов. Раздел IV. Функциональные возможности стандартных и специализированных средств обработки текстов, создания и исследования баз данных. 4.1.Название темы Лингвистические функции и возможности Word. Содержание темы Особенности получения элементарной статистики. Возможности расширенного поиска и замен. Проблема проверки орфографии и пунктуации, реферирования, составления предметных указателей, анализа стиля, сравнения текстов. Подготовка текстов для корпусов, создаваемых магистрантами. 4.2.Название темы Создание и исследование баз данных с помощью Excel. Содержание темы Создание базы данных. Подготовка материала для БД, создаваемых магистрантами. Анализ материала с помощью сводных таблиц и диаграмм. Использование формул. 4.3.Название темы Основные возможности, предоставляемые макросами Excel. Содержание темы Разбор основных возможностей VBA и некоторых макросов, автоматизирующих анализ данных. 4.4. Название темы Создание, разметка и исследование корпусов текстов с помощью системы Dictum-2 (ЛОКЛЛ МГУ). Содержание темы Знакомство с функциями системы. Самостоятельное создание и обработка электронного корпуса текстов. Извлечение из него материала для собственной БД. 4.5.Название темы Компьютерная информационно-исследовательская система «ИСТОК»(ЛОКЛЛ МГУ) и проведение с ее помощью исследования размеченного корпуса текстов Содержание темы Знакомство с функциями системы. Проведение самостоятельного исследования конвертированных в неё корпусов. 4.6. Название темы Квантитативное исследования стиля текстов с помощью программы «StyleAnalyser» (ТомскГУ, ЛОКЛЛ МГУ) Содержание темы Знакомство с функциями системы и реализованными в ней статистическими функциями. Проверка с помощью этих инструментов различительной силы разных лингвистических признаков на текстах разных жанров и авторов. VIII. Перечень компетенций, формируемых в результате освоения дисциплины - способность самостоятельно формулировать научные проблемы на основе адекватного анализа научной традиции и современных тенденций (М-ОНК-2); - способность к самостоятельному пополнению, критическому анализу и применению теоретических и практических знаний в сфере гуманитарных наук для собственных научных исследований и практической деятельности (М-ОНК-3). - владение основными методами, способами и средствами получения, хранения, переработки информации; умение анализировать и совершенствовать методы, способы и средства работы с информацией, в соответствии с поставленными задачами (М-ИК-3); - владение навыками использования программных средств, способность самостоятельно определять и осваивать необходимое для профессиональной деятельности аппаратное и программное обеспечение (М-ИК-4). способность к поиску, критическому анализу, обобщению и систематизации научной информации, к постановке целей исследования и выбору оптимальных путей и методов их достижения (М-СК-2); - способность к самостоятельному обучению и разработке новых методов исследования, к изменению научного и научно-производственного профиля деятельности; к инновационной научно-образовательной деятельности (М-СК-3); - умение выстраивать прогностические сценарии и модели развития коммуникативных и социокультурных ситуаций (М-СК-5). - знание актуальных проблем и современных методов филологической науки, понимание структуры и перспектив развития филологии как области знаний, междисциплинарных связей филологии (М-ПК-1); - умение применять филологическую теорию в прикладных областях (М-ПК-7); -умение трансформировать различные типы текста (изменение стиля, жанра, целевой принадлежности текста, перевод словесных гипертекстовые и электронные и т.п.) (М-ПК-9); текстов в мультимедийные, печатных в -умение оказывать филологические экспертные и консультационные услуги в различных областях науки и образования, культуры, производства, общественнополитической жизни и государственного управления (М-ПК-14); IX. Используемые образовательные, производственные технологии: научно-исследовательские А. Аудиторные занятия и самостоятельная работа и научно- Б. Работа с оригинальными программными средствами, базами данных и корпусами текстов ЛОКЛЛ филологического ф-та МГУ. В. Подготовка самостоятельного продукта (БД или корпуса текстов), пригодного для использования обучаемым и другими специалистами – как практическая реализация полученных знаний. X. Учебно-методическое обеспечение самостоятельной работы студентов, оценочные средства контроля успеваемости и промежуточной аттестации: А. Учебно-методические рекомендации для обеспечения самостоятельной работы студентов: Самостоятельная работа студентов обеспечивается доступностью рекомендуемой литературы, доступностью основных программных продуктов и систем, обсуждаемых в курсе, для студентов (в лаборатории общей и компьютерной лексикологии и лексикографии филологического факультета, на материальной основе и собственных компьютернолингвистических продуктах которой базируется данный курс). Б. Примерный список вопросов и заданий для проведения текущей и промежуточной аттестации (а также тем для докладов и рефератов): - Типы информации (зоны) в толковом словаре и организация БД для анализа словаря по этим зонам. - Анализ проблем автоматической классификации и распознавания текстов различных типов (индивидуальная, гендерная и жанровая специфика текстов). - Анализ проблем разработки и использования лемматизаторов и морфологических анализаторов в анализе данных русского языка. - Анализ принципов и целей создания, системный анализ БД по закономерностям сохранности общеславянского лексического фонда в современных славянских языках. - Анализ принципов и целей создания и результатов использования Корпуса «Стихи и драматургия Пушкина». - Анализ принципов и целей создания и результатов использования Чеховского корпуса - Анализ принципов и целей создания БД по корпусу газетных текстов конца 20 века, результаты её использования при анализе закономерностей развития русской лексики. - Анализ принципов и целей создания БД по «Хронологическому морфемнословообразовательному словарю русского языка», результаты её использования при анализе закономерностей словообразовательного развития русской лексики. - Анализ принципов и целей создания БД по русской и английской лексической синонимике (по материалам словарей «Словарь синонимов» А.П. Евгеньевой и «Webster’s New Dictionary of Synonyms»), результаты её использования при анализе закономерностей устройства лексической синонимии русского английского языка. - Принципы сбора данных, организации и анализу БД по тестированию индивидуального знания лексики и др. - Исследовательские задания: каждый магистрант должен с использованием предоставляемых ему компьютерных средств создать и исследовать базу данных или корпус текстов, связанный с темой его научно-исследовательской работы. XI. Учебно-методическое и информационное обеспечение дисциплины Основная литература к курсу. № п/п Разд ел Автор Отв. редактор Место Название книги / Издатель(для издастатьи ство коллектив- ния ных работ) Год издания Название журнала (сборника) Том (выпуск) Номер Раздел журнала журна про/ ла граммы сборник а Аверина С. А., Азарова И. В., Алексеева Е.Л. и др. Прикладное языкознание. СПб. Изд-во СПбГУ. 1996. III 2 Алексеев П.М. Статистическая лексикография (типология, составление и применение частотных словарей). – Л.: ЛГПИ им. А.И. Герцена, 1975. I 3 Аношкина Ж.Г. Подготовка частотных словарей и конкордансов на компьютере. М., 4 Бакулов А. Д., Леонтьева Н. И., Шаляпина 3. М. Отечественные системы машинного перевода // М., 5 Беляева Л. Н., Герд А. С., Убин И. И. Автоматизация в лексикографии // СПб. 6 Хронологический морфемноБогданов словообразовате В.В., льный словарь Крюкова русского языка: О.С., создание базы Поликарпов данных и ее А.А. системноквантитативный анализ // 1 М.: 1995. 1990. Искусственный интеллект. Кн. 1. Систем ы общения и экспертн ые системы . III Изд-во 1996. СПб. Ун-та Прикладная лингвистика. I Московски 1998 й лицей, Вопросы общего, сравнительноВып.2. исторического, сопоставительн ого языкознания. II № п/п Разд ел Автор Отв. редактор Место Название книги / Издатель(для издастатьи ство коллектив- ния ных работ) Компьютерные Гринбаум О. аспекты Н. стилеметрии // Год издания Название журнала (сборника) Том (выпуск) Номер Раздел журнала журна про/ ла граммы сборник а СПб. Изд-во 1996. СПб. Ун-та Прикладное языкознание. II Исаев И. А. Опыт автоматизации лексикографичес ких исследований. Система DIALEX // М., Ин-т русского языка Российско 1996. й академии наук. Слово Достоевского. II 9 Казакевич О.А. Исследование текстовых баз данных в лингвистических исследованиях: обзор 9зарубежных работ // М. 1988 Научнотехническая информация. 10 Исследование системных параметров Колодяжная лексики на Л.И., основе Поликарпов компьютерной А.А. версии синонимического словаря // М., 11 СистемноКолодяжная квантитативное Л.И., исследование Поликарпов русской А.А. синонимии // Сыктывк. Сыкты гос. 1997. вкар: университ ет, 7 8 12 Кукушкина О.В. Словарная база данных "Грамматический словарь русского языка" А.А. Зализняка // 13 Кукушкина О.В., Поддубный В.В., Поликарпов А.А., Шевелев О.Г. Автоматическая классификация текстов корпуса русских текстов конца ХХ века по жанровым типам и источникам. // 14 Проверка теоретически Кукушкина предсказанных О.В., неодериватологи Отв. ред. Поликарпов ческих М.И.Черн А.А., закономерностей ышёва). Токтонов данными русской А.Г. корпусной неодериватогра фии // ( Серия 2. №6, I Т. 2. II Альманах "Говор". Ч.1. D. - II Сыктывк. Cыкты гос. Альманах 1997. вкар: университ "Говор".ет, Ч.1. D. - II Ин-т русского языка РАН. - Труды машинного 1992. фонда русского языка. Изд-во Москв Моск. уна, та, 2007. Русский язык: исторические судьбы и современность. Труды и материалы. М., 2008. – Теория и история славянской лексикографии.– 15 Кукушкина О.В., Поликарпов А.А., Хмелёв Д.В. Определение авторства текста с использованием буквенной и грамматической информации // М., 2001. Проблемы передачи информации. 16 Диск CD-ROM: КИИСа. Корпусная информационнопоисковая Кукушкина, система . Выпуск О.В., А.А. 1. "Поэзия и Поликарпов, драматургия В.В.Федотов А.С. Пушкина и . Путеводитель по Пушкину". – МГУ им. М.В.Ломоносова. Филологический М.: 2006. http://www.philol. msu.ru/~humlang /articles/polystylc orp.html Изд-во Моск. унта, Т. 37, №2 - II II II IV № п/п Разд ел Автор Отв. редактор Место Название книги / Издатель(для издастатьи ство коллектив- ния ных работ) Год издания Название журнала (сборника) Том (выпуск) Номер Раздел журнала журна про/ ла граммы сборник а факультет. Кафедра русского языка. Лаборатория общей и компьютерной лексикологии и лексикографии, 17 Читаем и исследуем. Работа с корпусами Кукушкина, текстов с О.В., А.А. помощью Поликарпов, информационноВ.В.Федотов исследовательск . ой системы КИИСа. Выпуск 1: «Поэзия и драматургия А.С.Пушкина». - М.: Изд-во Моск. унта, 2006. - IV 18 Мартыненко Основы Г.Я. стилеметрии. – Л.: Изд-во Ленингр. ун-та, 1988. – I 19 Марусенко М. В. Атрибуция анонимных и псевдонимных литературных произведений методами теории распознавания образов. Л., 1990. I 20 Мельников Г. П. Системология и языковые аспекты кибернетики. - Москв Советское 1978. а: радио, http://www.philol. msu.ru/~lex/melni kov/meln_r/titl.ht m 21 Диссипативная стохастическая Поддубный, динамическая В.В., А.А. модель развития Поликарпов. языковых знаков // М. 2011 Компьютерные исследования и т. 3, моделирование. - 22 Эволюционное обоснование "Закона Менцерата" и Поликарпов поиск базовой А.А. функциональной зависимости длин морфем от их позиционных характеристик // Новос Изд. ибирск НГПУ, , 2005. Квантитативная лингвистика: Исследования и модели. - II 23 Поликарпов А.А., Бушуева О.В. Опыт построения контекстуальног о словаря и анализ его устройства // 1988. – Теоретические и практические проблемы прикладной лингвистики. – IV 24 Поликарпов А.А., Кукушкина О.В., Виноградов а В.И., Пирятинска я Е.Ф., Савчук С.О. Компьютерный под ред. корпус текстов М.Н.Волод М.: современной иной. русской газеты // Язык средств массовой информации. – II 25 Стилистика, семантика, грамматика: Поликарпов опыт анализа А.А., Курлов системных В.Я. взаимосвязей (на основе анализа данных толкового М.: М. Изд-во Моск. унта, Академиче ский 2008. проект; – Альма Матер, 1994. - Вопросы языкознания, I № 2. - № 1, II I № п/п Разд ел Автор Отв. редактор Место Название книги / Издатель(для издастатьи ство коллектив- ния ных работ) Год издания Название журнала (сборника) Том (выпуск) Номер Раздел журнала журна про/ ла граммы сборник а словаря) // 26 Степень абстрактности и субъективности Поликарпов смысла – А.А., факторы Селезнева- варьирования Елецкая степени Л.А. сохранности во времени его лексических обозначений // Составите ль В.А. М.: Кочергина. – Изд-во Моск. унта, 2004 Сравнительноисторическое исследование языков: Современное состояние и перспективы. Сб. статей по материалам международной научной конференции (Москва, 22-24 января 2003 г.). / II Изд-во Моск. унта, Проблемы славянского языкознания в контексте индоевропейског о сравнительноисторического языкознания. 2001. Тез. докл. научн. конф. Москва, филологический факультет МГУ им. М.В.Ломоносова . 30-31 октября 2001 г. - II Язык. Глагол. Предложение. К 70-летию 2000. Георгия Георгиевича Сильницкого. - II 27 Зависимость сохранности общеславянской лексики во Поликарпов времени от А.А.. категориальной принадлежности и возраста слов // М.: 28 Закономерности образования новых слов: Поликарпов моделирование А.А.. процесса и его экспериментальн ое исследование // Изд-во Смоле Смоленск нск, ого ун-та 29 Шайкевич А.Я. Дифференциаль ные частотные словари и исследование языка Достоевского (на материале романа “Идиот”) // 30 A System for Compilation and Kolodyazhna Analysis of Czap, H., ya, L.I., Computerized Nedobity Polikarpov, Philological W. (eds). A.A. Dictionaries Using a Personal Computer. 31 Study of Quantitative Correlations Kolodyazhna between ya, L.I., Stylistics, Polikarpov. Grammar and A.A. Polysemy of Words (On the Basis of Ozhegov Dictionary) // 32 Kukushkina Olga V., Polikarpov Anatoliy A. DicTUM-1 - A System for Dictionary-Text Universal Manipulations and Analysis // 33 Kukushkina, Using Letters and O. V., Grammatical М.: Ин-т русского языка Российско 1996. й академии наук. Слово Достоевского. II Frankf Indeks urt/M. Verlag, 1990 TKE`90: Terminology and Knowledge Engineering. II Москв а, Qualico-94. 2-ая Международная конференция по квантитативной 1994. - лингвистике, 20- Vol.2. 24 сент. 1994 г., Москва, МГУ, филологический факультет. - II Mosco w. - 1996 XI International Conference "History and Computing", Moscow, Moscow State Universiti, August 20-24 1996. - М. 2001 Problems of Information IV II № п/п Разд ел Автор Polikarpov, A. A., and Khmelev, D. V. Отв. редактор Место Название книги / Издатель(для издастатьи ство коллектив- ния ных работ) Год издания Statistics for Authorship Attribution // Название журнала (сборника) Том (выпуск) Номер Раздел журнала журна про/ ла граммы сборник а Transmission. Leipzig , Linguistische ArbeitsBerichte. Institut fuer Linguistik Universitaet Leipzig. 3. 2000. - Europaeische Konferenz "Formale Beschreibung slavischer 35Spachen, Leipzig 1999". Vol.37, Mosco w– Varna, 2004. – Text Processing and Cognitive Technologies. № 75.- II 2006. – Contributions to the Science of Text and Language: Word Length Studies and Related Issues. – № 9, II 34 Chronological Morphemic and Word-Formational Dictionary of Polikarpov A. Russian: Some A. System Regularities for Morphemic Structures and Units // 35 Cognitive Mechanisms for Emergence of Polikarpov A. some Regularities A. of Human Language Evolution // 36 Towards the Foundations of Menzerath’s Law: On the Functional Polikarpov A. Dependence of A. Affixes’ Length on their Positional Number within Words // 37 Koehler, Polikarpov A. On the Model of Dordre R., Rieger, Kluwer, A. Word Life Cycle // cht: B. (eds.) 38 Using Corpus for the Benefit of Neoderivatology: Theoretical and Experimental Polikarpov A. Study of New A. Words Based on Data from «Polystylistic Corpus of Modern Russian Texts» // Dordre Springer, cht: Contributions to 1993. - Quantitative Linguistics. - Frantisek Sticha, Mirjam Praha: Academia, 2008. Fried (eds.) // Grammar and Corpora. Gramatika a Korpus 2007. (Selected contributions from the conference “Grammar and Corpora, Sept. 25-27, 2007, Liblice). — Issue 2. - II II IV Дополнительная литература к Программе № п/п Автор Название книги / статьи Отв. редактор (для коллективных работ) Место ИздаГод издательство издания ния Название журнала (сборника) 1 Апресян Ю.Д. и др. Лингвистическое обеспечение системы ЭТАП-2. М., Наука, 1988. 2 Ахмеджанов М.С., Э.И. Королёв, А.А.Поликарпо в, И.И.Ратцева, М.М.Розенбер г, Т.Г.Тройнова. Дистрибутивностатистический метод анализа лексики и его реализация на ЭВМ // М.: Изд-во Моск. ун-та, 1989. Прикладные аспекты лингвистики. – 3 Бакулов А. Д., Теоретические аспекты Леонтьева Н. машинного перевода // 1990. Искусственны й интеллект. М, Том (выпуск) журнала / сборника Номер журнала №№ разделов программы III II Кн. 1. Системы общения и III № п/п Автор Название книги / статьи Отв. редактор (для коллективных работ) Место ИздаГод издательство издания ния Название журнала (сборника) Н. Том (выпуск) журнала / сборника Номер журнала №№ разделов программы экспертные системы. 4 Баранов А. Н., Немецкая корпусная Добровольски лингвистика // й Д. О. М. 5 Виноградов В. Проблема авторства и В. теория стилей. М., 6 ГаазеРапопорт М. Г., Поспелов Д. А., Семенова Е. Т. Имитация сказочного мира // Изд-во Тартуско Тарту, го 1984. универс итета, 7 Герд А. С. Научно-техническая лексикография // СПб., 8 Гребенников А.О. (сост.). Частотный словарь рассказов А.П. Чехова. 9 Караулов Ю. Н. Лингвистическое конструирование и тезаурус литературного языка. 10 Кобозева И. Моделирование М., Лауфер Н. общения в человекоИ., Сабурова машинных системах // И. Г. М., 11 Кукушкина О.В., Поликарпов А.А. Жанровое распределение русских предлогов в корпусе современной газеты // Минск, 12 Кукушкина О.В., Поликарпов А.А., Пирятинская Е.Ф. «Полистилевой корпус текстов современного русского языка»: задачи, принципы, первичный анализ Под ред. Г.Я. СПб: Мартыненко. М., 1998 Наука, Вестник МГУ. Сер. Иностранные языки. № 1. II 1961. Изд-во СПб. Ун- 1996. та IV Уч. зап. Тартуского гос. ун-та. Вып. 688. Принципиальн ые вопросы теории знаний. II Прикладное языкознание. IV Изд-во СПбГУ. 1998. II Наука, 1981. IV 1987. Лингвистическ ое обеспечение информацион ных систем. I 2003. Язык и социум. – II М. 2006 http://www.phil ol.msu.ru/~hum lang/articles/pol ystylcorp.html II Наука, Труды машинного фонда русского языка. Т. 1. II 13 Леннгрен Л., Ферм Л. Уппсальский машинный фонд русского языка // М. Ин-т русского 1991. языка РАН 14 Леонтьева Н. Современное состояние Н, Шаляпина машинного перевода // 3. М. М., 1990. Искусственны й интеллект. Кн. 1. Системы общения и экспертные системы. III 15 Маккьюин К. Дискурсивные стратегии для синтеза текста на естественном языке // М., 1989. Новое в зарубежной лингвистике. Вып. XXIV. Компьютерная лингвистика. II 16 Мартин Дж. Организация баз данных в вычислительных системах. М., 1980. 17 Олкер X. Р. Волшебные сказки, трагедии и способы изложение мировой истории // М., 18 Панков И. П., Захаров В. П. Информационнопоисковые системы // СПб., 19 Поддубный, В.В., А.А. Поликарпов. Вывод закона синхронного полисемического распределения языковых знаков на основе диссипативной стохастической динамической модели эволюции знако вых ансамблей // М.: Добросв 2011 ет, 20 Поликарпов А.А. Теоретические проблемы прикладной лексикологии // М. 1989 Наука, IV 1987. Язык и моделировани е социального взаимодейств ия. II 1996. Прикладное языкознание. I Синхронное и диахронное в сравнительноисторическом языкознании. II Вестник МГУ. Сер.9 Филология. № 5. - I № п/п 21 22 Автор Название книги / статьи Отв. редактор (для коллективных работ) Место ИздаГод издательство издания ния Поликарпов А.А. Проблемы и перспективы автоматизации лексикологического и лексикографического анализа с помощью ЭВМ // Киев: Поликарпов А.А., Крюкова О.С. О системном соотношении краткого и среднего толковых словарей русского языка // Название журнала (сборника) Том (выпуск) журнала / сборника Номер журнала №№ разделов программы Наукова 1990. думка, Использовани е ЭВМ в лингвистическ их исследования х. - I Изд-во Тартуско Тарту: го 1989. универс итета, Квантитативна я лингвистика и автоматически й анализ текстов. - II 2001. - Русский язык: исторические судьбы и современност ь. Международн ый конгресс русистовисследовател ей. Москва, филологическ ий ф-т МГУ им. М.В.Ломоносо ва. 13-16 марта 2001 г. Труды и материалы. - II II Поликарпов А.А., Кукушкина О.В., Виноградова В.Б., Савчук С.О. Компьютерный корпус текстов русских газет конца 20-го века: создание, категоризация, автоматизированный анализ языковых особенностей // М.: 24 Поликарпов А.А., Филимонова Т.В. О системной зависимости негативно окрашенных денотативно-смысловых и субъективнооценочных характеристик фразеологических единиц от их возраста // М. 2005. Text Processing and № 11, Cognitive Technologies. 25 Попов Э. В., Особенности Преображенск реализации ЕЯ-систем // ий А. Б. М., 1990. Искусственны й интеллект. 26 Севбо И. П. Графическое представление синтаксических структур и стилистическая диагностика. Киев, 27 Сзлтон Г. Автоматическая обработка, хранение и поиск информации. М, 1973. 28 Слокум Дж. Обзор разработок по машинному переводу: история вопроса, современное состояние и перспективы развития // М., 1989. 29 Субботин М. М. Гипертекст. Новая форма письменной коммуникации // М. ВИНИТИ 1994. . 30 Хмелёв Дмитрий Викторович. Лингвоанализатор 3эпсилон. М. http://www.phil ol.msu.ru/~lex/ khmelev/ II М., Когнитивные исследования за рубежом. Методы искусственног о интеллекта в моделировани и политического мышления. II 23 31 Макроструктура повествования и Цимбурский В. механизмы его Л. социального воздействия // Изд-во Моск. ун-та, Кн. 1. Системы общения и экспертные системы. Наукова 1981. думка, 1990. I II III Новое в зарубежной лингвистике. Вып. XXIV. Компьютерная лингвистика. III Информатика Т. 18. III № п/п Автор Название книги / статьи Отв. редактор (для коллективных работ) Место ИздаГод издательство издания ния 32 Шайкевич А. Я. Конкорданс к прозаическому тексту (К выходу в свет конкорданса к «Преступлению и наказанию») // 33 Шайкевич А. Я. Количественные методы // М., 34 Шайкевич А. Я. Дистрибутивностатистический анализ в семантике // М., 35 Элти Дж., Кумбс М. Экспертные системы: концепции и примеры. М., 36 Ред. Л.С.Ковтун , СПб: Д.М. Поцепня, Словоупотребление и стиль писателя. В. Программное подразделов: обеспечение Название журнала (сборника) Том (выпуск) журнала / сборника Номер журнала 1995. Русистика сегодня. №2. Наука, 1990. Лингвистическ ий энциклопедич еский словарь. II Наука, 1976. Принципы и методы семантических исследований. II Изд-во СПбГУ. и 1987. IV 1995. – II Интернет-ресурсы – с №№ разделов программы II выделением Программное обеспечение: 1. Microsoft Office 2007 2. Продукты ЛОКЛЛ филфака МГУ и ТомскГУ(Dictum-2, «Istok», StyleAnalyser) Интернет-ресурсы: http://www.philol.msu.ru/~humlang, http://www.philol.msu.ru/~lex, http://www.ruscorpora.ru, http://feb-web.ru, http://lit-info.ru и др. XII. Материально-техническое обеспечение дисциплины / практики: А. Помещения: учебные аудитории Б. Оборудование: стационарные ПЭВМ и индивидуальные ноутбуки Программа составлена в соответствии с требованиями ОС МГУ по направлению подготовки «Филология». Разработчики программы: проф. О.В.Кукушкина, проф. А.А.Поликарпов