Драгана Радоичич Этнографический институт Сербской академии наук и искусств (САНУ) Белград Проект разработан как стимул к объединению и взаимному пронизыванию основных, прикладных и исследований развития в области сербского языкового и культурного наследия, в целях создать единное цифровое сокровище знаний о сербском языке и культуре, которое, при соблюдении наивысших научных и технологических стандартов, принсет вклад в сохранение языкового и культурно-исторического наследия, модернизацию научной практики в области этнологии, науки о языке и других гуманитарных дисциплин и осуществление предпосылок для цифрового производства знаний в современном информационном обществе. Основой проекта является материал собранный в оцифрованных словарях сербского языка и культуры (диалектологических, исторических, этимологических, ономастических, терминологических, энциклопедических), интегрированный в удобную для поиска и поддающуюся расширению базу данных, которую участники в Проекте будут использовать как основу для разработки междисциплинарного словаря сербской культуры, в форме инновативного, мультимедийного, цифрового тезауруса. Цель проекта – установка цифровой инфраструктуры, которая позволит исследователям в области гуманитарных наук общими усилями комбинировать свои теоретические и полевые исследования и использовать результаты этих исследований для создания представительного интернет-портала, который своей профессиональной неуступчивостью и тематической всеохватностью будет совершенно новым видом презентации научной деятельности, и тем самим будет стимулировать трансфер знаний и сохранение культурной идентичности Республики Сербии. Проект выполнится в рамках трех подпроектов: I ПРИМЕНЕНИЕ ЛИНГВИСТИЧЕСКИХ ИССЛЕДОВАНИЙ В РАЗРАБОТКЕ ЦИФРОВОГО СЛОВАРЯ. Основой является разработка цифровой лексикографической базы и концептуального словаря, в котором слова групированы по семантическим отношениям, с приведением варианта форм из сербских диасистем и сведений энциклопедического типа. Фазы: разработка программного обеспечения для ввода лексикографических данных и формирование базы путем ввода первого круга выбранных источников; семантическая сегментация базы и определение лемм и лексического фонда в области материальной и духовной культуры; этимологическая обработка выбранных лексем (фонетический, словообразовательный и семантический анализ, установление происхождения); формирование систем этимологических гнезд; словообразовательносемантический анализ диалектных лексем, морфофонематической формы, мотивирующей основы и языкового расслаивания согласно региональному и общественному употреблению и регистрам, анализ контекста. Организация тезауруса: терминология сербской духовной культуры: космогоническая, онтологическая, мифологическая, религиозная, демонологическая, обрядовая, гносеологическая, этическая и эстетическая терминология; терминология социальной культуры: правового обычая, родственных отношений и народных инстутов, определения идентитичности (национальные, местные, религиозные, гендерные). Терминология сербской материальной культуры: зоологические и ботанические термины, народная медицина, народная экономика, ремесла и умения. Взаимное связывание архаичной и диалектной терминологической лексики с терминологиями современной культуры (соовременный литературный язык, городские диалекты, социолекты и остальные разновидности языка). Связывание лингвистических и этнологических исследований установлением типа отношений реалия – номинация. II ЭТНОЛОГИЧЕСКОЕ И АНТРОПОЛОГИЧЕСКОЕ ТОЛКОВАНИЕ ТРАДИЦИЙ. Подпроект сосредоточен на декодировании и анализе традиции и идентичностей в Сербии и регионе – моделей и стратегий, с помощью которых они конструируются, хранятся и трансформируются под влиянием исторических и общественных факторов. Обработанные и истолкованые данные о культурном наследии и практиках идентичности будут представлены в форме энцикопедического произведения терминов и научных трудов, интегрированных в интернет-библиотеке. Исследоваться будут: концепции традиции в прошлом и настоящем: жизненные обычаи, обряды и ритуалы, мифология, религия и новая религиозность; концептуализация практики идентичности и культурных практик в рамках сельской и городской культур и субкультур на местном, национальном и региональном уровнях; гендарные идентичности, СМИ и практики идентичности; дуализм и параллелизм правового обычая и гражданского права, народная и альтернативная медицина, демография и репродуктивные стратегии, коллективные модели памяти; модели культурной и морфологической вариации в различных популяциях, объем переменных и вариаций культурных и биологических характеристик, анализ их породивших общественных и микроэволюционных процессов – особенно миграций. III ОЦИФРОВКА СЕРБСКОГО КУЛЬТУРНОГО НАСЛЕДИЯ И РАЗВИТИЕ ИНТЕГРАЛЬНОЙ ЛЕКСИКОГРАФИЧЕСКОЙ ИНФРАСТРУКТУРЫ. Разработка и развитие теоретических моделей компьютерной интеграции различных лексикографических ресурсов, организация процесса оцифровки лексикографической, этнологической и другой литературы, нужной для междисциплинарных исследований. Развитие мета-лексикографических моделей словаря, как вида веб-сервиса и практическое софтверное применение мультимедийной базы данных сербской культуры и языка. Оцифрованные словари будут вручную обработаны и размечены в формате XML, в соответствии с Text Encoding Initiativе (TEI). Наглядное определение текстуальной структуры и содержания кодированием и разметкой текста для машинного или человеческого употребления, с особенным ударением на осмысленном поиске. Таким образом обработанный текст характеризуется архивной устойчивостью, межплатформенной совместимостью и портативностью данных. Цифровое TEI-идание возможно использовать в качестве единственного электронного источника для манипулирования размеченными частями текста и подготовку различного вида отправления и хранения. Создание лексикографическо-энциклопедической базы (ЛЭБ) позволяет многоцелевой и комплексный поиск разнообразных оцифрованных лексикографических ресурсов. Оцифрованные словари будут включены в ЛЭБ для нужд исследования и подготовки Словаря. ЛЭБ будет расширен и новейшими результатами исследований участников проекта, мультимедийными элементами (картинки, аудио- и видео-файлы), иллюстрирующими знания о самых важных понятиях сербской культуры, и интегрирован с существующими веб-ресурсами: Интернетбиблиотекой Сербии по гуманитарным наукам и искусству, и проектами Центра по цифровым гуманитарным наукам: билингвальным сербско-английским словарем и Сербской морфо-синтаксической базой (СМС). Научно-исследовательские темы: исследование сложных лексических архитектур в электронной лексикографии; трансформация статических словарей в веб-сервисы, употребление технологии Web-2.0 и взаимное связывание лингво-культурологических ресурсов; использование социальных сетей в академических проектах; стандартизация, взаимодействие и объединение веб-ресурсов, определение общих интерфейсов прикладного программирования (API), исследований технологий семантического веба, таких как Topic Maps, Resource Description Framework (RDF), онтологии. Речь идет о амбициозном, междисциплинарном проекте, который свяжет сотрудников в разных областях – во-первых, этнологии, линквистике, компьютерной науке, и объединит теперешние усилия по развитию лексикографической и гуманитарной цифровой инфраструктуры в Распублике Сербии, включая туда в первую очередь Интернет библиотеку Сербии по гуманитарным наукам и искусству (ИБиС, http://ibis.mi.sanu.ac.rs/) и проекты Центра цифровых гуманитарных наук (http://humanistika.org). Ожидаемый эфект программы Презентация сербского культурного и языкового наследия в международных рамках. Сохранение культурной идентичности и обучение широких общественных кругов. Совершенствование разработки капиталных лексикографических и энциклопедических трудов, но и предоставление научному сообществу и широким общественным кругам полезных и надежных сведений по областям этнографии, этнологии, культурологии и остальным гуманитарным и общественным дисциплинам. Так как в Интернете налицо многочисленные данные, надежность которых проблематична, разработка такого портала имеет большую национальную ценность. Развитие цифровых гуманитарных наук в Республике Сербии. К части проекта, касающейся развития, относится и формирование лабораторий цифровой гуманистики. Будущие лаборатории цифровой гуманистики будут развиваться в рамках трех институций: этнографического института Сербской академии наук и искусств, Института сербского языка Сербской академии наук и искусств и Технического факультета университета в Приштине, с штаб-квартирой в Косовска-Митровице. Создание лабораторий, наряду с обеспечением дополнительного оборудования, подразумевает трудоустройство, обучение и совершенствование новых сотрудников, так же как и развитие новых цифровых технологий, приспособленных к требованиям гуманистики, посредством чего был бы заложен фундамент для развития цифровых гуманитарных наук в Сербии и открыта возможность для более успешного регионального и более широкого международного сотрудничества в этих научных дисциплинах. Лаборатория в рамках Этнографического института Сербской академии наук и искусств будет развиваться в направлении оцифровки этнологического архивного материала и источников, а также и формирования этнографическо-антропологической базы данных; в рамках Института сербского языка будут заниматься оцифровкой лексикографических источников, лексического и ономастического материала и развитием цифровой платформы в целях лингвистических исследований, в то время как в рамках Технического факультета работа лаборатории будет направлена на развитие решений программного обеспечения для нужд цифровой гуманистики. В рамках части проекта, касающейся развития, будет продолжена работа над оцифровкой научных книг и трудов, и компьютеризацией Интернет-библиотеки Сербии по гуманитарным наукам и искусству (организация метаданных и обработка текста в формате у XML). Работа над дальнейшим развитием ИбиС будет подразумевать обработку научных книг и трудов в текстуальном формате и их связывание с терминами Словаря сербской культуры. Одновременно, с Математическим институтом Сербской академии наук и искусств будет продолжено сотрудничество в сохранении книг и трудов в формате PDF в рамках Виртуальной библиотеки. К научному применению относится: Научно-исследовательская работа в сфере лингвистики и этнолингвистики, этимологии, лексикографии и лексикологии, диалектологии, сербистики и славистики Научно-исследовательская работа в сфере этнологии и антропологии, а также и остальных гуманитарных и общественных дисциплин (литература, история, культурология, балканистика, социология, педагогогия...) Научно-исследовательская работа в сфере гуманитарной информатики, компьютерной лингвистики и обработки естественных языков – включая разнородные проекты, такие как семантический анализ текста, разрешение многозначности слова, исправление омофонов, классификация и нахождение документов, ответы на вопросы в рамках открытых доменов, обнаружение текстуальных импликаций (textual entailment). Создание новых или совершенствование существующих машинных инструментов для обработки текста (корректировщика правильности текста, грамматических парсеров, лемматизаторов и т. д.) Возможные пользователи: все носители сербского языка в родной стране и диаспоре; отечественная и зарубежная популяция школьников и студентов; представители профессий, для которых необходимо хорошее знание сербского языка и культуры (образование, журналистика, годударственная администрация, эконимика и политика) международное и отечественное научно сообщество; иностранные и отечественные дипломаты. Общественно доступный Интернет-портал по сербскому языку и культуре, благодаря хорошей организации данных и связыванию с научными книгами и трудами, опубликованными в интернетбиблиотеке, позволит всеохватный и надежный поиск. Таким образом организованная лексикографическая и этнографическая база имеет высокие возможности дальнейшего развития путем добавления новых единиц и мультимедийного содержания. База будет выработана в строгом соответствии с общепринятыми методологическими правилами всех включенных лингвистических и культурноисторических дисциплин, приспособлена к требованиям научно-исследовательских проектов учреждений, являющихся их носителями, и будет иметь несомненную пользу и для исследований в более широком кругу гуманитарных и общественных наук, на отечественном и международном уровне, а также и для обучения широких общественных слоев. Проект был бы важным и для усиливания международного сотрудничества Республики Сербии с иностранными партнерами в области гуманитарных наук.