Новый взгляд на проект электронной библиотеки диссертаций Лаврёнова Ольга Александровна Российская государственная библиотека lavr@rsl.ru личностного Обстоятельства различного характера: правового ЭБД организационного финансового технологического Необходимость максимальной доступности полных текстов работ заложена в самом факте появления и существования диссертаций и авторефератов. Не должны ли эти официальные документы в таком случае публиковаться для всех в открытом удаленном доступе? Основное содержание и результаты работ обязательно опубликованы до защиты. Актуальность, практическая значимость и т.д. работы доказывается в диссертации. Можно утверждать, что в интересах общества и ВАК стимулировать представление этого доказательства как можно большему кругу специалистов? Наличие невероятно ограниченного количества хранилищ диссертаций и небольшой тираж авторефератов существенно затрудняет обнаружение фактов плагиата на основе текстов диссертаций. Разве не очевидно, что размещение полных текстов диссертаций и авторефератов в открытом теледоступе сделает плагиат не столь легким, сколь бессмысленным, ибо всем желающем эта «дурь видна» будет (особенно при использовании соответствующих программных средств)? Какие причины противодействия авторов открытой публикации в теледоступе можно признать действительно уважительными? – Подготовка к изданию монографии на базе текста диссертации. Что еще? Не пора ли настолько повысить требования к качеству диссертаций, чтобы всем авторам ими можно было гордиться? Подавляющее большинство авторов оформляют тексты диссертаций и авторефератов путем ввода в компьютер своими руками или с использованием труда операторов. Не обидно ли, что большая часть таких файлов далее не используется или используется частично? Не лучше ли установить правило их передачи в советы по защите и ЭБД? Вопросы выглядят тривиально? Почему в таком случае до сих пор общество не может решиться на открытую публикацию в теледоступе хотя бы всех авторефератов, а затем и диссертаций как официальных документов в рамках процедуры получения ученой степени? Единственно реальный способ обеспечения широкой доступности диссертаций – электронная библиотека диссертаций (ЭБД). Действующая ЭБД РГБ – результат разработки трех проектов: Электронная библиотека диссертаций в теледоступе (при поддержке Российского фонда фундаментальных исследований (РФФИ), проект № 01-07-90310); Проект сканирования диссертаций из фонда РГБ для пользователей РГБ в ее стенах и виртуальных филиалах (Российская Государственная Библиотека расходует 8 млн. рублей в год); Интегрированная библиотека электронных диссертаций (при поддержке РФФИ, проект № 04-07-90154). В открытом доступе – только по договорам с авторами! Шаг 1. Теперь каждый автор защищенной в стране диссертации имеет возможность опубликовать ее в ЭБД на официальном Web-сайте РГБ бесплатно. 1% от защитившихся Шаг 2. Каждая организация получает возможность продемонстрировать труды своих диссертантов в открытом доступе, даже не имея собственных технических и материальных возможностей, на основе договоров с авторами и с РГБ - бесплатно. Количество диссертаций и авторефератов, переданных авторами в открытую ЭБД по договорам непосредственно с РГБ или с вузами – 770. Становится очевидным, что в настоящее время обеспечение не только полноты, но и даже определенной представительности коллекции диссертаций можно достичь лишь путем сканирования поступающих в фонд диссертаций. Поправки 2004 г., которые позволяют библиотекам предоставлять экземпляры «произведений, выраженных в цифровой форме» во временное безвозмездное пользование, но только в помещениях библиотек [Закон ..., ст. 19, п.2] Шаг 3. РГБ с 2004 г. сканирует все поступающие в ее фонды диссертации, предоставляет их пользователям в своих стенах и виртуальных читальных залах РГБ в других организациях (по договорам). Не в открытом доступе! Сканируется 25000 диссертаций в год (финансирование из бюджета РГБ). Общий объем базы данных закрытой электронной библиотеки на август 2005 года составляет 77 700 диссертаций. Создано 75 виртуальных читальных залов. 4 возможности доступа к базам данных ЭБД: в электронной библиотеке отсканированных диссертаций в зале РГБ; в виртуальных читальных залах электронной библиотеки РГБ, создаваемых в других организациях по договорам; в открытой электронной библиотеке OREL на сайте РГБ; в экспериментальной открытой ЭБД на основе ИСИР РАН. Структура данных для ЭБД: Электронный каталог с библиографическими записями в формате MARC 21 + PDF - файлы полных текстов; Формат RDF (язык XML) для метаданных+ PDF файлы полных текстов. ЗАДАЧА Технические и организационные условия для перемещения существенной части нагрузки по формированию базы данных с персонала ЭБД на авторов и организации, представляющие своих диссертантов в ЭБД для для снижения стоимости поддержки ЭБД и обеспечения надежности ее развития ВЫПОЛНЕНО Проект единой структуры представления данных о диссертациях, авторах и организациях в государственной системе проведения защит для подготовки основной части метаданных относительно процессов защиты диссертаций непосредственно по месту защиты для перспективной технологии передачи документов из советов по защите в ВАК и РГБ по электронным каналам связи Необходим новый государственный порядок представления авторами документов на защиту ! Для автора до защиты в системе, поддерживаемой организацией, создается некая интерактивная форма, в которую автоматически вносятся данные об организации и Совете по защите диссертаций Автор перед защитой диссертации вводит в эту форму данные о своей диссертации и о себе, полностью копирует в форму структурные составляющие автореферата. Автореферат печатается из этой формы; передается в электронном виде в другие системы по определенному списку рассылки. Организации, которые будут заранее определены ВАК, установят авторефераты на обозначенных заранее Web-сайтах; при этом определяется порядок и электронный адрес передачи официальных отзывов ученых. После защиты автор и Совет вносят в форму автора остальные данные о рукописи диссертации и процессе защиты; в частности, разносятся по составляющим формы библиографические данные, оглавление и библиографический список. Система рассылает определенные группы данных по установленным правилами ВАК электронным адресам (например, в ВАК, РГБ, ЦНМБ, сеть академических библиотек и т.д.); тем самым все организации получат нужные для их систем метаданные. Метаданные преобразуются в нужные внутренние форматы систем (например, в MARC для электронных каталогов) и используются в локальных ЭБД и в центральной ЭБД РГБ. С целью дальнейшей реализации модели : разработана структура метаданных относительно процесса защиты диссертации, включающая максимум данных, необходимых для различных целей (хранения и поиска информации, вывода информации о диссертациях, авторефератах, лицах и организациях, связанных с фактом защиты, для учета самих процессов защиты в советах и ВАК, формирования информационных карточек диссертаций (метаданные структурированы с использованием XML – skeleton); разработан проект типовой электронной формы автореферата; налажены контакты с разработчиками системы для ВАК; адаптирована новая версия программного обеспечения ИСИР (Интегрированной системы информационных ресурсов)РАН как перспективной технологии поддержки базы данных ЭБД и поиска информации. Основные адреса для поиска электронных диссертаций: - Открытая электронная библиотека диссертаций в рамках электронной библиотеки РГБ OREL – http: //orel.rsl.ru ; - Библиотека отсканированных диссертаций в РГБ и виртуальных филиалах) – http: //diss.rsl.ru. Для участия в создании открытой ЭБД: lavr@rsl.ru Для создания виртуальных читальных залов обращаться по адресу: diss@rsl.ru Формы договорного участия организаций в создании базы данных ЭБД: организация заключает договоры с авторами и обеспечивает передачу данных через свой FTP-сервер, на котором помещает полные тексты диссертаций и/или авторефератов в форматах DOC, PDF и метаданные в XML-разметке; другой вариант передачи данных в РГБ - по электронной почте; если организация настаивает при заключении договора с РГБ на хранении текстов только в своей электронной библиотеке, в базу данных РГБ передаются только структурированные метаданные в XML и адреса полных текстов в открытом доступе на соответствующих сайтах. В зале Интернет и электронных документов РГБ, а также в виртуальных читальных залах предоставлен доступ к электронным версиям диссертаций, защищенных: в 1998 – 2003 гг. - по специальностям: «Экономические науки», «Юридические науки», «Педагогические науки», «Психологические науки» и «Философские науки» (всего около 28000 полных текстов) – стартовый пакет, наиболее спрашиваемая тематика; с начала 2004 г. - по всем специальностям, кроме медицины и фармации, по мере их оцифровки; в другие годы и по иным специальностям – отдельные работы. Необходимо изменение правил представления диссертаций: более строгие правила оформления электронных и печатных диссертаций; создание удобных программ интерактивного формирования текстов диссертаций для авторов и советов по защите; обязательное представление электронных авторефератов перед защитой в совет и ЭБД; представление в РГБ не только печатной диссертации, но и полного электронного текста (из советов), предоставление автору возможность выбора формы доступа (закрытая или открытая ЭБД); Перспективы формирования открытой ЭБД: расширение круга участников проекта; развитие программного обеспечения; развитие интерактивной формы ввода метаданных об авторефератах и диссертациях с автоматическим представление метаданных в XML разметке; работа в направлении изменения правил представления работ на защиту (электронные метаданные, автореферат).