Zajcev

реклама
Сценарии использования
архивов сетевых электронных
документов различными типами
пользователей цифровых
библиотек
Зайцев А.В.
Переход в цифровую форму
2
Веб-архивы
• Около 70 организаций, занимающихся вебархивированием
• 53 сформированных архива
– Объем от 30 тыс. до 80 млрд. объектов
хранения
– Занимают от 300 Гб до 1000 Тб
– Форматы хранения: ARC, WARC, HTTrack
3
География проектов
4
Сетевые электронные документы
Стили
(CSS)
Изображения
Надстройки
(Flash / Silverlight)
Веб-страница
Скрипты и
программы
(JavaScript, …)
Фреймы
(HTML, …)
Мультимедиа
(HTML5)
5
Изменение с течением времени
Апрель
Август
Ноябрь
6
Wayback Machine
7
Сценарии использования
• Поиск утраченной/снятой с публикации
информации
• Исследования в интернете, обзоры, аналитика
• Формирование постоянных ссылок
• Использование в качестве доказательной базы
• Резервные копии сайтов
• Для размещения экземпляров электронных
изданий
8
Основные требования
• Тематический и широкий(broad) отбор документов,
небольшие периоды между проведением отборов
• Авторитетная организация, обеспечивающая
хранение данных в аутентичном виде
• Возможность организации долгосрочного хранения
большого объема данных, с формированием
постоянных ссылок
• Достаточные мощности для обеспечения обработки
большого массива данных, поиска, индексации,
работы с метаданными и описаниями.
9
Основные требования
• Открытый доступ для всех пользователей, либо доступ в стенах
организации для защищенных ресурсов
• Исключение архивов из индексов поисковых систем для
предотвращения конфликта с оригинальными сайтами
• Инструменты содействия созданию резервной копии
материалов веб-сайтов
• Создание различных точек доступа к ресурсам в т.ч. создание
коллекций, интегрированных с библиотечными коллекциями.
Группировка ресурсов по различным признакам
• Индивидуальный подход к каждому электронному изданию,
журналу и прочих СМИ.
10
Спасибо за внимание!
ФГБУ «Президентская библиотека имени Б.Н. Ельцина»
Отдел поддержки интернет-портала
zaitsev@prlib.ru
Санкт-Петербург
2014
11
Скачать