C. Средства управления микроданными

реклама
Документирование и распространение
данных переписи населения и опроса
Липо Серво, ЭСКАТО ООН, Бангкок,
survo.unescap@un.org
для
Обучающего семинара ЕЭК ОНН по технологии
переписи для стран-членов СПЕКА, г. Астана, 7-8
июня 2007г.
Содержание
A. Систематическое документирование данных
переписи
B. Для чего нужно распространять
микроданные?
C. Средства управления микроданными
A. Систематическое документирование
данных переписи
Качественный набор данных переписи
является..
• Четко задокументированным
• Исключает возможность непредвиденных случаев
• Позволяет пользователю
– Быстро приступить к работе
– Найти необходимые данные
– Понять, что определяют данные и как они создаются
– Оценить качество данных
Развитие технологии документирования
• Наличие стандартов документирования =>
международные стандарты по метаданным
• Национальная практика =>лучшая
международная практика
• Специальные средства => средства
структурирования, базы данных
• Текстовые словари кодов => словари кодов XML
Содержание метаданных в центральной
базе данных
• Управление определениями, методологическая
информация, информация по переменным,
информация по сбору данных одновременно
• Обеспечивает согласованность хранилищ данных
• Эффективный подход к планированию, сбору
данных, обработке, анализу и распространению
Лучшие виды практики документирования
данных
• Пояснительный материал
– Требуется минимум материалов для обеспечения долгосрочной
устойчивости и функциональности набора данных
• Контекстуальная информация
– Материал о контексте, в рамках которого проводился сбор
данных, и об использовании данных
– Позволяет вторичному пользователю полностью понять
предпосылки и процессы сбора данных
• Материалы каталогизации
– Библиографический учет набора данных, для
соответствующего признания и ссылки
– Базовый инструмент, используемый для поиска ресурсов
• http://www.esds.ac.uk/news/goodPractice.pdf
B. Для чего нужно распространять
микроданные?
Неиспользованный потенциал микроданных для
национального развития
•
Даже самым тщательным образом спланированное
составление таблиц не могут извлечь всю исчерпывающую
информацию из данных переписи
•
Разнообразие, несоответствия и связанные причины
наилучшим образом анализируются при помощи
микроданных, н-р,
– Прослеживание влияния политических вмешательств на
целевые группы
– Определение масштабов несоответствий внутри страны
• Качество исследования способствует
=> увеличению результатов сбора данных
=> Более эффективной постановке национальной
политики
=> Более эффективному использованию общественных
ресурсов
Факторы, препятствующие распространению
данных
- Обсуждение
• Вопросы конфиденциальности данных
• Неясность или отсутствие национального
законодательства
• Ограниченные полномочия
статистического агентства
• Вопросы качества данных
• Низкий уровень использования данных
пользователями
Международные инициативы
• Марракешский план действий в области статистики,
http://www.surveynetwork.org/home/docs/Marrakech_Action_Pla
n_for_Statistics.pdf
• Международная сеть по обследованию домашних хозяйств,
http://www.surveynetwork.org/
• Средство управления микроданными IHSN
• ЭСКАТО-Всемирный банк-PARIS21 проект по улучшению
доступа к исследованию микроданных в Азии и Тихом
Океане
Проект ЭСКАТО по улучшению доступа к
исследованию микроданных в Азии и Тихом
Океане, 2007-2008гг.
• Обследование домашних хозяйств, перепись
населения и жилищного фонда, не обследование
предприятий
• Оценка состояния распространения микроданных
• Региональный реестр и архив данных по переписи
жилищного фонда
• Региональная защита и обучающие семинары
• Обучение на практике и техническая помощь по
документации и сохранению анонимности
C. Средства управления микроданными
Средства управления микроданными – Резюме
Набор средств программного обеспечения для
документирования, архивирования, распространения и
хранения микроданных
1. Редактор метаданных
– Данные документального обследования в
соответствии с международными стандартами
2. CD-Rom формирователь
– Создает информационные средства,
ориентированные на пользователя, такие как CD,
вебсайты для распространения и архивирования
данных
3. Проводник
– Для просмотра метаданных
– Для перевода данных в разные форматы
Загрузка и использование
• Пакет средств распространения можно закачать с
http://www.surveynetwork.org/home/?lvl1=tools&lvl2=
documentation&lvl3=toolkit
• Кроме редактора метаданных, все компоненты
пакета средств бесплатны
• Редактор Nesstar Editor: одна свободная лицензия
для БС всемирного Банка участников МАР (н-р,
Афганистан, Грузия, Республика Кыргызстан,
Молдова, Таджикистан)
Редактор метаданных
• Данные документального обследования в
соответствии с международными стандартами
• Инициатива документирования данных (ИДД)
• Дублинская инициатива по ключевым метаданным
(ДИКМ)
• Данные и метаданные в одном файле
• Данные могут импортироваться из разных
форматов, в т.ч. пакетов статистических данных
• Создает документацию обследования в
формате PDF
Расширяемый язык разметки (XML)
• Язык для описания данных с
использованием управляющих кодов
(тэгов)
• Концептуально тэги аналогичны полям
базы данных
• Файлы XML – это обычные текстовые
файлы
• Можно редактировать текстовыми
редакторами
• Файлы XML, как и базу данных, можно:
• Искать и запрашивать
• редактировать
• Обучающая программа:
http://w3schools.com/xml
Пример файла XML
<titl> многочисленный индикаторный кластер Опрос 2005 </titl>
<altTitl> MICS </altTitl>
<AuthEnty> Национального агентство по статистике (NSO) </AuthEnty>
<fundAg abbr= «ЮНИСЕФ">Детский фонд ООН </fundAg>
<collDate date= "2005-01" event="start"/>
<collDate date= "2005-03" event="end"/>
<nation> Popstan </nation>
<geogCover> национальный </geogCover>
<sampProc> 5,000 домохозяйств, два многослойных этапа
</sampProc>
<respRate> 98 процентов </respRate>
Преимущества XML
• Создание исчерпывающего контрольного списка
элементов метаданных
• Возможность использования содержимого файла
путем определения присутствия или отсутствия
специальных тэгов в файле
• Создание каталога базы данных, где можно
запрашивать элементы ключевых метаданных
• Возможность трансформировать файл в формат,
более ориентированный на пользователя, такой
как HTML, PDF
• Файлами XML можно обмениваться в сети или
Интернете при помощи веб-услуг или протокола SOAP
CD-ROM формирователь
• Интегрируется с редактором метаданных
• Создает средства, ориентированные на
пользователя (CD-Rom, вебсайт) для
распространения и архивирования данных
(формат HTML)
• Позволяет изготовление по заказу
– Брэндинг: внешний вид и качества CD или вебсайта
– Содержание: единое или многочисленные обследования
Процесс работы CD-ROM формирователя
1
Создать новый проект CD-ROM
2
3
Добавить обзор в проект и
выбрать его тип и брэндинг
Нажать клавишу Save для
создания интерфейса HTML
4
• Выбор
составляющего
обзора путем
открытия файла DDIXML или Nesstar
•Брэндинг обзора
определяет внешний
вид и качество CD
•Тип обзора
определяет
содержание
метаданных по
умолчанию
Через несколько минут, Ваш
проект CD готов к публикации!
Пример вывода данных CD-ROM формирователем
Демонстрация редактора метаданных
Оперативный показ с набором данных Popstan, на
экране на английском и русском языках
Спасибо!
Обсуждение, вопросы, ответы
Скачать