Информация о семинаре: Предмет и задачи

реклама
Информация о семинаре:
Предмет и задачи
Предмет семинара
Архивирование
Концепция
Сбор
Публикация
Обработка данных
Поставка
Обнаружение
Повторное
использование
Жизненный цикл данных DDI
Анализ
Индустриализация поставки данных,
основанная на стандартах
• "Standards-based” industrialization of
statistical production
Marco Pellegrino Eurostat
• Standards-Based Acquisition &
Interoperability
American Council of Technology; Industry Advisory
Council
Темы семинара
• Рассмотрены:
– Экология
– Высшее образование
• Сегодня: Общая Инструментальная
• Следующие темы:
– Оборот статистической информации (SDMX)
– Корпоративная отчетность (XBRL)
– …
Темы для обсуждения
• Практическая реализация, в т.ч. возможные
бизнес - модели использования единых
форматов данных.
• Стандартизация- инфраструктурная
деятельность, нужны инновационные
бизнес-модели
План
•
•
•
•
Категории межсистемного взаимодействия
Спецификация CAM OASIS
CAM Editor – подготовка шаблонов
OpenXDX – публикация веб сервисов
Типы межсистемного
взаимодействия
• использование технологической
инфраструктуры СМЭВ
• использование единых форматов данных
для структур данных - NIEM
• использование семантики, посредством
которой данные могут быть преобразованы в
наделенную смыслом информацию – EU
ADMS
Единые форматы данных
наименование объектов,
типы данных
Студент Выполняет Задание
Пространство имен и
идентификация
• Корпоративная интеграция
– Пространство имен и идентификация
• Мастер данные
• Межведомственная интеграция
– Идентификация - Единые реестры
– Пространство имен – публикация словарей (NIEM)
• Интеграция в интернет – пространстве
– Идентификация – открытые идентификаторы базовых
объектов (opencorporates.com, Legal Entity Identifier openleis.com, European Legislation Identifier http://eli.legilux.public.lu/eli)
– Пространство имен - регламентация поставки данных в
репозитории ADMS (поставка данных в репозитории)
Слабая
не RDF/OWL
Средняя Сильная RDF/OWL +
Контролируемый
RDF/OWL
словарь
Информационная архитектура
Мир связанных данных
(data.gov circa 2009)
нет
Связанность
ETL/Код/SPARQL Модельная
Стандартизация пространства имен
в NIEM
Национальная модель информационного
обмена США (National Information Exchange
Model, NIEM)
• Спецификация OASIS Content Assembly
Mechanism (CAM),
• CAM Editor – подготовка шаблона
• библиотека Open XDX – публикация веб
сервисов
OASIS Content Assembly
Mechanism (CAM)
• Описание обработки потоков информации
в формате XML документов с целью
нормализации семантической дисперсии
между узами обмена и системами
Демонстрация
• Организация БД: связи между таблицами –
первичные ключи и внешние ключи
• Редактор позволяет работать в режиме
дизайна и маркировки.
• Создаем шаблон и экспортируем его в
формат .CXF
• Создавать и использовать словари
Демонстрация 2
• Библиотека OpenXDX позволяет
– читать шаблон;
– преобразовать его в SQL запрос;
– получить данные из БД;
– выполнить бизнес правила шаблона
– привести в соответствие имена
– верификацию выполняет дополнительная
библиотека
"5-ти летний план" OpenXDX
1) Next release is bug fix - 3.2.1
2) 3.2.2 upgraded Open-XDX release
3) 3.2.3 NIEM 3.0 Dictionaries
4) iQvoc RDF/turtle support for export from CAM
dictionary
5) UML logical model
6) Japan IMI initiative for Tokyo 2020 Olympics and
Open Data for Transportation/Tourism/Public Safety
Поставка данных для БП
Вопросы?
lipuntsov@econ.msu.ru
Скачать