Информация о семинаре: Предмет и задачи Предмет семинара Архивирование Концепция Сбор Публикация Обработка данных Поставка Обнаружение Повторное использование Жизненный цикл данных DDI Анализ Индустриализация поставки данных, основанная на стандартах • "Standards-based” industrialization of statistical production Marco Pellegrino Eurostat • Standards-Based Acquisition & Interoperability American Council of Technology; Industry Advisory Council Темы семинара • Рассмотрены: – Экология – Высшее образование • Сегодня: Общая Инструментальная • Следующие темы: – Оборот статистической информации (SDMX) – Корпоративная отчетность (XBRL) – … Темы для обсуждения • Практическая реализация, в т.ч. возможные бизнес - модели использования единых форматов данных. • Стандартизация- инфраструктурная деятельность, нужны инновационные бизнес-модели План • • • • Категории межсистемного взаимодействия Спецификация CAM OASIS CAM Editor – подготовка шаблонов OpenXDX – публикация веб сервисов Типы межсистемного взаимодействия • использование технологической инфраструктуры СМЭВ • использование единых форматов данных для структур данных - NIEM • использование семантики, посредством которой данные могут быть преобразованы в наделенную смыслом информацию – EU ADMS Единые форматы данных наименование объектов, типы данных Студент Выполняет Задание Пространство имен и идентификация • Корпоративная интеграция – Пространство имен и идентификация • Мастер данные • Межведомственная интеграция – Идентификация - Единые реестры – Пространство имен – публикация словарей (NIEM) • Интеграция в интернет – пространстве – Идентификация – открытые идентификаторы базовых объектов (opencorporates.com, Legal Entity Identifier openleis.com, European Legislation Identifier http://eli.legilux.public.lu/eli) – Пространство имен - регламентация поставки данных в репозитории ADMS (поставка данных в репозитории) Слабая не RDF/OWL Средняя Сильная RDF/OWL + Контролируемый RDF/OWL словарь Информационная архитектура Мир связанных данных (data.gov circa 2009) нет Связанность ETL/Код/SPARQL Модельная Стандартизация пространства имен в NIEM Национальная модель информационного обмена США (National Information Exchange Model, NIEM) • Спецификация OASIS Content Assembly Mechanism (CAM), • CAM Editor – подготовка шаблона • библиотека Open XDX – публикация веб сервисов OASIS Content Assembly Mechanism (CAM) • Описание обработки потоков информации в формате XML документов с целью нормализации семантической дисперсии между узами обмена и системами Демонстрация • Организация БД: связи между таблицами – первичные ключи и внешние ключи • Редактор позволяет работать в режиме дизайна и маркировки. • Создаем шаблон и экспортируем его в формат .CXF • Создавать и использовать словари Демонстрация 2 • Библиотека OpenXDX позволяет – читать шаблон; – преобразовать его в SQL запрос; – получить данные из БД; – выполнить бизнес правила шаблона – привести в соответствие имена – верификацию выполняет дополнительная библиотека "5-ти летний план" OpenXDX 1) Next release is bug fix - 3.2.1 2) 3.2.2 upgraded Open-XDX release 3) 3.2.3 NIEM 3.0 Dictionaries 4) iQvoc RDF/turtle support for export from CAM dictionary 5) UML logical model 6) Japan IMI initiative for Tokyo 2020 Olympics and Open Data for Transportation/Tourism/Public Safety Поставка данных для БП Вопросы? lipuntsov@econ.msu.ru