Презентация компании АО «РАМЭК-ВС» НА СЛУЖБЕ БИЗНЕСА И ГОСУДАРСТВА Решения АО «РАМЭК-ВС» по интеграции данных и системам анализа связей Интеграция данных: создание хранилищ данных Хранилище данных (Data Warehouse) - реляционная база данных, спроектированная для запросов и анализа. Как правило, содержит "исторические" данные, собранные из разных источников. Специальные принципы проектирования систем такого типа позволяет достичь высокой производительности именно запросов аналитического характера и достаточно просто консолидировать данные из разных источников. Хранилище данных практически всегда имеет средства загрузки больших массивов внешних данных и средства оперативного анализа (OLAP). Хранилища данных имеют следующие особенности: Предметную ориентацию, то есть рассчитаны на анализ конкретной предметной области. Интегрированность, то есть данные, собранные из разных источников, должны быть приведены к одному формату. Например, должны быть использованы одинаковые единицы измерения, разрешены конфликты имен и т.д. Неизменность, то есть данные, однажды введенные в систему, не должны изменяться или корректироваться. Зависимость от времени, так как наиболее часто используемый вид анализа - временной. Это наиболее существенное отличие от обычных систем оперативного ввода информации, в которых требуются только актуальные (текущие) данные, а исторические данные переносятся в архив. 3 Опыт АО «РАМЭК-ВС» по созданию хранилищ данных Федеральное хранилище данных ФНС России СУБД Oracle 11G Годы создания 2008-2015 Использование данных: аналитический инструмент собственной разработки (система визуального анализа связей). Хранилище данных ФГБНУ «Дирекция научно-технических программ» СУБД Oracle 11G Годы создания 2008-2009 Использование данных: аналитический инструмент собственной разработки (система визуального анализа связей). Хранилище данных Ространснадзора СУБД Microsoft SQL Server 2010 Годы создания 2013 Использование данных: Microsoft Analysis Services 2010 + информационная панель Центральный банк РФ СУБД Oracle 11G Годы создания 2010-2015 Использование данных: аналитический инструмент собственной разработки (система визуального анализа связей) + компоненты для корпоративного портала. 4 Система визуального анализа связей предназначена: для консолидации из разных источников информации по искомым объектам; для выявления явных и неявных связей искомых объектов в больших массивах структурированных и неструктурированных данных; для поиска взаимосвязей между различными объектами; для визуализации (наглядного представления) в виде семантических графов искомых объектов 5 Система визуального анализа связей Система внедрена и используется в ряде органов государственного управления: • Федеральная налоговая служба (базы: ЕГРЮЛ, ЕГРИП, ЕГРН, декларации 2-НДФЛ и 3-НДФЛ, таможня, однодневки, схемы уклонения, учет КГН, расчеты с бюджетом и др.) • Центральный банк РФ ( базы: ЕГРЮЛ, ЕГРИП) • ФГБНУ «Дирекция научно-технических программ» (базы: ЕГРЮЛ, ЕГРИП, БД контрактов) 6 Источники данных для анализа Источники данных В качестве источников данных для системы используются: Открытые и общедоступные сведения единого государственного реестра юридических лиц (ЕГРЮЛ) Открытые и общедоступные сведения единого государственного реестра индивидуальных предпринимателей (ЕГРИП) Базы данных заказчика Данные ЕГРЮЛ и ЕГРИП предоставляются ФНС России на DVDдисках в виде архивов и xml-файлов Функции системы Загрузка и хранение данных из источников ЕГРЮЛ и ЕГРИП Поиск и предоставление информации о юридических лицах и индивидуальных предпринимателях пользователям Поиск и визуализация взаимосвязей объектов ЕГРЮЛ и ЕГРИП для анализа данных Интеграция с внешними системами 7 Компоненты системы Система разбора и загрузки данных Система информационного обеспечения Система предоставления информации o Компонент предоставления информации ЕГРЮЛ и ЕГРИП на портале o Компонент визуального анализа связей 8 Особенности системы визуального анализа связей Возможность конфигурирования под любую предметную область; Интеграции объектов из различных источников; Трехзвенная архитектура с централизацией данных и бизнес-логики; Высокая скорость поиска и асинхронный режим работы; Возможность создания инструментов для проведения анализа по требованию Заказчика; Взаимодействие с внешними системами; Ведение статистики использования комплекса. 9 Архитектура системы 10 Архитектура системы требуемое ПО Клиент: Браузер и Java JRE 1.6 или выше Сервер приложений: JBoss Application Server 4.2 Сервер баз данных: СУБД Oracle 11.2 (требуется лицензия) 11 Система предоставления информации Ввод поисковых параметров ЮЛ 12 Система предоставления информации Результаты поиска ЮЛ 13 Компонент визуального анализа связей Объекты поиска, связи между объектами 14 Компонент визуального анализа связей. Результаты в виде графа 15 Компонент визуального анализа связей. Результаты в виде таблицы 16 Потенциальные потребители Организации, заинтересованные в проверке контрагентов по данным государственных реестров Внедрение комплекса возможно в организациях, которые могут получать данные в соответствии с приказом Минфина России от 18.02.2015 № 25н о предоставлении сведений ЕГРЮЛ и ЕГРИП: Органы государственной власти и иные государственные органы Органы государственных внебюджетных фондов Органы местного самоуправления Суды Организации, имеющие большие массивы разрозненных данных, имеющие необходимость их оперативного анализа 17 Варианты совместной деятельности Задача АО «РАМЭК-ВС» Партнер Выявление заинтересованности - + Пресейл + + Формирование ТЗ и конкурса + - Разработка ПО + - Внедрение ПО у заказчика + + Техподдержка ПО + + Распределение усилий по софту РАМЭК от 75%, партнер до 25% Поставка техники через партнера. 18