BG.020 Консолидация данных Состав раздела Теоретические единицы M.019 Задача консолидации M.020 Введение в хранилища данных M.021 Основные концепции ХД M.022 Многомерные ХД M.024 Реляционные ХД M.025 Гибридные ХД M.026 Виртуальные ХД M.031 Введение в ETL M.032 Извлечение данных в ETL M.033 Очистка данных в ETL M.034 Преобразование данных в ETL M.037 Загрузка данных в хранилище M.038 Загрузка данных из локальных источников M.039 Обогащение данных Практические единицы Практикум "Проектирование хранилищ данных Deductor Warehouse" Практикум "Извлечение информации из Deductor Warehouse*" Самопроверочные тесты Аттестационный тест Индивидуальное задание в Deductor Studio * Облегченный вариант Объем: 21 академический час Рассматриваемые вопросы 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. Основные задачи консолидации данных Обобщенная схема процесса консолидации Предпосылки появления ХД Основные требования к ХД Задачи, решаемые ХД Детализированные и агрегированные данные, метаданные Многомерное представление данных и многомерный куб, MOLAP Измерения и факты; операции с многомерным кубом ROLAP, схемы "звезда" и снежинка" HOLAP, преимущества и недостатки гибридной архитектуры ХД Витрины данных Концепция виртуальных хранилищ данных Процесс ETL, его основные цели и задачи Выбор используемых источников данных Организация процесса извлечения данных Уровни очистки данных Классификация проблем в "грязных" данных Преобразование структур данных: агрегирование, перевод значений и пр. Организация процесса загрузки в ХД Многопоточная загрузка и постзагрузочные операции Преимущества и недостатки отказа от создания ХД Особенности загрузки из локальных источников данных Необходимость обогащения данных и способы обогащения Обязательная предварительная подготовка Раздел BG.001 Технологии анализа данных Контрольные вопросы В чем заключается процедура консолидации данных, каковы ее цели? Какие основные виды источников данных вы знаете? Какие задачи решаются при консолидации? Какие причины мешают корректной аналитической обработке и требуют использования методов очистки данных? В чем заключается цель процедуры обогащения данных? Каково назначение систем OLTP и СППР? Отличия OLTP-систем и СППР? Какие факторы стимулировали появление концепции ХД? В чем заключаются основные различия между ХД и обычными базами данных? Какие функциональные требования предъявляются к ХД? Какие принципы лежат в основе построения ХД? Каковы цели использования концепции ХД в процессе поддержки принятия решений и интеллектуального анализа данных? Зачем выполняется агрегирование данных? Что такое метаданные и какова их роль в процессе функционирования ХД? Какие виды метаданных вам известны? Какие ХД называются кросс-платформенными? Какие архитектуры ХД вам известны? Как вы понимаете термин «многомерный куб», «гиперкуб»? Какова роль измерений и фактов в многомерной модели данных? В чем принципиальное отличие многомерной модели от реляционной? Каковы преимущества и недостатки многомерной модели данных. Какие действия применяются к измерениям для извлечения нужной информации из многомерного куба? В какой форме хранятся данные в РХД? Как соотносятся таблицы фактов и таблицы данных в РХД? Чем отличаются схемы «звезда» и «снежинка»? Какие преимущества дает схема «снежинка» при анализе данных с иерархией измерений? Какую цель преследует использование гибридной концепции ХД? Каков принцип организации гибридных ХД? В чем недостаток гибридных ХД? Что такое витрина данных? Каковы преимущества и недостатки использования витрин данных? Имеет ли смысл использовать витрины данных на предприятии, не имеющем подразделений? Что такое виртуальное ХД?