Основные классы ИС продолжение Бизнес-приложения: DSS-BI. www.econ.msu.ru Необходимость СППР • Ограниченная рациональность (не всегда рациональный экономический выбор) Herbert Simon "Models of Man": "boundedly rational agents experience limits in formulating and solving complex problems and in processing (receiving, storing, retrieving, transmitting) information" Трудно сформулировать целевую функцию Недостаточно данных Трудно обрабатывая данные получить требуемые информацию и знания • Огромный объем сведений = >> трудно переработать и использовать для принятия экономических решений Кафедра экономической информатики ЭФ МГУ 2 Decision Support Systems (DSS). • Системы поддержки принятия решений (СППР), основанные на: Документах Знаниях Телекоммуникациях Данных Моделях Кафедра экономической информатики ЭФ МГУ 3 DSS на данных: OLAP • OLAP - Online analytical processing или оперативный анализ информации. Эдгар Кодд, 1993. • Концепция FASMI Fast (Быстрый) – 1-5 секунд на ответ Analysis (Анализ) – Всевозможные аналитические инструменты без дополнительной настройки Shared (Разделяемый) – Безопасность, помехозащищенность Multidimensional (Многомерный) – Полная иерархичность и многомерность Information (Информация) – Быстрый доступ к информации Сводная таблица в EXCEL. Рынок OLAP-систем • Объем мировых продаж порядка $5 млрд. • Основные производители: Microsoft Hyperion Cognos SAP ORACLE Кафедра экономической информатики ЭФ МГУ 5 Хранилище данных (Data Warehouse). • Билл Инмон: " Хранилище данных — это предметноориентированное, привязанное ко времени и неизменяемое собрание данных для поддержки процесса принятия управляющих решений". Кафедра экономической информатики ЭФ МГУ 6 Хранилище данных. Зачем строить хранилища данных — ведь они содержат заведомо избыточную информацию, которая и так "живет" в базах или файлах оперативных систем (ERP, CRM…)? 1. Задача хранилища — предоставить "сырье" для анализа в одном месте и в простой, понятной структуре. 2. Сложные аналитические запросы к оперативной информации тормозят текущую работу компании, надолго блокируя таблицы и захватывая ресурсы сервера. Кафедра экономической информатики ЭФ МГУ 7 ETL: Extracting, Transforming, Loading Ростов OLTP-БД1 London OLTP-БД2 New York данные биржи ETL Кафедра экономической информатики ЭФ МГУ Хранилище данных 8 Многомерный куб данных • • Измерения (разрезы, атрибуты) Дата Товар или группа товаров Супермаркет Страна Клиент Договор Менеджер Показатели (факты, метрики) Объем продаж Остаток на счёте Сумма проводки Цена товара в чеке Сумма дохода Продолжительность телефонного звонка Основные инструменты OLAP • Slice – формирование среза по измерению • Rotate – изменение порядка представления измерений • Drill Up – переход к более агрегированным данным • Drill Down – переход к более детализированным данным Кафедра экономической информатики ЭФ МГУ 10 Базовые возможности • Форматирование • Итоги и агрегация • Сортировка • Фильтрация • Визуальное представление Базовые возможности - исходные данные в формате MICROSTRATEGY Кафедра экономической информатики ЭФ МГУ 12 Базовые возможности – сортировка по году, региону и прибыли (profit) Кафедра экономической информатики ЭФ МГУ 13 Базовые возможности – отбор по признаку «недостижение прогнозного значения прибыли» Кафедра экономической информатики ЭФ МГУ 14 Базовые возможности – итоги и агрегация Кафедра экономической информатики ЭФ МГУ 15 Базовые возможности – вычислимое поле “Revenue Flag” Кафедра экономической информатики ЭФ МГУ 16 Базовые возможности - визуализация Кафедра экономической информатики ЭФ МГУ 17 Детализация и группировка • Детализация (Drill-down) Переход по иерархии вниз • Группировка (Drill-up, Roll-up) Переход по иерархии вверх • Движение сквозь данные (Drill-across) Переход в соседнюю иерархию Детализация и группировка Проекция и вращение • Операция вращения куба данных (pivoting and rotation) • Операция проекции куба данных (slice and dice) Проекция и вращение DSS на моделях: Data Mining Data Mining - Интеллектуальный анализ данных • Выявление закономерностей и связей Кластеризация Классификация Ассоциация Последовательность Понижение размерности Статистический анализ отклонений Прогнозирование • Визуализация результатов Кластеризация • Кластеризация – разбиения совокупности объектов на однородные группы • Характеристики кластера Внутренняя однородность Внешняя изолированность Задача кластеризации Классификация • Классификация – отнесение объекта, к одному из заранее известных классов • Этапы классификации Обучение Процесс классификации Задача факторного анализа (одна из возможностей снижения размерности) Основные принципы факторного анализа Прогнозирование Прогнозирование – исследование перспектив развития какого-либо процесса Методы прогнозирования • Регрессионные (моделирование) • Методы классификации Выводы. • 1. Системы поддержки принятия решений (СППР) - в отличие от трансакционных информационных систем - решают задачи анализа функционирования и прогнозирования развития бизнеса, относящиеся к классу неструктурированных или полуструктурированных задач и являются АНАЛИТИЧЕСКИМИ. • 2. OLAP – системы являются удобным и простым инструментом для решения наиболее часто встречающихся задач оперативного анализа данных о динамике бизнеса. • 3. Системы класса Data Mining представляют удобную реализацию наиболее часто используемых алгоритмов решения задач статистического анализа: кластеризации, классификации, снижения размерности, восстановления зависимостей и т.д.. • 4. Применение СППР направлено на повышение конкурентоспособности бизнеса. Кафедра экономической информатики ЭФ МГУ 29