Мониторинг бизнес-приложений «глазами пользователей» в ИТ-Службе [Quality of Experience + Application Performance] Monitor Платформа SLA-ON, (С) ProLAN, 2011 Бережливый ITSM и решения ProLAN Повышение производительн ости труда (бэк офиса) Мониторинг Эффективной Нагрузки работников регламентированного труда Предотвращение инцидентов Ускорение диагностики инцидентов ИТ - Бизнес Мониторинг бизнес-приложений «глазами пользователей» Ускорение квалификации инцидентов Корреляция информации об инцидентах с информацией о здоровье ИТ-Инфраструктуры и производительности приложений Автоматическая регистрация инцидентов Платформа SLA-ON, (С) ProLAN, 2011 Концепция Платформа SLA-ON, (С) ProLAN, 2011 Концепция решения Пятый Уровень Платформа SLA-ON, (С) ProLAN, 2011 Назначение Пятого Уровня 1. ИТ-Служба получает [Quality of Experience + Application Performance] Monitor, - инструментарий для повышения качества предоставления и поддержки ИТУслуг: 2. HR-Служба получает средство для нормирования труда и оптимизации численности персонала. 3. Бизнес получает дополнительный индикатор эффективности бизнес-процессов, работающий в режиме реального времени. Платформа SLA-ON, (С) ProLAN, 2011 Применение Пятого Уровня в ИТ-Службе 1. Управление качеством предоставления ИТ-Услуг: • Service Level Management (SLR SLO SLT SLA) 2. Повышение качества поддержки ИТ-Услуг: • Чтобы узнавать о сбоях в работе до обращения пользователей в Service Desk. • Если сбой произошел, то иметь возможность быстро его квалифицировать, а именно: Определить «уровень бедствия» (отдельный пользователь, группа, все пользователи приложения). Оценить влияние сбоя на бизнес-процессы. • Автоматически получать информацию, позволяющую быстро определять корневые причины сбоев. Если сбой в работе ИТ-Инфраструктуры, то где именно. Если неправильные действия пользователей, то какие именно. Платформа SLA-ON, (С) ProLAN, 2011 Традиционный Real User Monitoring (RUM) Платформа SLA-ON, (С) ProLAN, 2011 Ограничения традиционного RUM 1. ОЧЕНЬ СЛОЖНО, ОЧЕНЬ ТРУДОЕМКО, ОЧЕНЬ ДОРОГО. Для эффективного использования традиционного RUM необходимы: адекватная объектная модель + возможность контролировать ВСЁ + «супермозг». 2. Мониторинг псевдо реального QoE. • Вместо контроля реальных транзакций (как это видят пользователи) – контролируется их «отражение» в сетевом трафике (что не всегда одно и тоже). 3. Сложность мониторинга QoE в разрезе бизнес-процессов, ролей, и т.п. 4. Сложность диагностики корневых причин сбоев (отсутствие эффективной системы анализа получаемой информации). • Четыре «измерения» (APM, NPM, QoE, Incidents), связанные друг с другом только через Объектную Модель. • «Бедное» оповещение о сбоях. 5. Высокая стоимость и низкая масштабируемость. • Анализатор в центре сети (в месте консолидации трафика) – низкая точность; на границе сети – высокая стоимость. Платформа SLA-ON, (С) ProLAN, 2011 Архитектура решения Пятый Уровень Платформа SLA-ON, (С) ProLAN, 2011 «Паспорт» решения Пятый Уровень 1. Сбор данных – Client Instrumentation. 2. Управление данными – NMS,поддерживающая SNMP. 3. Диагностика сбоев - агрегация информации, характеризующей производительность ИТ-Инфраструктуры, бизнес-приложений, True QoE, инцидентов в единой базе данных и проведение факторного анализа. • • • «Привязка» всех метрик (APM, NPM, QoE, Incidents) к единой временной шкале. Корреляция Событий и Состояний. Автоматическое определение Связанных Событий. 4. Triggers: время реакции приложений, системные и пользовательские ошибки, APDEX. 5. Alarms: автоматическая отправка Снимка Инцидента (скриншот, информация о пользователе, бизнес-операции и др.) в Service Desk (HP Service Mananer, BMC Remedy, другие). Платформа SLA-ON, (С) ProLAN, 2011 Преимущества решения Пятый Уровень 1. ПРОСТО, РОБАСТНО, ДОСТУПНО. 2. Адекватность получаемой информации - True QoE. 3. Возможность мониторинга QoE в разрезе бизнес-процессов, ролей, географии и т.п. 4. Эффективная диагностика сбоев. • «Привязка» сбоев в работе бизнес-приложений к Оценкам Здоровью ИТИнфраструктуры (получаемыми средствами Экспертной Системы). • Содержательное Оповещение о Сбоях (Снимок Инцидента). • Факторный анализ 5. Поддержка APDEX. • Эффективность Service Level Management • Эффективность Incident Management, Availability Management, Capacity Management. Платформа SLA-ON, (С) ProLAN, 2011 Технология Платформа SLA-ON, (С) ProLAN, 2011 Experience & Performance Agent (EPM-Агент) Платформа SLA-ON, (С) ProLAN, 2011 Пример транзакции: «Выдача кредита в Diasoft FA#» Платформа SLA-ON, (С) ProLAN, 2011 Метрики Quality of Experience Метрики: Атрибуты метрик: 1. Время выполнения системных и пользовательских транзакций (RT). 1. Имя пользователя и домен (например, Ivanov@prolan) 2. Ошибки при выполнении транзакций: 2. Бизнес-процесс (например, учет товаров). Системные ошибки. Пользовательские ошибки. 3. Число выполненных транзакций: Нормально завершенные транзакции. Принудительно завершенные транзакции (ошибка, тайм-аут). Транзакции с нарушением последовательности действий. 4. Application Performance Index APDEX (www.apdex.org) ProLAN 1DEX Платформа SLA-ON, (С) ProLAN, 2011 3. Бизнес-приложение (например, 1С Предприятие). 4. Местоположение пользователя (например, московский офис). 5. Подразделение пользователя (например, бухгалтерия) 6. Вид транзакции (например, Task). 7. Другое (на ваше усмотрение) APDEX (www.apdex.org) – оценка Quality of Experience APDEX и Service Level Management: SLR SLO SLT SLA SLR – например, время выдачи кредита < 10 мин. SLO = T, например – 2 сек. SLT = Apdex [2], например 0.7 SLA – как соблюдается SLT Платформа SLA-ON, (С) ProLAN, 2011 «Пятый Уровень + Красная Кнопка» Платформа SLA-ON, (С) ProLAN, 2011 Состав решения: «Пятый Уровень + Красная Кнопка» ПО на компьютере пользователя + EPM-Агент Измерят QoE + «красная кнопка» +/- SelfTrace Определяет, какую бизнес-операцию выполняет пользователь +/- Remote Hands Удаленное управление компьютером пользователя +/- HelpMe «Красная кнопка» + дополнительные возможности Агрегатор Информации + SLA-ON Operartions Консоль управления здоровьем ИТ-Инфраструктуры + консоль удаленного управления компьютерами пользователей + консоль управления событиями (Help Desk) + SLA-ON Probe Измерительный зонд + Экспертная Система + Экспертизы + запись Снимков Инцидента в консолидированную базу данных +/- Коннектор Интеграция с Service Desk +/- AutoImport Запись информации о здоровье ИТ-Инфраструктуры и выполняемых пользователями операциях в консолидированную базу данных + управление этими данными «+» - обязательно; «+/-» - опционально. Платформа SLA-ON, (С) ProLAN, 2011 Интеграция Платформа SLA-ON, (С) ProLAN, 2011 Интеграция «из коробки» с NMS Платформа SLA-ON, (С) ProLAN, 2011 Root Cause Analysis (пример методики) «Привязка» сбоев в работе бизнес-приложений к Оценкам Здоровья ИТ-Инфраструктуры (получаемым средствами Экспертной Системы). Платформа SLA-ON, (С) ProLAN, 2011 Проактивное управление QoE Платформа SLA-ON, (С) ProLAN, 2011 Способы интеграции с Service Desk Платформа SLA-ON, (С) ProLAN, 2011 Вместо заключения Ключевые преимущества: 1. Адекватность получаемой информации. 2. Мощные диагностические возможности. 3. Экономичность. Ограничения: 1. Необходимость разработки Шаблонов, однако: • Для тиражируемых приложений ProLAN разрабатывает Шаблоны бесплатно. • Шаблоны можно разрабатывать самостоятельно (предоставляется детальная инструкция). 2. В настоящее время в полной мере поддерживаются только Windows-приложения, однако: • Для приложений другого типа предлагается другая методика управления QoE. • Поддерживается интеграция с Network Instruments GigaStor; возможна интеграция с продуктами других вендоров. Платформа SLA-ON, (С) ProLAN, 2011 Приложение №1 Пятый Уровень на платформе Network Instruments Подробнее: http://www.prolan.ru/solutions/showcase/prolanplusni/index.html Платформа SLA-ON, (С) ProLAN, 2011