Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Антон Миносьян Ведущий инженер отдела системной интеграции aminosjan@polikom.ru Поставка ПО и оборудования ИТ-инфраструктура Бизнес-приложения ЦОД, сети, инженерная инфраструктура 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Вопросы обеспечения непрерывности бизнеса Непрерывность бизнеса Как поддерживать системы в работоспособном состоянии? Защита данных Как предотвратить потерю данных? Высокая доступность Как минимизировать простои? 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Аварийное восстановление Как сократить время восстановления после сбоя? Решения VMWare Простой на уровне Плановый простой Сайта Site Recovery Manager Хранилища Сервера Сети Внеплановый простой Storage VMotion vStorage Backup APIs Data Recovery VMotion + DRS Maintenance Mode HA, Fault Tolerance Network Redundancy (отказоустойчивость сетевых путей) NIC & HBA Teaming 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Предотвращение плановых простоев: VMotion VMotion vSphere Storage VMotion VMware vSphere 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры vSphere Network VMotion Особенности технологии Network vMotion • До четырех одновременных миграций на адаптерах 1Gbps и до 8 одновременных миграций по 10Gbps сетевым адаптерам • Поддержка до 4 адаптеров 10Gbps и до 16 адаптеров 1Gbps • Миграция одной виртуальной машины vMotion может идти сразу по нескольким сетевым адаптерам (между ними - балансировка нагрузки) • В версии 5.5: миграция VM между хостами, на которых установлены графические адаптеры (GPU) разных вендоров. В случае полной несовместимости VM автоматически переключается на Soft 3D (программная эмуляция) 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Network vMotion без общего хранилища • Аналогия с Microsoft Hyper-V. Впервые появилась в vSphere 5.1 • Shared Nothing vSphere vMotion возможность "горячей" миграции виртуальных машин без использования общего хранилища. • VM должны быть в пределах одного объекта “Datacenter” • Управляется только vSphere Web Client 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Особенности Storage vMotion • Параллельная миграция дисков VMDK 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Сокращение внеплановых простоев •Сбои аппаратных компонентов – Использование дублированных LAN и SAN соединений •Сбои серверов – Автоматический перезапуск ВМ. VMware High Availability автоматически запускает ВМ на работоспособном сервере – Непрерывная защита ВМ VMware Fault Tolerance •Сбои на уровне сайта X 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры – Автоматизированное переключение на резервный сайт (failover) VMware Site Recovery Manager Сетевые технологии vSphere • Стандартный коммутатор (Standard vSwitch) Отдельная сущность на каждом хосте ESXi • Распределенный коммутатор (Distributed vSwitch) Единая конфигурация на всех охваченных узлах, включая группы портов (виртуальные сети) и все настройки • NIC Teaming и балансировка нагрузки NIC Teaming – Active/active или Active/standby, различные политики failover Балансировка нагрузки: на базе Port ID, IP Hash, Source MAC Hash, Explicit failover order, Physical NIC Load (только dvSwitch) 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Сетевые технологии vSphere. Link Aggregation (LACP) • В vSphere 5.5 поддерживается до 64 физических соединения в агрегированном канале (Link Aggregation Group, LAG), и до 64 LAG на один dvSwitch 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Сокращение внеплановых простоев: High Availability XX App App HA HA OS OS VMware ESX App App App App OS OS OS OS VMware ESX X 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Защита от сбоя аппаратного сервера, сбоя гостевой ОС ВМ автоматически перезапускается при сбое (требуется время на загрузку гостевой ОС) Настраиваемые политики failover. Контроль наличия свободных ресурсов на случай сбоя Возможность задать приоритет перезапуска для каждой ВМ High Availability в версии vSphere 5.x • На хост-серверах ESXi 5.x есть агенты (Fault Domain Manager - FDM), среди которых выбирается Master, управляющий операциями восстановления HA. • Мастер следит за всеми защищаемыми хостами и виртуальными машинами, ведет список защищенных ВМ, мониторит кластер и взаимодействует с vCenter • Slave отдают отчет на Master. В случае сбоя Master – перевыборы. Побеждает хост с максимальным количеством хранилищ (при эквивалентном количестве он выбирается случайно) 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Архитектура High Availability 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Сокращение внеплановых простоев: Fault Tolerance Две идентичные ВМ одновременно выполняются на разных хостах APP APP APP OS OS OS Отсутствие простоя при сбое аппаратного сервера VMware vSphere™ Не требуется специализированное оборудование Единый механизм защиты для всех приложений 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Механизм защиты от сбоев Изменения уровней доступности приложений Непрерывная защита VMware FT Автоматический перезапуск VMware HA Нет защиты 0% 100% 10% Охват приложений 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Мониторинг приложений – vSphere AppHA • Ранее механизм VM Monitoring позволял только перезапускать VM • Теперь поддерживается мониторинг приложений средствами агентов Microsoft SQL 2005, 2008, 2008R2, 2012 Tomcat 6.0, 7.0 TC Server Runtime 6.0, 7.0 Microsoft IIS 6.0, 7.0, 8.0 Apache HTTP Server 1.3, 2.0, 2.2 • Рестарт приложений, если не помогает – рестарт VM, на основе политик 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Политики AppHA 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Distributed Resource Scheduling – DRS • Классический DRS – балансировка нагрузки на серверы в кластере ESXi • DRS для хранилища (Storage DRS) – в vSphere 5 и выше Динамические замеры нагрузки по RAM, CPU, дисковой подсистеме (для Storage DRS) Ручной либо автоматический режим применения рекомендаций Различные уровни агрессивности Правила аффинности (Affinity Rules) для HA и DRS 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Storage DRS Связанная технология - Storage Profiles 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Защита данных. Резервное копирование Интерфейс управления VMware vCenter ПО резервного копирования от партнеров VMware Data Recovery VMware vStorage API for Data Protection VMware Infrastructure VMWare API for Data Protection (VADP) В зависимости от требуемого функционала могут быть использованы решения от партнеров, или встроенное решение VMWare Data Protection 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Защита данных. vSphere Data Protection • Резервное копирование содержимого гостевой ОС виртуальной машины, без агентов и со встроенной дедупликацией. • Синтетическое резервное копирование на основе технологии CBT (Change Block Tracking) 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Технологии. Традиционное резервное копирование SUN MON TUE WED THU FRI SAT SUN Полная копия Полная копия • Требуются, как минимум, еженедельные «полные» копии и ежедневные копии изменений, часто на уровне файлов. • Для восстановления требуется свежая полная копия + изменения на каждую дату. 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Технологии. Синтетическое резервное копирование на основе CBT Полная копия Полная копия Полная копия FRI SAT SUN Полная копия THU Полная копия WED Полная копия TUE Полная копия • • MON Полная копия • SUN Требуется только одна полная копия, ежедневные копии содержат изменения на уровне блоков. Восстановление состояния ВМ на любую дату за один шаг Регулярные «полные» копии не требуются >> экономия места на носителе. Как правило, используются дисковые пулы по соображениям скорости 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Защита данных. Партнерские решения по резервному копированию используют API VADP • Поддержка гранулярного восстановления отдельных файлов либо данных приложений (AD/Exchange/SQL/Sharepoint/Windows/Linux) GRT в Symantec U-Air в Veeam Backup and Replication • Поддержка VSS в гостевых системах Windows • Репликация, дедупликация, компрессия • Лицензируются отдельно Во встроенное решение VADP 5.5 вошла часть функционала коммерческих средств – гранулярное восстановление Exchange и Sharepoint, тестирование восстановленной VM в изолированной среде 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Сложность аварийного восстановления Комплексная инфраструктура, сложные взаимосвязи ? Требуются: актуальная документация, обучение персонала, тестовые восстановления На практике не удается восстановить инфраструктуру за требуемое время > Восстановление занимает дни и даже недели > Большие трудозатраты IT-персонала > В худшем случае – невозможность полного восстановления ? ? ? ? ? ? ? 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Защита от сбоев на уровне сайта: Site Recovery Manager Упрощает и автоматизирует процедуры переноса нагрузки на резервный сайт Автоматизированный план аварийного восстановления вместо бумажных инструкций Централизованное управление планами восстановления из консоли vCenter Возможность практического тестирования планов аварийного восстановления 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Архитектура SRM vCenter vCenter SRM SRM СХД 1 СХД 2 Репликация средствами СХД 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры SRM может использовать vSphere Replication • Репликация средствами VMWare vSphere (vSphere Replication) 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Дополнительные возможности SRM. Автоматическое восстановление (Automatic Failback) 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Дополнительные возможности SRM. Плановая миграция (Planned Migration) 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Подводя итог VMWare обеспечивает защиту от сбоев на разных уровнях: VMware Fault Tolerance, High Availability, DRS Maintenance Mode, VMotion Site Recovery Manager Storage VMotion NIC Teaming, Multipathing VDP + Third-Party Backup Solutions, VADP Компонент Сервер Хранилище 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Данные Сайт Благодарю за внимание! Антон Миносьян Ведущий инженер aminosjan@polikom.ru Москва тел. (495) 660 32 91 факс (495) 660 32 93 23.12.2013 | Механизмы обеспечения высокой доступности виртуальной серверной инфраструктуры Санкт-Петербург тел. (812) 325 84 00 факс (812) 320 56 86 www.polikom.ru