Доказательная медицина и интеллектуальный анализ данных в клинической информатике с помощью системы FCART А.А. Незнанов, к.т.н., доц. © А.А. Незнанов, 2015 Доказательная медицина Доказательная медицина или медицина, основанная на доказательствах [evidence-based medicine] – совокупность методологических подходов к медицинской практике, опирающихся на проверку эффективности любых клинических действий, причём эффективность обосновывается рандомизированными клиническими исследованиями В узком смысле это подразумевает, что решение о применении лечебных или профилактических мер по отношению к пациенту принимается только исходя из существующих доказательств эффективности и безопасности этих мероприятий В современном смысле термин введён в 1990 году введен группой ученых из Канады Крупнейшая организация, специализирующаяся на доказательной медицине – The Cochrane Collaboration (http://www.cochrane.org) с лозунгом «Trusted evidence. Informed Decisions. Better health» © А.А. Незнанов, 2015 2 Клинические исследования Клиническое исследование/испытание [Clinical study/trial] – исследование воздействия медицинских препаратов, приборов и методов лечения на человека (пациента) с целью выявления любых положительных или отрицательных результатов и оценки эффективности и безопасности предлагаемого средства Клиническое исследование (КИ) должно быть как минимум рандомизированным двойным слепым, но также очень желательно – с проверкой плацебо-эффекта Такое КИ называется контролируемым или рандомизированным (по главной процедуре ) Главная аббревиатура – РКИ РКИ – статистический эксперимент специального вида! © А.А. Незнанов, 2015 3 Свойства РКИ Основные свойства: Ослепление (Слепое исследование [Blind Study]) – одна или несколько участвующих сторон не знают, как распределены пациенты и/или средства по группам лечения и контроля Одинарное, двойное, тройное, полное Рандомизация (Рандомизированное исследование [Randomized Study/Trial]) – пациенты распределяются по группам лечения на основе процедур рандомизации (для повышения равновероятности получения каждого из средств) Стратификация [Stratification] – повышение равномерности распределения факторов риска (возраст, пол, избыточный вес, генетический маркер и др.) в группах лечения Критерии включения/исключения [inclusion/exclusion criteria] – характеристики, которые позволяют / не позволяют пациенту принять участие в КИ © А.А. Незнанов, 2015 4 Медицинская статистика Медицинская статистика – отрасль статистики, изучающая явления и процессы в области здоровья населения и здравоохранения Задачи медицинской статистики: Разработка специальных методов исследования массовых процессов и явлений в медицине и здравоохранении Выявление наиболее существенных тенденций в здоровье населения во взаимосвязи с конкретными условиями и образом жизни Особенности Акцент на анализе временных рядов, анализе выживаемости и и специальных методах подготовки данных Развивалась ещё до формулировки термина «доказательная медицина» и дала много результатов, обогативших другие отрасли © А.А. Незнанов, 2015 5 Цензурирование наблюдений Цензурированные наблюдения – наблюдения, которые содержат неполную информацию Пример: «пациент A был жив, по крайней мере, 4 месяца с момента начала наблюдений до момента перевода в другую клинику, когда контакт с ним был потерян» Наблюдения формализуются в виде «событий» разных типов на временной оси Механизмы цензурирования: Фиксированное цензурирование Случайное цензурирование Направления цензурирования Правостороннее цензурирование Левостороннее цензурирование © А.А. Незнанов, 2015 6 Пример на цензурирование наблюдений Графики жизни при левостороннем и правостороннем цензурировании © А.А. Незнанов, 2015 7 Анализ выживаемости Анализ выживаемости [Survival analysis] – область медицинской статистики, занимающаяся оценкой вероятности наступления события некоторого типа на основе истории аналогичных событий В методах анализа выживаемости вместо функции распределения удобнее использовать функцию выживания – вероятность того, что объект проживет время большее t Описательные методы исследования цензурированных данных: Построение таблиц времен жизни Подгонка распределения выживаемости Оценивание функции выживания с помощью процедуры Каплана-Мейера Введение в рассмотрение факторов риска и оценивание кумулятивных конкурирующих рисков Разнообразие моделей © А.А. Незнанов, 2015 8 Пример дискретной функции выживаемости © А.А. Незнанов, 2015 9 Постановки проблем при сравнении Superiority Equivalence Обоснование превосходства Обоснование эквивалентности Non-inferiority Обоснование не меньшей эффективности © А.А. Незнанов, 2015 10 © А.А. Незнанов, 2015 11 Технологии РКИ Проведение и использование результатов РКИ – огромная высокотехнологичная отрасль! Регистры РКИ Пример одного из наиболее важных регистров РКИ – ClinicalTrials.gov (http://clinicaltrial.gov) Клинические регистры и службы сопровождения [Clinical Trial Management Software] Пример веб-службы – Sealed envelop: Randomisation and online databases for clinical trials (https://www.sealedenvelope.com) Пример интегрированной среды – Bio-Optronics Clinical Conductor (http://biooptronics.com/clinical-conductor) Средства планирования и анализа результатов Универсальные R, SAS, SPSS, XLSTAT и др. Создаются многочисленные расширения для нужд медицинской статистики Специальные средства, например Aptiv Solutions ADDPLAN (http://www.aptivsolutions.com/addplan-software) Интеграционные средства Пример – средства, поддерживающие стандарт HL7 (http://www.hl7.org) © А.А. Незнанов, 2015 12 ClinicalTrials.gov UI sample © А.А. Незнанов, 2015 13 Sealed envelop UI samples © А.А. Незнанов, 2015 14 Проблемы РКИ Весьма ограниченное понимание статистики другими специалистам Сложность разработки «дизайна РКИ» Вопросы интерпретации результатов Top Five Mistakes in Clinical Protocol Design (http://www.askcato.com/2014/10/top-five-mistakes-clinical-protocol-design) Ten Most Common Mistakes in Clinical Trial Interpretation (http://www.slideshare.net/clinicaltrialist/intellectual-optical-illusions-in-clinicaltrials-slidecast-version) Подлоги The vaccine-autism connection: a public health crisis caused by unethical medical practices and fraudulent science, Dennis K Flaherty, Annals of Pharmacotherapy, 45(10):1302-4, 2011 (http://www.ncbi.nlm.nih.gov/pubmed/21917556) © А.А. Незнанов, 2015 15 R Packages ClinicalTrials catalog (http://cran.rproject.org/web/views/ClinicalTrials.html) Например, Package Survival (http://cran.rproject.org/web/packages/survival/survival.pdf) Пример вызова (на основе тестовых данных, входящих в Surv): 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. library(survival); library(KMsurv); library(OIsurv); data(psych); attach(psych); my.surv <- Surv(age, age+time, death); my.surv; detach(psych); survfit(my.surv ~ 1); my.fit <- survfit(my.surv ~ 1); plot(my.fit, main="Kaplan-Meier estimate with 95% confidence bounds", xlab="time", ylab="survival function") © А.А. Незнанов, 2015 16 Промежуточные выводы Доказательная медицина – магистральный путь развития здравоохранения Без РКИ не было бы не только вполне понятного повышения эффективности ранее известных методов, но и столь бурного развития высокотехнологичной медицинской помощи (ВМП) Более того – не было бы даже намёка на персонализированную медицину В России – всё очень печально, но есть надежда Ассоциация организаций по клиническим исследованиям (http://actorussia.org) Перевод международной нормативной базы Продвижение стандартов и «лучших практик» © А.А. Незнанов, 2015 17 Медицинская информатика Медицинская информатика (МИ) [Medical informatics] Наиболее общее определение: the discipline, dedicated to the systematic processing of data, information and knowledge in medicine and health care Включает также: Клиническая информатика [Clinical Informatics], Оптимизация ухода за пациентами [Nursing Informatics] Примыкает к: Биоинформатика [Bioinformatics] Официальная история начинается в 1967 году с создания International Medical Informatics Association (IMIA) С конца 1990-х годов – специализации в ведущих университетах (например, Гарвардской медицинской школе) В соответствии с новыми стандартами и сертификационными программами (например, Board Certified in Clinical Informatics) Число публикаций за последние пять лет – более 12000 статей только по базам Springer Link и Elsevier Science Direct! © А.А. Незнанов, 2015 18 Основные драйверы развития МИ Программируемые электронно-вычислительные машины (компьютеры) Телекоммуникационные технологии Базы данных Онтологическое моделирование и базы знаний Робототехника (телеприсутствие, робо-хирурги, роботизированные аптеки, …) Молекулярная биология и фармацевтика Средства объективной диагностики пациентов с выдачей показателей в цифровом виде Доказательная медицина Формализация стандартов медицинской помощи Генетика и персонализированная медицина © А.А. Незнанов, 2015 19 Цель и примеры задач МИ Основная цель МИ – повышение качества здравоохранения за счет применения современных алгоритмов анализа и обработки данных Задачи Повышение качества медицинских данных (без дополнительной нагрузки на пациента) Менеджмент и управление операциями в клинике Принятие решений Факторный анализ результатов клинического исследования Компьютерная диагностика Математическое моделирование Интеграция и стандартизация Конфиденциальность и обмен данными ... © А.А. Незнанов, 2015 20 Основные проблемы Многоуровневое регулирование сферы здравоохранения => непроизводительные затраты и время Жесткие требования надёжности и информационной безопасности => повышение стоимости и понижение удобства Трудность пилотного развёртывания решений Огромная косность мышления и кадровые проблемы Отсутствие ясно выраженных плюсов к дальнейшему развитию большинства методов для большинства врачей и медперсонала после решения локальных критических проблем Интеграция большого числа разнородных компонентов МИС НО! Наличие явных плюсов и синергетический эффект от комплексного внедрения решений! © А.А. Незнанов, 2015 21 © А.А. Незнанов, 2015 22 Медицинские информационные системы Базовые медицинские системы (МИС) – управление историями болезни и карточками пациентов (Electronic Healthcare Records) Лабораторные информационные системы – автоматизация лабораторных исследований Системы диагностики реального времени – поддержка реанимационных мероприятий и др. Системы поддержки принятия врачебных решений – экспертные системы в клинической практике Системы трансфузиологии – управление донациями и компонентами крови PACS-системы – накопление и анализ мультимедийных диагностических данных Клинические регистры – сопровождение рандомизированных клинических исследований Телемедицинские системы – организация удалённой коллективной работы, телеконференций, телеприсутствия И многие другие … © А.А. Незнанов, 2015 23 История развития МИС До 1990 г. – исследования + EHR С 1990 гг. – резкое удешевление персоналок – локальные и клиент-серверные системы, повсеместное внедрение в США Европе С 2000 гг. – новое поколение МИС, интероперабельность, вебинтерфейсы, интеграция с диагностическими системами С 2010 гг. – резкое удешевление обработки больших данных, реальное внедрение крупномасштабной аналитики, начало поддержки персонализированной медицины С 2012 г. – появление полноценных интерфейсов для пациентов и методология постоянного сопровождения, носимое медицинское оборудование © А.А. Незнанов, 2015 24 Что даёт интеллектуальный анализ данных? В первую очередь – новые возможности систем поддержки принятия врачебных решений (CDSS) Майнинг данных Выявление знаний в неструктурированных данных (тексты, изображения) Визуализация Согласование знаний: как в рамках предметных областей, так и междисциплинарных Онтологическое моделирование: формализация и уточнение понятий и связей между ними, интеграция онтологий Стандарты на обмен знаниями Новые методы обработки и интерпретации результатов РКИ Новый уровень метаанализа (анализа результатов нескольких РКИ в одной области за многие годы) © А.А. Незнанов, 2015 25 Онтологическое моделирование в медицине Важнейшее направление – базис нового поколения баз знаний и систем анализа медицинских данных Развивается во всех предметных областях – от общей терминологии и связи базовых понятий медицины (метаонтологии) до заболеваний, симптомов, возбудителей, лекарственных препаратов и их компонентов, методов лечения, геномных маркеров и т.д. Многие онтологии свободны и доступны для непосредственного использования через web-сервисы или пользовательские webинтерфейсы Приведём лишь несколько примеров © А.А. Незнанов, 2015 26 Базовые метаонтологии Unified Medical Language System (UMLS) Metathesaurus (http://www.nlm.nih.gov/research/umls/quickstart.html) Интегратор источников данных, предметных онтологий и метаонтологий SNOMED Clinical Terms (http://www.ihtsdo.org/snomed-ct) Medical Subject Headings (MeSH) (http://www.nlm.nih.gov/mesh/meshhome.html) MedDRA текущая версия 17.1 (http://www.meddra.org) HL7 Reference Information Model (http://www.hl7.org/implement/standards/rim.cfm) … Инструменты группы Medical Ontology Research (http://mor.nlm.nih.gov) © А.А. Незнанов, 2015 27 Классификаторы и онтологии заболеваний Болезни (Diseases) – важнейшая область онтологического моделирования,с точки зрения классификации – класс проблем со здоровьем, который можно выделить с точки зрения причин, симптоматики, последствий и способов лечения International Classification of Diseases and Related Health Problems, ICD – 10 пересмотр, сейчас готовится 11 пересмотр (http://www.who.int/classifications/icd) ICD-O (Oncology) – 3 пересмотр (http://www.who.int/classifications/icd/adaptations/oncology) Международная классификация болезней, МКБ Перевод ICD с некоторыми странными несоответствиями The Disease Ontology (http://disease-ontology.org) … © А.А. Незнанов, 2015 28 Другие предметные онтологии FDA Substance Registration System – Unique Ingredient Identifier (http://fdasis.nlm.nih.gov/srs/srs.jsp) RxNorm – нормализованные названия лекарственных препаратов (http://www.nlm.nih.gov/research/umls/rxnorm/index.html) Anatomical Therapeutic Chemical (ATC) classification system (http://www.whocc.no/atc_ddd_methodology) Drug Interactions Checker (http://www.drugs.com/drug_interactions.php) Gene Ontology Consortium (http://geneontology.org/) … © А.А. Незнанов, 2015 29 Проекты ДАДиИИ НИУ ВШЭ Департамент анализа данных и искусственного интеллекта факультета компьютерных наук НИУ ВШЭ (http://cs.hse.ru/ai) Направление подготовки «Прикладная математика и информатика» Магистерская программа «Науки о данных» [Data Science] Дисциплины «Введение в медицинскую информатику», «Практикум по анализу данных в медицине» Проекты по анализу данных в медицины Структурированных данных диагностики и назначений Текстов на естественном языке – историй болезни, осмотров и т.п. Мультимедийных данных Проекты по оптимизации бизнес-процессов в медицине Проекты по развитию медицинской статистики и поддержке рандомизированных клинических исследований © А.А. Незнанов, 2015 30 Образовательные аспекты МИ: области знания Математика (медицинская статистика, методы оптимизации, анализ временных рядов, …) Анализ данных и методы искусственного интеллекта (майнинг данных, визуализация данных, машинное обучение, компьютерная лингвистика, рекомендательные системы, онтологичекое моделирование) Программная инженерия (МИС) Робототехника Менеджмент и оптимизация бизнес-процессов © А.А. Незнанов, 2015 31 Проект 1: Улучшение качества изображений Улучшение качества включает в себя: Минимизацию побочных эффектов для пациента Создание алгоритмов для повышения «веса» наиболее диагностическиважных факторов в снимке Анализ факторов восприятия качества снимка человеком © А.А. Незнанов, 2015 32 Проект 1: Улучшение качества изображений Удаление шума для понижения дозы радиации при сканировании пациента: Удаление шума на сканере © А.А. Незнанов, 2015 Сравнимое качество 33 Проект 1: Улучшение качества изображений Улучшение диагностического качества изображений Улучшение качества © А.А. Незнанов, 2015 34 Проект 2: Управление операциями Современная клиника – это сложная «фабрика» по оказанию медицинских услуг МИ помогает анализировать и оптимально управлять различными процессами в клинике Одно из направление – моделирование различных этапов обслуживания Line1 Line2 Service Line3 Основной разработчик: О.С. Пьяных © А.А. Незнанов, 2015 35 Проект 2: Управление операциями Пример – моделирование потока пациентов. Например, можем ли мы предсказать время ожидания пациента? Сложная, нелинейная задача: Поток пациентов в клинике Максимальное кол-во пациентов в единицу времени Среднее кол-во пациентов в единицу времени © А.А. Незнанов, 2015 36 Проект 2: Управление операциями Построенная модель и предсказанное ею время ожидания пациента: 40 Реальное время 35 Предсказание времени ожидания W 30 Предсказанное время (модель) 25 20 15 10 5 0 1 51 © А.А. Незнанов, 2015 101 151 201 251 301 351 401 451 501 37 Оптимизация выделения ресурсов Fixed supply Optimal supply Задачи целочисленного линейного/нелинейного программирования See: Brunner JO, Bard JF, Kolisch R., “Flexible shift scheduling of physicians”, Health Care Manag Sci. 2009 Sep;12(3):285-305. © А.А. Незнанов, 2015 38 Проект 3: Сегментация изображений Большой объем медицинских данных требует автоматических алгоритмов сегментации – разделения данных на области и анатомические органы Задача должна решаться в реальном времени, устойчиво к шуму и артефактам © А.А. Незнанов, 2015 39 Проект 3: Сегментация изображений Интерактивные алгоритмы сегментации помогают врачу быстро и надежно определить 3D-границы интересующей области: Сегментация почек © А.А. Незнанов, 2015 40 Проект 4. Оптимизация госпитализаций Существует много процессов, которые могут быть оптимизированы только при участии эксперта Эксперт заинтересован в моделях анализа, которые: Просто интерпретируются Уточняются (детализируются) на нескольких уровнях На верхнем уровне имеют небольшой размер (обозримы) Строятся за разумное время Пример – модель траекторий госпитализаций пациентов Большое число параметров и скрытого знания © А.А. Незнанов, 2015 Основные разработчики: А.В. Бузмаков, С.О. Кузнецов 41 Проект 4. Оптимизация госпитализаций Траектории госпитализаций изучаются с помощью «узорных структур» [Pattern Structures] – формализма теории анализа формальных понятий © А.А. Незнанов, 2015 42 Проект 5. Математическое сопровождение рандомизированных клинических исследований Основа доказательной медицины и значимый раздел клинической информатики Базируются на медицинской статистике и различных регистрах Стандартизованы и обладают развитой методологией (http://acto russia.org) Поддерживаются развитыми базами данных и знаний Например: http://www.controlled-trials.com, http://www.clinicaltrials.gov Актуальные задачи Эффективное сопровождение мультицентровых исследований Оптимизация дизайна исследования Повышение эффективности анонимизации и ослепления Новые методы анализа результатов Мета-анализ © А.А. Незнанов, 2015 43 Выводы Медицинская информатика всё более востребована в здравоохранении как прикладная дисциплина, ориентирующая на достижение реального результата Интересные приложения математики, информатики, менеджмента, … Новые технологии открывают новые возможности Изменения методологии, методов и инструментов © А.А. Незнанов, 2015 44 Вопросы? Контакты Доцент департамента анализа данных и искусственного интеллекта ФКН НИУ ВШЭ, заведующий информационно-аналитическим отделом ФНКЦ ДГОИ им. Д. Рогачева, к.т.н., доц. Незнанов Алексей Андреевич E-Mail: aneznanov@hse.ru, alexey.neznanov@fnkc.ru © А.А. Незнанов, 2015 45 Что такое ФНКЦ ДГОИ им. Дмитрия Рогачева? Федеральный научно-клинический центр детской ГЕМАТОЛОГИИ, ОНКОЛОГИИ И ИММУНОЛОГИИ им. Д. Рогачева Крупнейший в Европе центр по лечению и исследованию онкологических заболеваний детей и подростков Под руководством ведущих специалистов ФНКЦ ДГОИ ведётся разработка и внедрение эффективных протоколов терапии заболеваний крови, злокачественных новообразований, патологий иммунной системы и других тяжелых заболеваний детского возраста Для повышения эффективности лечения и организации научных исследований в ФНКЦ ДГОИ активно разрабатываются и внедряются современные информационные системы и технологии © А.А. Незнанов, 2015 46 Что такое ФНКЦ для специалиста в ИТ? Исключительно сложные больные с опасными заболеваниями С точки зрения информатизации, оптимизации и анализа данных © А.А. Незнанов, 2015 Их судьба зависит от согласованности и эффективности работы всех врачей и сотрудников разных подразделений Необходимость адекватного сопровождения больных и грамотной организации работы персонала (оптимизация основных и вспомогательных бизнес-процессов) Сложность структуры (> 100 подразделений, > 1200 сотрудников) Уникальность многих элементов для России Совершенно новые информационные системы и пилотные проекты Участие в федеральных проектах в области здравоохранения Активная научно-исследовательская и образовательная деятельность 47