Интеграция «омиксных» технологий на примере маленькой бактерии Говорун В.М. Казань 2014 «Омики» Геном ДНК Транскриптом РНК Протеом Белки Метаболом Белки Сахара Нуклеотиды Аминокислоты Метаболиты Область исследований, направленная на суммарную характеристику и количественную оценку совокупностей биологических молекул в клетке, органе или организме. Фенотип/Функция Липиды Объекты исследования: бактерии класса Молликут • Spiroplasma melliferum • Acholeplasma laidlawii • Mycoplasma gallisepticum (основной объект) «Минимальные» бактерии с наиболее «простой» организацией Геномика. Технологические платформы • Капиллярный секвенатор ABI 3730XL (1000bp) • Roche 454 FLX (800bp) • SOLID 4 ABI (50bp) • PACBIO RS II (5-10 kbp) Геномика A. laidlawii • Первый геном, полностью отсеквенированный в России, 2007 год • Технология – секвенирование по методу Сэнгера (капиллярные секвенаторыABI 3730XL) Lazarev et al., Complete Genome and Proteome of Acholeplasma laidlawii, J. of Bacteriology, 2011 M. gallisepticum • Полностью геном прочтен в 2013 • Использованы 3 различных секвенирующих платформы • Окончательная сборка была реализована за счет «ручной» валидации с применением метода «прогулки по хромосоме» Gorbachev et al., DNA repair in Mycoplasma gallisepticum, BMC Genomics, 2013 Fisunov et al., Core proteome of the minimal cell: comparative proteomics of three mollicute species., PloS One, 2011 S. melliferum • Полная последовательность неизвестна • В настоящее время существует в виде 4 геномных «контигов» и двух полностью собранных плазмид • Использованы 4 различных технологии секвенирования Alexeev et al., Application of Spiroplasma melliferum proteogenomic profiling for the discovery of virulence factors and pathogenicity mechanisms in hostassociated spiroplasmas, J. of Proteome res., 2012 Геном A. laidlawii PG-8A Стратегия секвенирования: Lazarev et al, Complete Genome and Proteome of Acholeplasma laidlawii, J. of Bacteriology, 2011 • Получение фрагментной библиотеки • Клонирование в вектор pCR4Blunt-Topo • Секвенирование по методу Сэнгера • Анализ результатов на капиллярном анализаторе ABI 3730XL • Сборка генома • Закрытие «дырок» методом «прогулки по хромосоме» Протеогеномное профилирование A. laidlawii MNMNNINQLLGTK….. • N-концевые а.к. (~70 белков) • Обнаружение новых белков (~30 новых белков) • Фосфорилирование - 79 MNNINQLLGTK Старт белка из геномной аннотации PTNENEIGVYMKQFKKVWRYIRRYKKL Найденный белок белок 79.99 Триптические пептиды Lazarev et al, Complete Genome and Proteome of Acholeplasma laidlawii, J. of Bacteriology, 2011 Геном S. melliferum KC3 характеристики генома: - длина 1,460,000 bp - GC состав 26% - присутствие фаговых повторов 3х типов длинной от 6-8 kbp Spiroplasma phage 1-C74, Spiroplasma phage 1-R8A2B, Spiroplasma phage SVTS2 - Экстрахромосомальная ДНК - плазмиды (сколько?) Стратегия секвенирования и сборки генома Копия повтора 2 Копия повтора 1 Более длинные фрагменты Mate pair чтения скафолдинг контиги Приблизительные размеры дырок (Gaps) 4 контига хромосомальной ДНК общей длиной 1,250,000 bp (1273 гена) 4 контига плазмидной ДНК длиной 33,677 bp (20 генов)) Графы сложности сборок, полученные с помощью Сytoscape (contigscape) «Сэнгер» + SOLID4 Сложность сборки после секвенирования по Сэнгеру «Сэнгер» + SOLID4 +PacBio RSII Геном S. melliferum KC3 С помощью технологи PacBio : 1.Была реализована окончательная сборка последовательности плазмидной ДНК S. melliferum KC3 2.Проверена предшествующая сборка хромосомальных контигов 3.Проведена сборка геномной ДНК с использованием различных алгоритмов и программного обеспечения. Для завершения генома S.melliferum KC3 необходимо: 1.Увеличить представленность длинных ридов, за счёт увеличения покрытия до 200x (PacBio) 2.Использовать парные риды со вставкой не меньше 20kbp Карты плазмид S. melliferum, полученные с помощью технологии PacBio Протеогеномный анализ S. melliferum в отсутствии полной последовательности генома Функциональная аннотация генома S. melliferum и S. citri Пример организации вирусных кластеров в геноме. Гены, кодирующие белковые факторы патогенности, окружены плектовирусными генами. Подобное расположение может указывать на появление «островков патогенности» посредством горизонтального переноса Alexeev et al., Application of Spiroplasma melliferum proteogenomic profiling for the discovery of virulence factors and pathogenicity mechanisms in host-associated spiroplasmas, J. of Proteome research, 2012 Характеристика S. melliferum KC3 S. citri GII3 Размер (bp) 1,260,000 1,780,000 GC состав (%) 27,3 26,1 Число ORF 1142 1908 ORF с предсказанной функцией 720 1340 Консервативные ORF с неизвестной функцией 326 180 Уникальные ORF с неизвестной функцией 96 354 Плотность ORF (%) 81 74 Средний размер гена (bp) 813 766 Число оперонов rRNA 1 1 tRNA 31 32 Геном M. gallisepticum S6 Секвенирование на платформе FLX Roche 5 контигов Идентификация уникальных участков в «гэпах» Сборка Картирование и in silico обеднение ридами Закрытие «гэпов» с помощью ПЦР или «прогулки по хромосоме» (по Сэнгеру) Сборка Геном Редукция сложности сборки Системный анализ Mycoplasma gallisepticum Клеточный цикл Математическое моделирование и валидация Mycoplasma gallisepticum S6 Транскриптом qPCR, RNA-seq Количественная протеомика LC-MS Характеристика белковых комплексов Метаболом LC-MS Транскриптомика. Технологические платформы SOLID 4 ABI Анализ количественных изменений всего транскриптома. Определение стартов и стопов транскрипции. QX100 ddPCR system Bio-Rad Точное измерение числа копий РНК (кДНК) в клетке FLX Roche Разметка оперонной структуры CFX Real-Time detection system Bio-Rad Валидация данных полнотранскриптомного анализа методом ОТ-ПЦР Транскрипционное профилирование M. gallisepticum. Общая схема эксперимента Библиотеки кДНК Два способа фрагментации РНК (химическая и ферментативная) Фрагментная библиотека (сохраняется ориентация кДНК цепей +/-) Обогащенная 5’концевыми фрагментами Протокол разработан в нашей лаборатории Нормализация с помощью Дуплексспецифической нуклеазы (Евроген) Секвенирование на платформе SOLID4 Количественные изменения транскриптов Разметка стартов транскрипции по всему геному Валидация Библиотека полноразмерных кДНК Протокол разработан в нашей лаборатории Секвенирование на платформе FLX Roche Картирование оперонов Транскрипционное профилирование. Валидация данных Сравнение результатов транскрипционного профилирования, полученного в результате секвенирования кДНК (SOLID4) и количественной ПЦР (ABI 7000) сопряженной с обратной транскрипцией Для валидации были использованы данные количественной ПЦР, полученные для 100 генов (с разным уровнем транскрипции) M. gallisepticum. Использовались средние значения дельта Ct трех независимых биологических повторностей. В качестве величины представленности транскрипта, полученной в результате секвенирования, использовали RPKM – нормализованную меру покрытия экзона RPKM – (Reads Per Kilobase of exon model per Million mapped reads) Транскрипционное профилирование M. gallisepticum в разных состояниях A B Количество генов, увеличивающих (A) и уменьшающих (B) транскрипцию в разных типах стресса. Синий – тепловой стресс, жёлтый – окислительный стресс, зелёный – солевой стресс, красный – стационарная фаза. Транскрипционное профилирование M. gallisepticum при тепловом стрессе Идентификация паттернов изменения транскрипции в процессе теплового стресса Полногеномное картирование сайтов инициации транскрипции M. gallisepticum Строение сильного промотора M. gallisepticum 450 Положение промотора относительно сайта инициации транскрипции 350 300 250 200 150 100 50 0 100 90 80 70 60 50 40 Положение сайта 30 20 10 0 Число вхождений 400 Транскрипционное профилирование M. gallisepticum в разных состояниях Поведение транскрипции Поведение транскрипции Поведение транскрипции Влияние генетических детерминант в промоторе на транскрипцию в тепловом стрессе. Идентификация сайтов связывания рибосомы 35 30 25 20 15 10 5 0 100 90 80 70 60 50 40 30 Положение сайта относительно старт-кодона 20 10 0 Количество сайтов 40 Протеомика Протеомное профилирование в условиях теплового стресса. Технология SWATH Трипсинолиз Хроматографическое разделение Получение спектров фрагментации каждого пептида База данных пептидов и их фрагментов Хроматографическое разделение Получение спектров фрагментации пептидов с широким окном Идентификация пептидов по результатам первого запуска Реконструкция хроматограммы по спектрам фрагментации Количественная протеомика • Получен исчерпывающий протеом M. gallisepticum (идентифицирован 561 белок).Вариации количества идентифицированных белков в независимых экспериментах не превышают 2% Критерии отбора: число уникальных пептидов на белок – не менее двух, global *FDR<1% (исходя из анализа в PSPEP, пороговое значение unused score для белка 0.4). Был идентифицирован 17221 уникальный пептид (global FDR<1% по PSPEP). • Проведена первичная полуколичественная оценка изменения протеомного профиля в условиях теплового стресса методом дифференциального двумерного гель-электрофореза (валидация данных MS) • Отработан оптимальный протокол пробоподготовки для количественной детекции изменений протеома M. gallisepticum (трипсинолиз в геле без разделения белков, трипсинолиз в растворе (с использованием MS совместимых детергентов (холат натрия, RapiGest, Waters отрабатывается в настоящее время) • Проведена количественная оценка изменения протеомного профиля в условиях теплового стресса с применением высокопроизводительной Массспектрометрии (SWATH, MRM) MRM для ста белков по трем пептидам и трем транзициям • Оценка посттрансляционных модификаций (до 50 фосфорилированных пептидов в протеоме M. gallisepticum) Протеомное профилирование при тепловом стрессе M. gallisepticum Шапероны Трансляция Транскрипция Транспорт Функция неизвестна Представление результатов SWATH анализа Протеомное профилирование M. gallisepticum (логарифмическая фаза роста культуры) в условиях теплового стресса (460С – 30мин). *Эксперимент был проведен в виде трех независимых биологических повторов Утилизация перекиси Метаболизм Белок (функция) Ко-шаперонин GroES ClpB шаперон Фактор трансляции EF-Tu Фактор трансляции EF-Ts Фактор созревания рибосом RpoE (δ- субъединица РНК полимеразы) HatA ABC транспортер PotD спермидин/путресцин ABC транспортер Гипотетический белок (функция неизвестна) Гипотетический белок (функция неизвестна) SufC (транспортер железа) Пероксиредоксин OsmC тиоредоксин тиоредоксин НАДН оксидаза Пируват дегидрогеназа E1 αсубъединица Пируват дегидрогеназа E1 βсубъединица Триозо-фосфат изомераза Фосфолипид-связывающий белок Гипотетический белок (функция неизвестна) Изменение уровня рост рост рост рост рост рост рост рост рост рост рост рост рост рост рост падение падение падение падение падение Представление результатов 2D-гель-электрофореза Протеомное профилирование в условиях теплового стресса. Технология SWATH Концентрация белка возрастает (совпадает с 2D-гель-электрофорезом) • ClpB • DnaK Концентрация белка падает (на 2D не выявлялись) • VlhA (поверхностные антигены) • Мембранные белки семейства DUF В настоящее время продолжается обсчет и анализ данных! Схема расположения VlhA-антигена в мембране Гемагглютининовый домен (вариабельный) Пролиновая ножка (PXPXPXP) Трансмембранный участок Lys- и Arg-богатый участок 32 АА MKRKNILK---FVSLLGIGSFVMLAAASCTSATT---PTPNPTPNPEPKPDPMPNPP---SGGMNGG Сброс поверхностных антигенов M. gallisepticum в условиях теплового стресса Повышение температуры Тест на гемагглютинацию с клетками M. gallisepticum после теплового стресса. Сверху вниз идут серии двукратных разведений клеток M. gallisepticum. По горизонтали располагаются условия, слева направо: контроль, тепловой стресс 5 мин, 15 мин, 30 мин. Видно снижение гемагглютинации после теплового стресса около 4-6 раз. В условиях теплового шока наблюдается рост нетриптических пептидов поверхностных антигенов (Vlh). Подобные результаты могут указывать на наличие специфических протеаз, изменяющих антигенный репертуар в условиях стресса. Метаболомика Алгоритм анализа метаболома Mollicutes 50 мл культуры,log phase MeOH, t↓ Экстракция холодным метанолом HPLC, RX-SIL column MS data acquisition Обработка данных Vanyushkina et al., Identification of intracellular Spiroplasmamelliferum metabolites by the HPLC-MS method, Biochemistry (Mosc)., 2012 1. Реконструированы карты метаболизма Acholeplasma laidlawii, Spiroplasma melliferum, Mycoplasma gallisepticum Реконструкция карты метаболизма M. gallisepticum Vanyushkina et al., Compare metabolome of three Molicutes species, PloS One, 2014 2. Метаболические пути трех видов бактерий класса Mollicutes были тщательно проанализированы и сопоставлены между собой 3. На основе данных метаболизма, а также протеомного и геномного анализа был проведен сравнительный анализ метаболических потенций к адаптации при воздействии стрессовых факторов на исследуемые виды бактерий Белки,ответственные за этот путь: •arginine deiminase •ornithine transcarbamylase • carbamate kinase • arginine/ornithine antiport Наличие белков пути: •MGA +/•Acl – •Spiro + Vanyushkina et al., Compare metabolome of three molicutes species, PloS One, 2014 4. Анализ изменения метаболома бактерий S. melliferum, A. laidlawii и M. gallisepticum в условиях кислотного и осмотического воздействий, а также теплового воздействия на бактерии M. gallisepticum Изменение метаболома Mollicutes при ↓pH=5.5 Down Thymidine Up 2-C-Methyl-D-erythritol 2-4cyclodiphosphate 5-Amino-6-(5-P-ribosylamino)uracil Uracil L-Tryptophan 7 L-Leucine 0 8 AMP/dGMP L-Proline L-Tyrosine L-Phenylalanine L-Glutamate L-Aspartate 0 4 4 NAD+ GMP Adenine Sucrose/a-a-Trehalose 5 Vanyushkina et al., Compare metabolome of three molicutes species, PloS One, 2014 Создание модели метаболизма •Стехиометрическая модель метаболизма •Набор постоянных потоков •Список генов, ответственных за метаболизм Модель состоит из следующих подсистем: -получение энергии -обмен аминокислот -обмен нуклеотидов -обмен липидов -обмен кофакторов M.рneumoniae map:306 реакций,145 белков,216 метаболитов Метаболизм пирувата у M. gallisepticum в условиях теплового шока Схема эксперимента: Анализ литературы и баз данных Поиск гомологов (BLAST) NOX – НАДН-оксидаза LDH – лактат-дегидрогеназа PDH – пируват-дегидрогеназа PTA – фосфотранс-ацетилаза ACK – ацетат-киназа Схема метаболизма пирувата у M. gallisepticum. Реконструирована на основании геномных данных. Наблюдается рост НАДН-оксидазы на белковом уровне, а также рост скорости генерации H2O2 Построение карты метаболизма Аэробный путь утилизации дает +2 молекулы АТФ на 1 молекулу глюкозы Возрастание уровня внутриклеточного АТФ в условиях теплового стресса у M. gallisepticum Схема эксперимента: Быстрый лизис клеток в стерильном DMSO (1:10) Измерение уровня АТФ с помошью набора «Люмтек» (люциферин/люцифераза) Изменение уровня АТФ при тепловом стрессе. В качестве «нулевого» уровня была использована стерильная среда для культивирования M. gallisepticum. Образцы подвергнутые тепловому стрессу (5, 15 и 30 мин при 460С) демонстрируют повышение уровня внутриклеточного АТФ по сравнению с контролем (клетки в логарифмической фазе роста). Эксперимент был проведен в виде трех независимых биологических повторов с тремя техническими повторами в каждом. Transient increase of ATP as a response to temperature up-shift in Escherichia coli, Soini et al., Microbial Cell Factories, 2005 Проблема интеграции данных. Как анализировать столько информации? Проблема интеграции данных. Электронный журнал как следующий уровень после баз знаний. Геном Транскриптом Протеом Метаболом Клетка Благодарности Спасибо за внимание! Дмитрий Алексеев Лаб. Протеомного анализа НИИ ФХМ А также: Сергей Ковальчук Татьяна Семашко Елена Кострюкова Павел Мазин