На правах рукописи Дидыч Дмитрий Александрович ИДЕНТИФИКАЦИЯ И КАРТИРОВАНИЕ РЕГУЛЯТОРНЫХ ЭЛЕМЕНТОВ В ЛОКУСЕ FXYD5-COX7A1 ХРОМОСОМЫ 19 ЧЕЛОВЕКА специальность 03.01.03 – молекулярная биология Автореферат диссертации на соискание ученой степени кандидата биологических наук Москва – 2009 Работа выполнена в лаборатории структуры и функций генов человека Учреждения Российской академии наук Института биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН Научный руководитель: кандидат биологических наук Акопов Сергей Борисович Официальные оппоненты: доктор биологических наук, профессор Карпов Вадим Львович кандидат биологических наук Эльдаров Михаил Анатольевич Ведущая организация: Учреждение Российской академии наук Институт биологии гена РАН Защита состоится 2010 года в часов на заседании диссертационного совета Д002.019.01 при Учреждении Российской академии наук Институте биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН по адресу: 117997, Москва, ул. Миклухо-Маклая 16/10. С диссертацией можно ознакомиться в библиотеке Учреждения Российской академии наук Института биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН. Автореферат разослан 2009 г. Ученый секретарь диссертационного совета, доктор физ.-мат. наук В.А. Олейников ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность проблемы. Вся совокупность генов и транскрибируемых областей генома многоклеточных организмов связана в сложнейшую регулируемую сеть, определяющую существование многочисленных типов специализированных клеток. Первостепенную роль в существовании этой регулируемой сети играют различные классы цис-регуляторных элементов генома. После определения полной нуклеотидной последовательности геномов ряда организмов одной из главных задач современной геномики стало изучение функциональных некодирующих элементов генома, таких как промоторы, энхансеры, сайленсеры, инсуляторы, S/MAR-элементы и др. Известно, что функциональная активность регуляторного элемента генома зависит не только от его нуклеотидной последовательности, но и от специфического набора связывающихся с ними белковых факторов транскрипции, модификации ДНК этого элемента, положения данной последовательности на хромосоме, структурной компартментализации ядра и др. По этим причинам, несмотря на стремительное развитие методов биоинформатики, использование компьютерных подходов для предсказания положения в геноме цис-регуляторных элементов крайне затруднительно. Согласно теоретическим предсказаниям в геномах эукариотических организмов содержатся сотни тысяч цис-регуляторных последовательностей (Pennisi, 2004). Поэтому создание подходов, позволяющих осуществить как масштабный поиск этих элементов в геноме, так и их функциональный анализ, является одним из приоритетных направлений современной функциональной геномики. В последнее время было предложено большое число различных экспериментальных подходов для идентификации регуляторных последовательностей внутри генома. Во всех этих подходах используется один и тот же ключевой этап - получение высокообогащенных клонотек фрагментов ДНК, содержащих соответствующие регуляторные элементы. После конструирования таких клонотек нахождение их места в геноме становится чисто технической задачей и может быть осуществлено при помощи различных технологий, таких как гибридизация с геномными микрочипами, массированное секвенирование, технологии, сходные с SAGE (Serial Analysis of Gene Expression) и др. Эти подходы можно разделить на две группы. В первую входят методы, которые можно назвать структурными, т.е. методы, основанные на взаимодействии ДНК с белками или субклеточными структурами, а также на структурных особенностях ДНК. В данной работе были задействованы функциональные подходы, относящиеся ко второй группе методов, обычно использующих “метод репортерного гена”. 1 К сожалению, на сегодняшний день картирование всех функциональных областей на уровне целого генома с учетом всевозможных типов клеток многоклеточных организмов выходит за пределы наших возможностей. Поэтому, альтернативой данного рода исследованиям служит полный функциональный анализ отдельных протяженных сегментов генома с последующей интеграцией полученных данных и созданием полной геномной карты регуляторных элементов. В нашей лаборатории проводится работа по построению полной функциональной карты регуляторных последовательностей, расположенных в полигенном сегменте длиной 1 млн. п.о. хромосомы 19 человека. Ранее в этом локусе нами были идентифицированы и нанесены на карту около сотни последовательностей, относящихся к различным классам функциональных элементов генома, что делает исследуемый нами локус одним из наиболее охарактеризованных участков генома человека. Данная диссертационная работа состоит из трех частей. В первой части описан подход, позволяющий проводить скрининг геномных фрагментов по их способности усиливать экспрессию репортерного гена (потенциальные энхансеры) и определять их местоположение в геноме. С помощью этого метода нами были обнаружены и картированы 15 потенциальных энхансеров в локусе FXYD5-COX7A1 хромосомы 19 человека. Во второй части работы с помощью ранее разработанной методики (Akopov et al., 2006) произведено картирование в том же локусе десяти новых последовательностей, проявляющих инсуляторную активность. Третья часть посвящена анализу энхансер-блокирующей активности десяти обнаруженных ранее в исследуемом локусе CTCF-связывающих последовательностей (Vetchinova et al., 2006). Было показано, что все десять проверенных CTCF-связывающих последовательностей проявляют энхансер-блокирующую активность в системе позитивно-негативной селекции. Цели и задачи работы. Целью диссертационной работы являлось выявление и картирование цис- регуляторных элементов (энхансеры, инсуляторы) в локусе FXYD5-COX7A1 хромосомы 19 человека, а также выявление энхансер-блокирующей функции десяти ранее обнаруженных в исследуемом локусе CTCF-связывающих фрагментов (Vetchinova et al., 2006) с помощью позитивно-негативной селекции. В ходе работы были поставлены следующие задачи: 1. С помощью предложенного нами подхода выявить и картировать в локусе FXYD5-COX7A1 хромосомы 19 человека последовательности, проявляющие свойства энхансеров. 2 2. Провести анализ обнаруженных фрагментов методом сдвига электрофоретической подвижности в полиакриламидном геле (EMSA), а также определить активность обнаруженных фрагментов с помощью системы двойной люциферазной детекции. 3. Выявить с помощью ранее разработанной в лаборатории системы позитивнонегативной селекции энхансер-блокирующих элементов все, или почти все, потенциальные инсуляторы, расположенные в локусе FXYD5-COX7A1 хромосомы 19 человека. 4. Проверить на наличие энхансер-блокирующей активности десять ранее выявленных CTCF-связывающих последовательностей, расположенных в локусе FXYD5-COX7A1 хромосомы 19 человека. Научная новизна и практическая значимость работы. В работе разработан оригинальный метод функционального картирования энхансерподобных элементов в протяженных участках генома, основанный на отборе геномных фрагментов по их способности усиливать транскрипцию репортерного гена. С помощью предложенного подхода впервые идентифицированы в клетках культуры HeLa 15 потенциальных энхансеров в локусе FXYD5-COX7A1 хромосомы 19 человека. Было показано, что идентифицированные последовательности взаимодействуют in vitro с белками ядерного экстракта HeLa. Для 13 обнаруженных последовательностей была показана способность активировать сильный промотор SV40 при транзиентной трансфекции клеток HeLa с использованием системы двойной люциферазной детекции. Была построена карта распределения обнаруженных в работе потенциальных энхансеров в локусе FXYD5-COX7A1 хромосомы 19 человека. С помощью ранее разработанной методики идентификации потенциальных инсуляторов (Akopov et al., 2006) выявлены и картированы 10 новых последовательностей в локусе FXYD5-COX7A1 хромосомы 19 человека. Был проведен исчерпывающий анализ полученной в работе библиотеки потенциальных инсуляторов, позволивший обнаружить в исследуемом локусе большую часть последовательностей, проявляющих свойства инсуляторов. В работе с помощью системы позитивно-негативной селекции был проведен анализ энхансер-блокирующей активности десяти CTCF-связывающих последовательностей, картированных ранее в локусе FXYD5-COX7A1 хромосомы 19 человека. Данная диссертационная работа является частью масштабной работы, направленной на создание полной функциональной карты области хромосомы 19 человека длиной 1 млн. п.о. 3 Публикации и апробация работы. По теме диссертационной работы опубликованы 3 статьи в отечественных и зарубежных научных журналах. Результаты работы были представлены на российских и международных конференциях: Международная конференция студентов, аспирантов и молодых ученых “Ломоносов–2008” (Москва, 2008); IV съезд Российского общества биохимиков и молекулярных биологов (Новосибирск, 2008); 3rd ESF Functional Genomics Conference “Functional genomics and Disease” (Инсбрук, 2008); XXI Зимняя международная молодежная научная школа “Перспективные направления физико-химической биологии и биотехнологии” (Москва, 2009); Международная научная конференция по биоорганической химии, биотехнологии и бионанотехнологии (Москва-Пущино, 2009). Структура диссертации. Диссертационная работа изложена на … страницах и состоит из введения, обзора литературы, экспериментальной части, результатов и их обсуждения, основных выводов и списка цитируемой литературы, включающего … ссылки. Диссертация содержит … таблиц и … рисунков. РЕЗУЛЬТАТЫ И ИХ ОБСУЖДЕНИЕ ИДЕНТИФИКАЦИЯ И КАРТИРОВАНИЕ ЭНХАНСЕР-ПОДОБНЫХ ЭЛЕМЕНТОВ В ЛОКУСЕ FXYD5-COX7A1 ХРОМОСОМЫ 19 ЧЕЛОВЕКА. Энхансеры – тип регуляторных элементов генома, способных усиливать транскрипцию с промоторов, находясь на значительных расстояниях от них. Для многих энхансеров показана их способность активировать гетерологичные промоторы. Основываясь на этих свойствах энхансеров, нами предложен метод, позволяющий идентифицировать энхансеры в протяженных участках генома по способности этих элементов активировать транскрипцию гена неомицинфосфотрансферазы II (NPTII), находящегося под контролем минимального промотора цитомегаловируса (CMV). Схема метода изображена на рис. 1Б.Энхансеры – тип регуляторных элементов генома, способных усиливать транскрипцию с промоторов, находясь на значительных расстояниях от них. Для многих энхансеров показана их способность активировать гетерологичные промоторы. Основываясь на этих свойствах энхансеров, нами предложен метод, позволяющий идентифицировать энхансеры в протяженных участках генома по способности этих элементов активировать транскрипцию гена неомицинфосфотрансферазы II (NPTII), находящегося под контролем минимального промотора цитомегаловируса (CMV). Схема метода изображена на рис. 1-Б (стр. 5). 4 На первом этапе работы нами был получен вектор pQCXIX-Enh, предназначенный для отбора геномных фрагментов, обладающих энхансерной активностью (Рис. 1-А). Вектор был сконструирован на основе самоинактивирующегося ретровирусного вектора pQCXIX (Clontech), и содержал ген составного белка GTN, в состав которого входила неомицинфосфотрансфераза II. Были получены контрольные векторные конструкции: положительный pQCXIX-Enh(+), содержащий ген GTN под контролем минимального промотора и энхансера CMV, и отрицательный pQCXIX-Enh(-), из которого был удален минимальный промотор CMV. 5 Подготовка и клонирование библиотеки геномных фрагментов в ретровирусный вектор pQCXIX-Enh. Отбор фрагментов, обладающих энхансерными свойствами, проводили из фрагментов геномной библиотеки локуса FXYD5-COX7A1 хромосомы 19 человека, любезно предоставленной И.П. Черновым. При конструировании библиотеки 30 космид, содержащих перекрывающиеся фрагменты исследуемого локуса длиной 1 млн. п.о., были обработаны ферментами рестрикции Sau3A и Csp6I, позволяющими получить фрагменты длиной от 200 до 700 п.о. Два фермента было использовано для того, чтобы исключить потери функциональных элементов из-за присутствия сайта расщепления внутри функциональной области фрагмента. К выступающим концам рестриктных фрагментов посредством специфических олигонуклеотидных адапторов был присоединен праймер LP, содержащий сайт узнавания эндонуклеазы рестрикции SalI. Итоговая библиотека содержала около 4 тыс. уникальных фрагментов. Фрагменты библиотеки клонировали по сайту XhoI в вектор pQCXIX-Enh. Было получено около 16 тыс. колоний E. coli, из которых была выделена плазмидная ДНК и получен пул плазмид pQCXIX-Enh(L), представляющий собой набор ретровирусных векторов pQCXIX-Enh(L), содержащих фрагменты библиотеки локуса FXYD5-COX7A1 хромосомы 19 человека. Отбор последовательностей ДНК, обладающих энхансерной активностью. Набором плазмид pQCXIX-Enh(L), а также контрольными конструкциями, проводили трансфекцию клеток пакующей линии Phoenix-AMPHO (Kinsella and Nolan, 1996). Клетки линии Phoenix-AMPHO способны экспрессировать вирусные белки, необходимые для образования амфотропных вирусных частиц. Были получены четыре популяции вирусных частиц: pQCXIX-Enh, pQCXIX-Enh(L), pQCXIX-Enh(+) и pQCXIX-Enh(-). Определение титра вирусных частиц проводили по экспресс-методу, предложенному в работе Byun et al. (Byun et al., 1996). Для каждой популяции титр составил не менее 5•103 частиц/мл. Полученными вирусными частицами инфицировали клетки линии HeLa. Выбор клеточной культуры был обусловлен тем, что ранее в нашей лаборатории были картированы в исследуемом локусе S/MAR-элементы (Chernov et al., 2002),а также участки связывания белка CTCF (Vetchinova et al., 2006) с использованием этой клеточной линии. Инфицированные клетки HeLa культивировали в среде с генетицином (800 мкг/мл) в течение двух недель. 6 В результате инфекции происходит интеграция кДНК-копии вирусной мРНК в геном хозяйской клетки. Если интегрированная кассета содержит фрагмент библиотеки, усиливающий активность гена селективного маркера (NPTII в составе белка GTN), т.е. проявляющий энхансерную активность, то содержащие такую конструкцию клетки выживают в среде с генетицином. После селекции клеток из них была выделена геномная ДНК и проанализирована с помощью двустадийной ПЦР (nested-PCR) с использованием внешних плазмидных праймеров (1L и 1R), а затем с помощью библиотечного праймера LP (Раунд 1, Рис. 2-А). Известно, что интеграция ретровирусной ДНК происходит в основном в активно транскрибируемые области генома (Scherdin et al., 1990), поэтому гены, находящиеся в составе ретровирусного вектора, после интеграции в геном могут быть подвержены регуляции со стороны эндогенных цис-регуляторных элементов. Если таким элементом окажется энхансер, то в результате селекции отберутся фрагменты библиотеки, не обладающие энхансерной активностью (ложные энхансеры). Чтобы снизить вероятность отбора ложных энхансеров мы проводили два раунда селекции. Для этого фрагменты библиотеки, амплифицированные с геномной ДНК популяции pQCXIX-Enh(L) после первого раунда селекции, снова клонировали в вектор pQCXIX-Enh. Количество выросших на этом этапе трансформантов составило около 10 тысяч. Из выросших клонов была выделена плазмидная ДНК, представляющая собой набор ретровирусных векторов с фрагментами библиотеки, прошедшими отбор в первом раунде селекции. Полученным набором векторов, а также контрольными векторами, снова трансфицировали клетки Phoenix-AMPHO и получали вирусные частицы. Полученными вирусными частицами инфицировали клетки HeLa для проведения второго раунда селекции. После селекции из выживших клеток выделяли геномную ДНК и анализировали с помощью двухстадийной ПЦР (Раунд 2, Рис. 2-Б, стр. 8). На рисунке 2-Б видно, что на дорожке 4 (раунд 2) содержится меньше фрагментов ДНК, чем в исходной библиотеке (дорожка 2) и в библиотеке после первого раунда (дорожка 3), что свидетельствует об отборе последовательностей, обладающих энхансерной активностью. Клонирование энхансер-подобных элементов и анализ выросших клонов E.coli. Амплифицированные после второго раунда селекции фрагменты библиотеки клонировали в плазмидный вектор pGEM-T Easy (Promega), которым трансформировали клетки E. coli. Выросшие клоны ранжировали в двух 96-луночных планшетах. Таким образом, была получена библиотека (клонотека) потенциальных энхансеров. 7 8 Для исключения случайных (background) последовательностей, доля которых среди фрагментов незначительна, проводили анализ ранжированных клонов с помощью блотгибридизации по Саузерну. Для этого проводили ПЦР-амплификацию ДНК индивидуальных клонов с использованием праймера LP. Продукты ПЦР разделяли в 1% агарозном геле (Рис. 2-Б, верхняя панель), переносили на нейлоновую мембрану и проводили гибридизацию с меченой фракцией тотальной ДНК, содержащей фрагменты библиотеки после двух раундов селекции (Рис. 2-В, нижняя панель). В результате гибридизации были выделены клоны, дающие сильный гибридизационный сигнал. Такие клоны содержали последовательности библиотеки, в существенном количестве представленные во фракции ДНК, полученной после двух раундов селекции. Клоны, давшие слабый гибридизационный сигнал, были исключены из дальнейшего анализа. Секвенирование библиотеки потенциальных энхансеров. В результате секвенирования 50 клонов полученной библиотеки было обнаружено 15 различных последовательностей, 6 из которых встретились при анализе полученных данных один раз, 2 последовательности - два раза, 4 последовательности – три раза, 2 последовательности – четыре раза и одна последовательность двенадцать раз. Как видно из графика (Рис. 2-В), число обнаруженных уникальных последовательностей перестает увеличиваться с увеличением числа секвенированных клонов, поэтому появление новых энхансеров при дальнейшем секвенировании библиотеки маловероятно. Свойства обнаруженных последовательностей представлены в таблице 1 (стр. 10). Проверка способности обнаруженных последовательностей взаимодействовать с ядерными белками in vitro. Активность регуляторного элемента зависит от специфического набора взаимодействующих ним белков. Поэтому способность формировать ДНК-белковые взаимодействия с ядерными белками является одним из критериев, по которому последовательность ДНК можно считать функциональным элементом. С помощью метода сдвига электрофоретической подвижности (EMSA), позволяющего выявить ДНК-белковые взаимодействия, нами была проверена способность идентифицированных фрагментов взаимодействовать с ядерными белками. Поскольку отбор энхансеров проводили с использованием клеточной линии HeLa, для EMSA-анализа нами был выбран ядерный экстракт, выделенный из клеток этой культуры по методу, предложенному в работе Дигнам (Dignam et al., 1983). 9 Таблица 1. Расположение потенциальных энхансеров в области FXYD4-COX7A1 хромосомы 19 человека. № Энхансера 1 2 3 4 5 6 7 8 9 10 11 12 Координаты на хромосоме 19** 4034182140342118 4034450640344897 4042799440428292 4063442140635308 4071872040719018 4074823740748490 4075779540758182 4076346940763799 4076418440764486 4079238940792543 4081285040813109 4092741040927666 Длина, п.о. Положение относительно генов локуса Активность* 298 Интрон 3 гена FXYD5 2.2 392 Интрон 4 гена FXYD5 2.1 299 888 ~2 т.п.о. от 5′-конца гена LSR 1 т.п.о. от 3′-конца гена FFAR2 3.5 Перекрытие с повторяющими ся элементами 1-232 Alu-Y 2.8 299 Интрон 1 гена GAPDHS 2.3 254 2 т.п.о. от 5′-конца гена ATP4A 4.7 388 Межгенное*** 1.4 331 Межгенное*** 1.6 303 Межгенное*** 3.9 156 3 т.п.о. от 5′-конца гена KIAA0841 2.8 260 Интрон 2 гена RBM42 2.8 257 Интрон 2 гена U2AF1L4; 0.7 т.п.о. от 5′-конца гена PSENEN 4.3 1-388 HERV-K LTR 1-240 Alu-Y 1-220 Alu-Sc 40965824196 Интрон 15 гена SNX26 4.9 40966019 410915170.5 т.п.о. от 5′-конца гена 14 198 4.3 41091714 TYROBP 411109608 т.п.о. от 5′-конца гена 15 277 2.9 70-277 Alu-Sx 41111236 LRFN3 *Данные по транзиентным трансфекциям в системе двойной люциферазной детекции (Рис. 3-Б). **Согласно Human Genome Browser (сборка от марта 2006 г.). ***На расстоянии > 103 п.о. от ближайших генов. 13 Способность взаимодействовать с ядерными белками была проверена для нескольких идентифицированных фрагментов (фрагмент 7, 8, 10, 11 и 12). В качестве положительного контроля использовали последовательность энхансера цитомегаловируса, который активен в клетках HeLa, а значит, способен связывать ядерные белки этой клеточной линии. Для того чтобы показать специфичность обнаруженных ДНК-белковых взаимодействий, в реакционные смеси с мечеными фрагментами ДНК добавляли в качестве конкурирующих те же немеченые фрагменты в трех- и шести- кратном избытке (Рис. 3-А, стр. 11). О специфичности судили по ослаблению зон торможения ДНК-белковых комплексов в результате конкуренции немеченных фрагментов с мечеными за связывание с белками. Все проверенные последовательности с высокой специфичностью образуют комплексы с 10 белками ядерного экстракта HeLa. В то же время, добавление в реакционные смеси немеченого неспецифического конкурента (фрагмент промоторной области гена c-myc человека), взаимодействующего с ядерным белком CTCF (Filippova et al., 1996), не влияет на способность анализируемых фрагментов образовывать комплексы ДНК-белок (данные не представлены). Как видно на рисунке 3-А, почти все из исследованных фрагментов образуют одну или более ярко выраженных зон торможения, что указывает на способность этих фрагментов взаимодействовать с белками ядерных экстрактов. ДНК-белковые комплексы некоторых фрагментов заметно отличаются по электрофоретической подвижности (например, фрагменты 7 и 8, 7 и 10), что указывает на то, что эти фрагменты связывают белки с разной молекулярной массой. Проверка энхансерной активности обнаруженных фрагментов в системе двойной люциферазной детекции. Энхансерная активность обнаруженных 15 последовательностей была проверена в системе двойной люциферазной детекции (Promega). Обнаруженные фрагменты клонировали по сайту Sal I в вектор pGL3-promoter (Promega). Полученными конструкциями 11 проводили котрансфекцию клеток HeLa с нормирующей плазмидой pRL-TK c использованием реагента Lipofectamine 2000 (Invitrogen). Тринадцать из пятнадцати обнаруженных потенциальных энхансеров проявляют энхансерную активность в данной системе, усиливая активность гена люциферазы в 2-5 раз, что соответствует 15-30% от активности сильного энхансера SV40 (CV, Рис. 3-Б). Стоит подчеркнуть, что полученные значения активностей обнаруженных фрагментов могут не соответствовать активностям, которые проявляют эти фрагменты, располагаясь в геноме в своем нативном окружении. Кроме того, существуют указания на то, что промотор SV40 сам по себе обладает сильной активностью в клетках HeLa, обусловленной взаимодействием промотора с транскрипционным фактором Sp1 (Dynan and Tjian, 1983). Вероятно поэтому способность промотора SV40 быть подверженным модуляции со стороны гетерологичных энхансеров в этих клетках сильно снижена (Scheef et al., 2001), либо вовсе отсутствует, как, например, для обнаруженных последовательностей 7 и 8, несмотря на их способность взаимодействовать с белками ядерного экстракта (Рис. 3-А). Согласно полученному результату около 85 % (13 из 15) прошедших отбор фрагментов библиотеки проявляют энхансерную активность, что указывает на высокую эффективность предложенного подхода. Анализ расположения потенциальных энхансеров в геноме. Положение предполагаемых энхансеров в исследуемом локусе показано на рисунке 6. Шесть фрагментов были идентифицированы внутри генов (в интронах), пять фрагментов локализуются со стороны промоторов генов, один предполагаемый энхансер расположен с 3′-стороны от гена и три фрагмента в межгенных областях (ближайшие гены находятся на расстоянии более 10 тыс. п.о.). Учитывая то, что гены локуса (включая интроны) составляют не более 50 % всей длины локуса, можно заключить, что обнаруженные потенциальные энхансеры преимущественно располагаются внутри, либо вблизи генов локуса. Некоторые из обнаруженных последовательностей (фрагмент 3, 9, 11 и 15) перекрываются с ретроэлементами, в частности Alu-элементами и длинным концевым повтором (LTR) семейства HERV-K (фрагмент 7) (таблица 1). Энхансерная активность LTR HERV-K хорошо изучена (Domanskii et al., 2002, Illarionova et al., 2007, Ruda et al., 2004), поэтому обнаружение среди потенциальных энхансеров фрагмента, расположенного в этом классе повторяющихся элементов генома, подтверждает достоверность предложенного метода. Гораздо меньше данных о проявлении энхансерной активности у Alu-элементов. Тем не менее, известно, что некоторые энхансеры, например, энхансер гена BRCA1, представляет собой Alu-элемент со свойствами эстроген-зависимого энхансера. 12 Два энхансера было идентифицировано непосредственно рядом с ранее обнаруженными активными промоторами (Kim et al., 2005). Однако это не означает, что энхансеры участвуют в регуляции именно этих промоторов, так как действие энхансера может распространяться на значительные расстояния. ИДЕНТИФИКАЦИЯ И КАРТИРОВАНИЕ ДЕСЯТИ НОВЫХ ИНСУЛЯТОРОВ В ЛОКУСЕ FXYD5-COX7A1 ХРОМОСОМЫ 19 ЧЕЛОВЕКА. Инсуляторы – это последовательности ДНК, способные предотвращать нежелательные взаимодействия между регуляторными элементами генома, например между промотором и энхансером, а также, будучи помещенными по краям генетической конструкции (трансгена), вводимой генно-инженерными способами в клетки, образовывать независимые домены и тем самым защищать экспрессию трансгена от эффекта положения (Gaszner and Felsenfeld, 2006, Valenzuela and Kamakaka, 2006, West and Fraser, 2005). В частности, одним из основных свойств инсуляторов является их способность блокировать действие энхансера на промотор только в том случае, если инсулятор располагается между этими элементами. На основе этого свойства ранее в нашей лаборатории была разработана система для поиска инсуляторов в длинных геномных последовательностях, позволившая обнаружить в локусе FXYD5-COX7A1 хромосомы 19 человека восемь потенциальных инсуляторов. В данной работе мы попытались с помощью уже испытанной системы поиска инсуляторов идентифицировать и картировать все или подавляющую часть потенциальных инсуляторов исследуемой области генома. 13 Стратегия отбора предполагаемых инсуляторов. Принцип отбора предполагаемых инсуляторов основан на защите промотора репортерного гена от влияния энхансера и позитивно-негативной селекции. Общая схема метода представлена на рисунке 4-Б. Для отбора инсуляторных последовательностей был сконструирован вектор, названный pPNT/EmP, схема которого представлена на рисунке 4-А. Вектор содержит маркер устойчивости к генетицину, позволяющий проводить позитивную селекцию клеток с интегрированной плазмидой, а также негативный маркер селекции – ген тимидинкиназы вируса простого герпеса (HSV-tk), экспрессия которого придает клеткам с интегрированным вектором чувствительность к ганцикловиру. Исходный вектор эффективно экспрессирует ген HSV-tk, однако, если поместить между промотором и энхансером этого гена последовательность ДНК, способную блокировать действие энхансера (инсулятор), экспрессия гена HSV-tk в стабильно трансфицированных таким вектором клетках прекращается или же существенно снижается, и содержащие эту последовательность клетки становятся устойчивыми к ганцикловиру. В качестве положительного контроля был сконструирован вектор pPNT/mP, содержащий в регуляторной области гена HSV-tk минимальный промотор цитомегаловируса. Клетки, в геном которых интегрирует такая конструкция, не чувствительны к ганцикловиру. Получение библиотеки фрагментов, предназначенной для отбора инсуляторов. Поиск последовательностей (потенциальных инсуляторов), способных нарушать взаимодействие между промотором и энхансером, проводили в пределах участка хромосомы 19 человека длиной 1 млн. п.о., расположенного между генами FXYD5 и COX7A1. При получении библиотеки фрагментов, предназначенной для отбора потенциальных инсуляторов, ДНК 30 космид, перекрывающих область FXYD5–COX7A1, расщепляли по отдельности рестриктазами Sau3A и Csp6I. К полученным фрагментам (длиной 200–700 п.о.) посредством синтетических адапторов был присоединен праймер 27Pr, позволяющий проводить ПЦР-амплификацию фрагментов библиотеки. Праймер 27Pr содержит сайт расщепления XhoI. Обе библиотеки объединяли. Полученная библиотека была ПЦРамплифицирована с использованием праймера 27Pr и обработана рестриктазой XhoI. Обработанные рестриктазой фрагменты клонировали в плазмиду pPNT/EmP по сайту SalI. Для сохранения репрезентативности библиотеки было получено 12 000 колоний, что примерно соответствует 4-кратному перекрыванию области FXYD5–COX7A1. Из выросших клонов была выделена плазмидная ДНК. 14 Отбор предполагаемых инсуляторов. Полученный набор плазмид линеаризовали обработкой эндонуклезой рестрикции Ssp I и трансфицировали электропорацией в клетки линии СНО. Условия электропорации (20 мс, 360 В, 800 мкФ) для клеток культуры CHO были отработаны в нашей лаборатории ранее, и обеспечивают интеграцию одной копии линеаризованной плазмиды в геном. Параллельно проводили контрольные трансфекции плазмидами pPNT/mP и pPNT/EmP. На стадии позитивной селекции клетки, в геном которых интегрировал вектор, были отобраны по их устойчивости к генетицину (G418). Генетицин-устойчивые клетки затем подвергали негативной селекции ганцикловиром (GCV). Доказательством успешно проведенной селекции служила 100%-ная гибель клеток, содержавших вектор pPNT/EmP, обусловливающий чувствительность клеток к ганцикловиру. В то же время большая часть клеток, трансфицированных контрольной плазмидой pPNT/mP, была устойчива к ганцикловиру. Незначительная гибель клеток может объясняться тем, что в этих клетках интеграция pPNT/mP произошла в участки генома, находящиеся под контролем эндогенных энхансеров. Следует отметить, что клетки могут стать чувствительными к ганцикловиру и в том случае, если клонированный фрагмент ДНК обладает свойствами сайленсера. Однако последовательность со свойствами сайленсера не обладает направленностью и будет подавлять также и транскрипцию гена устойчивости к неомицину, что приведет к гибели таких клеток на этапе позитивной селекции. После негативной селекции из клеток, устойчивых к ганцикловиру, была выделена геномная ДНК. На этой матрице была проведена ПЦР-амплификация участка между энхансером и промотором CMV с помощью праймеров 2L и 2R (Рис. 4-Б). Продукты амплификации повторно клонировали в вектор pPNT/EmP для проведения второго раунда селекции. На рисунке 5-А показаны результаты ПЦР с праймерами 2L и 2R пула плазмид перед трансфекцией (дорожка 1) и ПЦР с теми же праймерами на матрице геномной ДНК из клеток, трансфицированных библиотекой в плазмиде pPNT/EmP и прошедших позитивную и негативную селекции (дорожка 2). На рисунке видно, что в результате селекции исходная библиотека, содержащая набор большого числа фрагментов разной длины (дорожка 1), превращается в «лесенку» (дорожка 2) из ограниченного числа фрагментов. Ранее в лаборатории была проанализирована небольшая часть полученных фрагментов. В данной работе мы попытались клонировать все или подавляющую часть потенциальных инсуляторов исследуемой области. Для этого отобранные фрагменты ДНК (дорожка 2, рисунок 5-А) были клонированы в вектор pGEM-T (Promega), и полученные клоны были 15 проверены на наличие и длину вставок ПЦР с теми же праймерами (Рис. 5-Б). Видно, что вставка наблюдалась во всех 12 проверенных клонах, и длины вставок в основном различались для разных клонов. 20 клонов были секвенированы, четыре идентифицированные последовательности не принадлежали к исследуемой области (содержали фрагменты ДНК E. coli и человеческую ДНК других хромосом). Анализ остальных выявил 10 новых последовательностей. Далее для полученных в этой работе последовательностей вместе с ранее обнаруженными последовательностями была построена зависимость между числом секвенированных клонов и числом новых (уникальных) последовательностей (Рис. 5-В). На рисунке видно, что идентификация новых инсуляторов при дальнейшем секвенировании библиотеки маловероятна. В результате секвенирования было получено 10 новых последовательностей. Эти последовательности были нанесены на карту исследуемой хромосомы 19 между генами FXYD5 и COX7A1 (Рис. 6, инсуляторы 9-18, стр. 18), а их свойства представлены в таблице 2 (стр. 17). 16 Анализ расположения инсуляторов в геноме. Предполагается, что одна из основных функций инсуляторов – образование функциональных доменов генома. Нужно отметить, что термин «инсулятор» применяется для обозначения как энхансерблокирующих элементов, так и пограничных элементов генома, отделяющих участки хроматина с различной структурой или активностью. Так как инсуляторы в данной работе были идентифицированы только по энхансерблокирующей активности, то, в принципе, они могут не проявлять «барьерной» активности, хотя она и располагается, скорее всего, вблизи этих элементов. Тем не менее, в ряде случаев можно выделить гипотетические домены, заключенные между инсуляторами. Область FXYD5–COX7A1 содержит кластер генов, кодирующих рецепторы, ассоциированные с G-белком, – FFAR1, FFAR2, FFAR3 и GPR42P. Ранее было обнаружено, что гены FFAR3 и FFAR2 имеют различные профили экспрессии (Brown et al., 2003). Расположение инсулятора 6, находящегося между генами FFAR3 и FFAR2, и инсулятора 2, отделяющего FFAR2 от гена KRTDAP, экспрессирующегося преимущественно в эпидермальных кератиноцитах (Bazzi et al., 2007), согласуется с независимой экспрессией этих генов. Гены ATP4A и KIAA0841 находятся каждый в своем гипотетическом домене (между инсуляторами 5 и 1, а также 1 и 18 соответственно). Ген ATP4A транскрибируется преимущественно в тканях желудка (Chalaya et al., 2006, Herrmann et al., 2007) и резко отличается в этом отношении от окружающих генов. Таблица 2. Расположение потенциальных инсуляторов в области FXYD5-COX7A1 хромосомы 19 человека. № 9 10 11 12 13 14 15 16 17 18 Координаты на Длина Расположение относительно генов 1 хромосоме 19 (п.о.) 40347492-40347685 194 6-й интрон гена FXYD5 40406076-40406590 515 ~1 т.п.о. с 3'-стороны от гена TMEM162 40437627-40437699 73 2-й интрон гена LSR 40909389-40909561 173 14-й интрон гена MLL4 40932935-40933049 114 1-й интрон гена LIN37 41067647-41067745 99 ~4 т.п.о. с 3'-стороны от гена NFKBID 41116085-41116309 225 ~4 т.п.о. с 5'-стороны от гена LRFN3 41147417-41147594 178 Межгенное2 41350295-41350437 143 Межгенное2 40801090-40801286 197 10-й и 11-й интроны, 11-й экзон гена KIAA0841 1 Согласно Human Genome Browser (Kuhn et al., 2007), сборка от марта 2006 г. 2 На расстоянии более 10 т.п.о. от ближайших генов. 17 18 Рисунок 6. Метрическая карта области FXYD5-COX7A1 хромосомы 19 человека длиной 106 п.о. Вертикальными линиями показано положение потенциальных инсуляторных последовательностей, идентифицированных ранее (INS № 1-8) (Akopov et al., 2006) и в этой работе (INS № 9-18). Пунктирными вертикальными линиями показано положение обнаруженных в работе потенциальных энхансеров (№1-15). Гены обозначены горизонтальными линиями. Нижние горизонтальные панели отображают данные по экспрессии генов локуса в различных тканях человека (черный цвет соответствует высокому уровню экспрессии, светло-серый соответствует низкому уровню экспрессии) (Su et al., 2004). Карта составлена с помощью Human Genome Browser (сборка от марта 2006 г.). Гены HCST и TYROBP расположены между инсуляторами 14 и 15 и характеризуются выской тканеспецифичностью экспрессии, отличной от специфичности окружающих их генов. Так, эти гены экспрессируются на высоком уровне в миелоидных клетках (Takaki et al., 2006, Wu et al., 1999), тогда как отделенный от них инсулятором 14 ген APLP1 экспрессируется преимущественно в коре головного мозга (Kim et al., 1995), а отделенный инсулятором 15 ген LRFN3 – в нейрональных клетках (Morimura et al., 2006). Эти данные согласуются с представлением о том, что последовательности, обладающие инсуляторной активностью, разделяют цепь ДНК на независимые домены, в каждом из которых находятся гены, характеризующиеся специфичным для них профилем экспрессии. Нужно отметить, что изученная область может содержать инсуляторы, которые не были идентифицированы из-за ограниченных возможностей использованного подхода. Идентифицируемые при данном подходе инсуляторы должны быть активны в клетках CHO и по отношению к промоторно-энхансерной паре цитомегаловируса. Таким образом некоторые ткане- или энхансерспецифичные инсуляторы могли быть пропущены. Эти недостатки, однако, могут быть преодолены путем использования других клеточных линий и промоторно-энхансерных конструкций. ЭНХАНСЕР-БЛОКИРУЮЩАЯ ПОСЛЕДОВАТЕЛЬНОСТЕЙ, АКТИВНОСТЬ КАРТИРОВАННЫХ CTCF-СВЯЗЫВАЮЩИХ В ЛОКУСЕ FXYD5-COX7A1 ХРОМОСОМЫ 19 ЧЕЛОВЕКА. Ранее с помощью разработанного нами метода двумерного сдвига электрофоретической подвижности в нашей лаборатории были выявлены и картированы в локусе хромосомы 19 человека длиной 1 млн п.о., расположенном между генами FXYD5 и COX7A1, десять фрагментов ДНК, содержащие участки связывания транскрипционного фактора CTCF (Vetchinova et al., 2006). В данной работе мы предприняли попытку определить, обладают ли эти фрагменты инсуляторной (энхансер-блокирующей) активностью в системе позитивно-негативной селекции. Для этого были приготовлены плазмиды представленные на рис. 7 (стр. 20). Инсуляторная активность CTCF-связывающих фрагментов. Для проверки энхансер-блокирующих свойств десяти CTCF-связывающих фрагментов в системе позитивно-негативной селекции, их клонировали в плазмиду pPNT/EmP между энхансером и минимальным промотором цитомегаловируса. Было приготовлено 20 плазмид, каждая содержала один из фрагментов, связывающих CTCF, клонированный в прямой или обратной ориентации. 19 Для интеграции в геном клеток плазмиды pPNT/EmP со вставками были линеаризованы, и все 20 плазмид объединены в общую смесь в равных количествах. В качестве вложенного контроля в смесь были добавлены в эквивалентном количестве линеаризованные плазмиды pPNT/E-sns-mP (положительный контроль) (рис. 7), содержащие инсулятор sns в обеих ориентациях. Полученным пулом плазмид, были трансфицированы клетки линии СНО в отработанных ранее условиях электропорации, приводящих к интеграции единственной копии плазмиды в геном (Baer et al., 2000). После позитивно-негативной селекции, которую проводили как описано в предыдущей главе, из выживших клеток была выделена геномная ДНК. Анализ полученных образцов геномной ДНК проводили при помощи двухстадийной ПЦР. На первом этапе на матрице геномной ДНК с праймерами 2L и 2R амплифицировали фрагменты, заключенные между энхансером и промотором CMV. Для каждого CTCFсвязывающего фрагмента из локуса FXYD5-COX7A1, а также для инсулятора морского ежа sns были подобраны внутренние праймеры, которые в комбинации с плазмидными праймерами 2L или 2R позволяли определять как наличие в смеси каждой из вставок, так и их ориентацию. Результаты ПЦР приведены на рисунке 8 (стр. 21). 20 Как видно на рисунке 8 (верхние панели, рис. 8-А и 8-Б) все 10 CTCF-связывающих фрагментов и контрольный инсулятор sns присутствуют в геномной ДНК клеток после селекции G-418, то есть содержащие их конструкции интегрированы в геном клеток. Те же фрагменты присутствуют и в нижних панелях (рис. 8) после селекции с 10 мкМ GCV. Аналогичные результаты были получены при селекции с 4 мкМ GCV в ростовой среде (не показано). Таким образом, можно заключить, что все 10 клонированных нами CTCFсвязывающих фрагментов придают клеткам устойчивость к ганцикловиру, будучи помещенными между промотором и энхансером. Кроме инсуляторов, устойчивость к ганцикловиру трансфицированным клеткам могут придавать последовательности с активностью сайленсеров, которые, в отличие от инсуляторов, способны подавлять активность промотора независимо от их положения относительно последнего (Ogbourne and Antalis, 1998). Таким образом, активность сайленсера должна распространяться и на промотор гена неомицинфосфотрансферазы, и клетки, несущие такой вектор должны погибать на стадии позитивной селекции (Akopov et al., 2006). Тем не менее, для проверки возможного присутствия сайленсерной активности у CTCF-связывающих фрагментов мы клонировали три из них (3, 7 и 8) в плазмиду pPNT/EmPS с 3′-стороны от гена HSV-tk (Рис. 7). Клетки, трансфицированные этими 21 плазмидами, погибали на стадии негативной селекции с GCV, т.е. не оказывали ослабляющего действия на энхансер CMV и не являлись сайленсерами. Таким образом, анализ инсуляторной активности сайтов связывания транскрипционного фактора CTCF, картированных в локусе FXYD5-COX7A1, с помощью системы позитивно-негативной селекции показал, что все эти фрагменты обладают энхансерблокирующими свойствами, причем эта их способность наблюдается в обеих ориентациях относительно промотора. Способность инсулятора морского ежа sns блокировать действие энхансера на промотор в системе позитивно-негативной селекции также не зависит от ориентации. 22 ВЫВОДЫ 1. Предложен подход к идентификации и картированию потенциальных энхансеров в протяженных областях генома. 2. С помощью предложенного подхода с использованием культуры клеток HeLa идентифицировано 15 потенциальных энхансеров в локусе, расположенном на хромосоме 19 человека между генами FXYD5 и COX7A1. 3. Обнаруженные потенциальные энхансеры специфически взаимодействуют с белками ядерных экстрактов из клеток культуры HeLa. 13 из 15 обнаруженных последовательностей проявляют энхансерную активность в системе двойной люциферазной детекции в экспериментах по транзиентным трансфекциям линии клеток HeLa. 4. С помощью ранее разработанного метода позитивно-негативной селекции энхансерблокирующих элементов генома идентифицировано 10 новых потенциальных инсуляторов в локусе, расположенном на хромосоме 19 человека между генами FXYD5 и COX7A1. 5. С помощью системы позитивно-негативной селекции проведен анализ энхансерблокирующей активности ранее обнаруженных 10 CTCF-связывающих фрагментов ДНК, расположенных в локусе FXYD5-COX7A1 хромосомы 19 человека. Все исследованные CTCF-связывающие последовательности проявляют энхансерблокирующую активность в данной системе. 23 ОСНОВНЫЕ РЕЗУЛЬТАТЫ ДИССЕРТАЦИИ ИЗЛОЖЕНЫ В СЛЕДУЮЩИХ РАБОТАХ Публикации в научных журналах 1. Chernov, I., E. Stukacheva, S. Akopov, D. Didych, L. Nikolaev and E. Sverdlov (2008). "A new technique for selective identification and mapping of enhancers within long genomic sequences." Biotechniques 44(6): 775-84. 2. Дидыч Д.А., Акопов С.Б., Снежков Е.В., Скапцова Н.В., Николаев Л.Г., Свердлов Е.Д. (2009) «Идентификация и картирование 10 новых потенциальных инсуляторов в области FXYD5-COX7A1 хромосомы 19q13.12 человека». Биохимия (Москва) 74(7), 728-733. 3. Nikolaev, L. G.; Akopov, S. B.; Didych, D. A.; Sverdlov, E. D. (2009). Vertebrate Protein CTCF and its Multiple Roles in a Large-Scale Regulation of Genome Activity. Current Genomics 10, 294-302. Материалы российских и международных конференций 1. Д.А. Дидыч. «Поиск и картирование энхансерных элементов внутри длинных геномных последовательностей». Международная конференция студентов, аспирантов и молодых ученых «Ломоносов – 2008». 8-11 апреля 2008 г., Москва, тезисы докладов, стр.148. 2. С.Б. Акопов, А.С. Ветчинова, Д.А. Дидыч, В.М. Руда, В.В. Батрак, Л.Г. Николаев, Е.Д. Свердлов. «Картирование участков с активностью инсуляторов в мультигенном локусе хромосомы человека 19q13.12». IV съезд Российского общества биохимиков и молекулярных биологов. 11-15 мая 2008 г., Новосибирск, тезисы докладов, стр.119. 3. Л.Г. Николаев, И.П. Чернов, Е.А. Стукачева, Д.А. Дидыч, С.Б. Акопов, Е.Д. Свердлов. «Прямая идентификация и картирование энхансеров внутри протяженных областей генома». IV съезд Российского общества биохимиков и молекулярных биологов. 11-15 мая 2008 г., Новосибирск, тезисы докладов, стр.131. 4. D. Didych, I. Chernov, E. Stukacheva, S. Akopov, L. Nikolaev, E. Sverdlov. «Straightforward identification and mapping of enhancers within long genomic sequences». 3rd European Science Foundation functional genomics conference «Functional genomics and Disease». October 1-4, 2008, Innsbruck, Austria. Abstract book, p. 83. 5. Д.А. Дидыч, С.Б. Акопов, Н.В.Скапцова, Е.В.Снежков, Е.А.Стукачева, И.П.Чернов, Л.Г.Николаев. «Экспериментальные подходы к функциональному картированию энхансерных и инсуляторных последовательностей в протяженных участках генома человека». XXI Зимняя молодежная научная школа «Перспективные направления физико-химической биологии и биотехнологии». 9-11 февраля 2009 г., Москва. 6. Е.С. Котова, А.С. Ветчинова, Д.А. Дидыч, С.Б. Акопов, Л.Г. Николаев. «Выявление инсуляторной активности CTCF-связывающих последовательностей с использованием метода позитивно-негативной селекции». XXI Зимняя молодежная научная школа «Перспективные направления физико-химической биологии и биотехнологии». 9-11 февраля 2009 г., Москва. 7. Д.А. Дидыч. «Идентификация и картирование регуляторных элементов в локусе FXYD5-COX7A1 хромосомы 19 человека». Международная научная конференция по биоорганической химии, биотехнологии и бионанотехнологии. 28 сентября – 1 октября 2009 г., Москва, тезисы работ участников Конкурса молодых ученых, стр. 65. 24