Молекулярная биология Лекция 2. Структура, свойства и функции нуклеиновых кислот. Скоблов Михаил Юрьевич Часть 1. Структура нуклеиновых кислот Состав клетки Неорганические • • Вода – 75-85% Неорганические соли, кислоты – 1-1,5% Вещества в клетке Органические Малые молекулы Биополимеры • Моносахариды (макромолекулы) • Аминокислоты • Полисахариды 0,5% • Нуклеотиды (углеводы) - 0,2-2% • Другие • Белки - 10-20% • Липиды • Нуклеиновые (жиры) – 1-5% кислоты (ДНК, РНК) - 1-2% История открытия: ДНК • В 1869 году молодой швейцарский врач Фридрих Мишер в Германии решил изучить химический состав клеток животных, а в качестве материала выбрал лейкоциты, которых было много в гное. Из местной хирургической больницы ему стали привозить корзины с гнойными повязками, снятыми с ран. • В процессе работы он понял, что кроме белков в лейкоцитах присутствует неизвестное соединение, содержащееся в ядрах клеток. • Фридрих Мишер назвал его нуклеином, от латинского nucleus — ядро. • Позже было обнаружено, что бактериальные клетки, в которых нет ядра, тоже содержат нуклеиновые кислоты. Фридрих Мишер РНК • Джерард Маирбакс изолировал первую матричную РНК, кодирующую гемоглобин кролика и показал, что при её введении в ооциты образуется гемоглобин. • Северо Очоа получил Нобелевскую премию по медицине в 1959 году за открытие механизма синтеза РНК Строение нуклеозида и нуклеотидов Строение нуклеозида и нуклеотидов Строение нуклеозида и нуклеотидов Строение рибонуклеотидов • Рибоза • Урацил U Почему в ДНК тимин, а в РНК урацил? • Синтез урацила, энергетически выгоднее, чем тимина, так как не нужно делать лишнее метилирование. • Это косвенно подтверждает гипотезу мира РНК, о том что первичными нуклеиновыми кислотами были РНК • При частом спонтанном дезаминировании цитозина в клетке, цитозин превращается в урацил. • Если в составе ДНК был бы урацил, то отличить его от возникшего из цитозина было бы невозможно. • Это бы привело к невозможности репарации, и как следствию к интенсивному накоплению мутаций. Названия оснований и нуклеозидов Сокращение A G T C U Основание Аденин Гуанин Тимин Цитозин Урацил Нуклеозид Аденозин Гуанозин Тимидин Цитидин Уридин Минорные основания нуклеозидов Искусственные нуклеотиды Искусственная пара реплицируется бактериальной ДНК полимеразой и не удаляется механизмами репарации. KlenTaq polymerase replicates unnatural base pairs by inducing a Watson-Crick geometry. Betz K1, Malyshev DA, Lavergne T, Welte W, Diederichs K, Dwyer TJ, Ordoukhanian P, Romesberg FE, Marx A. Nat Chem Biol. 2012 Jul;8(7):612-4. Модифицированные нуклеозиды Ацикловир – самое распространенное противогерпетическое лекарственное средство. Убирает симптомы заболевания, но не излечивает! ТК вируса герпеса Ацикловир ? ? Монофосфат ацикловира Дифосфат ацикловира Трифосфат ацикловира Вирусная ДНКполимераза Вирус погибает Модифицированные нуклеозиды Тимидилатсинтетаза катализирует превращение дезоксиуридина монофосфата в дезокситимидин монофосфат, который является единственным источником синтеза тимидина, начальным предшественником для репликации ДНК. Активные метаболиты 5-ФУ FdUMP, FUTP и FdUTP ответственны за противоопухолевый эффект препарата: • FdUMP связывается с ТС, препятствуя синтезу тимидина трифосфата • FdUTP инкорпорируется в ДНК, приводя к ее разрывам • FUTP инкорпорируется в РНК, вызывая нарушения ее стабильности и функции 5-фторурацил Содержание нуклеотидов в ДНК Правила Чаргаффа Соотношения, выявленные Чаргаффом для аденина (А), тимина (Т), гуанина (Г) и цитозина (Ц), оказались следующими: Эрвин Чаргафф • Количество аденина равно количеству тимина, а гуанина — цитозину: А=Т, Г=Ц. • Количество пуринов равно количеству пиримидинов: А+Г=Т+Ц. • Количество оснований с аминогруппами в положении 6 равно количеству оснований с кетогруппами в положении 6: А+Ц=Г+Т. Принцип комплементарности Вторичная структура ДНК Джеймс Уотсон и Френсис Крик. 1953 год. Содержание нуклеотидов Организм A G C T G+C, мол. % Бактериофаг λ 26 23,8 24,3 25,8 48 Бактериофаг Т2 32,5 18,2 16,72 32,6 35 Escherichia coli 23,8 26 26,4 23,8 52 29 20,7 21,3 29 42 26,6 24,5 24,2 24,7 49 31,3 18,7 17,1 32,9 36 19,6 30,2 30 19,7 60 Мышь 28,9 21,1 20,3 30 41 Пшеница 27,2 22,6 22,8 27,4 45 Bacillus subtilis Вирус папилломы Шоупа Saccharomyces cerevisiae Chlamydomonas Соотношение (A+Т):(Г+Ц) может быть различным у ДНК разных видов. У одних преобладают пары АТ, в других — ГЦ. Содержание динуклеотидов За 400 млн лет позвоночными утрачено 75% CpG динуклеотидов Gentles AJ, Karlin S. Genome-scale compositional comparisons in eukaryotes. Genome Res. 2001 Apr;11(4):540-6. Вторичная структура ДНК Формирование вторичной структуры ДНК определяется следующими типами взаимодействий: • водородные связи между комплементарными основаниями (две между аденином и тимином, три — между гуанином и цитозином); • стэкинг-взаимодействия • нековалентное взаимодействие между органическими соединениями, содержащими ароматические компоненты. • В ДНК параллельный стэкинг имеет место между соседними парами нуклеотидов и повышает стабильность молекулярной структуры. Сила комплементарных взаимодействий оснований в ДНК: пурин-пурин>пиримидин-пурин>пиримидин-пиримидин Неканонические формы ДНК В-ДНК - основное состояние ДНК показанное на кристаллах и в водных растворах. С-ДНК - форма существующая при пониженной концентрации Na и влажности 44-66%, если GC=31-72%. А-ДНК - форма ДНК-РНК гибридов. Z-ДНК - левозакрученная форма. Переходу B->Z способствует наличие GC-5' последовательности являющейся местом метилирования у организмов. Z-ДНК обнаружена в междисках политенных хромосом D. melanogaster. G-квадруплексы последовательности нуклеиновых кислот, обогащенные гуанином и способные образовывать структуры из двух, трёх или четырех цепей. Часть 2. Свойства нуклеиновых кислот Химические свойства • ДНК и РНК - нуклеиновые кислоты, кислоты, слабые, но кислоты • Молекулы нуклеиновых кислот содержат множество отрицательно заряженных фосфатных групп и образуют комплексы с ионами металлов; их калиевая и натриевая соли хорошо растворимы в воде. • 2’ гидроксил делает РНК уязвимой к щелочному и кислотному гидролизу • Концентрированные растворы нуклеиновых кислот очень вязкие и слегка опалесцируют, а в твердом виде эти вещества белые. • Нуклеиновые кислоты сильно поглощают ультрафиолетовый свет, и это свойство лежит в основе определения их концентрации. С этим же свойством связан и мутагенный эффект ультрафиолетового света. Оптические свойства ДНК • Поглощение нуклеиновых кислот в ближней УФ-области почти целиком обязано пуриновым и пиримидиновым основаниям. • Сахарофосфатный остов РНК и ДНК дает незначительный вклад в спектр поглощения при длинах волн, превышающих 200 нм. • Спектры всех четырех нуклеозидов чувствительны к рН. Протонирование С и G приводит к значительному сдвигу поглощения в сторону больших длин волн (красное смещение). Депротонирование U или Т при щелочных рН также приводит к существенному красному смещению максимума поглощения. Протонирование А сопровождается гораздо меньшими спектральными изменениями. Оптические свойства ДНК • Наиболее часто измерения поглощения проводят для определения концентрации. • Это можно делать, если известен коэффициент молярной экстинкции и соблюдается закон Ламберта-Бера. Например, для двухцепочечной ДНК D260=1 соответствует 50 мкг/мл, для РНК – 40. Молекулярный коэффициент экстинкции. OD - единица измерения количества олигонуклеотидов, соответствует количеству, которое в 1ml на пути 1см дает А260=1 C [µmol/ml] = OD/E олигонуклеотида E олигонуклеотида = сумма (Eнуклеотидов) всех dG dC dA dT dN E [ml/µmol] 7 12 16 9,6 10,8 Плавление ДНК Денатурация или плавление - расхождение цепей ДНК при нагревании ДНК или при повышении pH. • • • Расхождение цепей происходит из-за разрушения слабых водородных связей и плоскостных взаимодействий между основаниями. На денатурацию также влияют: ионы одно- и двухвалентных металлов, белки, нейтрализующие отрицательные заряды фосфатных групп. Температура плавления GC выше чем АТ. 40% 60% • • • • • Денатурация – процесс обратимый, последующее восстановление двухцепочечной структуры ДНК может происходить даже при полном расхождении цепей. Процесс воссоединения, называемый ренатурацией, реассоциацией или отжигом, происходит при понижении температуры или рН При резком понижении температуры или рН правильное воссоединение комплементарных цепей затрудняется из-за спаривания оснований локально комплементарных участков в пределах одной или разных цепей. При ренатурации сначала соединяются участки цепей с повторенной ДНК и затем с уникальными участками Если совместно. отжигают одноцепочечные ДНК, происходящие из различных источников, то формирование двухцепочечной структуры ДНК называют гибридизацией. Плавление ДНК Tm — температура, при которой половина ДНК-матриц имеет двухцепочечную структуру Плавление ДНК • Плавление ДНК - процесс перехода регулярной двойной спирали линейной молекулы ДНК в клубкообразное состояние. • При переходе ДНК из спирального состояния в клубкообразное поглощение раствора A в области 250-270 нм увеличивается на 30-40% • Суммарная длина различных присутствующих в геноме последовательностей, оценивается по их реассоциации в процессе ренатурации ДНК • Метод реассоциации ДНК позволяет судить о близком родстве по способности денатурированных отдельных нитей ДНК одних бактерий реассоциировать перекрестно при инкубации в определенных условиях с нитями ДНК других, образовывая спиральную гибридную молекулу. Вторичная и третичная структуры РНК Вторичная структура – распределение вторичных структур рибозофосфатного скелета вдоль цепи Третичная структура – 3D структура молекулы РНК Вторичная и третичная структуры тРНК кодированы одним цветом Элементы вторичной структуры C G G C | C | C | A / G | A \ Спирали / A A C-A U-G G-C-A-A-G G-G-U-U-C / \ G | U C | G | U C U \ A G | C | A A A A G | G G | A | G | C C | U | U | G Петля-шпилька G Выпячивание A Внутреняя петля \ / Множественная петля \ / C | G | C | / G | C | G G A Псевдоузел \ / A | U | C | A Вторичная структура HIV-1 Часть 3. Методы исследования первичной и вторичной структуры нуклеиновых кислот. Секвенирование ДНК Терминаторы элонгации цепи 1980г Вторая Нобелевская премия по химии: «for their contributions concerning the determination of base sequences in nucleic acids» Дидезоксинуклеотиды Фредерик Сенгер Секвенирование ДНК по Сенгеру Капилярное секвенирование с флуоресцентными терминаторами Обратная транскрипция Обратная транскрипция Обратная транскриптаза (также известная как ревертаза или РНКзависимая ДНК-полимераза) • Фермент класса трансфераз, осуществляющий ДНК-зависимый синтез ДНК на матрице РНК (обратная транскрипция). • Обладает активностью РНКазы Н (т.е. разрушает цепь РНК, входящую в состав ДНК/РНК-дуплекса). • Подобно всем ДНК-полимеразам функционирует только при наличии затравки. Потенциал вторичной структуры РНК Более чем для 3000 транскриптов определены элементы вторичной структуры, что составляет около 50% всех генов Saccharomyces cerevisiae. Предсказание вторичной структуры • Перебор вариантов (жадные алгоримы) • Минимизация свободной энергии/ Максимизация числа пар (Динамическое программирование) • Стохастические алгоритмы (Монте-Карло, генетические алгоритмы) • Поиск консервативных структур Реальность: • Проблема формирования вторичной структуры РНК – сложная комбинаторная и физическая задача • Результаты минимизации энергии не всегда дают биологически осмысленную структуру • Наилучшие результаты дает поиск консервативных структур Часть 4. Функции нуклеиновых кислот Происхождение ДНК Земное! Внеземное? Эксперимент Миллера — Юри Теория химической эволюции Ученые из NASA проанализировали состав 12 богатых углеродом метеоритов, 9 из которых найдены в Антарктике. В них были обнаружены компоненты ДНК такие как аденин, гуанин, а также и другие клеточные компоненты - гипоксантин и ксантин. Происхождение ДНК Земное! • Возраст Земли составляет 4.5 миллиарда лет • Самые древние следы жизни на ней имеют возраст около 3.5 миллиардов лет. • Все виды современных организмов являются потомками древних форм жизни и используют одинаковый материал для хранения и передачи наследственной информации - ДНК. История изучения ДНК • В 1869 году Фридрих Мишер обнаружил неизвестное соединение, содержащееся в ядрах клеток, и назвал его нуклеином, от латинского nucleus — ядро. Эксперимент Фредерика Гриффита по трансформации бактерий. 1944 г. История изучения ДНК Эксперимент Эвери, Маклеода и Маккарти по трансформации бактерий. 1944 г. Вывод: Только ДНК определяет наследственные свойства организма. Реализация ДНК как генетического материала У каждого живого организма есть наследственный материал Реализация ДНК как генетического материала Размер генома человека 3,2x109 нуклеотидных пар, из него около 1.5% генома кодирует белки А остальное? “junk DNA”? Реализация ДНК как генетического материала Плотность генов,ген/тыс.нукл. Прокариоты и вирусы Эукариоты Размер генома, тыс. нукл. Реализация ДНК как генетического материала Структура генома человека Информационная емкость ДНК Демонстрация записи текста целой книги Чёрча в 1 пикограмм молекул. Авторы кодировали не текст ASCII, а бинарный код —книгу Чёрча, с сохранением форматирования HTML и иллюстраций JPEG. Перед записью код разбили на 96-битные блоки. Общий объём записанной информации составил 54898 таких блоков, то есть примерно 643 килобайта, включая служебную информацию — 19-битный уникальный адрес каждого блока (на диаграмме внизу он изображён красным цветом). В данном эксперименте достигнута информационная плотность записи 5,5 петабит на кубический миллиметр. Информационная емкость ДНК Исследователи из Европейского института биоинформатики опубликовали работу с описанием способа, как можно существенно повысить информативность ДНК, предложив отказаться от четверичной системы (Base-4) в пользу троичной (Base-3), а четвёртый нуклеотид использовать в служебных целях для разбиения длинных цепочек Информационная плотность записи 2,2 петабайта на 1 грамм биологического материала. На сегодняшний день стоимость кодирования информации в ДНК оценивается примерно в $12400 за мегабайт, стоимость считывания — $220 за 1 МБ. Часть 5. Функциональные элементы генома Анализ первичной структуры ДНК и её функции Что? Где? Когда? Проект ENCODE The Encyclopedia of DNA Elements Полученные данные позволяют провести фактически полноценный анализ по исследованию регуляции изучаемого локуса. Гены Найти ген – значит картировать РНК на ДНК, проаннотировать эту последовательность. «Ген – это совокупность геномных последовательностей, кодирующих сцепленный набор потенциально перекрывающихся функциональных продуктов». Гены Гены • К 2007 году из 7000 генов у дрожжей была известна функция только для 1000 генов. • У человека известна функция примерно для половины генов • Каждый год примерно для 100 генов открывают функцию Псевдогены. Классификация. (процессированый) (единичный) (дуплицированный) Обратная транскрипция Процессированные псевдогены Виды Количество генов Количество процессированных псевдогенов Arabidopsis 33583 4260 Caenorhabditis elegans 21187 2445 Drosophila melanogaster 22372 2208 Danio rerio 34291 16357 Gallus gallus 22720 5539 Canis lupus familiaris 24953 12852 Rattus norvegicus 42743 13962 Mus musculus 58433 19119 Pan troglodytes 32989 16785 13 12 10 48 24 52 33 33 51 Homo sapiens 42000 17609 42 % ? функциональность • Образованы 10% кодирующих генов • Около 80% примато-специфичные • Значительная фракция псевдогенов (до 20%) транскрипционно активна… Механизмы действия процессированных псевдогенов Регуляторные участки в геноме Промотор — последовательность нуклеотидов ДНК, узнаваемая РНКполимеразой для осуществления транскрипции. мРНК гена А ТАТА-бокс - консервативная, богатая аденином и тимином последовательность ДНК, выявленная примерно у четверти генов человека на расстоянии 25-30 п. о. слева («вверх по течению») от точки инициации транскрипции. ТАТА-бокс обеспечивает ориентацию РНК-полимеразы относительно промотора, участвует в инициации транскрипции генов. Регуляторные участки в геноме Энхансер (enhancer) — последовательность ДНК, способный связываться с факторами транскрипции, при этом увеличивая уровень транскрипции гена или группы генов. Сайленсер (silencer) — последовательность ДНК, с которой связываются факторы транскрипции (белки-репрессоры), что приводит к понижению или к полному подавлению транскрипции гена. Инсулятор (insulator) — последовательность ДНК, способная блокировать взаимодействие между энхансером и промотором, если находится между ними. Регуляторные участки в геноме Уровень экспрессии гена является результирующей всех взаимодействий. Регуляторные участки в геноме • Проанализировано 19 тканей и типов клеток мыши • Найдено около 300 000 цис-регуляторных последовательностей • Они составляют до 11% генома мыши • И включают в себя более 70% консервативных не-кодирующих последовательностей Регуляторные участки в геноме В результате было выявлено: • 53,834 возможных промоторов • 234,764 потенциальных энхансеров • 111,062 инсуляторов Повторяющиеся последовательности в ДНК Тандемные повторы Организм Диспергированные повторы Всего повторов в Сателлиты и геноме простые повторы Мобильные элементы Кукуруза 70% 10% 60% Рис 35% 9% 26% Рожь 87% 15% 72% Нематода 16% 7% 9% 8% 6% 2% Дрозофила 16% 6% 10% Москит 95% 11% 84% Курица 16% 7% 9% Мышь 62% 15% 47% Человек 64% 17% 46% Медовая пчела Повторяющиеся последовательности в ДНК Диспергированные повторы Тандемные повторы Сателлиты Минисателлиты Микросателлиты > 100 нуклеотидов от 7 до 100 нукл. от 1 до 6 нуклеотидов ATGCGTAGCTAGCAGTAG CTGACGTACATGCTAACA TGCTAACATGCTAACATG CTAACATGCTAACATGCT AACATGCTAACATGCTAA CATGCTAACATGCTAACA TGCTACTAGCAGTAGCTG ACGTAGACTAGGCTAGC ATGCGTAGCTAGCAGTAGC TGACGTACAACAACAACAA CAACAACAACAACAAATGC GTAGCTAGCAGTAGCTGAC GTATAGGCTAGCATGCAGTC TAGCTAATGCGATCGCATCG Повторяющиеся последовательности в ДНК Болезни экспансии (умножения) тринуклеотидных повторов Умножение полиглутаминовых трактов (GAA, GAG) • болезнь Генгтинтона • болезнь Кеннеди • спиноцеребеллярная атаксия тип 1,2,3,6,7,17 Умножение неполиглутаминовых трактов • синдром ломкой Ххромосомы • атаксия Фридрейха • спиноцеребеллярная атаксия 8,12 Повторяющиеся последовательности в ДНК Повторяющиеся последовательности в ДНК Диспергированные повторы Транспозоны мобильные элементы, репликация которых включает перемещение своей ДНК последовательности на новое место в геноме • 2-3% генома человека • Примеры: MER1, MER2 Ретротранспозоны мобильные элементы, которые могут самовоспроизводиться в геноме, осуществляя реакцию обратной транскрипции. • 42% генома человека • Примеры: Alu, MIR, LINE1, LINE2….. Открытие мобильных элементов Нобелевская премия по физиологии и медицине: «За открытие мобильных генетических элементов» Исследование южноамериканских видов кукурузы Барбара Мак-Клинток, 1944-1951 гг. лаборатория Колд-Спринг Харбор Эффект транспозиции мобильных элементов выражался в изменении окраски зёрен кукурузы относительно образцов из поколений от контрольного скрещивания. Mobile DNA in cancer. Extensive transduction of nonrepetitive DNA mediated by L1 retrotransposition in cancer genomes. Tubio JM, Li Y, Ju YS, Martincorena I, Cooke SL, et al.. Science. 2014 Aug 1;345(6196):1251343. Полиморфизм ДНК Сравнение результатов секвенирования индивидуальных геномов человека Gonzaga-Jauregui C, Lupski JR, Gibbs RA. Human genome sequencing in health and disease. Annu Rev Med. 2012;63:35-61. Функционирование вторичной структуры ДНК • Квадруплексы - последовательности нуклеиновых кислот, обогащенные гуанином и способные образовывать структуры из двух, трёх или четырех цепей. • В геноме человека насчитывается около 350 тысяч квадруплексов. G-квадруплексы G-квадруплексы в промоторе Direct evidence for a G-quadruplex in a promoter region and its targeting with a small molecule to repress c-MYC transcription. Siddiqui-Jain A1, Grand CL, Bearss DJ, Hurley LH. Proc Natl Acad Sci U S A. 2002 Sep 3;99(18):11593-8. G-квадруплексы в теломерах Модель укладки теломер, в которой G4 ДНК взаимодействует с G-квадруплекс связывающими белками (G4BP) Rudimentary G-quadruplex-based telomere capping in Saccharomyces cerevisiae. Smith JS, Chen Q, Yatsunyk LA, Nicoludis JM, Garcia MS, Kranaster R, Balasubramanian S, Monchaud D, Teulade-Fichou MP, Abramowitz L, Schultz DC, Johnson FB. Nat Struct Mol Biol. 2011 Apr;18(4):478-85. ДНКазимы • Впервые дезоксирибозимы были экспериментально продемонстрированы в 1994 Брикеро и Джойсом • Они использовали селекцию in vitro для поиска специфичных ДНК последовательностей способных катализировать Pb2+-зависимое расщепление фосфодиэфирной связи в РНК • Сегодня в литературе описано большое количество различных каталитических молекул ДНК способных расщеплять, лигировать, фосфорилировать деапуринизировать молекулы ДНК, метилировать порфирины, расщеплять и лигировать молекулы РНК. • Также в литературе описано несколько десятков случаев использования in vivo РНКрасщепляющих дезоксирибозимов для подавления экспрессии генов с ориентированием на будущий прикладной потенциал.