Московский Государственный Университет им. М.В. Ломоносова Факультет Биоинженерии и Биоинформатики Изучение регуляции азотофиксации в различных видах архебактерий Курсовая студентки второго курса Цыгановой Марины Тьюторы: Герасимова А.В., Равчеев Д.А. Супервайзер: д.б.н. проф. Гельфанд М.С. Москва, 2004 Введение Изучение прокариотических организмов на молекулярно-биологическом уровне имеет важное практическое и теоретическое значение. Сейчас активно ведутся работы по исследованию малоизученной группы организмов, архебактерий. О ее существовании стало известно в 1977 году, и уже к 1978 было предложено выделить этих организмов в новый домен, то есть определить их как третью форму жизни. Расхождение трех основных эволюционных линий произошло на ранних этапах развития жизни (Doolittle and Brown, 1994). При этом эубактерии, скорее всего, отделились от общей ветви до расхождения архей и эукариот, которые в своей истории имели значительный период совместного развития. В связи с этим археи и эубактерии схожи по морфологической организации клетки и по многообразию метаболических и физиологических процессов, но на уровне организации транскрипции и трансляции археи проявляют большее сходство с эукариотами. Так, РНКполимераза архей подобна таковой у эукариот. Таким образом, археи совмещают в себе как признаки эубактерий, так и признаки эукариот, но, в тоже время, обладают уникальными свойствами, многие из которых позволяют этим организмам жить и развиваться в разнообразных, в том числе и экстремальных условиях. Археи имеют чрезвычайно маленький геном и являются единственными живыми организмами, производящими метан, как продукт метаболизма. Своеобразны и некоторые особенности строения архебактерий. Так, археи не имеют муреина в клеточной стенке, а гидрофобные цепи фосфолипидов одной стороны бислоя мембраны связаны при помощи эфирных связей с соответствующими гидрофобными участками противоположной стороны (Bell and Jackson, 1998). Однако, несмотря на то, что эти факты уже известны, архебактерии остаются весьма малоизученной группой. Как известно, экспериментальное изучение регуляции представляет собой очень трудоемкий процесс. Поэтому в настоящее время активно разрабатываются и применяются теоретические методы анализа. Так, в случае архей классические экспериментальные методы зачастую не могут быть применены. Причиной являются экстремальные условия обитания многих видов архей, которые трудно воспроизвести в лабораторных условиях. Теоретические же методы позволяют проводить исследования на основе уже известных генетических последовательностей. И значительно облегчают процесс аннотации геномной последовательности. В связи с успешным применением биоинформатических методов в отношении бактериальных геномов (Mironov et al., 1999) возник вопрос о возможности использования подобных стратегий в отношении и другой группы прокариотических организмов, архей . Детальный анализ белков, кодируемых в полных геномах архей привел к предсказанию некоторого числа белков, имеющих строение типа спираль-поворот-спираль, аналогичных 1 регуляторам у бактерий (Aravind and Koonin, 1999).Также было установлено несколько групп совместно регулируемых генов и соответствующие им регуляторные сигналы. Одной из изучаемых систем стала система регуляции азотофиксации (Gelfand et al., 2000). Под азотофиксацией понимается процесс включения аммония в состав органических соединений организма. Первичными продуктами усвоения аммония, поступившего извне, являются глутамин и глутамат. Прямо или опосредованно они предоставляют азот всем азотсодержащим соединениям клетки. Реакция образования глутамина из глутамата, собственно включение молекулы аммония, регулируется ферментом глутамин-синтетазой. Данная реакция сопряжена с расщеплением АТФ и требует присутствия ионов магния (Рис.1). Некоторые бактерии и археи способны также фиксировать молекулярный азот, превращая его в аммоний с последующим включением в соединения организма (Рис. 2). Процесс шестиэлектронного восстановления молекулярного азота в аммиак, катализируется ферментом нитрогеназой. Нитрогеназная система включает в себя два компонента: железосодержащий белок, имеющий активный железосерный [Fe4S4]-центр, и белок, включающий железомолибденовый (FeMo) кофактор (Dixon and Kahn, 2004). Кроме того, существуют молибден-независимые нитогеназы, кофактор которых вместо молибдена содержит ванадий или не содержит ни одного из этих металлов. Оба типа таких альтернативных нитрогеназ были обнаружены в организме Methnosarcina acetivorans (Kessler et al.,1996). Рис. 1. Синтез глутамина из глутамата. O O O O OH HO NH2 HO NH2 H2N NH3 H2O Рис. 2. Синтез аммиака из молекулярного азота. 2 Регуляция азотофиксации. Регуляция азотофиксации в археях подробно изучена лишь для Methanococcus maripaludis (Kessler et al.,1998). Набор генов и оперонов, которые регулируются в ответ на доступность азота, называется регулоном азотофиксации. В состав этого регулона входят следующие гены: glnA, кодирующий глутамин-синтетазу; amtB, кодирующий мембранный транспортер аммония; glnB и glnK, кодирующие регуляторные PII белки, причем amtB и glnB гены часто образуют оперон. nif-оперон, в состав которого входят 6 генов, кодирующих различные составляющие части нитрогеназы и два гена, кодирующих PII белки. К первой группе относятся гены nifH, nifD, nifK, nifE, nifN и nifX. nifD и nifK кодируют структурные субъединицы гетеротетрамера динитрогеназы. nifH кодирует железосодержащий белок, а nifE и nifN- поддерживающие структуры, в которых находится кофактор. Роль гена nifX не выяснена. Возможно, что его продукт участвует в биосинтезе кофактора. Эта схема не является универсальной для всех архей. Наряду с организмами, имеющими аналогичную структуру регулона, существует много организмов с различными вариациями этой схемы. В общем случае регуляция азотофиксации в археях к настоящему времени плохо изучена. Регуляция транскрипции генов, отвечающих за процесс азотофиксации, происходит у архей по механизму репрессии (Cohen-Kupiec et al.,1997). Экспериментально были определены белок-регулятор NrpR и регуляторный сигнал для генов регулона азотофиксации, состоящий из 14 нуклеотидов и имеющий палиндромное строение GGAA(6)-TTCC (Kessler and Leigh, 1999). NrpR представляет собой димер, каждая часть которого связывается с соответствующим плечом палиндрома, в результате чего ингибируется процесс транскрипции. В случае, когда перед геном располагается два регуляторных сайта происходит кооперативное связывание двух димеров с образованием тетрамера (Lie and Leigh, 2002). Полные гомологи NrpR были найдены в Methanobacterium thermoautotrophicum delta H и Methanocaldococcus jannaschii и их наличие коррелирует с присутствием установленного для Methanococcus maripaludis сигнала. У Methanosarcina mazei, Methanosarcina acetivorans, Methanopyrus kandleri, Archaeoglobus fulgidus присутствуют неполные гомологи, состоящие из ДНК-связывающего домена и еще одного домена с неизвестной функцией. Связывание NrpR с сайтом определяется концентрацией αкетоглутората. Неизвестно, связывается ли NrpR c α-кетоглуторатом непосредственно, или αкетоглуторат вызывает регуляторный каскад, активирующий NrpR. Избыток α3 кетоглутората, предшественника глутамата, свидетельствует о недостатке связанного азота в клетке (Рис.3). Поэтому при увеличении концентрации α-кетоглутората NrpR не может связываться с регуляторным сайтом и репрессия снимается. Кроме того, показана регуляция азотофиксации на посттранскрипционном уровне, которая обеспечивается гомологами белка РII (Kessler et al., 2000). Рис. 3. Синтез глутамата из α-кетоглутарата O O + OH HO O O NH3 NH2 HO O NH2 NH3 H2O + H2O . Цели и задачи За последние годы были дополнены ранее расшифрованные геномы архей и стали известны новые геномные последовательности организмов этой группы. Цель настоящей работы состояла в изучении регуляции процессов азотофиксации в различных группах архей. Были сформулированы следующие задачи: 1) Поиск белков-регуляторов, отвечающих за репрессию генов азотофиксации; 2) Поиск ортологов белков, участвующих в азотофиксации. Выявление неортологичных замен. 3) Построение матрицы позиционных весов нуклеотидов для поиска потенциальных регуляторных сайтов на основе анализа 5-областей генов, входящих в регулон азотофиксации в M. thermoautotrophicum, M. jannaschii и M. maripaludis; поиск потенциальных регуляторных сайтов в геномах родственных организмов с помощью полученной матрицы. 4) Создание новой матрицы позиционных весов нуклеотидов для распознавания сайтов на основе анализа 5-областей генов азотофиксации из геномов родственных организмов с целью поиска новых сайтов. Подобная задача может возникнуть в тех случаях, когда перед генами, ответственными за процесс азотфиксации, не найдено сайтов, схожих с известными сигналами. 4 Материалы и методы Нами было рассмотрено девять геномов архей, принадлежащим к различным группам. Полные геномы Methanobacterium thermoautotrophicum deltaH (Smith et al.,1997), Methanosarcina acetivorans C2A (Galagan et al., 2002), Methanosarcina mazei Gol (Deppenmeier et al., 2002), Archaeoglobus fulgidus DSM 4304 (Klenk et al.,1997), Methanocaldococcus jannaschiiDSM 2661 (Bult et al.,1996), Methanococcus maripaludis S2 и Methanopyrus kandleri AV19 (Slesarev et al., 2002), а также неполные геномы Methanosarcina barkeri str. fusaro и Methanococcoides burtonii DSM 6242 были взяты из базы данных GenBank (http://www.ncbi.nlm.nih.gov/) Для построения матриц для поиска регуляторных сайтов нами использовался метод позиционных весов (Гельфанд и Миронов,1999). В соответствии с этим методом каждому нуклеотиду в данной позиции присваивается определенный вес, вычисляемый по формуле. W(b,k)=log[N(b,k)+0.5]-0.25Σilog[N(b,k)+0.5], где i-нуклеотиды, N(b,k) - число появлений нуклеотида b в позиции k. Вес найденного сайта представляет собой сумму позиционных весов составляющих его нуклеотидов. Однако, данный метод не позволяет с уверенностью предсказать все сайты связывания данного белка и полностью избавиться от «ложных» сайтов, так называемого шума. В большинстве случаев не удается построить такое распознающее правило, которое позволило бы с уверенностью предсказать все сайты связывания данного белка. Поэтому для изучения регуляции используют метод, названный «проверкой соответствия» (“consistency check”). В основу метода положен сравнительный анализ геномных последовательностей родственных организмов. Метод оперирует понятием регулон - группа совместно регулируемых генов. Предполагается, что такая группа генов будет составлять регулон и в родственных геномах. Следовательно, перед ортологичными генами в разных геномах должен сохраняться потенциальный сайт. Сайты, не сохраняющиеся в других геномах, скорее всего не являются истинными и относятся к «шуму». Подобного рода исследования позволяют как описывать новые регулоны, так и находить новые потенциальные члены относительно хорошо изученных регулонов (Mironov et al,1999, Gelfand et al., 2000). Для построения матриц позиционных весов и использовалась программа SignalX (Mironov et al, 2000). Для поиска ортологов и потенциальных сайтов использовался пакет программ GenomeExplorer (Mironov et al., 2000). Для поиска гомологичных белков использовалась программа BLAST (Altschul et al., 1997). 5 Для построения выравниваний нуклеотидных и аминокислотных последовательностей и филогенетических деревьев применялась программа ClustalХ (Thompson, 1997). Для визуализации деревьев использовалась программа GeneMaster (А.А. Миронов, неопубл.). Для определения структуры регуляторного сигнала использовались диаграммы лого, построение которых производилось с помощью программы WebLogo (Crooks, 2004). Результаты и обсуждение. Наряду с экспериментально показанной последовательностью регуляторного сайта, для Methanococcus maripaludis было также установлено наличие регулятора азотофиксации белка NrpR (Lie and Leigh, 2002). Данный белок связывается с ДНК в виде димера или тетрамера. Каждая субъединица белка NrpR состоит из трех доменов. N-концевой домен содержит мотив спираль-поворот-спираль (так называемый НТН-домен) и является ДНКсвязывающим. Точная функция двух других доменов пока остается невыясненой. По всей видимости, они отвечают за ди- и тетрамеризацию или за взаимодействие с веществомэффектором. Следует заметить, что в данном случае отсутствуют какие-либо сведения о структуре NrpR и под доменом подразумевается участок аминокислотной последовательности, сохраняющейся в ходе эволюции. Более детально этот вопрос обсуждается в разделе “Поиск гомологов белка NrpR”. Поиск гомологов белка NrpR Первым шагом в изучении NrpR-зависимой регуляции стал поиск гомологов данного белка в различных геномах архей. Для этого с помощью программы BLAST в базе данных белков был проведен поиск гомологов белка NrpR. Затем в тех геномах, где были найдены гомологи NrpR, был произведен поиск ортологов данного белка. Результаты поиска приведены в Табл.1. Отдельного внимания заслуживает процедура поиска ортологов в геномах M.barkeri и M.burtonii. В настоящее время доступны лишь фрагментарные последовательности данных геномов, и поэтому, применяя общий подход, не удалось найти ортологи регулятора. Тем не менее, в белковой базе данных с помощью программы BLAST были найдены по два гомолога NrpR для каждого организма. При этом наилучшими гомологами NrpR оказались белки NrpR из M.barkeri и белок, кодируемый геном MCB_063_0041, из M.burtonii . Поиск их гомологов в M.maripaludis показал, что именно NrpR является их наилучшим гомологом. Кроме того, из построенного на основе НТН-доменов NrpR филогенетического дерева видно, 6 что эти белки близки к NrpR M.maripaludis (Рис.4). Таким образом, именно эти белки и представляют собой наилучшие гомологи NrpR. Табл.1. Ортологи NrpR в исследованных геномах. Геном Название гена Methanococcus maripaludis Methanobacterium thermoautotrophicum deltaH Methanocaldococcus jannaschii Methanosarcina mazei Methanosarcina acetivorans Methanococcoides burtonii Methanopyrus kandleri Methanosarcina barkeri Archaeoglobus fulgidus nrpR MTH1569 Количество доменов 3 3 MJ0159 MMZ1085 MA4404 MCB_070_0278 MK0337 nrpR AF2227 3 2 2 2 2 2 2 Рис. 4. Филогенетическое дерево НТН-доменов белка NrpR. MTH-Methanobacterium thermoautotrophicum, MMZ-Methanosarcina mazei, MJ-Methanocaldococcus jannaschii, MAMethanosarcina acetivorans, MK-Methanopyrus kandleri, MM-Methanococcus maripaludis,MCBMethanococcoides burtonii, AF-Archaeoglobus fulgidus,MB-Methanosarcina barkeri. MTH MA 0 .2 3 MCB 0 .1 7 AF 16 0 .2 8 0.17 0. MB MMZ 0 .3 7 MM MK MJ 7 По строению гомологов NrpR все исследованные организмы могут быть разделены на 3 группы. К первой относятся M.maripaludis, М.thermoautotrophicum deltaH и M.jannaschii, имеющие по одному полному ортологу, включающему все три домена. Ко второй группе относятся Archaeoglobus fulgidus и M.kandleri, в которых был найден один двухдоменный гомолог, состоящий из НТН-домена и одног потенциального олигомеризующего домена. Третья группа включает в себя M.mazei, M.acetivorans, M.burtonii, M.barkeri, в геномах которых есть два гомолога. Один из гомологов содержит ДНК-связывающий домен и один из предполагаемых олигомеризующих доменов, тогда как другой содержит лишь предполагаемых олигомеризующий домен (Рис.5a,b). Возможно, данный белок обеспечивает олигомеризацию NrpR или ответственен за взаимодействие с эффектором. В M.maripaludis НТН-домен был картирован ранее биоинформатическими методами (Lie and Leigh, 2002, Aravind and Koonin, 1999). Ортологи NrpR хорошо вырывниваются, что позволяет достаточно точно, на основании предсказанной последовательности этого домена для Methanococcus maripaludis, определить границы НТН-домена в найденных ортологах NrpR. На рисунке 5b аминокислоты, принадлежащие НТН-домену, показаны белым на черном фоне. Из выравнивания NrpR белков видно, что для гена МА4404 в M.acetivorans был неправильно определен старт транскрипции (Рис. 5b). Поиск ортологов регулируемых генов, как предполагаемых членов регулона Руководствуясь методом проверки соответствия, мы провели поиск ортологов для генов, входящих в регулон азотофиксации, во всех геномах, в которых были найдены гомологи NrpR. Полученные результаты, представленны в Таб. 2. Из таблицы видно, что не во всех геномах находится полный набор ортологов, что наводит на мысль о некоторых отличиях в регуляции азотофиксации между изучаемыми организмами. Рис. 5. а) Доменная структура гомологов NrpR в исследованных геномах. На рисунке оранжевой призмой обозначен НТН-домен, зеленым и синим прямоугольниками-домены с неизвестной функцией; b) Множественное выравнивание гомологов NrpR в исследованных геномах. Условные обозначения: MTH-Methanobacterium thermoautotrophicum, MMZMethanosarcina mazei, MJ-Methanocaldococcus jannaschii, MA-Methanosarcina acetivorans, MK-Methanopyrus kandleri, MM-Methanococcus maripaludis,MCB-Methanococcoides burtonii, AF-Archaeoglobus fulgidus, MB-Methanosarcina barkeri. а) Methanobacterium thermoautotrophicum MTH1569 N C 8 Рис. 5. Продолжение Methanocaldococcus jannaschii MJ0159 N C Methanococcus maripaludis N MM_NrpR C Methanopyrus kandleri MK0337 N C Archaeoglobus fulgidus. AF2227 N C Methanosarcina acetivorans MA4404 N C MA0822 N C Methanosarcina mazei MMZ1085 N C MMZ1969 N C Methanosarcina barkeri MB_NrpR N MB_NrpR2 C N C Methanococcoides burtonii MCB_063_0041 MCB_070_0278 N C N C 9 Рис. 5. Продолжение b) MA_MA4404 MMZ_MM1085 MB_NrpR MCB_063_0041 MB_NrpR2 MMZ_MM1969 MA_MA0822 MCB_070_0278 MK_MK0337 MMs_nrpR_ MJ0159 MTH1569 AF_AF2227 LRPVQNALICGLYGFITIIRKVHGIDTGYNGVIDMMDPQIERKLIEIMRVIHESDKPIGA ----------------------------------MMDPQIERKLIEIMRVIHESDKPIGA ----------------------------------MMDPQIERKLIEIMRVIHESDKPIGA ----------------------------------MTDPQIERKLIEIMRVISESDKPIGA -----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------MNRLDVMILKILAEADRPMGS --------------------------------------MDSNIDVEILSILSEASAPVGA ---------------------------------MIIMADLDRKLIEILDILSKSKEPVGA -------------------------------MVFLMADETNQKMMEILRILAEHDDVLGA -----------------------------------MAVNLLMVEEEILSVLEESG-ALSS MA_MA4404 MMZ_MM1085 MB_NrpR MCB_063_0041 MB_NrpR2 MMZ_MM1969 MA_MA0822 MCB_070_0278 MK_MK0337 MMs_nrpR_ MJ0159 MTH1569 AF_AF2227 RAIADELNNR-GYDIGERAVRYHLRILDERGFTNKHGYAGR----TLTDLGESEMNDALI RAIADELNNR-GYDIGERAVRYHLRILDERGFTRKHGYAGR----TLTDLGENEMNDALI RAIADELNNR-GYDIGERAVRYHLRILDERGFTSKHGYAGR----TLTELGEREMNDALI RNIADELQSR-GYNLGERAVRYHLRILDERGFTEKHGYNGR----TITTFGRKELDDALI ----------------------------------------------------------------------------------------------------------------MQK---N -----------------------------------------------------MQK---N -----------------------------------------------------MIK---Q GRIAELIEERFGEKYSTRSIRYRLQKMEERGLIRRVRRNDRVVGAEITEWGLTMLKTETS KIIADSLKDR-GYDIGERAVRYHLKVLDENSLTKKLGYSGR----EITEKGIEELEKANI KIIAKELNKR-GYKIGERAVRYHLKLLDGMKLTKKVGYAGR----VITERGLEELEKANI KIIASELRKK-GYNLGERAVRYHMRILDEKGFTERVGYAGR----RITEKGLQEINRGLV KEIELELRKR-GYNIRARTIRYHLKKLEERGLVRKNS-NGK---TELTEKGEKELKRKSA MA_MA4404 MMZ_MM1085 MB_NrpR MCB_063_0041 MB_NrpR2 MMZ_MM1969 MA_MA0822 MCB_070_0278 MK_MK0337 MMs_nrpR_ MJ0159 MTH1569 AF_AF2227 GDRFGFVISRIEEMAFRTTYDPETDKGDVVVNISYFDKDDFETVVDLVSYTAHAGYMISP GDRFGFVISRIEEMAFRTTYNPETDKGDVVVNISYFDKDDFETVIELISYTAHAGYMISP ADRFGFVISRIEEMAFRTTYNPKTNEGVVPVNISYFDKDDLETVIEVVSYTAHEGYMISP GDRLGFVITRIEELIYNTNYDPISKEGNVIVNLSTLDKNDFDNALDVMKYAASGGMCISP --------------MYRTTFDPKKMDGDIILNLSLIDKKDLDDVLGIFKMVISSGLSVTP GYRIQFTSSRIRDLMYRTTFDPKKMDGDIILNLSLIDKKDLDDVLGIFKMVISSGLSVTP GYRIQFTSSRIRDLMYMTTFNPKKMDGDVILNLSVIEKKDLDDVLGIFKMVISSGLSVTP PNRVQFTSSRIEDLMYRTTFDPVNMTGELIVNQSLVKEKDLEAVLEVYNLVIRSGLSVSP SERVGMYISLIEEMAYRCSFDPEVMKGKVVCNISVVKREHLDDFLDAVVETYRAGISPSP SFRIGSVFSQVIEKLYLSDFP-----SKVLINTAKFEGD-YKTIKEMVLRSFEAGYSVGD SYRLGSIYSNILEKTISANYRF----GYVVINRCQVYAD-FNDVLKIIKSVYESGLAVGD YDQVDFIFSKFESMIYNTSFNPDTLEGKVVVNTSRISP---RSI-ETLKHVMRNGLCLSP FERLGEFSERIEYNVYLSNFDLYTLSGLVPTNFAFIDKSLFERAMEIVEECISQPISISN : . : * . . MA_MA4404 MMZ_MM1085 MB_NrpR MCB_063_0041 MB_NrpR2 MMZ_MM1969 MA_MA0822 MCB_070_0278 MK_MK0337 MMs_nrpR_ MJ0159 MTH1569 AF_AF2227 RVRIFEED-SESEIHLPPGKIGIATVCSVTFDGLLLKAGIPVEPAYGGILQIENKKPSRF RVRIFEED-S-LEMSLPPGKIGIATVCSVTFDGLLLKAGIPVEPAYGGILQIENKKPARF RVRIIEED-E-ELLSLPPGKVGIATVCSVVFDGLLLKAGIPVEPAYGGIIQIENRKPARF NIKIFEED-SDSGVYVPEGSVGIATVCSITYDGVLLRNGIPVKPVYGGILEMEHNDPVQF YVKIVSEGESIGDLTVEKGKVGVGTVCSITIDGVLLKAGIPVNPKLGGVVQIRNGVPVRF YVKVISEGESIGDMTIEKGKVGIGTVCSITIDGVLLKAGIPVNPKLGGVVQIRNGIPVRF YVKVISEGESIGNLTVGKGKVGIGTVCSITIDGVLLKAGIPVHPKLGGVVQIRNGIPIRF FLKIIKSGETIGDLKIAQGDVGIATVCSITIDGVLLKGGVMINPRFGGVVQIKNGQPVRF LV-AVKEDLSDHDVEVGEDEVAVLTVCSVTIDGVLINRGIPVTPVCGGLLYLEDGEPLGM YLNIKKKG----------NTVSVETLCSITFDNFLLKNGIIPTPEYGGIVKFEDYEPVNF RVGIIDRE----------KFVEINTLCSLNFDNILLQNGIFPLHVCAGVVKYEDGKPVEF RVKLERDG----------DGCIISTICGTTVDGILLASGIPVIPQFGGLVRFEDHQPVNF RIFIAEEGESLGGYTVPKNSFALGVISNTIYDVILKTAGVNTTPEYAGLMSVENMEARGL : : .:.. * .* *: .*:: .. . : 10 Рис. 5. Продолжение MA_MA4404 MMZ_MM1085 MB_NrpR MCB_063_0041 MB_NrpR2 MMZ_MM1969 MA_MA0822 MCB_070_0278 MK_MK0337 MMs_nrpR_ MJ0159 MTH1569 AF_AF2227 LDLISYSGTSIDPIKIFMNRTPTSVLEVLEKGDGKILANMRQINASAYDTAKGIMKKAEK LDLISYSGTSIDPIKIFMNRTPTSVLEVLEKGEGKILANMRQINSSAYEMTGKILKKAEK SDLISYSGTSIDPIQIFMSRKTTSVLDVLEKGEGKILANMRQINCSAYERAREVLKTVEK RDLISYSGTSIDPVKIFMIRHATSVLDVLDTGNGRILANIRTIPSSAVDKAQEVLHQLEA TDVLTYVSTTVDPLEILMSQGITSVSEMLRTGSGKVLANLREAPMVARDEIESCLSDLLD TDVLTYVSTTVDPLEILMSQGITSVSEMLRTGSGKVLANLREAPMVARDEIESNLSDLLD TDVLTYVSTTVDPLEVLMSQGITSVSEMLRTGSGKVLANLREAPMVARDAIESTLSDLLD TDVVTYASTTIDPLEVLMSQDITSVTKMLRTGSGKILANLREAPLVARDDIDHILSDLME QEYIKYEGSTVDPLHVFVAKGMTQVERVLETGTGLVPANVRYVPWAALEDVEHVERELEK EGVIDFKSSSIDPLVAFIMQGKTDVIGVIENGEGLVPANFRVIPKSSEKQFETILKKDMKEIIDYKSTSIDPLRAFIEKKETDVMGIIENGEGYLPANFRYFGVEFLERFETILEIDETELIAYKKTSMTPLEAFTSENMTSVLSVIEEGDGLVPANLRLVPGTGREDAVKILRKLEG TELISYFGTTLSPGLLLLKAGLTSVYSACKTGRGEIIVAIRSFSRYAMDIARRELEIAES : : ::: * : *.* * * : . .* . MA_MA4404 MMZ_MM1085 MB_NrpR MCB_063_0041 MB_NrpR2 MMZ_MM1969 MA_MA0822 MCB_070_0278 MK_MK0337 MMs_nrpR_ MJ0159 MTH1569 AF_AF2227 VDLAGCITIGEIDEFLLGAPVETGKFGVAVVGGINGICALEETGIEIETNPISMMLDYRT VGLAGCITLGEIDEYLLGAPVETGKFGAAVVGGINGICALEETGIEIETNPISTMLDYQT VGLAGYYPLGEVDETLFGAPVETGKFGIAIVGGINGICALEETGIKMKTNPVSTVMEYNT SGLGNVMNIGSSAYDLCGAPVEEGLSGILVGVGVNMISAVEEAGIPVSTSPVSTVLDYKV AGFSGILEVGEPNTRVLDVPIERDHLGIVVIGGTNPMAVVQEYGIAIDTSAMSRLISFKE AGFSGILEVGEPNTRVLDVPIERDHLGIVVIGGTNPMAVVQEYGIPIDTSAMSRLISFKE AGFSGILEVGEPNTRVLDIPIERDHLGIVVIGGTNPMAVVQEYGIPIDTSAMSRLIPFKE AGLSGIMEVGEPNTRVLDVPVERDHLGVVVIGGTNPMAMAKEQGFEISTSAMSALIGIDS ADIRGIVDVPKVEGEILGIPLPPRSLGIVAYGGLVPVALLEERGISTRTYPTRTLVEYSS --LNSVLAYGT--ENVLGMNLNPEQIGVVLVGGLTPLCVPHESGYTADISAATQLKDISS --LKCIISYGT--ENVLGLDVGDDKVGVALIGGLTPIAPFVENNYCVEICPMSSIVRLES IGISGVLKVGEPGEDVLGVPVADGMVGVAIIGGITPLCAIQEAGYRAEIKLAENLIEFQS KGLRGVIKILHPSDRIFGLPAAN-RARLVVSAGLNMIAPLFENGIIPEVRVNEFFVDFRD : : . * :. * . . MA_MA4404 MMZ_MM1085 MB_NrpR MCB_063_0041 MB_NrpR2 MMZ_MM1969 MA_MA0822 MCB_070_0278 MK_MK0337 MMs_nrpR_ MJ0159 MTH1569 AF_AF2227 MSEI-------------------------------------------------------MKEI-------------------------------------------------------MTEI-------------------------------------------------------MSK--------------------------------------------------------MSRIEDLV---------------------------------------------------MSRIEDLV---------------------------------------------------MSRIEDLV---------------------------------------------------MKHIEDLI---------------------------------------------------LEDARRY----------------------------------------------------MEKKTKGFLEAKKKKGK--FKVTPVLSKMLSKMQTINYDIEDKKGNVVVNTAKIPIEYKE LHKLKKNPRDIVTKKAN--IRIKTALSKMFNAMAKVTYDIDEADGDVIVNTAFIDKKYLD LKPLVKPERKLMVSAPERGVKVRFLLSKAWNLINRVDLNPEDLSGRVIANISLISRDDLD FRVI-------------------------------------------------------: MA_MA4404 MMZ_MM1085 MB_NrpR MCB_063_0041 MB_NrpR2 MMZ_MM1969 MA_MA0822 MCB_070_0278 MK_MK0337 MMs_nrpR_ MJ0159 MTH1569 AF_AF2227 ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------EAINALKDSYENKLAIS-DRL-KVECDDKFLNAYTICSLTVDGVFLKNKIPVIPYYGGIL EAFDILKEAYKKGLGIS-DRFGIVEENDR-IKIQTICAVTLDGIFLRNSVPLIPKYGGIL YALEVIGQVLSERPEFSTLPMIGVTDEGGMAGIATVCSLTLDGVLIKSGIMSTPKYGGLL ------------------------------------------------------------ 11 Рис. 5. Продолжение MA_MA4404 MMZ_MM1085 MB_NrpR MCB_063_0041 MB_NrpR2 MMZ_MM1969 MA_MA0822 MCB_070_0278 MK_MK0337 MMs_nrpR_ MJ0159 MTH1569 AF_AF2227 ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------EVKADKKRFIEAIDYEGTSLDPHEVFFNK--------ADGKNYILAGIRKVPMSASEKLI EITEDKERFIDIIGYDGSSLDPHEVFFNF--------VDCEKTFLAGFREVHRVAREKLE EVGGRAPRFVELTAYSGSSLDPHEIYVSKNMTAVLEALNGQGRVLASLREVPYLARDHAE ------------------------------------------------------------ MA_MA4404 MMZ_MM1085 MB_NrpR MCB_063_0041 MB_NrpR2 MMZ_MM1969 MA_MA0822 MCB_070_0278 MK_MK0337 MMs_nrpR_ MJ0159 MTH1569 AF_AF2227 ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ELNEKLGWN--SIIEIGRPNNDICGVRVEKCMFGITTIGGTNPFANIRKNNIPVEMKTLH EVLKKLNWN--GIKAIGEPNNELYGIGVNKDMCGVVTMGGINPLVLLKENEIPIELKAMH GLIEELSEAGFSVLKIGVPGEILYNARVEKYHAGIVTPGGLNPLAAVREAGVEIRMKAIE ------------------------------------------------------------ MA_MA4404 MMZ_MM1085 MB_NrpR MCB_063_0041 MB_NrpR2 MMZ_MM1969 MA_MA0822 MCB_070_0278 MK_MK0337 MMs_nrpR_ MJ0159 MTH1569 AF_AF2227 ---------------------------------------------------------------------------------------------------------------------KSIDYSELTHYDDI EVVRFSDLKSYKEI RLMDLREFRYVDEV -------------- Таб.2. Таблица ортологов для генов регулона азотофиксации. Условные обозначения MTHMethanobacterium thermoautotrophicum, MMZ-Methanosarcina mazei, MJ-Methanocaldococcus jannaschii, MA-Methanosarcina acetivorans, MK-Methanopyrus kandleri, MM-Methanococcus maripaludis,MCB-Methanococcoides burtonii, AF-Archaeoglobus fulgidus. Ген glnA nifH glnBa glnBb nifD nifK nifE nifN amtB glnB MTH MMZ MJ MTH1570 MM0964 MJ1346 MTH1560 MM0719 MJ0879 MTH1561 MM0720 MTH1562 MM0721 MTH1563 MM0722 MTH1564 MM0723 MTH1565 nifE MA glnA vnfH nifI1 nifI2 vnfD nifK nifE MK glnA nifH MСВ RMM00058 MCB 069_0159 AF0949 AF RMM00033 MCB 068_0131 RMM00034 RMM00035 nifD RMM00036 RMM00037 RMM00038 MTH1566 MTH663, MM0733 MJ1343, MTH661 MJ0058 MTH664, MM0958 MJ0059, MTH662 MJ1344 MM RMM00039 amtB amtB glnB MK0054 12 MCB 054_0009 AF1746 Изменения в оперонной структуре Поиск ортологов показал, что такие организмы, как Archaeoglobus fulgidus, Methanococcoides burtonii, Methanocaldococcus jannaschii не имеют генов нитрогеназы, и, следовательно, не могут фиксировать молекулярный азот и нуждаются в присутствии ионов аммония. Как правило, гены, кодирующие нитрогеназу, объединены в nif оперон. Интересно, что кроме генов нитрогеназы в состав этого оперона входят гены nifI1 и nifI2, кодирующие белки из РII семейства. Однако в геноме Methanopyrus kandleri из nif генов присутствуют только nifH и nifD, которые не образуют оперона. Кроме того, в этом геноме нет генов nifI1 и nifI2, а ген glnA, который в других геномах расположен отдельно, образует оперон с геном nrpR. Гены glnB и glnK почти всегда образуют один оперон с amtB (Gelfand et al, 2000). При этом в пределах этих оперонов наблюдаются множественные дупликации как amtB, так и glnB. Подобная ситуация наблюдается в геномах M.maripaludis и M.acetivorans. Однако в геномах M.barkeri и M.kandleri присутствуют также одиночные гены amtB и glnB ( Рис.6). Рис. 6. Оперонные структуры генов азотофиксации исследуемых геномов. Гены показаны в виде стрелок, регуляторные сайты (по Gelfand et al., 2000) обозначены прямоугольниками. Расстояния до старта трансляции первого гена оперона указаны над сайтом. a) Methanococcus maripaludis -80 -47 nifH -46 glnBa glnBb nifD nifK glnA glnK1 amtB glnB glnK amtB b) Methanocaldococcus jannaschii amtB glnB -70 -54 glnA amtB -92 glnB nifH 13 nifE nifN nifX Рис. 6. Продолжение c) Methanobacterium thermoautotrophicum delta H nifH glnBa glnBb nifD nifK amtB glnB nifE nifN 28 glnA -50 -73 amtB glnB -7 nifH nifE d) Methanosarcina mazei nifH glnBa glnBb nifD nifK amtB amtB glnB glnA nifH2 glnA e) Methanococcoides burtonii glnA glnB amt 14 nifE nifN Рис.6. Продолжение f) Methanosarcina acetivorans nifI2 nifH vnfH nifI1 nifI1 glnK nifI2 nifI2 nifD amtB amt antK vnfG vnfK nifK amtB glnB anfG anfD nifI1 nifI2 glnA vnfE vnfN nifH g) Methanopyrus kandleri MK0337 glnA nifH nifD AmtB MK0054 glnB h) Archaeoglobus fulgidus amt2 amt1 nifE glnB3 amt3 glnB2 glnB1 glnA 15 vnfK nifN vnfE vnfN В процессе изучения оперонной структуры генов азотофиксации было обнаружено большое число дупликаций. Эволюцию дуплицирующихся генов в пределах исследуемых организмов можно последить по филогенетическим деревьям, построенным для каждой группы дуплицировавшихся генов в отдельности. Многочисленные дупликации наблюдаются для генов, кодирующих субъединицы транспортера аммония (amtB) и регуляторные белки семейства РII: glnB, glnK, nifI1, nifI2 (Рис.7-8). Рис. 7. Филогенетическое дерево AmtB белков-транспортеров аммония. Условные обозначения: MTH-Methanobacterium thermoautotrophicum, MMZMethanosarcina mazei, MJ-Methanocaldococcus jannaschii, MA-Methanosarcina acetivorans, MK-Methanopyrus kandleri, MM-Methanococcus maripaludis, MCB-Methanococcoides burtonii, AF-Archaeoglobus fulgidus, MB-Methanosarcina barkeri. Зеленым отмечены гены, в промоторных областях которых обнаружены регуляторные сигналы. MK_AmtB MA_Amt MJ_MJ0058 AF_AF1746 0 .3 0 .2 0 .1 2 0.13 5 29 MJ_MJ1343 0.27 9 0. MMs2_AmtB 0 .1 2 Met_MTH661 0 .1 9 Met_MTH663 0.17 0.30 0.16 MA_AmtB2 AF_AF1749 8 8 0.18 0 .1 3 0 .2 0 .1 0 .3 1 MCB_054_0009 MBa_RMMA06499 AF_AF0977 MA_AmtB1 MMZ_MM0733 MBa_RMMA01351 16 Рис.8. Филогенетическое дерево белков семейства PII. Условные обозначения: MTHMethanobacterium thermoautotrophicum, MMZ-Methanosarcina mazei, MJMethanocaldococcus jannaschii, MA-Methanosarcina acetivorans, MK-Methanopyrus kandleri, MM-Methanococcus maripaludis,MCB-Methanococcoides burtonii, AFArchaeoglobus fulgidus, MB-Methanosarcina barkeri. Зеленым отмечены гены, в промоторных областях которых обнаружены регуляторные сигналы. MMZ_GlBb MA_NifI2 0 .2 1 0.23 1 0 .1 4 0. 5 01 MJ_GlnB1 0 .0 0 .1 7 28 MMs2_NifI2 0 .2 0. Met_GlnBb 0.14 MMs2_GlnK2 MMs2_GlnB MMs2_GlnK1 0. 0 .1 14 0 .1 AF_Nrp3 0 .2 AF_Nrp2 9 0.19 4 18 5 18 AF_Nrp1 8 0 .1 0. Met_GlnBa MK_P2 0. 0 .1 MK_P2 0.19 0.21 MA_NifI1 0 .1 2 0 0.23 MMZ_GlnBa MJ_GlnB2 MA_GlnB MMs2_NifI1 MMZ_GlnB3 Met_GlnB2 Met_GlnB1 MMZ_GlnB4 MA_GlnK В геноме M.acetivorans дупликации на раннем этапе эволюции и последующей модификации подверглись гены, кодирующие субъединицы нитрогеназы, в результате чего в организме присутcтвуют три типа нитрогеназ: - молибден-зависимая нитрогеназа NifHDKEN - ванадий-зависимая нитрогеназа VnfHDKEN - нитрогеназа AnfDK, не содержащая ни молибденового , ни ванадиевого кофактора Аннотация генов vnf и anf была проведена ранее биоинформатическими методами. (Galagan et al, 2002). Филогенетическое дерево для белков, являющихся составными частями нитрогеназы, представлено на Рис.9. 17 Рис. 9. Филогенетическое дерево nif генов, кодирующих субъединицы нитрогеназы. Условные обозначения: MTH-Methanobacterium thermoautotrophicum, MMZMethanosarcina mazei, MJ-Methanocaldococcus jannaschii, MA-Methanosarcina acetivorans, MK-Methanopyrus kandleri, MM-Methanococcus maripaludis, MCB-Methanococcoides burtonii, AF-Archaeoglobus fulgidus, MB-Methanosarcina barkery. Зеленым отмечены гены, в промоторных областях которых обнаружены регуляторные сигналы. MA_VnfK MA_AnfK Met_NifD MMs2_NifD 0.14 0. MMZ_NifK 17 0.16 MA_NifK 0. MA_VnfD MA_AnfD 16 0. 0 .2 3 0. MMs2_NifK 21 0 .1 5 0 .1 1 25 0 .1 Met_NifK 9 0.22 MMZ_NifD 0.24 0.24 MA_NifD MMs2_NifN 0.22 22 8 0 .2 0. 0 .2 0. Met_NifN MA_NifE MMZ_NifE 5 38 MMs2_NifE 0 .3 9 0.34 MA_NifN MA_VnfN MMZ_NifN Met_NifE MA_VnfE Интересно, что в первых двух случаях полностью сохраняется структура оперонов, кодирующих субъединицы денитрогеназ, что наводит на мысль о происхождении их путем дупликации первоначального оперона (Рис.6f). Белки регуляторного каскада. В археях отсутствуют все гены, кодирующие белки регуляторного каскада, характерного для бактерий, кроме генов, кодирующих белки семейства РII (Dixon and Kahn, 2004). Это объясняется принципиально различным механизмом регуляции у архей и эубактерий. В то время, как в бактериях экспрессия генов азотофиксации регулируется по принципу активации энхансер-связывающими белками, в археях эта регуляция осуществляется по принципу репрессии при помощи NrpR белка. Известно, что белки РII семейства необходимы для быстрой посттранскрипционной регуляции азотофиксации, которая защищает клетку от затрат энергии, когда концентрация внутриклеточного аммония слишком высока 18 (Kessler et al, 2002). В бактериях посттранскрипционная регуляция азотофиксации осуществляется за счет ковалентного ADPрибозилирования железосодержащего белка, входящего в состав нитрогеназы. К сожалению, неизвестно, существует ли подобный механизм регуляции в археях, однако для M.maripaludis было показано, что для подобной регуляции необходимо присутствие не только GlnB и GlnK, как в бактериях, но и двух других членах этого семейства NifI1 и NifI2. Наличие этих двух белков в геноме характерно только для архей. ADP-рибозилирование железосодержащего белка нитрогеназы для архей не было установлено (Dixon and Kahn,2004). В то время как GlnB и GlnK близки по структуре к бактериальным белкам семейства PII, что выражается в наличие сайта уридинилирования и строении Т-петли - специфической последовательности, отвечающей за связывание с эффектором (Yiang et al, 1997). NifI1 и NifI2 не имеют сайта уридинилирования, а по строению Т-петли отличаются от других гомологов и между собой (Kessler et al, 2002). Все это указывает на то, что механизм посттранскрипционной регуляции в археях происходит иначе, чем в организме бактерий. Нами было показано,что гены nifI1 и nifI2 располагаются в одном опероне с генами субъединиц нитрогеназ, nif опероне. Исходя из этого, можно предположить, что они необходимы для посттранскрипционной регуляции фиксации молекулярного азота. Гены amtB, glnB и glnK также образуют один оперон, из чего можно сделать предположение, что GlnB и GlnK участвуют в регуляции транспорта аммония через плазматическую мембрану. Мы предполагаем, что при увеличении внутриклеточной концентрации глутамина, а значит, связанного азота, GlnB и GlnK находятся в активном состоянии и блокируют каналытранспортеры аммония, продукты генов amt. При уменьшении же концентрации аммония уридилтрансфераза уридинилирует GlnB и GlnK, в результате чего они теряют способность к связыванию с каналом (Рис.10). Аммоний Рис.10. Регуляция транспорта аммония через плазматическую мембрану клетки. При увеличении концентрации внутриклеточного азота “свободный” регулятор закрывает канал-транспортер. При низкой - уридилтрансфераза инактивирует регулятор, который теперь не может связываться с каналом. AmtB Концентрация глутамина Уридилтрансфераза UMP GlnB или GlnK 19 Поиск потенциальных регуляторных сайтов Ранее биоинформатическими методами был определен регуляторный сигнал для NrpR, представляющий собой палиндром длиной18 нуклеотидов. Сайты такого вида были обнаружены пред генами, участвующими в азотофиксации, в геномах M.thermoautotrophicum, M.jannaschii и M.maripaludis. (Gelfand et al, 2000). Для того, чтобы более полно охарактеризовать структуру данного регуляторного сигнала, нами была построена диаграмма логo на основе всех сайтов, найденных перед генами азотофиксации в этих трех геномах. Как видно из Рис.11, данный сайт представляет собой инвертированный повтор длиной 16 нуклеотидов и имеет спейсер из 6 нуклеотидов.(Рис.11) Этот результат отличается от полученного ранее экспериментальными методами, согласно которому регуляторный сигнал имеет строение GGTT-(6)-AACC (Kessler and Leigh, 1999), а так же не согласуется и с ранее полученными биоиформатическими данными, согласно которым этот сайт представляет собой палиндром из 18 нуклеотидов (Gelfand et al, 2000). Из составленной нами диаграммы лого видно, что крайние позиции не являются информационно значимыми. Поэтому есть основание предполагать, что регуляторный сигнал азотофиксации в геномах M.thermoautotrophicum, M.jannaschii, M.maripaludis представляет собой инвертированный повтор длиной 16 нуклеотидов с консенсусом mGGAAr-6-yTTTCCk. Рис. 11. Лого для сайта связывания NrpR. По горизонтальной оси указан номер позиции сайта связывания, по вертикальной – информационное содержание позиции. Высота столбца пропорциональна информационному содержанию данной позиции, относительная высота каждой буквы соответствует частоте нуклеотида в данной позиции. Поиск регуляторного сигнала в других геномах На основании филогенетического дерева ортологов NrpR была выделена группа организмов, обладающих высокой степенью сходства ортологов, а, следовательно, и регуляторных сигналов. В эту группу вошли геномы M.mazei, M.acetivorans, M.burtonii, M.barkeri. Поскольку ортологи NrpR из этих организмов содержат ДНК-связывающий и предполагаемый димеризующий домены, то можно предположит, что общий механизм 20 взаимодействия регулятора с ДНК не изменился. Из чего можно сделать вывод, что следует искать регуляторный сигнал палиндромного строения. Первоначально нами была осуществлена попытка поиска предполагаемых сайтов с использованием метода генетического футпринтинга. На основании промоторных областей всех генов, предположительно относящихся к регулону азотофиксации, Было построено множественное выравнивание 5-областей всех генов, предположительно относящихся к регулону азотофиксации. Однако на нем не было обнаружено продолжительных консервативных последовательностей. Исходя из предположения, что во всех исследуемых организмах сайт связывания NrpR имеет палиндромное строение, с помощью программы SignalX был произведен поиск палиндромов различной длины (от 12 до 18) в регуляторных областях генов, участвующих в фиксации азота. Однако нам не удалось найти потенциальных сигналов, которые бы сохранялись перед ортологичными генами в разных геномах. Взаимодействие NrpR-ДНК происходит путем связывания с плечами палиндрома НТНдоменов димера. Другие два домена, связываясь с соответствующими доменами второй субъединицы, образуют “мостик” между НТН-доменами над спейсерным участком регуляторного сигнала. В регуляторах исследуемой нами группы сохраняется только один ДНК-несвязывающий домен, что могло привести к укорочению длины “мостика”, а соответственно и спейсера. Таким образом, предполагая, что консенсус плечей палиндрома являетсясходным в исследуемых геномах, а длина спейсера изменяется, мы составили консенсус на основании уже известного регуляторного сигнала. Изменяя длину спейсера от 6 до 0 мы проводили поиск в исследуемых геномах, однако не удалось обнаружить потенциальных сигналов, сохраняющихся в разных геномах перед ортологичными генами. 21 Выводы: 1) Проведено исследование регуляции азотофиксации в различных группах архей с помощью методов сравнительной геномики. 2) Обнаружен ряд гомологов регуляторного белка NrpR. Показаны отличия в строении гомологов, косвенно указывающие на возможные различия в механизме регуляции азотофиксации. 3) Обнаружены множественные дупликации генов, кодирующих субъединицы транспортера аммония (amt) и белки, регулирующие транспорт аммония (glnB, glnK). 4) В геноме M.acetivorans обнаружены дупликации генов, кодирующих субъединицы нитрогеназы. 5) На основании анализа оперонной структуры в различных геномах выдвинута гипотиза о роли различных белков PII семейства в регуляции азотофиксации. 6) Подтверждена структура регуляторного сайта в геномах M.thermoautotrophicum, M.jannaschii и M.maripaludis. 7) В других геномах обнаружить потенциального регуляторного сайта не удалось. 22 Список литературы. Altschul S.F, Madden T.L., Schaffer A.A., Zhang J., Zhang Z., Miller W. and Lipman D.L.. (1997) Gappend BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Research, 1997, Vol. 25, No. 17: 3389-3402 Aravind L. and Koonin E.V. (1999) DNA-binding proteins and evolution of transcription regulation in the achaea. Nucleic Acids Research, Vol. 27, No. 23: 4658-4670 Atchley W.R., Rosinski J.A. (1999) Molecular evolution of helix-tern-helix proteins. J Mol Evol 49: 301-309 Bell S.D. and Jackson S.P. (1998) Transcription in Archaea. In “Mechanisms of transcription”, Cold Spring Harbor Laboratory Press. Bult C.J., White O., Olsen G.J., Zhou L., Fleischmann R.D., Sutton G.G., Blake J.A., FitzGerald L.M., Clayton R.A., Gocayne J.D., Kerlavage A.R., Dougherty B.A., Tomb J.F., Adams M.D., Reich C.I., Overbeek R., Kirkness E.F., Weinstock K.G., Merrick J.M., Glodek A., Scott J.L., Geoghagen N.S., and Venter J.C. (1996) Complete genome sequence of the methanogenic archaeon, Methanococcus jannaschii. Science. 273 (5278): 1058-1073. Cohen-Kupiec R., Blank C., and Leigh J.A. (1997) Transcriprional regulation in Archaea: In vivo demonstration of a repressor binding site in a methanogen. Proc. Nacl. Acad. Sci. 94: 13475 Crooks G.E., Hon G., Chandonia J.-M., and Brenner S.E.. (2004) WebLogo: a sequence logo generator. Cold Spring Harbor Laboratory Press ISSN 1088-9051/04 14:1188-1190 Deppenmeier U., Johann A., Hartsch T., Merkl R., Schmitz R.A., Martinez-Arias R., Henne A., Wiezer A., Baumer S., Jacobi C., Bruggemann H., Lienard T., Christmann A., Bomeke M., Steckel S., Bhattacharyya A., Lykidi A., Overbeek R., Klenk H.P., Gunsalus R.P., Fritz H.J., and Gottschalk G. (2002) The genome of Methanosarcina mazei: evidence for lateral gene transfer between bacteria and archaea. J Mol Microbiol Biotechnol. 4 (4): 453-461. Dixon R. and Kahn D.. (2004) Genetic regulation of biological nitrogen fixation. Nature Reviews, Microbiology, Vol. 2: 621 Doolittle W.F. and Brown J.R. (1994) Tempo, mode the progenote, and the universal root. Proc. Natl. Acad. Sci 91: 6721 Galagan J.E., Nusbaum C., Roy A., Endrizzi M.G., Macdonald P., FitzHugh W., Calvo S., Engels R., Smirnov S., Atnoor D., Brown A., Allen N., Naylor J., Stange-Thomann N., DeArellano K., Johnson R., Linton L., McEwan P., McKernan K., Talamas J., Tirrell A., Ye W., Zimmer A., Barber R.D., Cann I., Graham D.E., Grahame D.A., Guss A.M., Hedderich R., Ingram-Smith C., Kuettner H.C., Krzycki J.A., Leigh J.A., Li W., Liu J., Mukhopadhyay B., Reeve J.N., Smith K., Springer T.A., Umayam L.A., White O., White R.H., Conway de Macario E., Ferry J.G., Jarrell K.F., Jing H., Macario A.J., Paulsen I., Pritchett M., Sowers K.R., Swanson R.V., Zinder S.H., Lander E., Metcalf W.W., and Birren B. (2002) The genome of M. acetivorans reveals extensive metabolic and physiological diversity. Genome Res. 12 (4): 532-542. 23 Gelfand M.S., Koonin E.V., Mironov A.A. (2000) Prediction of transcription regulatory sites in Archaea by a comparative genomic approach. Nucleic Acids Res. 28. 695-705. Gibson T.J., Higgins D.G., Plewniak F., Thompson J.D. and Jeanmougin F.. (1997) The Clustal_X windows interfaca: flexible strategies for multiple sequence alignment aided by quality analysis tools. Nucleic Acids Resesrch, Vol. 25, No. 24. Jiang, P., Zucker P., Atkinson M. R., Kamberov E.S., Tirasophon W., Chandran P., Schefke B.R., and Ninfa A.J.. (1997). Structure/function analysis of the PII signal transduction protein of Escherichia coli: genetic separation of interactions with protein receptors. J. Bacteriol. 179:4342-4353 Kessler P.S., McLarnan Jennifer, and Leigh J.A.. (1996) Nirtogenase phylogeny and the molybdenum dependence of nitrogen fixation in Methanococcus maripaludis. Journal of Bacteriology, Vol. 179, No. 2: 541-543 Kessler P.S., Blank C., and Leigh J.A.. (1998) The nif gene operon of the Methanogenic Archaeon Methanococcus maripaludis. Journal of Bacteriology, Vol. 180, No. 6: 1504-1511 Kessler P.S. and Leigh J.A.. (1999) Genetics of nitrogen regulation in methanococcus maripaludis. Genetics 152: 1343-1351 Kessler P.S., Daniel C., and Leigh J.A.. (2000) Ammonia switch-off of nitrogen fixation in the methanogenic archaeon Methanococcus maripaludis: mechanistic features and tequirement for the novel GlnB homologues, NifI1 and NifI2.Department of Microbiology, University of Washington, Seattle, Washington 98195 Received 10 July 2000/Accepted 7 November 2000 Lie T.J., Leigh J.A.( 2002) A novel repressor of nif and glnA expression in the methanogenic archaeon Methanococcus maripaludis. J Bacteriol. 184. 5301-5306 Mironov A.A., Koonin E.V., Roytberg M.A., Gelfand M.S. (1999) Computer analysis of transcription regulatory patterns in completely sequenced bacterial genomes. Nucleic Acids Res. 27. 2981-2989. Mironov A.A., Vinokurova N.P., Gelfand M.S. (2000) Software for analyzing bacterial genoms. Mol Biol (Mosk). 34. 253-262 Slesarev A.I., Mezhevaya K.V., Makarova K.S., Polushin N.N., Shcherbinina O.V., Shakhova V.V., Belova G.I., Aravind L., Natale D.A., Rogozin I.B., Tatusov R.L., Wolf Y.I., Stetter K.O., Malykh A.G., Koonin E.V., and Kozyavkin S.A. (2002) The complete genome of hyperthermophile Methanopyrus kandleri AV19 and monophyly of archaeal methanogens. Proc Natl Acad Sci U S A. 99 (7): 4644-4649. Smith D.R., Doucette-Stamm L.A., Deloughery C., Lee H., Dubois J., Aldredge T., Bashirzadeh R., Blakely D., Cook R., Gilbert K., Harrison D., Hoang L., Keagle P., Lumm W., Pothier B., Qiu D., Spadafora R., Vicaire R., Wang Y., Wierzbowski J., Gibson R., Jiwani N., Caruso A., Bush D., and Reeve J.N. (1997) Complete genome sequence of Methanobacterium thermoautotrophicum deltaH: functional analysis and comparative genomics. J Bacteriol. 179 (22): 7135-7155. Гельфанд М.С., Миронов А.А. (1999). Компьютерный анализ регуляторных сигналов в полных бактериальных геномах. Молекулярная биология. Т.33. С 772-778 24