Московский Государственный Университет им. М.В.Ломоносова Отчет: Критический анализ модели белка метилтрансферазы RsmH, представленной в банке PDB, код 3TKA Выполнила студентка 4 курса Факультета биоинженерии и биоинформатики МГУ им. М.В. Ломоносова Мукосей Ирина Сергеевна 2012 Оглавление Аннотация ............................................................................................................... 3 Введение .................................................................................................................. 4 Результаты .............................................................................................................. 6 Заключение ........................................................................................................... 12 Список используемой литературы .................................................................. 16 2 Аннотация В отчете приведены результаты анализа качества структуры RsmH, расшифрованной методом РСА в 2012 году авторами статьи Yong Wei, Heng Zhang, Zeng-Qiang Gao, Wen-Jia Wang, Eleonora V. Shtykova, Jian-Hua Xu, Quan-Sheng Liu, Yu-Hui Dong и содержащимся в PDB под кодом 3TKA. 3 Введение RsmH – это специфическая S-аденозилметионин(AdoMet)-зависимая метилтрансфераза, которая метилирует N4-атом цитозина 1402 в 16Sр РНК. Последовательность RsmH консервативна почти во всех видах бактерий, что позволяет сделать предположение о том, что модификация P-сайта является общей структурной особенностью бактериальной 16SрРНК. В отсутствии гена, кодирующего RsmH, достаточно часто трансляция начинается не с AUG кодона, рибосома перескакивает через стоп кодон или происходит сдвиг рамки считывания. Структурный анализ показал, что комплекс состоит из двух раздельных, но структурно родственных доменов: типичный домен метилтрансфераз и предположительно домен, участвующий в узнавании субстрата и его связывании. Авторами статьи был также найден глубокий карман в консервативном домене связывания S-аденозилметионина. К тому же было обнаружено, что цитидин находится в комплексе на расстоянии 25.9 Å от AdoMet. Это говорит о том, что комплекс находится не в каталитически активном центре, поэтому структурные перестановки фермента или нуклеотидов, находящийся неподалеку от С1402, возможно, необходимы для запуска каталитической реакции. Несмотря на то, что в ассиметричной субъединице кристалла (ячейке) содержится только одна молекула, фермент может образовывать димеры. Дальнейший анализ, проведенный с помощью метода малоуглового рассеяния рентгеновских лучей (SAXS) также показал наличие димера в растворе, но с более подвижной конформацией, чем в кристалле. Вполне возможно, что in vivo этот фермент образует димеры для того, чтобы принять активную конформацию. В любом случае, знание структуры полезно для обоснования механизма действия фермента. 4 Рис.1 Димер метилазы RsmH Рис. 2 Карман внутри белка (ассиметрическая субъединица) Рис. 3 AdoMet или S-Adenosyl methionine. Лиганд RsmH 5 Результаты Общая информация о модели: Активный комплекс состоит из двух одинаковых субъединиц, каждая из которых метилтрансферазный состоит домен, из состоящий двух из доменов: N-концевой последовательности (Thr8 – Asp110) и С-концевого участка (Leu216 – Ala313); цитидин связывающий домен (Asp111 – Glu215). Метилтрансферазный домен состоит из девяти спиралей (семь – α-спиралей, две – η-спирали) и семи β-листов. Субстратсвязывающий домен состоит из семи спиралей (шесть α-спиралей и одна – η-спираль). Цитидин находится в кармане, образованном спиралями α6, α7 и α10. Рис. 4. Yong Wei и коллеги. Схема несимметричной субъединицы. Красным на рисунке под пунктом а) обозначена молекула AdoMet, а синим – цитидин. Статья была опубликована в 2012 году под названием «Crystal and solution structures of methyltransferase RsmH provide basis for methylation of C1402 in 16S rRNA». Авторы статьи Yong Wei, Heng Zhang, Zeng-Qiang Gao, Wen-Jia Wang, Eleonora V. Shtykova, Jian-Hua Xu, Quan-Sheng Liu, Yu-Hui Dong. Разрешение структуры: 2,25Å Решения фазовой проблемы молекулярного замещения. 6 осуществлено методом Число измеренных рефлексов: 18108 (18345 в оригинальном CIF-файле) – согласно EDS, 18379 – согласно статье. Значения R-фактора и Rfree-фактора: R-фактор = 0.18; Rfree-фактор = 0.23; Rfree-фактор – это R-фактор, вычисленный для 5% данных, не использованных при уточнении структуры. R = ∑ h||Fo-Fc||/∑ h|Fo|, где Fo и Fc наблюдаемые и подсчитанные структурные факторы, соответственно для рефлекса h. Анализ выдачи программы ProCheck: 1. Ramachandran Plot statistics No. of residues -----Most favoured regions [A,B,L] 225 Additional allowed regions [a,b,l,p] 18 Generously allowed regions [~a,~b,~l,~p] 0 Disallowed regions [XX] 0 ---Non-glycine and non-proline residues 243 End-residues (excl. Gly and Pro) %-tage -----92.6% 7.4% 0.0% 0.0% -----100.0% 5 Glycine residues Proline residues 22 13 ---283 Total number of residues Based on an analysis of 118 structures of resolution of at least 2.0 Angstroms and R-factor no greater than 20.0 a good quality model would be expected to have over 90% in the most favoured regions [A,B,L]. Согласно выдаче программы ProCheck, 92.6% остатков находятся в наиболее благоприятных областях [A, B, L] и 7,4% остатков находятся в дополнительно разрешенных областях [a, b, l, p]; остатков, находящихся в предположительно разрешенных областях и в запрещенных областях, нет. 7 Рис. 5. Карта Рамачандрана для всех аминокислотных остатков. Однако при переходе по ссылке к дополнительной информации (кнопка ProCheck), можно найти карты Рамачандрана для всех аминокислотных остатков по отдельности. В них отмечены три аминокислоты, которые выбиваются из карт Рамачандрана для этих аминокислот (для дополнительной информации см. прикрепленные файлы RamMap.pdf): Рис. 6. Карты Рамачандрана для аспарагиновой кислоты и триптофана. Красным отмечены номера аминокислот, выбивающихся из разрешенных областей. 8 Если посмотреть на расположение этих аминокислот в белке, то оказывается, что аспарагиновая кислота при подрезке 3.0 прекрасно вписывается в электронную плотность, но возможно выбивается из допустимых значений из-за того, что находится в неструктурированной области, к тому же в этом месте образуется карман для связывания с лигандом. (см. Рис.7) Рис. 7. Остаток аспарагиновой кислоты 125. Для остатков треонина получается, что 311 остаток также лежит в неструктурированной области, но на конце белка, что как и в предыдущем случае может означать подвижность этой части, из-за чего и попал этот остаток в неразрешенную область (см. Рис. 8). Остаток 31 лежит в кармане, где связывается лиганд, то есть все аналогично (см. Рис. 9). Рис. 8. Остаток треонина 311. 9 Рис.9. Остаток треонина 31. Список маргинальных остатков Согласно выдаче программы WHATIF, предложено достаточно много остатков, не удовлетворяющие различным критериям, поэтому остановимся на выдаче Significant regions в EDS. Рис. 10. Последовательно расположены Glu47 (RSR=0.335); Leu52 (RSR=0.250); Arg166 (RSR=0.303); Val193 (RSR=0.257); Gly259 (RSR=0.282) После анализа электронной плотности остатков в PyMol, оказалось, что помимо того, что эти остатки плохо вписаны в электронную плотность при подрезке 1.5, 1.0 или 0.5 (под картинками будет указана подрезка), так еще и нет областей 194-197 и 260-278 и граничные точки (остатки Lys198 и Arg279) тоже плохо вписаны. Рис.11. Подрезка 1.5. Остатки (слева направа): Glu47, Leu52, Arg166 10 Рис. 12. Подрезка 1.0. Val193 и Gly259 Рис. 13. Подрезка 0.5. Gly259 Рис. 14. Подрезка 1.0. Lys198 и Arg279 В случае с Leu52 не очень понятно, почему этот остаток оказался маргинальным, возможно потому, что находится близко к каталитическому центру. Arg166 и Val193 относятся к субстрат-связывающему домену. В случае с Arg166, ему мешает Glu145 из-за поворота между α-спиралями. В случае с валином и Lys198, их положение плохо определено (аналогично с Gly259 и Arg279), так как между ними находится область «потерянных» аминокислот. 11 Заключение Структура имеет хорошие значения R-фактора, свободного R-фактора, 100% остатков (отличных от Gly и Pro) попали в предпочитаемые области на карте Рамачандрана. Real-space R-value: 0.149 (0.045). Были найдены маргинальные остатки Glu47, Leu52, Arg166, Val193, Gly259, Lys198 и Arg279, но их маргинальность можно объяснить необходимым условием для существования структуры. В случае Glu47 остаток зажат между двумя петлями белка. В случае с Leu52 не очень понятно, почему этот остаток оказался маргинальным, возможно потому, что находится близко к каталитическому центру. Arg166 и Val193 относятся к субстрат-связывающему домену. В случае с Arg166, ему мешает Glu145 из-за поворота между α-спиралями. В случае с валином и Lys198, их положение плохо определено (аналогично с Gly259 и Arg279), так как между ними находится область «потерянных» аминокислот. Конечно, отсутствие более чем 20 аминокислотных остатков – это не самый лучший результат, однако, судя по разнице R – Rfree = 0.234 – 0.187 = 0.047 (4.7% < 10%) результат достаточно хороший. Выдача программы What_Check сильно отличается от того, что выдал EDS. Совпадений я практически не нашла (кроме одного остатка Arg166), однако, совпал один остаток (выделен серым), судя по карте Рамачандрана. 12 Серым будут выделяться атомы уже найденные предыдущими методами. Warning: Phenylalanine convention problem The phenylalanine residues listed in the table below have their chi-2 not between 90.0 and 90.0. 109 PHE ( 116-) A Лежит рядом с консервативным остатком, участвующим в катализе. Видимо, для этого приходится принимать нехарактерный угол. Torsion-related checks Warning: Torsion angle evaluation shows unusual residues The residues listed in the table below contain bad or abnormal torsion angles. 125 67 218 231 169 ARG ILE VAL HIS PRO ( ( ( ( ( 132-) 74-) 229-) 242-) 176-) A A A A A -2.3 -2.1 -2.0 -2.0 -2.0 218 VAL является консервативным остатком, видимо его расположение уникально именно для этого белка. Warning: Backbone evaluation reveals unusual conformations The residues listed in the table below have abnormal backbone torsion angles. 14 ILE ( 83 ASP ( 94 ASP ( 119 MET ( 149 GLY ( 150 GLU ( 171 THR ( 281 THR ( chi-1/chi-2 21-) A omega poor 90-) A Poor phi/psi 101-) A omega poor 126-) A Poor phi/psi 156-) A Poor phi/psi 157-) A Poor phi/psi 178-) A Poor phi/psi 311-) A Poor phi/psi correlation Z-score : -1.866 149 и 150 остатки являются консервативными и участвуют в катализе, видимо их расположение важно для белка. Warning: Unusual rotamers It is not necessarily an error if a few residues have rotamer values below 0.3, but careful inspection of all residues with these low values could be worth it. 31 SER ( 38-) A 0.38 31 остаток является консервативным и участвует в катализе. Его расположение тоже важно. Warning: Unusual backbone conformations 6 ASP ( 13-) A 0 13 13 24 25 27 37 49 61 62 69 84 85 95 97 107 109 111 112 113 117 118 119 120 124 125 ASN THR PHE ARG GLN ARG ASP ASP HIS LEU ILE LEU VAL ARG PHE PHE MET ARG LEU ASP MET ARG THR ARG ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( 20-) 31-) 32-) 34-) 44-) 56-) 68-) 69-) 76-) 91-) 92-) 102-) 104-) 114-) 116-) 118-) 119-) 120-) 124-) 125-) 126-) 127-) 131-) 132-) A A A A A A A A A A A A A A A A A A A A A A A A 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 And so on for a total of 77 lines. Warning: Unusual PRO puckering phases 100 PRO 268 PRO ( 107-) ( 298-) A A 102.6 envelop C-beta (108 degrees) 107.6 envelop C-beta (108 degrees) Warning: Low packing Z-score for some residues 105 ALA ( 112-) A -2.88 Warning: Abnormal packing environment for some residues The residues listed in the table below have an unusual packing environment. 247 ARG 125 ARG 27 ARG 40 GLU 113 ARG 282 ASN 258 MET 166 ARG 168 GLN 49 ARG 266 GLU 167 GLU 202 ASN ( 258-) A ( 132-) A ( 34-) A ( 47-) A ( 120-) A ( 312-) A ( 288-) A ( 173-) A ( 175-) A ( 56-) A ( 296-) A ( 174-) A ( 213-) A -7.58 -7.13 -6.20 -5.90 -5.63 -5.61 -5.56 -5.32 -5.19 -5.11 -5.04 -5.03 -5.02 Программа What_Chack выдала достаточно много предупреждений по поводу расположения аминокислотных остатков. В большинстве случаев, мне кажется, что это особенности структуры, так как аминокислотные 14 остатки оказываются либо рядом с консервативными аминокислотами, участвующими в катализе, либо сами этими аминокислотами (отмечены желтым). 15 Список используемой литературы 1. Yong Wei, Heng Zhang, Zeng-Qiang Gao, Wen-Jia Wang, Eleonora V. Shtykova, Jian-Hua Xu, Quan-Sheng Liu, Yu-Hui Dong (2012) Crystal and solution structures of methyltransferase RsmH provide basis for methylation of C1402 in 16S rRNA, Journal of Structural Biology, 179, pp. 29-40. 2. ProCheck (http://www.ebi.ac.uk/thornton-srv/databases/cgi- bin/pdbsum/GetPage.pl?pdbcode=3tka&template=procheck_summary.html) и (http://www.ebi.ac.uk/thornton-srv/databases/cgi- bin/pdbsum/GetPage.pl?pdbcode=3tka&template=procheck.html&c=1&dir= procheck572) 3. What_Chack (http://www.cmbi.ru.nl/pdbreport/cgi-bin/nonotes?3tka) 4. EDS (http://eds.bmc.uu.se/cgi-bin/eds/uusfs?pdbCode=3TKA) 5. Significant region in EDS (http://eds.bmc.uu.se/cgi- bin/eds/sign?3tka&sco=2.0) 6. PDB (http://www.rcsb.org/pdb/explore/explore.do?structureId=3tka) 16