Рибосомный белок L12: копийность и её регуляция Яков Давыдов Научно-технический центр «БиоКлиникум» davydov@bioinf.ru Ольга Цой Институт проблем передачи информации им. А. А. Харкевича РАН little.koreec@gmail.com Ирена Артамонова Институт общей генетики им Н. И. Вавилова РАН Институт проблем передачи информации им. А. А. Харкевича РАН irenart@vigg.ru Александр Тоневицкий Московский Государственный Университет им. М .В. Ломоносова Научно-исследовательский институт общей патологии и патофизиологии РАМН Научно-технический центр «БиоКлиникум» tonevitsky@mail.ru Аннотация мофильной бактерии — Thermus thermophilus [2]. Также экспериментально определено число молекул L12 в рибосоме Agrobacterium tumefaciens (шесть), Bacillus subtilis (четыре), Thermus aquaticus (шесть) и Bacillus stearothermophilus (четыре) [3, 4]. Белок L12 является единственным белком большой субъединицы, который связывается с 23S rRNA не напрямую, а посредством белка L10. Димеры белка L12 связываются с восьмой — последней — α спиралью белка L10 (далее α 8). Участки связывания димеров белка L12 расположены последовательно на спирали, между участками связывания L12 на α 8 спирали имеются изломы. Для оценки копийности L12 мы использовали данные предсказания вторичной структуры белка L10. Бактериальный рибосомный белок L12 является единственным многокопийным белком рибосомы. Рибосома Escherichia coli содержит четыре молекулы белка L12, в то время, как у термофильных бактерий Thermotoga maritima и Thermus thermophilus одна рибосома содержит шесть молекул белка L12. В данной работе мы предсказали число молекул белка L12 в рибосоме более чем для 1200 видов бактерий. Были обнаружены виды, в рибосомах которых присутствуют восемь молекул белка L12. Был проведен филогенетических профилей, коррелирующих с копийностью L12. Рассмотрены возможные механизмы поддержания необходимого соотношения белков в рибосоме. 2. Результаты и обсуждение 1. Введение Предсказание вторичной структуры белка L10 позволило нам выделить α 8 спираль (спираль, отвечающую за связывание димеров белка L12). Распределение длин α 8 спирали имеет четкую бимодальную структуру (рис. 1). Расстояние между модами образующих его распределение составляет девять аминокислот, что соответствует длине участка связывания димера белка L12. Белок L12 (также именуемый L7/L12) является единственным многокопийным белком рибосомы бактерий. В составе рибосомы белок L12 присутствует в форме димеров. Рибосома Escherichia coli содержит четыре молекулы белка L12. В то же время рибосома Thermotoga maritima [1] содержит шесть молекул белка L12, как и рибосома другой тер- 288 Рис. 1. Гистограмма распределения длины α 8 спирали белка L10 бактерий. Таким образом, по-видимому, длина α 8 спирали строго взаимосвязана с количеством димеров белка L12, которое способен связать белок L10. Наша гипотеза состоит в том, что мы можем предсказать количество сайтов связывания L12 на белке L10 по длине α 8 спирали. Мы оценили количество сайтов связывания L12 для 1221 вида бактерий. Всего было обнаружено 535 видов с четырьмя молекулами L12 в рибосоме и 686 — с шестью. Данные предсказания полностью совпадают с ранее полученными экспериментальными данными. Рис. 2. Лого α 8 спирали белков L10 цианобактерий. ную монофилетическую группу. Поскольку независимое приобретение вставки является маловероятным событием, мы предполагаем, что у общего предка цианобактерий в рибосоме содержалось восемь молекул белка L12, а впоследствии некоторые виды цианобактерий потеряли один из димеров L12. При помощи масс-спектрометрии была проведена оценка числа белков L12 в рибосоме цианобактерии Arthrospira platensis. Для достижения точных оценок количества, использовались пептиды меченые изотопом. Эти пептиды обладали идентичной с нативными пептидами последовательностью, а также одинаковыми физико-химическими свойствами. Поскольку меченые пептиды добавлялись в известных концентрациях, стало возможным получить точные концентрации исходных пептидов, а значит и белков. Результаты эксперимента полностью совпали с предсказанием: в рибосоме A. platensis обнаружено восемь молекул белка L12. 2.1. Восемь копий L12 В то время, как у большей части бактерий длина α 8 спирали составляла не более 47 аминокислот, у ряда бактерий α 8 спираль была значительно длиннее (около 55 аминокислот). Большинство этих бактерий относятся к цианобактериям (сине-зеленым водорослям). В нуклеотидной последовательности гена, кодирующего белок L12, — rplL — этих цианобактерий содержится вставка длиной 33 нуклеотида, что соответствует длине необходимой для связывания дополнительного димера белка L12 — одиннадцати аминокислотам. Все четыре предполагаемые участки связывания димера белка L12 имеют схожие мотивы (рис. 2). Мотивы второго, третьего и четвертого участка связывания имеют более высокую степень гомологии. Это говорит о том, что эти участки возникли в результате дупликации. Несмотря на то, что найденные бактерии относятся к типу цианобактерий, они не образуют еди- 2.2. Поиск ассоциированных свойств Известно, что белок L12 стимулирует ГТФазную активность некоторых факторов трансляции. 289 Также было показано, что уменьшение числа молекул L12 может негативно сказываться на точности трансляции. При этом открытым остается вопрос о причинах различной копийности белка L12 у различных видов. Для ответа на этот вопрос были исследованы филогенетические профили 50 бактерий. Были рассмотрены 4017 филогенетических профилей из базы данных COG. С использованием точного теста Фишера был проведен поиск корреляции между копийностью L12 и наличием различных генов. После применения поправки БенджаминиХохберга было обнаружено восемь генов с p-value < 0.01 (таблица 1). Идентификатор COG1854 COG1299 COG1445 COG0327 COG0499 COG1534 COG4668 COG0116 было показано, что перед rplL находится независимый промотор. Было показано, что такое расположение справедливо для всех рассматриваемых геномов. В окружении этих генов часто находятся гены rplA, rplK, rpoB и rpoC, кодирующие белки L1, L11, β и β ′ субъединицы РНК-полимеразы. Исследование межгенных областей показало наличие консервативной структуры перед геном rplJ, возможно образующую вторичную структуру. Перед геном rplL консервативных структур не обнаружено, что может говорить об отсутствии промотора или его небольшой силе. Был проведен анализ транскриптомных данных [6] для E. coli. Сравнение уровней экспрессии мРНК rplJ и rplL показало, что концентрация транскрипта rplL на 10-15% выше, чем у rplJ. Таким образом наличие независимого промотора гена rplL не может являться основным механизмом поддержания копийности L12. Тем не менее, анализ данных покрытия рибосомами [7] показал, что количество рибосом на одну мРНК у rplL по сравнению с rplJ выше в 3.5 раза (рис. 3). Название кластера LuxS protein involved in autoinducer AI2 synthesis Phosphotransferase system, fructose-specific IIC component Phosphotransferase system fructose-specific component IIB Uncharacterized conserved protein S-adenosylhomocysteine hydrolase Predicted RNA-binding protein containing KH domain, possibly ribosomal protein Mannitol/fructose-specific phosphotransferase system, IIA domain Predicted N6-adeninespecific DNA methylase Таблица 1. Гены, имеющие биологическую связь с копийностью. Идентификатор приведен по базе данных COG. 2.3. Регуляция копийности Рис. 3. Соотношение покрытия ридами участков мРНК, защищенных рибосомами [7], и полной мРНК для генов, кодирующих белки рибосомы E. coli. Размер гена пропорционален соотношению. Мы рассмотрели несколько возможных механизмов поддержания копийности: на уровне генного состава, транскрипции, трансляции или путем протеолиза. Для 492 геномов был проведен поиск гена rplL. Среди рассматриваемых организмов не было обнаружено ни одного случая присутствия более чем одной копии гена rplL. Таким образом, генный состав не оказывает влияния на стохиометрию. У E. coli ген rplL в геноме следует непосредственно за геном rplJ, кодирующим белок L10. Ранее На основе полученных результатов выдвинуто предположение о том, что основным механизмом регуляции копийности является высокая привлекательность мРНК rplL для рибосомы. Которая может быть объяснена наличием вторичной структуры, увеличивающей эффективность трансляции. 290 Список литературы [1] M. Diaconu et al. Structural basis for the function of the ribosomal L7/12 stalk in factor binding and GTPase activation, Cell, 2005, pp. 991–1004. [2] L. L. Ilag et al. Heptameric (L12)6/L10 rather than canonical pentameric complexes are found by tandem MS of intact ribosomes from thermophilic bacteria, Proceedings of the National Academy of Sciences of the United States of America, 2005, pp. 8192–7. [3] E. S. Grebenyuk et al. Studying the copy number of ribosomal protein L7/L12, Bulletin of Experimental Biology and Medicine, 2009, pp. 587–591. [4] Y. Gordiyenko et al. Mass spectrometry defines the stoichiometry of ribosomal stalk complexes across the phylogenetic tree, Molecular & Cellular Proteomics, 2010, pp. 1774–1783. [5] Y. Maki et al. Three binding sites for stalk protein dimers are generally present in ribosomes from archaeal organism, The Journal of Biological Chemistry, 2007, pp. 32827–33. [6] C. Kahramanoglou et al. Direct and indirect effects of H-NS and Fis on global gene expression control in Escherichia coli, Nucleic Acids Research, 2011, pp. 2073–91. [7] G.-W. Li et al. The anti-Shine–Dalgarno sequence drives translational pausing and codon choice in bacteria, Nature, 2012, pp. 538—541. 291