Известия ТулГУ. Серия Физика. Вып. 6. 2006 УДК 577.322 Галзитская О.В.1, Глякина А.В.2, Лобанов М.Ю.1 1 (Пущино, Ин-т белка РАН) 2 (Тула, ТулГУ) ПОИСК СТРУКТУРНЫХ ФАКТОРОВ, ОТВЕТСТВЕННЫХ ЗА СТАБИЛЬНОСТЬ БЕЛКОВ ИЗ ТЕРМОФИЛЬНЫХ ОРГАНИЗМОВ Создана база, состоящая из 245 пар гомологичных белков из термофильных и мезофильных организмов. Используя данную базу, найдено, что белки из термофильных организмов содержат больше межатомных контактов на остаток и водородных связей по сравнению со своими гомологами из мезофильных организмов. Вклад в увеличение этих параметров дают внешние аминокислотные остатки, доступные растворителю. Проанализирован аминокислотный состав внутренних, недоступных растворителю, и внешних аминокислотных остатков белков из термофильных и мезофильных организмов. Показано, что внешние остатки белков из термофильных организмов содержат больше таких аминокислот как лизин, аргинин и глутаминовая кислота, по сравнению с белками из мезофильных организмов. Внутренние остатки рассматриваемых белков по своему аминокислотному составу не отличаются. Введение Трехмерная структура белка определяется балансом разных взаимодействий. Водородные связи, солевые мостики, гидрофобный эффект – все играет важную роль в сворачивании белка и приобретении им своей конечной нативной структуры. Особое значение имеет термостабильность белков, определяющая диапазон температур естественного существования организмов. Отметим, что организмы, живущие при высоких температурах, называются термофилами; а организмы, адаптированные к нормальной температуре, называются мезофилами. В дальнейшем белки из термофильных организмов будут называться просто термофилами, а из мезофильных – мезофилами. Важность различных факторов, дающих вклад в термостабильность белка, является предметом интенсивных исследований. С термостабильностью белка связаны и многие структурные свойства [1-3]. К таким свойствам относят число водородных связей, число солевых мостиков, порядок контактов [4], площадь доступной для растворителя поверхности, длину белка, долю остатков в белке, вовлеченных в различные элементы вторич- 158 Известия ТулГУ. Серия Физика. Вып. 6. 2006 ной структуры (α-спирали и β-структуры), длину поверхностных петель, π-катионные взаимодействия [5] и др. Повышение термостабильности белков, в основном, связывают с действием двух механизмов [1]. Один из этих механизмов связан со структурными факторами, которые увеличивают компактность белков, а другой – с существенными модификациями аминокислотных последовательностей белков. Как былоь показано И.Н.Березовским и Е.И. Шахновичем [1], выбор механизма увеличения стабильности зависит от эволюционной истории организма. Белки из организмов, изначально обитающих в экстремальных условиях окружающей среды, более компактны, и увеличение стабильности осуществляется за счет структурных факторов. Те же организмы, которые изначально были мезофилами, а затем, в процессе эволюции, поменяли условия среды обитания на более теплые, имеют механизм термостабильности, основанный на модификации аминокислотной последовательности. В работе [6] было отмечено, что скорости сворачивания термофильных и мезофильных белков холодового шока сходны, а скорость разворачивания термофильного белка на два порядка ниже, чем его мезофильного гомолога. Авторы предполагают, что основной вклад в стабильность термофильных белков имеет не энергетическую, а энтропийную природу, и что различия в стабильности появляются из-за различия в константах скоростей разворачивания термофильных и мезофильных белков. При этом, для термофильных белков увеличивается активационный барьер разворачивания. Одним из возможных объяснений этого является стабилизация нативного состояния посредством поверхностных мутаций, ведущих к увеличению числа энтальпийных взаимодействий, которые формируются только после прохождения переходного состояния. У термофилов наблюдается повышенное значение числа солевых мостиков на остаток (0.0401 против 0.0322, p ~ 10-4), числа водородных связей на остаток (1.42 против 1.40, p ~ 10-2), а также пониженное значение эмпирической потенциальной энергии (-0.296 против -0.253, p ~ 10-4). Термофилы также имеют существенно низкие оценки площади, доступной для растворителя поверхности к площади всего белка, по сравнению с мезофилами (2.38 против 2.43, p ~ 10-4). (Вероятность p является оценкой, на сколько две выборочные совокупности отличаются друг от друга, если они имеют близкие средние значения. Если эта вероятность стремится к нулю, то эти две совокупности различны, а если к единице – одинаковы.) Таким образом, они менее доступны растворителю, которым чаще всего является очень теплая вода [2]. Для всех белков число солевых мостиков коррелирует с таким параметром как отношение числа заряженных остатков к полярным. Чем это отношение выше, тем больше в белке солевых мостиков. Но число солевых 159 Известия ТулГУ. Серия Физика. Вып. 6. 2006 мостиков в большей степени зависит от того, как заряженные остатки располагаются в пространственной структуре белка. Большое количество солевых мостиков было найдено в термофилах, особенно внутри спиралей [8]. Термофильные белки, в среднем, короче, чем мезофильные, и в них меньшая доля аминокислотных остатков не вовлечена в различные типы вторичной структуры (0.370 против 0.382, p ~ 10-2) [2]. Следует также отметить, что до насточщего времени не обнаружены корреляции между изменениями свойств, описывающих компактность и электростатические взаимодействия. Целью исследований данной работы был поиск ответа на вопрос, какое из рассмотренных взаимодействий является доминирующим в поддержании нативной структуры белков из термофильных организмов. Материалы и методы исследований Структуры исследуемых белков были взяты из банка белковых данных (Protein Data Bank). Сведения о вторичной структуре исследуемых белков были получены с помощью программы DSSP (Definition Secondary Structure of Proteins) [7]. Для нахождения структурных отличий термофильных белков от мезофильных использовали базу, которая включает в себя 407 пар гомологичных белков термофил-мезофил. Это база была составлена следующим образом: были выделены все белковые цепи, существующие на сентябрь 2005 года. Для каждой цепи было определено, из какого организма она взята (термофильного или мезофильного). Были созданы кластеры термофилов. Все цепи термофилов были выровнены против всех цепей мезофилов программой BLAST (Basic Local Alignment Search Tool) [8]. Стоит отметить, что программа BLAST строит выравнивание последовательностей аминокислотных остатков сравниваемых белков, добиваясь наибольшего сходства между ними. При этом для повышения сходства последовательности часто разрываются. Программа оценивает сходство выровненных последовательностей и говорит, гомологичны ли они (то есть, связаны ли они генетическим родством) и как выглядит наилучшее выравнивание этих последовательностей. Для каждого мезофильного белка были найдены гомологитермофилы (величина E < 10-5). Величина Е – вероятность того, что выбранные гомологичные последовательности случайны. Эти гомологи объединялись в кластер. Гомологи этих гомологов тоже помещались в соответствующий кластер. К каждому кластеру термофилов был добавлен список мезофилов, гомологичных (величина E < 10-5) хотя бы одному термофилу из кластера. В рамках каждого кластера все термофилы были пространственно выровнены против термофилов и термофилы против мезофилов. На выходе была получена величина MaxSub 160 Известия ТулГУ. Серия Физика. Вып. 6. 2006 (она определяет степень пространственного выравнивания структур) для каждой пары термофил-термофил и термофил-мезофил в рамках соответствующих кластеров. Для каждого кластера была отобрана одна пара термофил-мезофил с MaxSub > 50 %. Величина MaxSub определяет степень пространственного выравнивания структур и рассчитывается по следующей формуле 1 ∑i d 1+ i 3,5 , MaxSub = äëèí à×öåï è где суммирование производится по всем парам аминокислот, расстояние между Cα-атомами которых di (после наложения) меньше 3.5 Å. Фрагменты менее 4 остатков игнорируются. В соответствии с определением, величина MaxSub изменяется в пределах от 0 до 1 или от 0 до 100 %. если MaxSub = 1 (или 100 %), то это значит, что рассматриваемые структуры полностью совпадают. В итоге были отобраны 407 пар белков термофил-мезофил. Было предположено, что белки, относящиеся к различным классам, могут иметь различные структурные факторы, увеличивающие их термостабильность. Полученные пары белков были разделены на классы a, b, c, d, e, f, g в соответствии с типом вторичной структуры (табл. 1) при помощи базы SCOP (Structural Classification of Proteins) [9]. Таблица 1 Соответствие буквенных обозначений и классов в базе SCOP Класс а b c d e f g Тип белка, входящего в данный класс Только α-спиральные белки Только β-структурные белки В белках имеется строгое чередование по цепи α-спиралей и β-структур Белки, состоящие из α-спиралей и β-структур, которые могут располагаться отдельными кластерами; нет строгого чередования α-спиралей и β-структур по цепи Белки, состоящие из нескольких доменов, которые могут принадлежать различным классам Мембранные пептиды и белки Маленькие белки Белков класса e, f, g оказалось недостаточно для проведения с ними последующих статистических исследований, и эти классы в дальнейшем не рассматривались. В рассмотрение не брались пары белков, которые сильно отличались между собой по числу аминокислотных остатков, а также белки, по длине превышающие 400 аминокислотных остатков. 161 Известия ТулГУ. Серия Физика. Вып. 6. 2006 Таким образом, осталось 245 пар хорошо структурно выровненных белков, принадлежащих четырем основным классам: 24 пары, принадлежащие a-, 29 – b- , 127 – c- и 65 – d-классам. Остаток считали внутренним, если площадь его доступной для растворителя поверхности была равна нулю; а внешним – если площадь его доступной для растворителя поверхности была больше 25 % от максимальной площади, доступной для растворителя поверхности остатка. Максимальная площадь доступной для растворителя поверхности каждого типа аминокислотного остатка различна (табл. 2). Таблица 2 была получена следующим образом: считалась площадь доступной для растворителя поверхности каждого типа аминокислотного остатка для белков, взятых из PDB-банка данных, а затем из них были выбраны максимальные значения для каждого типа аминокислотного остатка. Таблица 2 Максимальная площадь доступной для растворителя поверхности аминокислотных остатков, найденная в PDB банке белков Тип остатка Gly Ala Pro Glu Gln Asp Asn Ser His Lys S, Å2 104 159 183 215 237 189 188 176 209 231 Тип остатка Arg Thr Val Ile Leu Met Phe Tyr Cys Trp S, Å2 278 186 164 190 212 204 237 250 144 160 S – максимальная площадь доступной для растворителя поверхности Подсчет числа межатомных контактов на остаток в белках осуществлялся следующим образом: два атома считались контактирующими друг с другом, если они находились на расстоянии менее 6 Å (8 Å). Межатомные контакты между соседними по цепи остатками в расчет не принимались. Встречаемость различных типов аминокислотных остатков среди внутренних и внешних определялась как отношение числа остатков каждого типа, встречающихся среди внешних (внутренних), к общему числу внешних (внутренних) остатков. Энергия водородных связей определяли с помощью программы DSSP. Принимали, что водородная связь существует, если ее энергия меньше -0.5 ккал/моль. Водородную связь считали внешней (внутренней), если ее донор и акцептор принадлежат внешним (внутренним) остаткам. Считали, что солевой мостик существует, если расстояние между противоположено заряженными боковыми группами таких аминокислотных остатков, как глутаминовая кислота и лизин, глутаминовая кислота и аргинин, не превышает 3 Å. Пространственное выравнивание одного термофильного и нескольких гомологичных ему мезофильных белков (по одному представителю от каждого класса) производили с помощью программы Friend, версия 1.6.02 [10]. Пример пространственного выравнивания приведен на рис. 1. 162 Известия ТулГУ. Серия Физика. Вып. 6. 2006 Рис. 1. Пространственное выравнивание белков из термофильных и мезофильных организмов: 1 – белок из термофильного организма Thermus thermophilus pdb код 1we3; 2 – белок из мезофильного организма Escherichia coli pdb код 1pcq; 3 – белок из мезофильного организма Mycobacterium tuberculosis pdb код 1p3h Погрешность измерений рассчитывали по формуле m _ 1 ( )2 , S= x − x ∑ i n(n − 1) i =1 где xi − значение измеряемого параметра для i-того аминокислотного остатка, n − число аминокислотных остатков. Для проверки, принадлежат ли два полученных средних значения разным выборочным совокупностям, использовался t-критерий Стьюдента. Резуьтаты и их обсуждение В литературе говорится о том, что термофильные белки должны быть более компактными [2]; из этого следует, что у них число контактов между аминокислотными остатками должно быть выше, чем у мезофилов. Для проверки этого утверждения было подсчитано число межатомных контактов на остаток для 245 пар белков термофил-мезофил при контактных расстояниях 6 Å и 8 Å. Для этого в каждом белке аминокислотные остатки были разделены на внутренние и внешние (см. разд. Материалы и методы исследований). Было предположено, что внешние аминокислотные остатки термофильных белков должны быть более плотно упакованы, чем мезофильных, так как термофильные белки живут при более критичных условиях окружающей среды. Число подсчитанных межатомных контак163 Известия ТулГУ. Серия Физика. Вып. 6. 2006 тов на остаток для внутренних и внешних аминокислотных остатков термофильных и мезофильных белков приведено в табл. 3. Из полученных данных видно, что внутренние аминокислотные остатки термофильных и мезофильных белков не отличаются по числу межатомных контактов на остаток. Это говорит о том, что внутренние части и термофильных, и мезофильных белков одинаково плотно упакованы, а внешние аминокислотные остатки термофильных белков имеют повышенное число межатомных контактов на остаток по сравнению с мезофильными (разница 1.78±0.32, p = 10-8 для 6 Å и 4.66±0.79, p = 10-9 для 8 Å). Таблица 3 Среднее число межатомных контактов на остаток для всех, внутренних и внешних аминокислотных остатков термофильных и мезофильных белков Типы остатков Все Внутренние Внешние Контактное расстояние 6 Å Контактное расстояние 8 Å термофилы мезофилы термофилы мезофилы p p -4 83.89±0.47 82.73±0.44 1.6⋅10 224.99±1.38 221.90±1.27 9.5⋅10-5 110.59±0.74 111.09±0.64 0.50 296.85±2.14 297.71±1.92 0.67 -8 61.56±0.32 59.78±0.27 1.4⋅10 165.71±0.79 161.05±0.63 1.3⋅10-9 Данные о среднем числе водородных связей на остаток для всех, внутренних и внешних аминокислотных остатков термофильных и мезофильных белков (табл. 4). В термофильных белках по сравнению с мезофильными наблюдается увеличение числа водородных связей на остаток (разница 0.05±0.02, p = 0.10). Вклад в это увеличение дают внешние аминокислотные остатки термофильных белков (разница 0.021±0.009, p = 10-2). Таблица 4 Среднее число водородных связей на остаток для всех, внешних и внутренних аминокислотных остатков термофильных и мезофильных белков Типы остатков Термофилы Мезофилы p Все 0.27±0.02 0.22±0.02 0.10 Внутренние 0.13±0.01 0.12±0.01 0.24 Внешние 0.111±0.009 0.090±0.008 6.7⋅10-2 Большое значение имеет аминокислотный состав внутренних и внешних остатков термофильных и мезофильных белков. Результаты этого анализа представлены на рис. 2. Из рис. 2а видно, что внутренние остатки термофильных и мезофильных белков не отличаются по своему аминокислотному составу. Среди внешних остатков термофильных белков наблюдается повышенное содержание таких аминокислотных остатков, как лизин (14.7 %), аргинин (12.7 %) и глутаминовая кислота (18.0 %). Этих аминокислот также больше 164 Известия ТулГУ. Серия Физика. Вып. 6. 2006 содержится среди внешних остатков термофильных белков (разница 0.022 ± 0.004 для лизина, 0.032 ± 0.004 для аргинина и 0.044 ± 0.004 для глутаминовой кислоты) по сравнению с мезофильными гомологами. И, наоборот, среди внешних остатков мезофильных белков наблюдается повышенное содержание аланина (разница 0.017 ± 0.002), аспарагиновой кислоты (разница 0.017 ± 0.003), глутамина (разница 0.027 ± 0.002) и треонина (разница 0.012 ± 0.002) по сравнению с мезофильными гомологами (см. рис. 2б). внутренние остатки доля аминокислотных остатков 0.25 термофилы мезофилы 0.2 0.15 0.1 0.05 a 0 ala cys asp glu phe gly his ile lys leu met asn pro gln arg ser thr val trp tyr тип аминокислотного остатка -0.05 внешние остатки доля аминокислотных остатков 0.2 термофилы мезофилы 0.15 б 0.1 0.05 0 ala cys asp glu phe gly his ile lys leu met asn pro gln arg ser thr val trp tyr тип аминокислотного остатка -0.05 Рис. 2. Доля каждого типа аминокислотных остатков, входящих в состав термофильных и мезофильных белков: а - внутренние аминокислотные остатки; б - внешние аминокислотные остатки. На рисунке приведена погрешность измерения средних значений. 165 Известия ТулГУ. Серия Физика. Вып. 6. 2006 Результаты расчета среднего числа межатомных контактов на остаток при контактном расстоянии 3 Å для всех аминокислотных остатков, внешних и внутренних представлены в табл. 5. Подсчет числа солевых мостиков показал, что термофильные белки содержат 1.11±0.08, а мезофильные 0.66±0.06 солевых мостиков на белок. Таблица 5 Среднее число межатомных контактов на остаток для всех, внутренних и внешних аминокислотных остатков термофильных и мезофильных белков при контактном расстоянии 3 Å Контактное расстояние 3 Å Термофилы Мезофилы Все остатки 0.661±0.007 0.662±0.009 Внутренние остатки 0.82±0.01 0.83±0.01 Внешние остатки 0.529±0.008 0.526±0.010 Из табл. 5 видно, что термофильные и мезофильные белки не отличаются по числу межатомных контактов на остаток при контактном расстоянии 3 Å, а среднее число солевых мостиков у них больше, чем в мезофильных белках (разница 0.45 ± 0.08, p = 10-7). Таким образом, солевые мостики дают вклад в стабильность термофильных белков, но ими полностью нельзя объяснить увеличение числа межатомных контактов в термофильных белках по сравнению с мезофильными. Заключение Было показано, что аминокислотный состав поверхностного слоя в белках из термофильных организмов достоверно отличается от состава поверхностного слоя в белках из мезофильных организмов, в то время как аминокислотные составы внутренних частей белков из термофильных и мезофильных организмов одинаковы. Среди внешних аминокислотных остатков белков из термофильных организмов содержится повышенная доля таких аминокислот, как лизин, аргинин и глутаминовая кислота. У поверхностных аминокислотных остатков белков из термофильных организмов в среднем межатомных контактов на остаток и водородных связей больше, чем у поверхностных аминокислотных остатков белков из мезофильных организмов. 166 Известия ТулГУ. Серия Физика. Вып. 6. 2006 Библиографический список 1. Berezovsky I.N., Shakhnovich E.I. Physics and evolution of thermophilic adaptation // Proc. Natl. Acad. Sci. USA. - 2005. – V. 102. – P. 12742– 12747. 2. Robinson-Rechavi M., Alibes A., Godzik A. Contribution of electrostatic interactions, compactness and quaternary structure to protein thermostability: lessons from structural genomics of Thermotoga maritime // J. Mol. Biol. 2006. – V. 356. – P. 547–557. 3. Liang H-K., Huang Ch-M., Ko M-T., Hwang J-K. Amino acid coupling patterns in thermophilic proteins// Proteins. - 2005. – V. 59. – P. 58–63. 4. Plaxco K.W., Simons K.T., Baker D. Contact order, transition state placement and the refolding rates of single-domain proteins // J. Mol. Biol. 1998. . – V. 277. – P. 985–994. 5. Gallivan J.P., Dougherty D.A. Cation-pi interactions in structural biology // Proc. Natl. Acad. Sci. USA. - 1999. – V. 96. – P. 9459 – 9464. 6. Schuler B., Kremer W., Kalbitzer H.R., Jaenicke R. Role of entropy in protein thermostability: folding kinetics of a hyperthermophilic cold shock protein at high temperatures using 19F NMR // Biochemistry. - 2002. – V. 41. – P. 11670–11680. 7. Kabsch W., Sander Ch. Dictionary of protein secondary structure: pattern recognition of hydrogen-bonded and geometrical features // Biopolymers. 1983. – V. 22. – P. 2577–2637. 8. Altschul S.F., Gish W., Miller W., Myers E.W., Lipman D.J. Basic local alignment search tool // J. Mol. Biol. - 1990. – V. 215. – P. 403–410. 9. Murzin A.G., Brenner S.E., Hubbard T., Chothia C. SCOP: a structural classification of proteins database for the investigation of sequences and structures // J. Mol. Biol. - 1995. – V. 247. – P. 536–540. 10. Abyzov A., Errami M., Leslin C.M., Ilyin V.A. Friend, an integrated analytical front-end application for bioinformatics // Bioinformatics. - 2005. – V. 21. – P. 3677–3678. 167