МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ имени М.В. ЛОМОНОСОВА

реклама
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
имени М.В. ЛОМОНОСОВА
ФАКУЛЬТЕТ БИОИНЖЕНЕРИИ И БИОИНФОРМАТИКИ
Бета-тяж, не входящий в бета-лист, периодические
структурные элементы, кроме бета-тяжей из бета-листов
и альфа-спиралей
Отчет по биоинформатики
студентки 4-го курса
Шерстюк Александры Сергеевны
10 декабря 2012 г.
Москва
1. Введение.
Как известно, за формирование спиральных структур или β-листов отвечают водородные
связи, которые образуются между полярными группами углеродной цепи (Baker and
Hubbard, 1984). В случае α-спиралей каждая аминогруппа (-NH2) в каркасе образует
водородную связь с карбонильной группой (-C=O) аминокислоты, находящейся на 4
аминокислоты раньше, а основная часть β-тяжей расположена по соседству с другими
тяжами и образует с ними обширную систему водородных связей между C=O и N-H
группами пептидных остовов. Формирование тяжей в белках часто оказывается
связанным с образованием β‐листов. Но существуют ли такие тяжи, не входящие в β‐лист?
Оказывается, такие структуры, находящиеся изолированно, довольно часто встречаются в
белках, что поднимает вопрос о роли, которую они выполняют.
В предложенной статье (Eswar et al., 2003) было проанализировано 250 различных
негомологичных белков, из которых 187 содержали изолированные β –тяжи (E-тяжи) в
своей структуре. В общей сложности было проанализировано 518 подобных структур. Их
особенностями можно назвать повышенное содержание остатков пролина по сравнению с
β-тяжами из β‐листов, что делает их схожими с полипролиновыми конформациями
второго типа (Ananthanarayanan et al., 1987), меньшую консервативность среди
гомологичных белков, что говорит об изменчивости этих структур, что также свойственно
петлям. Е-тяжи, как правило, экспонированы, фланкированы петлями, а также амидные и
карбонильные группы их главной цепи часто образуют водородные связи с другими
полярными группами или водой. Торсионные углы (ϕ, ψ), наблюдаемые в Е-тяжах,
попадают в область β-тяжей на карте Рамачандрана. В целом, Е-тяжи имеют много
схожего и с петлями, и с β-тяжами из β-листов.
2. Материалы и методы.
Для анализа был использован набор данных из 250 негомологичных белков, чьи
структуры были получены с высоким разрешением (<2.0 Å). Использовалась база данных
PDB. Для идентификации Е-тяжей был введен следующий критерий: как минимум 4
идущих друг за другом остатка с торсионными углами –180° < ϕ< –30°, 60° < ψ < 180° или
–180° < ψ < –150° могут считаться Е-тяжем EI (Gunasekaran et al., 1998). Причем если у
такого тяжа ϕ>-90 для каждого а.о., то такие структуры считались полипролиновыми
конформациями второго типа (PPII), которые представляют из себя левозакрученную
спираль из остатков пролина, образующие пептидные связи, имеющие транс
конфигурацию (Doose et al., 2007). Далее отобранные Е-тяжи были разделены на два
класса: изолированные (не взаимодействующие ни с какими другими тяжами посредством
водородных связей, характерных β-листам) и выровненные (входящие в состав β-листов),
которые, в свою очередь, делятся на краевые βE (образующие водородные связи только с
одним другим β-тяжем) и внутренние βB, имеющие водородные связи с β-тяжами по обе
стороны.
Спиральные вторичные структуры были идентифицированы подобным образом: как
минимум 4 идущих друг за другом остатка с торсионными углами –140° < ϕ< –30°, -90° <
ψ < 45° считаются α-спиралью (Gunasekaran et al., 1998). 310 спирали – спирали с 3 а.о. в
витке и 10 атомами в кольце, сформированным за счет образования водородной связи были отделены от остальных (Ramakrishnan and Soman, 1982).
Наконец, как минимум 4 остатка, торсионные углы в которых не попадают ни в один
интервал для категорий, описанных выше, были определены как петли. Оставшиеся
аминокислотные остатки не образуют вторичную структуру.
3. Результаты и обсуждение.
3.1.Длина ЕI в сравнении с другими вторичными структурами
Набор данных из 250 белков был проанализирован на наличие различных структурных
элементов, таких как α- и 310 спирали, изолированные Е-тяжи, краевые и внутренние βтяжи и петли. В результате было найдено 6030 сегментов из 48848 а.о., 56% из которых
являются какими-то известными вторичными структурами (β-листы или α-спирали), 33%
составляют петли, большинство оставшихся сегментов (518) – Е-тяжи, а остальные (56) –
PPII (Таблица 1). Анализ распределения длин всех сегментов показал, что α-спирали и βтяжи, формирующие β-листы, заключают в себе больше а.о., нежели ЕI или PPII (Таблица
1). Также были посчитаны максимумы распределения длин для различных вторичных
структур и соответствующие процентные доли для этих максимумов. Как видно, для
большинства структур пик распределения длин приходится на 4 а.о., кроме α-спиралей,
которым соответствует длина в 10 а.о. (хотя такая длина характерна всего 8% белков с
данной вторичной структурой) и внутренних β-тяжей. Это говорит о том, что в белках
повсеместно встречаются короткие элементы вторичной структуры.
Структура
Количество
Количество
Средняя длина
Максимум
Процентная
сегментов
вовлеченных
сегментов (а.о.)
распределения
доля сегментов
длин (а.о.)
в максимуме
а.о.
(%)
α - спираль
1483
17277
11,7
10
8,4
310 спираль
119
630
5,3
4
41,2
EI
518
2564
5,0
4
50,8
PPII
56
241
4,3
4
76,8
βE
1103
6892
6,3
4
23,9
βI
791
5822
7,4
6
19,0
Петли
1960
15422
7,9
4
24,0
Таблица 1. Статистика вторичных структур в анализируемом наборе данных.
Что же касается Е-тяжей, то для проанализированных 518 таких тяжей длина варьируется
от 4-х до 14-и а.о. на сегмент. Причем только половина из этих структур длиннее 4-х а.о.,
что подтверждает предыдущее утверждение о том, что ЕI– это, как правило, короткие
структуры (Soman and Ramakrishnan, 1986). Пример одного из самых длинных
изолированных Е-тяжей изображен на рисунке 1. Его длина составляет 14 а.о. Поскольку
в программе Pymol изолированные Е-тяжи изображаются как петли (Рис. 2), для
получения такого изображения использовалась программа SETOR (Evans, 1993).
Рис.1. Структура пероксидазы грибов 1ARP. Полосатыми стрелками обозначены изолированные Е-тяжи с
номерами а.о., с которых они начинаются и которыми заканчиваются. Тяж 330-343 является примером
одного из самых длинных ЕI.
Рис.2. Изображение пероксидазы 1ARP в виде вторичных структур, полученное в PyMOL. Красным
обозначены изолированные Е-тяжи.
3.2. Характеристика углов на примере белка 1ARP
Как уже было сказано, значения торсионных углов (ϕ, ψ), наблюдаемых в Е-тяжах, в
большей степени попадают в область β-тяжей на карте Рамачандрана. Это
продемонстрировано на примере пероксидазы грибов (Рис.3). Но высокое содержание
пролина в EI способствует тому, что значительная часть точек, соответствующих остаткам
пролина, оказываются в области PPII карты Рамачандрана. На рисунке видно, что около
60% точек, соответствующих аминокислотным остаткам разных Е-тяжей белка 1ARP,
рассредоточены в области β, остальные же остатки, 58% из которых – пролины,
сконцентрированы в области PPII.
Рис.3. Карта Рамачандрана для белка 1ARP. Красные квадраты соответсвуют аминокислотам, входящим
в Е-тяж 330-343, голубые квадраты – Е-тяжу 305-310, фиолетовые ромбы – Е-тяжу 297-303, зеленые
треугольники – Е-тяжу 186-189, голубые ромбы соответствуют всем остальным аминокислотам белка.
3.3. Предрасположенность к различным аминокислотам для некоторых вторичных
структур
Были посчитаны предрасположенности к различным аминокислотам для ЕI, βE, βB, PPII и
петель (Таблица 2). Для подсчета использовался метод Chou-Fasman (Chou and Fasman,
1974):
𝑃𝑥𝑖 =
доля остатков 𝑖 в структуре 𝑥
доля всех остатков в структуре 𝑥
где 𝑃𝑥𝑖 – оценка предрасположенности вторичной структуры x к аминокислоте i
Как видно на таблице 2, гидрофобные аминокислоты встречаются в Е I, βE, βB тяжах чаще,
чем полярные и, что интересно, такие аминокислоты как Val, Ile и Thr, характерные βлистам, имеют высокую оценку предрасположенности и у Е-тяжей. Этот факт еще раз
подтверждает то, что формирование тяжей определяется аминокислотами (Swindells et al.,
1995). Петли, к примеру, наоборот, предпочитают полярные аминокислоты.
А.о.
Ala
Arg
Asn
Asp
Cys
Gln
Glu
Gly
His
Ile
Leu
Lys
Met
Phe
Pro
Ser
Thr
Trp
Tyr
Val
EI
0.74
1.02
0.76
0.78
1.27
0.94
0.92
0.37
0.92
1.18
1.01
0.98
1.01
1.18
2.27
0.96
1.23
0.90
1.01
1.25
PPII
1.77
0.41
0.52
1.09
1.63
0.58
0.67
0.20
0.40
0.39
0.93
0.62
0.89
1.04
6.24
0.68
0.60
0.56
0.67
0.47
βE
0.73
1.00
0.70
0.61
1.12
0.81
0.81
0.45
1.02
1.42
1.12
0.85
1.07
1.29
1.00
0.94
1.36
1.47
1.41
1.68
βB
0.84
0.81
0.57
0.66
1.17
0.84
0.63
0.54
0.96
1.67
1.20
0.83
1.27
1.29
0.76
0.93
1.19
1.22
1.46
1.72
Петля
0.74
0.94
1.36
1.32
1.13
0.85
0.86
1.73
1.04
0.67
0.63
0.93
0.57
0.81
1.36
1.24
1.07
0.80
0.88
0.66
Таблица 2. Оценки предрасположенностей различных вторичных структур к разным аминокислотным
остаткам (а.о.).
Также на таблице 2 можно заметить, что предрасположенность к пролину у ЕI довольно
высока, что также характерно и PPII. Около 42% всех ЕI содержат хотя бы один остаток
пролина в своей последовательности. Причем эти остатки не имеют определенной
позиции, в которой они встречаются чаще всего. Все это можно объяснить такими
особенностями пролина, как, во-первых, отсутствие водорода, связанного с атомом азота,
что не дает возможности включать пролин в стандартные вторичные структуры, где
важно образование водородных связей (Richardson and Richardson, 1988). Во-вторых,
пролин влияет на торсионные углы предшествующего ему остатка (Gibrat et al., 1991). Эти
уникальные черты пролина, вероятно, являются причинами его предпочтительного
включения в состав EI, нежели в βE или βB тяжи.
3.4.Сравнение аминокислотного состава различных типов сегментов
Для того чтобы оценить схожесть между изолированными Е-тяжами и остальными
типами сегментов, были посчитаны коэффициенты корреляции Пирсона для каждой пары
сегментов, основываясь на значения оценок предрасположенностей к различным
аминокислотам:
2
∑(𝑥𝑖 − 𝑥ср )(𝑦𝑖 − 𝑦ср )
𝑃2 = {
2
1
} ,
2 2
[∑(𝑥𝑖 − 𝑥ср ) ∑(𝑦𝑖 − 𝑦ср ) ]
где 𝑥𝑖 и 𝑦𝑖 – оценки предрасположенностей к аминокислоте i, 𝑥ср и 𝑦ср – средние значения
предрасположенностей.
Значения коэффициентов корреляции представлены на таблице 3.
ЕI
PPII
βE
βB
Петля
ЕI
PPII βE
1.00 0.80 0.43
1.00 ‐0.06
1.00
βB
Петля
0.28 –0.09
–0.17 0.23
0.92 –0.60
1.00 –0.67
1.00
Таблица 3. Коэффициенты корреляции между парами значений оценок предрасположенностей различных
сегментов к разным аминокислотам.
Как видно, изолированные Е-тяжи хорошо коррелируют с PPII (P=0,8), хотя, судя по
данным на таблице 2 их оценки предрасположенностей не очень похожи. Отсюда можно
предположить, что такой высокий коэффициент корреляции стал результатом высоких
значений предрасположенностей для пролина. Поэтому было решено удалить жесткий
пролин и слишком гибкий глицин из набора значений, что уменьшило коэффициент
корреляции между ЕI и PPII до -0,08, а коэффициент корреляции между ЕI и βE увеличился
с 0,43 до 0,73, между ЕI и βB – с 0,28 до 0,72. С другой стороны, негативная корреляция
между ЕI и петлями с коэффициентом -0,09 только усилилась после удаления глицина и
пролина (P=-0,29).
Из-за таких изменений в сторону лучшей корреляции с β-тяжами, участвующими в
формировании β-листов, можно сделать вывод, что ЕI чрезвычайно похожи на β тяжи, за
исключением высокого содержания остатков пролина.
3.5.Доступность EI для растворителя
Степень доступности EI для растворителя была посчитана как отношение тотальной
доступной поверхности (ASA) белка к сумме доступных поверхностей для каждого а.о.,
составляющего EI (Lee and Richards, 1971). Оказалось, что больше 90% исследованных EI
имеют доступность меньше 50%. На рисунке 4А сравнивается распределение средней
доступности для EI, βB и петель.
Рис.4. Сравнительные диаграммы средних доступностей. А) Распределение средних доступностей (%) для
βB (левая белая полоса), EI (средняя полоса) и петель (правая полоса). Б) Распределение средних
доступностей (%) для EI (левая белая полоса) и петель (правая полоса).
Как видно, β-тяжи имеют очень низкую доступность: больше половины таких тяжей
имеют доступность ниже 10%. При этом распределение для петель очень схоже с таковым
для EI. Это можно объяснить тем, что EI как правило экспонированы, что способствует
высокой доступности. С другой стороны, как было показано выше, EI имеют высокую
предрасположенность к неполярным а.о. Поэтому для объяснения этого противоречия
была проанализирована доступность боковых цепей а.о. в EI и сравнена с таковой для
петель (Рис.4Б). Поведение доступностей практически идентично для обеих структур,
причем около половины всех неполярных боковых цепей и EI, и петель скрыты от
растворителя, судя по первому пику на рисунке 4Б. Следовательно, вклад в высокую
доступность вносят полярные боковые цепи и атомы главной цепи.
3.6.Водородные связи атомов главной цепи EI
Поскольку EI не участвуют в формировании β-листов, которые, как известно, образуются
благодаря водородным связям между карбонильными и аминогруппами пептидных
остовов, эти группы вынуждены образовывать водородные связи с другими атомами белка
или растворителем. Все а.о. EI были проанализированы на предмет наличия водородных
связей между полярными группами их главной цепи и другими атомами. Из 2564 остатков
263 были остатками пролина, у которых только карбонильная группа может участвовать в
образовании водородных связей. Из этих 263 а.о. 94 образовывали водородную связь, а
остальные 169 - нет. Среди оставшихся 2301 остатков, входящих в состав EI, 380
образовывали водородную связь через аминогруппу, 391 – через карбонильную, 656 –
через обе группы, 874 вообще не образовывали водородных связей. То есть около 41%
всех остатков EI не имеют водородных связей. В качестве примера на рисунке 5 показаны
водородные связи некоторых EI пероксидазы грибов 1ARP, которая уже использовалась в
качестве примера ранее. Как видно, остатки EI образуют водородные связи с молекулами
воды или другими остатками белка. Даже в такой маленькой выборке из 3-х тяжей (24
а.о.) наблюдается похожее соотношение, полученное для 2301 а.о.: около 38% (9 из 24) не
образуют никаких водородных связей.
3.7.Консервативность EI в семействах гомологичных белков
Чтобы оценить степень консервативности EI в гомологичных белках, был проведен анализ
базы данных семейств гомологичных белков HOMSTRAD (Mizuguchi et al., 1998). Для
каждого из 97 семейств из более 3-х членов было случайным образом выбрано по одной
референсной структуре. EI, присутствующие в этой структуре, были идентифицированы и
для каждого тяжа был посчитан индекс консервативности – отношение количества членов
семейства, в которых как минимум 90% длины сегмента из референсной структуры
структурно консервативно, к общему числу членов семейства. Результаты изображены на
рисунке 6.
Рис.5. Водородные связи, образованные EI белка 1ARP. А) Е-тяж 330-343; Б) Е-тяж 305-310; В) Е-тяж
186-189. Все изображения получены с помощью PyMOL.
Рис.6. Распределение индексов консервативности EI в семействах гомологичных белков.
Как видно, около 41% из 290 анализированных EI имеют высокий индекс
консервативности от 60 до 100%. Большинство все же имеет низкий индекс
консервативности, что говорит о том, что EI, как и петли, довольно изменчивые
структуры.
4. Заключение
Изолированные Е-тяжи часто встречаются в белках. Несмотря на отсутствие регулярных
водородных связей, они формируют довольно стабильные структуры благодаря связям с
молекулами воды или другими атомами белка.
Было показано, что по аминокислотному составу Е-тяжи похожи на β-тяжи,
формирующие β-листы, за исключением высокого содержания пролина, что еще раз
доказывает, что формирование тяжей определяется преобладанием конкретных типов
аминокислот. То же касается торсионных углов аминокислотных остатков, входящих в
изолированные Е-тяжи – их значения лежат преимущественно в области β, но высокое
содержание пролина сдвигает некоторые точки карты Рамачандрана в область PPII. По
другим характеристикам Е-тяжи схожи с петлями: они экспонированы и гидрофобные
группы скрыты от растворителя, они изменчивы внутри семейств гомологичных белков.
Вероятно, эти протяженные структуры выполняют функцию петель, когда необходимо
перемещение на большие расстояния в белке, задействуя минимальное количество
аминокислот. Все полученные наблюдения свидетельствуют о том, что изолированные Етяжи занимают особое положение среди вторичных структур, имея частично
характеристики петель, а частично β-тяжей.
Список литературы.
Ananthanarayanan,V.S., Soman,K.V. and Ramakrishnan,C. (1987) J. Mol. Biol., 198, 705–709.
Baker,E.N. and Hubbard,R.E. (1984) Prog. Biophys. Mol. Biol., 44, 97–179.
Chou,P.Y. and Fasman,G.D. (1974) Biochemistry, 13, 211–222.
Doose S, Neuweiler H, Barsch H, Sauer M. Probing polyproline structure and dynamics by
photoinduced electron transfer provides evidence for deviations from a regular polyproline type
II helix. Proc Natl Acad Sci U S A. 2007 Oct 30;104(44):17400-5. Epub 2007 Oct 23
Eswar N, Ramakrishnan C and Srinivasan N. Stranded in isolation: structural role of isolated
extended strands in proteins. 2003
Evans,S.V. (1993) J. Mol. Graph., 11, 134–138
Gibrat,J.F., Robson,B. and Garnier,J. (1991) Biochemistry, 30, 1578–1586.
Gunasekaran,K., Nagarajaram,H.A., Ramakrishnan,C. and Balaram,P. (1998) J. Mol. Biol., 275,
917–932.
Lee,B. and Richards,F.M. (1971) J. Mol. Biol., 55, 379–400.
Mizuguchi,K., Deane,C.M., Blundell,T.L. and Overington J.P. (1998) Protein Sci., 7, 2469–
2471.
Ramakrishnan,C. and Soman,K.V. (1982) Int. J. Pept. Protein Res., 20, 218–237. Medline
Richardson,J.S. and Richardson,D.C. (1988) Science, 240, 1648–1652
Swindells,M.B., MacArthur,M.W. and Thornton,J.M. (1995) Nat. Struct. Biol., 2, 596–603.
Скачать