Сравнительный анализ пространственных структур белков

реклама
Сравнительный анализ
пространственных структур
белков
1. Оценка качества
пространственной структуры
(по G.Kleywegt, 2000)
Построение пространственной
модели белка в результате
рентгеноструктурного анализа
кристалла
не есть точная наука!
Модель зависит от ее авторов:
•
•
•
•
их опыта
самокритичности
мотивации
используемого программного обеспечения
Ошибки в модели почти неизбежны!
При высоком разрешении
(<1.5 Å) и хороших фазах
модель на 95% и более основана
на экспериментальных данных
(Kleywegt, 2000)
Остальные 5% модели зависят от того,
• какие программы использовались
• как моделировался B-фактор (есть
свобода выбора)
• допускались ли альтернативные
конформации
• моделировались ли водороды
Продолжение
• какие сгущения электронной плотности
интерпретировались как молекулы растворителя
(воды), а какие – как шум
• как отнеслись к некристаллографической
симметрии:
посчитали ли 2е или более копий одной и той
же молекулы белка в ассиметрической ячейке
– идентичными или
– разрешили им отличаться?
При разрешении >2 Å (>90%
РСА моделей в PDB) роль
воображения авторов модели
возрастает!
Задачи, решаемые пользователем PDB
• Выбор хорошей (лучшей) модели из нескольких
моделей одного и того же или нескольких
родственных белков
• Интегральная оценка качества и, следовательно,
степень доверия модели
• Выявление “маргинальных” групп атомов
Маргинальные атомы в модели могут быть либо
ошибками расшифровки (“отщепенцами”), либо
особенными атомами белка (“белыми воронами”)
Основные индикаторы маргиналов
1. Пространственный R-фактор (Jones et al., 1991)
2. Карта Рамачандрана
(Ramachandran&Ramachandran, 1965)
3. “Ротамеровость” боковой цепи (Jones et al., 1991)
4. Комфортность окружения атомов (Vriend&Sanders,
1993), в частности, анализ водородных связей
5. Инверсии петидной цепи от Cα до следующего Cα
(pep-flip; Jones et al., 1991, Kleywegt&Jones, 1998)
Другие индикаторы маргиналов
•
•
•
•
•
•
•
высокий B-фактор ( >40)
странный коэффициент заполнения (напр. 0!?)
длины связей
углы
торсионные углы
(не) планарность
(неправильная) хиральность (Сα, для Thr, Ile –
еще и Сβ)
Продолжение
• недопустимое сближение несвязанных атомов
• существенное различие B-факторов ковалентно
связанных атомов
• существенное различие конформаций в разных
копиях одного и того же белка из
ассиметрической ячейки
Пространственный R-фактор
(Real Space R, RSR)
• Характеризует насколько модель атома (-ов)
соответствует “экспериментальной”
электронной плотности
Сумма берется по узлам пространственной решетки
в окружении атома (атомов)
Хорошие значения: RSR<10%
Плохие:
>20%
Продолжение
• ρэксп восстанавливается по фазам из модели и
интенсивностям рефлексов из эксперимента
(часто берут взвешенные интенсивности:
эксперимент+модель – отсюда разные карты
электронной плотности для одной модели)
• Карты электронной плотности моделей, для
которых в PDB есть файл структурных
факторов, доступны на сайте Electron Density
Server (EDS)
Вариант RSR – коэфициент корреляции
между ρэксп и ρмодели
• Как и RSR, вычисляется по узлам
пространственной решетки
• Не зависит от значений ρэксп , а зависит от
согласованности изменений ρэксп и ρмодели
• Coeff.corr. <0.9 - подозрительно
Еще один вариант RSR – Z-score
• Для вычисления Z остатка (напр. Ala57)
его RSR сравнивается со средним RSR
для того же типа остатков (Ala) по
выборке из PDB с примерно таким же
разрешением (напр. 1.5-2 Å)
Карта Рамачандрана характеризует насколько
конформация плипептидной цепи остатка (псевдо)энергетически выгодна
ψ
+180°
0°
-180°
-180°
0°
+180°
φ
Концепция “псевдоэнергии”
• Идея: то, что наблюдается чаще – более
энергетически выгодно
• Реализация:
– строим гистограмму интересующего нас
параметра по подходящей выборке из PDB
– приближаем ее разумной функцией (например,
гауссовой)
– считаем, что полученный график отражает
энергию в зависимости от параметра
81782 остатка на карте Рамачандрана
Beta (B)
Left helix
(L)
Alpha(A)
Области на карте Рамачандрана
1CNR, разрешение 1.05
Классификация
областей (PROCHECK):
- предпочитаемая (A,B,L)
- разрешенная (a,b,l,p)
- допустимая (~a,~b,~l,~p)
- запрещенная
В хорошей модели >90% остатков, не считая
Gly, Pro, находятся в предпочитаемой области
КартаPROLINE
какого остатка?
Где
Trp,
где
Ser?
Trp
Ser
Анализ водородных связей
• В моделях встречается инверсия боковых
цепей His, Asn, Gln
His
Asn
Gln
Инверсия (?) в Asn51 гомеодомена №2
№2
№1
Asn51
Атом ND2
?
?
Атом N7 –
акцептор H
A103
Атом OD1
Атом N6 –
донор H
Еще в 36 структурах гомеодоменов – так же, как в 1й;
еще в 2х – как во второй
Анализ молекул воды.
Пример из модели 1CBS
HOH375
HOH376
Может ли HOH376
фиксироваться в
одинаковых точках
во всех ячейках
кристалла!???
4.3Å
3.9Å
Leu28.CD
Думаю, что нет
Интегральная оценка комфортности
окружения остатка
• В программе WhatCheck рассчитывается
Z-score для комфортности окружения
каждой боковой цепи
• Маргиналы – Z-score < -5
• Более показательны участки цепи с
низким Z, для их обнаружения строится
сглаженный график зависимости Z от
номера остатка
Статистика конформаций боковых
цепей остатков
• Боковые цепи имеют от 0 (Gly, Ala) до 4х
(Lys, Arg) степеней свободы вращения
вокруг ковалентных связей
• Обозначаются χ1, ..., χ4
Распределение угла χ1 в моделях PDB
Всего в
выборке
было
67608
остатков
Карта углов χ1 и χ2 для Leu
Ось X: chi_1 (0-360°)
Ось Y: chi_2 (0-360°)
Всего 6638 остатков
Изображены линии
уровня плотности
числа остатков
Ротамеры - это боковые цепи в
типичных для данного типа остатков
конформациях
У каждого типа остатков (Leu, Trp,
Arg и т.п.) свое число ротамеров
SwissPDBviewer “знает” ротамеры и
может их показать
Примеры грубых ошибок в записях
PDB
• Кристалл не того белка !!! 
• Полностью ошибочная модель (!)
• Правильно найдены, но неправильно
соединены элементы вторичной
структуры
• Участок цепи вписан в электронную
плотность с ошибкой
Janin, 1990:
в лаборатории очищали и кристаллизовали
ретинат-связывающий белок;
при РСА обнаружилось, что получился
лизоцим …
1PHY, 2.4 Å
McRee et al. 1989
2PHY, 1.4 Å
Borgstahl et al. 1995
Две структуры фотоактивного желтого белка рецептора
фототаксиса Ectothiorhdospira halophila:
почти ничего общего!
Хлормуконат циклоизомераза из Alcaligenes
eutrophus: совмещенные структуры 1chr и 2chr
1CHR: Hoier et al., 1993
Разрешение 3.00 Å
2CHR: Kleywegt et al., 1996
Разрешение 3.00 Å
Наложение 1CHR_A и 2СHR
Ala5
Ala5
Gln20
Ser22
Lys16
Gly40
Lys16
Gly40
1CHR и 2CHR: пример “сдвига рамки”
при расшифровке
Выравнивание последовательностей 1CHR
и 2CHR по близости C_alpha атомов при
наложении структур
Мог ли пользователь заподозрить
ошибку в структуре 1CHR до
появления 2CHR?
Server EDS:
Real-space R-value vs Residue for 1chr
RSR: пространственный R-фактор
для всех остатков структуры 1CHR
1СHR: коэффициент корреляции для
RSR
То же – для всех остатков
EDS server: Z-score vs Residue for 1chr
Z-score=(RSR-<RSR>)/sigma
Z-score для всех остатков структуры 1CHR
Real-space R-value vs Residue for 2chr
RSR для всех оснований из 2chr
2СHR: коэффициент корреляции для
RSR
То же – для всех остатков
EDS server:
Z-score vs Residue for 2chr
Z-score для RSR для всех остатков структуры
2CHR
Packing environmen for 1CHR:
“Second generation quality Z-score plot
smoothed over a 10 residue window” (PDBCheck)
1CHR: Arg35 оказался
в гидрофобном
кармане
2CHR: Arg35 образует
одну водородную
связь
Наложение участка 5-47 двух цепочек A и
B из структуры 1CHR
Сравнение статистик по картам Рамачандрана
1CHR
2CHR
Типичные
Области
A,B,L
492
76%
Типичные
Области
A,B,L
270
83%
Разрешенн
ые a,b,l,p
126
19%
Разрешенн
ые a,b,l,p
51
16%
Допустим
ые
~a,~b,~l,~p
22
3.5%
Допустим
ые
~a,~b,~l,~p
3
1%
Запрещен
ные
10
1.5%
Запрещен
ные
1
<1%
Сравнение структур 1CHR и 2CHR
Statistic
1CHR
2CHR
Comments
Crystallo
graphic
R-value
0.195
0.189
Not very
informative
Free Rvalue
???
0.264
Cannot
compare
Продолжение
Statistic
1CHR
-1.6
WHAT IF Z-score
Ramachandran plot
appearance (for 3.0 Å
structures)
WHAT IF Z-score
-1.6
rotamer quality (for 3.0
Å structures)
WHAT IF Z-score
backbone
conformation quality
(for 3.0 Å structures)
-1.6
2CHR
Comments
0.2
1CHR worse than
average
1.3
1CHR worse than
average; 2CHR
better than
average
0.6
1CHR worse
than average;
2CHR better
than average
Сервисы и программы
• PDBsum
• PDB
• PDBCheck (программа WhatCheck из
пакета WhatIf)
• PDBReport
• EDS (RSR во всех видах, файлы с
электронными плотностями)
Продолжение
• Ramachandran plots for all types of residues
(http://xray.bmc.uu.se/gerard/supmat/ramarev.html)
• Rotamers for all types of side chains
(http://xray.bmc.uu.se/gerard/supmat/chi.html)
Скачать