Сравнительный анализ пространственных структур белков 1. Оценка качества пространственной структуры (по G.Kleywegt, 2000) Построение пространственной модели белка в результате рентгеноструктурного анализа кристалла не есть точная наука! Модель зависит от ее авторов: • • • • их опыта самокритичности мотивации используемого программного обеспечения Ошибки в модели почти неизбежны! При высоком разрешении (<1.5 Å) и хороших фазах модель на 95% и более основана на экспериментальных данных (Kleywegt, 2000) Остальные 5% модели зависят от того, • какие программы использовались • как моделировался B-фактор (есть свобода выбора) • допускались ли альтернативные конформации • моделировались ли водороды Продолжение • какие сгущения электронной плотности интерпретировались как молекулы растворителя (воды), а какие – как шум • как отнеслись к некристаллографической симметрии: посчитали ли 2е или более копий одной и той же молекулы белка в ассиметрической ячейке – идентичными или – разрешили им отличаться? При разрешении >2 Å (>90% РСА моделей в PDB) роль воображения авторов модели возрастает! Задачи, решаемые пользователем PDB • Выбор хорошей (лучшей) модели из нескольких моделей одного и того же или нескольких родственных белков • Интегральная оценка качества и, следовательно, степень доверия модели • Выявление “маргинальных” групп атомов Маргинальные атомы в модели могут быть либо ошибками расшифровки (“отщепенцами”), либо особенными атомами белка (“белыми воронами”) Основные индикаторы маргиналов 1. Пространственный R-фактор (Jones et al., 1991) 2. Карта Рамачандрана (Ramachandran&Ramachandran, 1965) 3. “Ротамеровость” боковой цепи (Jones et al., 1991) 4. Комфортность окружения атомов (Vriend&Sanders, 1993), в частности, анализ водородных связей 5. Инверсии петидной цепи от Cα до следующего Cα (pep-flip; Jones et al., 1991, Kleywegt&Jones, 1998) Другие индикаторы маргиналов • • • • • • • высокий B-фактор ( >40) странный коэффициент заполнения (напр. 0!?) длины связей углы торсионные углы (не) планарность (неправильная) хиральность (Сα, для Thr, Ile – еще и Сβ) Продолжение • недопустимое сближение несвязанных атомов • существенное различие B-факторов ковалентно связанных атомов • существенное различие конформаций в разных копиях одного и того же белка из ассиметрической ячейки Пространственный R-фактор (Real Space R, RSR) • Характеризует насколько модель атома (-ов) соответствует “экспериментальной” электронной плотности Сумма берется по узлам пространственной решетки в окружении атома (атомов) Хорошие значения: RSR<10% Плохие: >20% Продолжение • ρэксп восстанавливается по фазам из модели и интенсивностям рефлексов из эксперимента (часто берут взвешенные интенсивности: эксперимент+модель – отсюда разные карты электронной плотности для одной модели) • Карты электронной плотности моделей, для которых в PDB есть файл структурных факторов, доступны на сайте Electron Density Server (EDS) Вариант RSR – коэфициент корреляции между ρэксп и ρмодели • Как и RSR, вычисляется по узлам пространственной решетки • Не зависит от значений ρэксп , а зависит от согласованности изменений ρэксп и ρмодели • Coeff.corr. <0.9 - подозрительно Еще один вариант RSR – Z-score • Для вычисления Z остатка (напр. Ala57) его RSR сравнивается со средним RSR для того же типа остатков (Ala) по выборке из PDB с примерно таким же разрешением (напр. 1.5-2 Å) Карта Рамачандрана характеризует насколько конформация плипептидной цепи остатка (псевдо)энергетически выгодна ψ +180° 0° -180° -180° 0° +180° φ Концепция “псевдоэнергии” • Идея: то, что наблюдается чаще – более энергетически выгодно • Реализация: – строим гистограмму интересующего нас параметра по подходящей выборке из PDB – приближаем ее разумной функцией (например, гауссовой) – считаем, что полученный график отражает энергию в зависимости от параметра 81782 остатка на карте Рамачандрана Beta (B) Left helix (L) Alpha(A) Области на карте Рамачандрана 1CNR, разрешение 1.05 Классификация областей (PROCHECK): - предпочитаемая (A,B,L) - разрешенная (a,b,l,p) - допустимая (~a,~b,~l,~p) - запрещенная В хорошей модели >90% остатков, не считая Gly, Pro, находятся в предпочитаемой области КартаPROLINE какого остатка? Где Trp, где Ser? Trp Ser Анализ водородных связей • В моделях встречается инверсия боковых цепей His, Asn, Gln His Asn Gln Инверсия (?) в Asn51 гомеодомена №2 №2 №1 Asn51 Атом ND2 ? ? Атом N7 – акцептор H A103 Атом OD1 Атом N6 – донор H Еще в 36 структурах гомеодоменов – так же, как в 1й; еще в 2х – как во второй Анализ молекул воды. Пример из модели 1CBS HOH375 HOH376 Может ли HOH376 фиксироваться в одинаковых точках во всех ячейках кристалла!??? 4.3Å 3.9Å Leu28.CD Думаю, что нет Интегральная оценка комфортности окружения остатка • В программе WhatCheck рассчитывается Z-score для комфортности окружения каждой боковой цепи • Маргиналы – Z-score < -5 • Более показательны участки цепи с низким Z, для их обнаружения строится сглаженный график зависимости Z от номера остатка Статистика конформаций боковых цепей остатков • Боковые цепи имеют от 0 (Gly, Ala) до 4х (Lys, Arg) степеней свободы вращения вокруг ковалентных связей • Обозначаются χ1, ..., χ4 Распределение угла χ1 в моделях PDB Всего в выборке было 67608 остатков Карта углов χ1 и χ2 для Leu Ось X: chi_1 (0-360°) Ось Y: chi_2 (0-360°) Всего 6638 остатков Изображены линии уровня плотности числа остатков Ротамеры - это боковые цепи в типичных для данного типа остатков конформациях У каждого типа остатков (Leu, Trp, Arg и т.п.) свое число ротамеров SwissPDBviewer “знает” ротамеры и может их показать Примеры грубых ошибок в записях PDB • Кристалл не того белка !!! • Полностью ошибочная модель (!) • Правильно найдены, но неправильно соединены элементы вторичной структуры • Участок цепи вписан в электронную плотность с ошибкой Janin, 1990: в лаборатории очищали и кристаллизовали ретинат-связывающий белок; при РСА обнаружилось, что получился лизоцим … 1PHY, 2.4 Å McRee et al. 1989 2PHY, 1.4 Å Borgstahl et al. 1995 Две структуры фотоактивного желтого белка рецептора фототаксиса Ectothiorhdospira halophila: почти ничего общего! Хлормуконат циклоизомераза из Alcaligenes eutrophus: совмещенные структуры 1chr и 2chr 1CHR: Hoier et al., 1993 Разрешение 3.00 Å 2CHR: Kleywegt et al., 1996 Разрешение 3.00 Å Наложение 1CHR_A и 2СHR Ala5 Ala5 Gln20 Ser22 Lys16 Gly40 Lys16 Gly40 1CHR и 2CHR: пример “сдвига рамки” при расшифровке Выравнивание последовательностей 1CHR и 2CHR по близости C_alpha атомов при наложении структур Мог ли пользователь заподозрить ошибку в структуре 1CHR до появления 2CHR? Server EDS: Real-space R-value vs Residue for 1chr RSR: пространственный R-фактор для всех остатков структуры 1CHR 1СHR: коэффициент корреляции для RSR То же – для всех остатков EDS server: Z-score vs Residue for 1chr Z-score=(RSR-<RSR>)/sigma Z-score для всех остатков структуры 1CHR Real-space R-value vs Residue for 2chr RSR для всех оснований из 2chr 2СHR: коэффициент корреляции для RSR То же – для всех остатков EDS server: Z-score vs Residue for 2chr Z-score для RSR для всех остатков структуры 2CHR Packing environmen for 1CHR: “Second generation quality Z-score plot smoothed over a 10 residue window” (PDBCheck) 1CHR: Arg35 оказался в гидрофобном кармане 2CHR: Arg35 образует одну водородную связь Наложение участка 5-47 двух цепочек A и B из структуры 1CHR Сравнение статистик по картам Рамачандрана 1CHR 2CHR Типичные Области A,B,L 492 76% Типичные Области A,B,L 270 83% Разрешенн ые a,b,l,p 126 19% Разрешенн ые a,b,l,p 51 16% Допустим ые ~a,~b,~l,~p 22 3.5% Допустим ые ~a,~b,~l,~p 3 1% Запрещен ные 10 1.5% Запрещен ные 1 <1% Сравнение структур 1CHR и 2CHR Statistic 1CHR 2CHR Comments Crystallo graphic R-value 0.195 0.189 Not very informative Free Rvalue ??? 0.264 Cannot compare Продолжение Statistic 1CHR -1.6 WHAT IF Z-score Ramachandran plot appearance (for 3.0 Å structures) WHAT IF Z-score -1.6 rotamer quality (for 3.0 Å structures) WHAT IF Z-score backbone conformation quality (for 3.0 Å structures) -1.6 2CHR Comments 0.2 1CHR worse than average 1.3 1CHR worse than average; 2CHR better than average 0.6 1CHR worse than average; 2CHR better than average Сервисы и программы • PDBsum • PDB • PDBCheck (программа WhatCheck из пакета WhatIf) • PDBReport • EDS (RSR во всех видах, файлы с электронными плотностями) Продолжение • Ramachandran plots for all types of residues (http://xray.bmc.uu.se/gerard/supmat/ramarev.html) • Rotamers for all types of side chains (http://xray.bmc.uu.se/gerard/supmat/chi.html)