Сравнение аминокислотных последовательностей белков и нуклеотидных последовательностей соответствующих генов. Цель: Исследовать элементарные эволюционные события в ближайших гомологах RRMJ_ECOLI и зависимость процента совпадений последовательностей белков от процента совпадений последовательностей их генов. 1) Была создана выборка гомологов. ID гомолога RRMJ_Salpa RRMJ_Erwst RRMJ_Pholl RRMJ_Vibch RRMJ_Xylft RRMJ_Bucap АС гомолога Q5PLC1 Q6D9B9 Q7MYY0 Q9KU87 Q9PH52 Q8K9G7 ID гена CP000026 BX950851,1 BX571874.1 AE004149 AE003863 AAM67922 Процент идентичности гомолога с RRMJ_Ecoli 99 94 90 70 52 49 Обозначение Fastaфайлов p1/g1 p2/g2 p3/g3 p4/g4 p5/g5 p6/g6 2) Элементарные эволюционные события в ближайших гомологах Выравнивание RRMJ_Ecoli c RRMJ_Salpa выявило только выпадение последней аминокислоты (пролина) в гомологе. При выравнивании соответствующих генов было обнаружено выпадение последнего триплета («ссс» в моем белке). Также были обнаружено 52 замены нуклеотидных остатков. 51 из них не привела к заменам аминокислот в белке (так называемые синонимичные замены). Матрица замен: A A T G C T 3 17 4 G 6 18 C 4 Зеленым цветом выделены транзиционные замены. Бежевым – трансверсионные. Соотношение транзиций к трансверсиям равно 35:17. Очевидно, что вероятность замены пурина на пиримидин и наоборот во время синтеза ДНК меньше, чем вероятность замены пурина на пурин и пиримидина на пиримидин. 43 замены произошли в третьих позициях. Таблица синонимичных замен: Аминокислота триплет в RRMJ_Ecoli триплет в RRMJ_Salpa Количество Ala Ala Arg Arg Arg Asp Cys Cys Gln Gln Glu Glu Gly Gly Gly Gly Gly Lys Lys Leu Leu Leu Leu Leu Leu Leu Pro Thr Tyr Ser Ser Ser Ser Val Val Val Val Val Val gca gct cgt cgg cgt gac tgt tgc caa cag gag gaa ggt ggt ggt ggc ggc aag aaa tta ctc ctt ctg ctg cta tta ccg acc tat tcc agc tcc tct gtg gtt gtt gtc gta gtc gcg gcg cga cgt cgc gat tgc tgt cag caa gaa gag ggc gga ggg ggt gga aaa aag cta ctt ctc ctt tta tta ctg cca acg tac tca agt tcg tcg gtc gta gtg gta gtg gtt 3 1 1 1 3 1 1 1 2 1 1 2 2 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Голубым цветом выделены замены, произошедшие не по третьей позиции. Также найдена одна несинонимичная замена: gtt(валин) – att(изолейцин). 3) Исследование зависимости процента совпадений последовательностей белков от процента совпадений последовательностей их генов. Ниже приведен график. Розовая линия (ось С) показывает зависимость процента совпадений в белковых последовательностях от совпадений в нуклеотидной последовательности. Ось С получена следующим образом: прямой соединены точки, отвечающие за выравнивание, с одной стороны, последовательности некоторого белка с самим собой (100, 100), с другой стороны, последовательностей двух несвязанных белков (5, 25). Синяя ломаная – аналогичная зависимость для выборки гомологов белка RRMJ_Ecoli. Желтая ломаная - зависимость для выборки гомологов белка гемагглютинина. RRMJ 120 моя выборка gen identity 100 прямая сравнения 80 60 вирус гриппа 40 20 0 0 50 100 150 protein identity На первый взгляд они очень похожи. Но… Гемагглютинин – белок, с помощью которого вирус гриппа присоединяется к клеткам человека. Конфигурация аминокислот, определяющих разновидность белка гемагглютинина, часто изменяется, ежегодно появляется новый тип вируса гриппа. График для гемагглютинина соответствует набору мало консервативных последовательностей. График для RRMJ_Ecoli отражает большую консервативность этого белка по сравнению с гемагглютинином.