Слабый отбор и дрейфовый груз в сайтах сплайсинга

advertisement
Слабый отбор и дрейфовый груз в сайтах сплайсинга
Степан Денисов
ИППИ РАН
stepan@bioinf.fbb.msu.ru
Аннотация
Сайты сплайинга (СС) содержат наряду с частыми,
консенсусными
(Cn)
нуклеотидами
редкие,
неконсенсуные (Nc) нуклеотиды. Мы изучили, как
устроен отбор, действующий как на Cn, так и на Nc
нуклеотиды.
Для
этого
мы
использовали
последовательности СС филогенетически близких
видов позвоночных, а также мух рода Drosophila.
Выяснилось, что замены из Cn в Nc происходят реже,
а из Nc в Cn происходят чаще, чем в нейтрально
эволюционирующих
последовательностях,
что
свидетельствует
об
отрицательном
и
положительном отборе, соответственно. Отбор
является относительно слабым (1 < |4Nes| < 4), его
эффективность
приблизительно
одинакова
у
приматов и мух рода Drosophila. В целом,
отрицательный и положительный отбор схожи по
силе (4Nes), что соответствует теоретическому
ожиданию
при
неизменном
ландшафте
приспособленности. Однако, в некоторых позициях
отдельных
СС,
положительный
отбор,
способствующих заменам из Nc в Cn, слабее, чем
отрицательный
отбор,
поддерживающий
существующие Cn нуклеотиды. Эта разница
объясняется
наличием
сайт-специфического
отрицательного отбора, направленного на сохранение
Nc нуклеотидов. Примесь таких СС несколько
уменьшает среднее значение 4Nes для переходов из Nc в
Сn. Несмотря на наличие в части сайтов Nc
нуклеотидов, поддерживаемых отборов, большинство
Nc нуклеотидов являются вредными аллелями,
которые суммарно несут значительный дрейфовый
груз.
1. Введение
Сайты сплайсинга (СС) представляют собой
короткие
последовательности,
находящиеся
на
границах экзонов и интронов. Они необходимы для
корректного сплайсинга молекул мРНК в клетках
эукариотических организмов. Сплайсосома – машина
262
сплайcинга – связывается с СС, расположенных на
концах интрона, вырезает интрон и сшивает экзоны.
Известно, что сплайсосома имеет предпочтения по
последовательности СС, то есть в каждой позиции СС
некоторые нуклеотиды связываются со сплайсосомой
более прочно, чем другие [1, 2]. Хорошо
взаимодействующие со сплайсосомой нуклеотиды
также чаще встречаются в данной позиции и
называются консенсусными (Cn). Соответственно,
редко
встречающиеся
нуклеотиды,
слабо
взаимодействующие со сплайсосомой, называются
неконсенсусными (Nc). Функциональная значимость
СС предположительно означает, что на них действует
сильный стабилизирующий (отрицательный) отбор.
Однако за исключением ключевых динуклеотидов (AG
и GT), СС не столь консервативны, как ожидается при
действии сильного отрицательного отбора. Большое
количество сайтов содержит Nc, т.е. видимо
невыгодные, нуклеотиды. В связи с этим представляет
интерес изучить, как устроен отбор, действующий как
на консенсусные, так и на некосенсусные нуклеотиды.
В частности, важно понять силу отбора и факторы,
которые на нее влияют.
2. Мотивация и теоретическое обоснование
Рассмотрим некий локус в геноме. В этом локусе
может находиться один из четырех нуклеотидов
(аллелей). Если каждый из аллелей дает одинаковый
вклад в приспособленность организма (например, когда
данный локус функционально не важен), то отбор не
действует на такой локус по определению. В
противоположность этому, если один аллель несёт
существенно больший вклад в приспособленность, чем
остальные, то он через некоторое время фиксируется в
популяции в качестве единственного аллеля благодаря
сильному положительному отбору. После этого
зафиксировавшийся аллель будет находиться под
действием сильного отрицательного отбора, который
препятствует увеличению частоты альтернативных
аллелей в популяции.
Однако промежуточная ситуация также возможна:
вклады в приспособленность разных аллелей не равны,
но разница во вкладах невелика (~1/Ne, где Ne эффективный размер популяции). Тогда отбор
недостаточно
силен,
чтобы
воспрепятствовать
фиксации даже вредных аллелей, которая происходит
вследствие генетического дрейфа. Поэтому даже если
ландшафт приспособленности постоянен во времени
(то есть существенно не изменяются условия
окружающей среды и проч.) и низка скорость
мутагенеза (µ << 1/Ne, что верно для рассматриваемых
нами организмов), в данном сайте будут происходить
эпизодические
фиксации
слабовредных
и
слабополезных аллелей благодаря генетическому
дрейфу [3, 4]. Если фиксируется слабополезный аллель,
то на него действует слабый отрицательный отбор,
если слабовредный аллель – слабый положительный
отбор против него [5, 6, 7, 8].
Зафиксировать наличие слабого отбора на геномных
данных можно только при наличии большого числа
локусов, имеющих приблизительно одинаковый
ландшафт приспособленности. Таким набором локусов
могут служить соответствующие позиции сайтов
сплайсинга.
В данной работе мы использовали
несколько десятков тысяч (в геноме D. melanogaster) и
несколько сотен тысяч (в геноме H. sapiens) СС, что
позволило нам довольно точно оценить силу отбора и
проследить, как дополнительные факторы (такие как
сила СС, уровень экспрессии соответствующего гена,
уровень рекомбинации соответствующего участка
генома и др.) влияют на нее.
2. Результаты и обсуждение
Мы сравнили частоту замен происходящих между
консенсусными (Cn, т.е. часто встречающимися) и
неконсенсуными (Nc, редкими) нуклеотидами в
локусах находящихся в СС и в локусах, находящихся в
нейтрально эволюционирующих участках генома.
Замены фиксировались на линии Homo sapiens начиная
с момента расхождения с линией Macaca mulatta и в
линии Drosophila melanogaster начиная с момента
расхождения с линией Drosophila simulans. Сравнение
частот замен в сайтах сплайсинга с соответствующими
частотами
в
нейтрально
эволюционирующих
последовательностях
(нейтральном
контроле)
позволяет выявить случаи положительного и
отрицательного отбора, а также оценить силу отбора.
Мы обнаружили, что во всех позициях СС, если там
находится Cn нуклеотид, то частота замен из Cn в Nc
ниже, чем в нейтральном контроле (p < 10-18, точный
тест Фишера). То есть на Cn нуклеотиды действует
отрицательный отбор. В большинстве позиций СС, где
находится Nc нуклеотид наблюдается положительный
отбор: Nc нуклеотиды заменяются на Cn быстрее, чем в
нейтральном контроле (p < 10-3 для всех выборок за
263
исключением донорных сайтов сплайсинга D.
melanogaster, где разница статистически не значима).
Согласно [9] отношение частоты замен в локусах, на
который действует отбор (с коэффициентом отбора s) к
таковой в нейтральном контроле равно 4Nes/(1-exp(4Nes)). Это отношение мы находим экспериментально
для замен из Cn в Nc и обратно. Отсюда получаем
значение силы отбора 4Nes. Согласно этим расчетам
отбор, действующий на СС как на линии H. sapiens, так
и на линии D. melanogaster является слабым (1 < |4Nes|
< 4).
Предполагая, что ландшафт приспособленности
приблизительно одинаков для соответствующих
позиций всех СС, мы ожидаем увидеть, что
абсолютные значения силы отбора (|4Nes|) будут
одинаковы для положительного отбора, действующего
против Nc нуклеотидов, и отрицательного отбора,
защищающего Cn нуклеотиды [8].
Действительно, это верно для акцепторных СС.
Однако в значительной части позиций донорных СС
положительный отбор,
действующий против Nc
нуклеотидов
оказывается
несколько
слабее
отрицательного отбора, защищающего Cn нуклеотиды.
Этот факт можно интерпретировать следующим
образом. Отбор не всегда предпочитает Cn нуклеотиды.
В выборке донорных сайтов существует примесь
сайтов, где наличие Nc нуклеотида функционально
важно и поэтому Nc находится здесь под действием
отрицательного, а не положительного отбора.
Анализ консервативности Nc нуклеотидов в 45
геномах позвоночных и 15 геномах насекомых
подтвердил функциональную значимость отдельных Nc
нуклеотидов: их консервативность в большинстве
случаев выше, чем в нейтральном контроле и это не
происходит по случайным причинам. Кроме того
показано, что если на Nc нуклеотиды действует
отрицательный отбор, то он сохраняет конкретный
зафиксированный Nc нуклеотид, а не любой из
неконсенсуных нуклеотидов. Это свидетельствует об
отсутствии отбора на слабые сайты, скорее это говорит
о том, что конкретные нуклеотиды в данной позиции
сайта несут параллельную функциональную нагрузку,
что и вызывает их повышенную консервативность.
Таким образом, примесь сайтов с функциональными Nc
нуклеотидами уменьшает среднее значение 4Nes для
положительного отбора против Nc нуклеотидов.
Для того, чтобы изучить возможное влияние
фонового отбора (background selection) и эффекта
”выметания” отбором (selective sweep), мы разделили
выборку СС на две подвыборки: СС, находящиеся в
участках генома с высоким и низким уровнем
рекомбинации. Выяснилось, что сила отбора не зависит
от уровня рекомбинации соответствующего участка
генома, что говорит, что фоновый отбор и ”выметание”
отбором не оказывают существенного влияния на
результат. Это же свидетельствует о том, что эффектом
генетического ”сквозняка” (genetic draft) [10] также
можно пренебречь. Мы показали, что наличие CpG
динуклеотидов в сайтах и нейтральном контроле
практически не влияет на оценку силы отбора. Не
наблюдается значительной разницы между отбором
действующим, на СС конститутивных и кассетных
экзонов. Аналогично, мы показали, что на силу отбора
существенно не влияет сила СС, уровень экспрессии
соответствующего гена. Единственным исключением
является зависимость между силой отрицательного
отбора, действующего на Cn и силой СС: в слабых
сайтах на Cn нуклеотиды действует более сильный
отрицательный отбор, чем в сильных.
Мы восстанавливали матрицы замен двумя
методами: парсимонией и методом максимального
правдоподобия (используя пакет PAML, [11]).
Сравнение методов показало, что результаты
качественно (а зачастую и количественно) схожи.
Грубая оценка величины дрейфового груза говорит,
что сумма коэффициентов отбора, действующих
против всех Nc нуклеотидов в геноме человека равна
~10 для донорных и ~20 для акцепторных СС, что
составляет слишком большую величину и не возможно
теоретически. Наиболее вероятным разрешением этого
парадокса является предположение о наличие
глобального синергического эпистаза (synergistic
epistasis) между СС (или между позициями внутри СС).
В таком случае коэффициенты отбора неаддитивны и
реальный дрейфовый груз может быть существенно
меньшим (Kondrashov 1995; Charlesworth 2013).
Работа выполнена совместно с Г. Базыкиным, Р.
Суторминым, А. Фаворовым, А. Мироновым, М.
Гельфандом и А. Кондрашовым.
Список литературы
[1] G. Ast, How did alternative splicing evolve?, Nat Rev Genet
(2004), 5(10), 773-782.
[2] X. Roca, R. Sachidanandam, A.R. Krainer, Determinants of
the inherent strength of human 5′ splice sites, RNA (2005), 11,
683-698.
[3] M. Kimura, T. Ōta, Theoretical Aspects of Population
Genetics, Princeton University Press, NJ, 1971.
[4] T. Ohta, The Nearly Neutral Theory of Molecular Evolution,
Annu Rev Ecol Syst (1992), 23, 263-286.
[5] W.-S. Li, Models of nearly neutral mutations with particular
implications for nonrandom usage of synonymous codons, J Mol
Evol (1987), 24(4), 337-345.
[6] M. Bulmer, The selection-mutation-drift theory of synonymous
codon usage, Genetics (1991), 129(3), 897-907.
[7] A. Kondrashov, Contamination of the genome by very slightly
deleterious mutations: why have we not died 100 times over?, J
Theor Biol (1995), 175(4), 583-594.
[8] J. Charlesworth and A. Eyre-Walker, The other side of the
nearly neutral theory, evidence of slightly advantageous backmutations, Proc Natl Acad Sci USA (2007), 104(43), 1699216997.
[9] M. Kimura, The neutral theory of molecular evolution,
Cambridge University Press, NY, 1983.
[10] J.H. Gillespie, Is the population size of a species relevant to
its evolution?, Evolution (2001), 55(11), 2161-2169.
[11] Z. Yang, PAML 4: Phylogenetic Analysis by Maximum
Likelihood, Mol Biol Evol (2007), 24(8), 1586-1591.
264
Download