С. В. Козырев МИАН им. В.А.Стеклова p-Адические параметры в теории сложных систем 6 июля, 2010, МФТИ, летняя Школа ПМФ 2010 Спиновые стёкла – p-адическая параметризация матрицы Паризи Динамика белка – уравнение p-адической диффузии Генетический код – 2-адическая плоскость Сложные системы Спиновые стёкла — модель Шеррингтона–Киркпатрика H= N X Jij σi σj i,j=1 σi = ±1 – спины Jij (беспорядок) – симметрическая вещественная гауссовская случайная матрица Jij = Jji , нулевое среднее hJij i = 0 матричные элементы независимы, то есть ненулевые квадратичные корреляционные функции только hJij2 i = 1/N беспорядок — флуктуации в процессе приготовления образца статистическая физика неупорядоченных систем Белок — цепь аминокислот, свёрнутая в компактную глобулу (нативное состояние) Миоглобин проблема устойчивости, проблема фолдинга глобула белка схожа с кривой Пеано (заполнение кривой пространства) ДНК упакована также аналогично кривой Пеано кривая Пеано устроена иерархически Биология — сложные системы (уже на молекулярном уровне) Иерархические методы в теории сложных систем Карл Линней, Systema Naturae, 1735 филогенетическое дерево p-Адические числа p-Адическая норма рационального числа: для простого p x = pγ m , n |x|p = p −γ , |0|p = 0. Поле Qp p-адических чисел — пополнение Q по p-адической норме p-адические числа — ряды x= ∞ X xi p i , xi = 0, . . . , p − 1. i=γ Мера Хаара: инвариантность относительно сдвигов, нормировка: ∞ X {x : |x|p ≤ 1} = { xi p i } i=0 шар с мерой единица. Ультраметричность (сильное неравенство треугольника) |x + y |p ≤ max(|x|p , |y |p ) все треугольники равнобедренны два шара либо не пересекаются, либо один содержит другой шары вложены друг в друга иерархично (дерево иерархии шаров, p = 2) Матрица Паризи и p-адическое расстояние Блочно–иерархическая матрица Паризи (Qab ) (теория спиновых стёкол, метод реплик) 0 q1 q2 q2 q1 0 q2 q2 0 q1 , q2 q2 0 q1 , q1 0 q2 q2 q1 0 0 q1 q2 q2 q3 q3 q3 q3 q1 0 q2 q2 q3 q3 q3 q3 q2 q2 0 q1 q3 q3 q3 q3 q2 q2 q1 0 q3 q3 q3 q3 q3 q3 q3 q3 0 q1 q2 q2 qi суть вещественные параметры. q3 q3 q3 q3 q1 0 q2 q2 q3 q3 q3 q3 q2 q2 0 q1 q3 q3 q3 q3 q2 q2 q1 0 Перестановка строк и столбцов матрицы Паризи p N × p N (в примере p = 2 и N = 1, 2, 3) l : {1, . . . , p N } → p −N Z/Z, l −1 : −1 X xj p j 7→ 1 + p −1 j=−N −1 X xj p −j . j=−N выражает матричный элемент Qab матрицы Паризи как функцию p-адического расстояния между l(a) и l(b): Qab = q(|l(a) − l(b)|p ), где q(p k ) = qk , q(0) = 0, k = 1, . . . , N. −N Группа рассматривается как группа дробей P−1 p Z/Z j { j=−N xj p }, xj = 0, . . . , p − 1 со сложением по модулю 1. иерархия состояний спинового стекла Динамика на ландшафтах энергии Уравнение диффузии в потенциале ∂ f (x, t) = ∆f (x, t) + β∇f (x, t) · ∇U(x) + βf (x, t)∆U(x) ∂t f (x, t) – функция распределения U – потенциал, β = 1/kT – обратная температура. Приближённое описание диффузии в потенциале кинетическими уравнениями переходы между потенциальными ямами – локальными минимумами энергии X d f (a, t) = (Qab f (b, t) − Qba f (a, t)) . dt b Скорость перехода – формула Аррениуса – скорость пропорциональна exp(−β∆E ), ∆E – барьер активации. ∆E = E1 − E0 Сложные энергетические ландшафты Сложный ландшафт — много локальных минимумов. Как построить аррениусовскую кинетику? Наблюдение: три локальных минимума – два переходных состояния. отсюда следует ультраметричность. Пример: локальные минимумы A, B, C , переходное состояние с энергией E1 между A и B, переходное состояние с энергией E2 между (A, B) и C , E1 < E2 матрица переходных энергий 0 E 1 E2 E1 0 E2 . E2 E 2 0 Пример: локальные минимумы A, B, C , D, переходное состояние с энергией E1 между A и B, переходное состояние с этой же энергией между C и D, переходное состояние с энергией E2 > E1 между парами минимумов (A, B) и (C , D) матрица переходных энергий 0 E1 E 2 E2 E1 0 E 2 E2 E2 E 2 0 E1 . E2 E 2 E 1 0 таблица расстояний для ультраметрики Общий случай — дерево локальных минимумов и переходных состояний (disconnectivity graph) иерархия бассейнов барьеры активации — задают ультраметрическое расстояние между локальными минимумами d(x, y ) = E (sup(x, y )) Межбассейновая кинетика Система кинетических уравнений X d f (a, t) = (Qab f (b, t) − Qba f (a, t)) . dt b Сложный ландшафт — (Qab ) есть матрица Паризи. Блоки матрицы Паризи — переходы между бассейнами — межбассейновая кинетика p-адическая параметризация матрицы Паризи даёт Z ∂ f (a, t) = q(|a−b|p )(f (b, t)−f (a, t))dµ(b), ∂t p M Zp /p N Zp интегрирование (суммирование) по мере Хаара на группе p M Zp /p N Zp , нормировка меры: µ(Zp /p N Zp ) = 1. Предел M → −∞, N → +∞ бесконечно много локальных минимумов интегральное уравнение межбассейновой кинетики Z ∂ f (x, t) = q(|x − y |p )(f (y , t) − f (x, t))dµ(y ). ∂t Qp p-Адическая диффузия. M < N, Пример: −1−α q(|x|p ) = Γ−1 , p (−α)|x|p уравнение p-адической диффузии ∂ f (x, t) + Dxα f (x, t) = 0 ∂t порождаемой дробным оператором Владимирова Z f (x, t) − f (y , t) α −1 Dx f (x, t) = Γp (−α) dµ(x) |x − y |1+α Qp p α пропорционально обратной температуре: α = βk. — описывает динамику белка. x — конформации белка Воспроизводит результаты экспериментов Фрауенфельдера по динамике миоглобина Генетический код ДНК (РНК) — конечные последовательности (линейные полимеры) нуклеотидов белок — конечная последовательность аминокислот Нуклеотиды: C, A, T (или U), G Cytosine, Adenine, Thymine (или Uracil), Guanine Триплетная структура генетического кода (Гамов) Кодон — тройка C1 C2 C3 нуклеотидов Генетический код — переводит кодоны в аминокислоты 20 аминокислот и 1 символ остановки 4 нуклеотида, 4 × 4 × 4 = 64 кодонов 64 > 21 — проблема вырождения генетического кода AAA Lys AAU Asn AAG Lys AAC Asn UAA Ter UAU Tyr UAG Ter UAC Tyr GAA Glu GAU Asp GAG Glu GAC Asp CAA Gln CAU His CAG Gln CAC His AUA Met AUU Ile AUG Met AUC Ile UUA Leu UUU Phe UUG Leu UUC Phe GUA GUU GUG GUC Val Val Val Val CUA CUU CUG CUC Leu Leu Leu Leu AGA AGU AGG AGC UGA UGU UGG UGC GGA GGU GGG GGC Gly Gly Gly Gly CGA CGU CGG CGC Arg Arg Arg Arg ACA Thr UCA Ser GCA Ala CCA ACU Thr UCU Ser GCU Ala CCU ACG Thr UCG Ser GCG Ala CCG ACC Thr UCC Ser GCC Ala CCC митохондриальный генетический код Pro Pro Pro Pro Ter Ser Ter Ser Trp Cys Trp Cys 2-Адическая плоскость кодонов 1) Занумеруем нуклеотиды парами 0,1 A G 00 01 = U C 10 11 (A) Химический смысл: 1-ая строка — пурины 2-ая строка — пиримидины 1-ый столбец — слабая H-связь 2-ой столбец — сильная H-связь 2) Порядок нуклеотидов в кодоне 2>1>3 (B) 3) 2-Адическая плоскость — группа Z/8Z × Z/8Z с координатами (x, y ): x = (x0 x1 x2 ) = x0 + 2x1 + 4x2 , xi = 0, 1, y = (y0 y1 y2 ) = y0 + 2y1 + 4y2 , yi = 0, 1. с 2-мерной 2-адической метрикой d((x, y ), (x 0 , y 0 )) = max(|x − x 0 |2 , q|y − y 0 |2 ), 1/2 < q < 1. 4) Отображение кодонов ρ переводит кодон в точку 2-адической плоскости ρ : C1 C2 C3 7→ (x, y ) = (x0 x1 x2 , y0 y1 y2 ), C2 определяет пару (x0 , y0 ), C1 определяет пару (x1 , y1 ), C3 определяет пару (x2 , y2 ). Нуклеотиды определяют пары цифр по правилу (A), порядок пар задаётся правилом (B). 5) Перенумеровка строк и столбцов Занумеруем строки и столбцы 2-адической плоскости: η : x 7→ e x, y 7→ ye; η : x0 + 2x1 + 4x2 7→ 1 + 4x0 + 2x1 + x2 ; η : y0 + 2y1 + 4y2 7→ 1 + 4y0 + 2y1 + y2 . Эквивалентно: η : 0, 4, 2, 6, 1, 5, 3, 7 7→ 1, 2, 3, 4, 5, 6, 7, 8. (чтобы близкие 2-адически элементы были расположены в соседних клетках плоскости) 2-Адическая плоскость кодонов AAA AAG AAU AAC UAA UAG UAU UAC GAA GAG GAU GAC CAA CAG CAU CAC AGA AGG AGU AGC UGA UGG UGU UGC GGA GGU CGA CGU AUA AUG AUU AUC UUA UUG UUU UUC GUA GUU CUA CUU ACA ACG ACU ACC UCA UCG UCU UCC GCA GCG GCU GCC CCA CCG CCU CCC GUG GUC CUG CUC GGG GGC CGG CGC с метрикой d(C1 C2 C3 , C10 C20 C30 ) = max(|x − x 0 |2 , q|y − y 0 |2 ), (x, y ) = ρ(C1 C2 C3 ), 1/2 < q < 1, (x 0 , y 0 ) = ρ(C10 C20 C30 ). Применим к плоскости кодонов митохондриальный код: Lys Asn Ter Tyr Met Ile Leu Phe Glu Asp Gln His Ter Ser Trp Cys Val Thr Ala Leu Ser Pro Gly Arg В частности AAA AAG Lys → , AAU AAC Asn CCA CCG → Pro CCU CCC Вырождение генетического кода описывается метрикой d(·, ·): кодоны, отображающиеся на одинаковые аминокислоты — шары относительно метрики d(·, ·). Иерархические методы для сложных систем Спиновые стёкла – p-адическая параметризация матрицы Паризи Динамика белка – уравнение p-адической диффузии Генетический код – 2-адическая плоскость непостижимая эффективность математики в естественных науках непостижимая неэффективность математики в биологии возможно, нужны новые математические методы