ТЕМЫ ВЫПУСКНЫХ КВАЛИФИКАЦИОННЫХ РАБОТ (2014-2015 учебный год) Профессор Никитин Я.Ю. 1. Предельные теоремы для периметров и площадей случайных многоугольников. Представим себе единичную окружность, на которой ставится n равномерно распределенных случайных точек. Будем выбирать всевозможные подмножества из k<n точек и строить по ним вписанные и описанные случайные многоугольники. Интересно изучать средние значения их периметров и площадей, а также изучать предельное поведение максимальных и минимальных значений этих характеристик. Ответы на эти и подобные задачи формулируются в терминах так называемых U-max статистик, теория которых только начала разрабатываться. Для ориентировки предлагаю статью E.V.Koroleva, Ya. Yu. Nikitin. U-max-statistics and limit theorems for perimeters and areas of random polygons. Journal of Multivariate Analysis 127(2014), N 5, 98–111. 2. Экспоненциальная длительность исторических периодов. Как известно, человеческая жизнь распределена неэкспоненциально, а как именно – об этом до сих пор спорят статистики и демографы. Вместе с тем в последние годы появилось мнение, что исторические периоды – например, длительности правления царей, времена существования империй и т.д. , как правило, имеют экспоненциальные распределения. Предлагается разобраться в этом с помощью критериев экспоненциальности и попутно научиться сравнивать эти критерии (весьма многочисленные) между собой. Для ориентировки предлагаю статью E V Khmaladze, R Brownrigg, and J Haywood. Memoryless reigns of the “Sons of Heaven”. International Statistical Review, 78(3): 348— 362, 2010. 3. Новые подходы к проверке авторства литературных произведений. Эта тема изучается долгие годы и литература почти неисчерпаема. Статистический подход к проверке авторства и атрибуции произведений традиционно основывался на распределении длины слова в текстах. В последние годы предлагалось изучать другие характеристики, например, основанные на доле служебных слов. В любом случае необходимо изучить применение статистических критериев для проверки однородности дискретных данных, таких как знаменитый критерий хи-квадрат, и других, более современных. Примечание. Эти темы являются продолжением курсовых на 3-м курсе. Если их исполнители не пожелают их продолжать, то темы освободятся. Профессор Лифшиц М.И. 1. Графы социальных сетей: стохастические модели и реальность Целью работы является изучение математических моделей больших сетей социальной природы (Facebook, "Вконтакте", "Одноклассники" и др.) В работе предлагается сопоставить математические свойства фрагментов реальных сетей и графов, генерируемых на основе математических моделей. 2. Предельные теоремы в многомерных обобщениях моделей телетрафика Целью работы является изучение разнообразных предельных теорем теории вероятности на примере многомерных моделей, обобщающих классические модели телетрафика. Литература: Lifshits M.A. Random Processes by Example. World Scientific, 2014, 230 pp. 3. Дважды дробные броуновские движения Целью работы является точное определение класса дважды дробных броуновских движений, уточнение способов моделирования и их роли в предельных теоремах для импульсной модели Мандельброта Профессор Невзоров В.Б. 1. Неклассические варианты задачи оптимиального выбора В известной классической проблеме оптимального выбора ( “задаче о разборчивой невесте”) исследуются методы выбора максимальной порядковой статистики в ситуации, когда имеем дело с n последовательно получаемыми наблюдениями. Предлагается рассмотреть варианты этой задачи, когда целью является получение максимального или минимального (любого одного из них!) или пары, состоящей из максимального и минимального из n последовательно наблюдаемых значений выборки. 2. Дискретные варианты Fα-схемы и рекордные индикаторы Одним из обобщений классической рекордной модели является так называемая Fαсхема, в которой мы имеем дело с последовательностями независимых случайных величин, функции распределения которых имеют вид Fα(k), k=1,2,…, где F-некоторая непрерывная функция распределения, а α(k), k=1,2,…- произвольные положительные константы. В этой схеме индикаторы появления на k-ом месте рекордной величины независимы. Для дискретных исходных независимых одинаково распределенных X-ов, принимающих целые неотрицательные значения, рассматривают другие индикаторы , которые равны единице, если соответствующее значение k является рекордом, и равны нулю иначе. Предлагается построить для дискретных распределений аналог Fα-схемы, когда исходные случайные величины не являются уже одинаково распределенными, но сохраняют свойство независимости соответствующих рекордных индикаторов. Профессор Петров В.В. 1. О лемме Бернштейна. С.Н.Бернштейн (Собр. соч., том 4, М. 1964, с. 131-132) показал, что сумма двух случайных величин имеет асимптотически нормальное распределение, если этим свойством обладает одно из слагаемых, а другое в некотором смысле пренебрежимо мало. Предлагается найти оценку скорости сходимости в этой лемме Бернштейна. 2. Оценки функции концентрации суммы независимых случайных величин. Предлагаются поиски усилений известных результатов этого типа при различных предположениях о распределениях слагаемых. См. В.В.Петров, Предельные распределения для сумм независимых случайных величин. М. 1987., глава 3, теоремы 8 11. Профессор Фролов А.Н. 1. Комбинаторная ЦПТ и оценки в ней. Комбинаторной центральной предельной теоремой (ЦПТ) называются теоремы, содержащие достаточные условия для асимптотической нормальности \sum_{i=1}^n X(i,p(i)), X(i,j) – независимые случайные величины, p(i) – случайная перестановка чисел 1, 2, …, n. Имеется довольно обширная литература, посвященная комбинаторной ЦПТ и оценкам остаточного члена в ней, подобным классическим неравенствам Эссеена и Берри-Эссеена. При доказательствах используется метод Стейна. 2. Предельные теоремы для больших приращений случайных последовательностей и процессов. Если {X(n)} – случайная последовательность, то X(n+a(n))-X(n), где a(n) растет быстрее ln n, называются большими приращениями. Предельным теоремам о п.н. поведении больших приращений посвящена значительная литература. Большие приращения (в отличие от малых) обладают тем свойством, что нормирующая последовательность в предельных теоремах для них определяется некоторыми численными характеристиками X(n+1)-X(n), а не всем распределением/-ями. Для их изучения используют сильную аппроксимацию или метод больших уклонений. Профессор Бородин А.Н. 1. Теорема Рэя о марковости броуновского локального времени. В работе предлагается проверить, для каких конкретных моментов остановки выполняются условия теоремы Рэя об описании остановленного броуновского локального времени, как марковского процесса по пространственной переменной. Профессор Зайцев А.Ю. 1. Функции концентрации сверток вероятностных распределений Функция концентрации распределения случайной величины определяется как максимальная вероятность попадания случайной величины в отрезок заданной длины. В выпускной работе предлагается изучить результаты о поведении функций концентрации распределений сумм независимых слагаемых и, по возможности, получить новые результаты. 2. Оценки точности аппроксимации в центральной предельной теореме для L1- нормы ядерных оценок плотности. В выпускной работе предлагается изучить работы 1. Zaitsev A.Yu. Estimates of the rate of approximation in the Central Limit Theorem for L1norm of kernel density estimators. In: High Dimensional Probability. III, Progress in Probability, v. 53. (E. Giné, M. Marcus, J.A. Wellner Eds.) Basel: Birkhäuser, 2003, p. 255-292. 2. Зайцев А.Ю. Умеренные уклонения для L1-нормы ядерных оценок плотности. Вестник Санкт-Петербургского Государственного Университета. Сер. 1: Математика, Механика, Астрономия, 2005, вып. 4, с. 21-33. На их основе предполагается получить оценки точности аппроксимации в центральной предельной теореме для L1-нормы ядерных оценок плотности для конкретных классов плотностей. Доцент Ананьевский С.М. 1. Задачи случайного покрытия отрезка. В данной теме предполагается изучать различные процессы случайного покрытия отрезка интервалами случайной длины, провести описание этих процессов и их некоторых свойств. На эту тему известно множество работ различных авторов. По этой теме предполагается для начала познакомиться с предложенной руководителем литературой и попытаться решить ряд возникающих по этой теме задач. Литература у руководителя. Доцент Гордин М.И. 1. Центральная предельная теорема для простых и кратных стохастических интегралов по процессу Пуассона В простейшем варианте речь идёт о нахождении условий сходимости к нормальному распределению сумм по процессу Пуассона, рассматриваемых в теореме Кэмпбелла. В случае успеха возможны обобщения на кратные суммы такого рода. Литература. 1.J.F.C. KINGMAN. POISSON PROCESSES.1993, ГЛ.3. 2.D.NUALART, G. PECCATI. CENTRAL LIMIT THEOREMS FOR SEQUENCES OF MULTIPLE STOCHASTIC INTEGRALS Annals of Probability 2005: 33,1, 177–193. 2. Случайные множества и графики случайных процессов. Литература. Ж.МАТЕРОН. СЛУЧАЙНЫЕ МНОЖЕСТВА И ИНТЕГРАЛЬНАЯ ГЕОМЕТРИЯ. М.,1978, ГЛ.2. Электронная почта: gordin@pdmi.ras.ru Доцент Грибкова Н.В. 1. Оценка интенсивности циклического пуассоновского процесса. В дипломной работе предлагается рассмотреть неоднородный процесс Пуассона с периодической функцией интенсивности. Известно несколько статей, в которых авторы разрабатывают непараметрические методы оценки периода функции интенсивности и самой функции интенсивности. В дипломной работе предлагается изучить эти методы и попытаться продвинуться в исследовании статистических свойств оценок. ЛИТЕРАТУРА: [1] Bebbington, M., Zitikis, R. (2004), A robust heuristic estimator for the period of a Poisson intensity function, Methodology And Computing In Applied Probability 6(4), 441-462. [3] Belitser, E, Serra, P. van Zanten, H. (2013), Estimating the Period of a Cyclic NonHomogeneous Poisson Process, Scandinavian Journal of Statistics, v.40, N 2, p. 204–218. [2] Helmers, R., Mangku, I. W. (2003), On estimating the period of a cyclic Poisson process, in Mathematical statistics and applications: Festschrift for Constance van Eeden, p. 345-356. 2. Оценки точности нормальной аппроксимации для слабо усеченных сумм. Пусть 𝑋1, , 𝑋2 … -- последовательность независимых одинаково распределенных случайных величин, 𝑋1:𝑛 ≤· · · ≤ 𝑋𝑛:𝑛 , -- порядковые статистики, соответствующие первым n элементам последовательности. Слабо усеченной суммой называется 𝑛−𝑚𝑛 статистика вида 𝑇𝑛 = ∑𝑖=𝑘 +1 𝑋𝑖:𝑛 , где 0 ≤ 𝑘𝑛 < 𝑛 − 𝑚𝑛 ≤ 𝑛 , min(𝑘𝑛 𝑚𝑛 ) → ∞, 1 𝑛 𝑚𝑎𝑥(𝑘𝑛 𝑚𝑛 ) → 0 при 𝑛 → ∞. n Необходимые и достаточные условия асимптотической нормальности распределения нормированной статистики. 𝑇𝑛 были найдены в работе [1]. В статье [2] получены оценки скорости сходимости к нормальному закону типа Берри – Эссена для широкого класса статистик вида 𝑇𝑛 = 𝜏(𝑋1 , … , 𝑋𝑛 ), где 𝜏 – симметричная функция 𝑛 переменных. В дипломной работе предлагается изучить статьи [1], [2] и применить метод из статьи [2] для получения оценок скорости сходимости к нормальному закону распределения 𝑇𝑛 . ЛИТЕРАТУРА: [1]. Csörgő. S, Haeusler E and Mason D. The asymptotic distribution of trimmed sums . – Annals of Probability, 1988, v. 16, p. 672-699. [2]. Van Zwet, W.R. A Berry – Esseen bound for symmetric statistics . – Z. Wahrsch. Verw. Gebiete, 1984, v. 66, p. 425-440. E-mail: nv.gribkova@gmail.com Доцент Малов С.В. 1. Методы контроля FDR в задаче интерпретации результатов множества тестов. Проблема совместной интерпретации результатов множества статистических тестов состоит в выявлении зависимостей наблюдаемой переменной от широкого набора признаков или комбинаций признаков, изучаемых по отдельности. Концептуально данная задача может быть сформулирована в терминах идентификации сигналов, где сигналом является наличие зависимости наблюдаемой переменной от ковариаты. Одновременно рассматриваются результаты огромного множества статистических тестов (значения статистик критериев), многие из которых показывают значимое отклонение от независимости по чисто случайным причинам. Для выявления сигналов в случае небольшого их числа можно использовать так называемую поправку Бонферрони, гарантирующую, что вероятность выявления хотя бы одного ошибочного сигнала не превышает наперед заданного уровня. Для независимых тестов можно использовать поправку Данна–Шидака, но в случае малого числа сигналов она практически не отличается от поправки Бонферрони. Для увеличения числа выявленных сигналов используют более слабый контроль, ограничивающий средний процент ошибочно выявленных сигналов (FDR-False Discovery Rate). Предлагается изучить известные подходы и современные методы контроля FDR в случае зависимых результатов тестов (статистик критериев) и, возможно, модернизировать методы идентификации сигнала для некоторых специальных случаев. В первую очередь предлагается детально изучить случай простейших категориальных тестов для таблиц сопряженности 2X2. Литература. Benjamini, Y. & Hochberg, Y. (1995) Controlling the false discovery rate: a practical and powerful approach to multiple testing. J.R.Statist.Soc. B, 57,289–300. Benjamini, Y. & Yekutieli, D. (2001) The Control of the False Discovery Rate in Multiple Testing under Dependency. The Annals of Statistics 29(4), 1165–1188. Storey, J.D. (2002) A direct approach to false discovery rates. J.R.Statist.Soc. B, 64, 479 – 498. 2. О скорости эволюции генов. В середине XX века было установлено, что вся информация о структуре рибонуклеиновых кислот (РНК) и белков, определяющих свойства всех известных организмов, закодирована в молекуле дезоксирибонуклеиновой кислоты (ДНК), которая находится в каждой клетке. Генетическая информация в молекуле ДНК кодируется последовательностью четырех видов нуклеотидов, обозначаемых буквами (символами) «A», «G», «T»,«C», по первым буквам названий четырех видов азотистых оснований, входящих в состав соответствующих нуклеотидов. Последовательность ДНК подвержена изменениям (мутациям), часть из которых сохраняется в следующих поколениях. Простейшие мутации представляют собой замену одного нуклеотида на другой. Можно считать, что замены нуклеотидов происходят независимо и удовлетворяют Марковскому свойству. Белок представляет собой упорядоченный набор аминокислот. Известно 20 аминокислот, из которых состоят белки. Каждая аминокислота кодируется тройкой нуклеотидов (кодоном). Код каждого белка начинается определенным кодоном (старткодоном) и заканчивается одним из двух стоп-кодонов. Подпоследовательность нуклеотидов, начинающаяся старт-кодоном и заканчивающаяся стоп-кодоном называется открытой рамкой считывания. В случае если белок несет определенную функцию, то уменьшение соответствующей открытой рамки считывания (в силу мутации) ведет к потере данной функции и гибели организма, тогда как ее увеличение может привести к эволюции гена и появлению новой функции. Целью данной работы будет изучение скорости эволюции гена путем простейших мутаций типа «замена» на базе имеющихся оценок вероятностей однонуклеотидных замен. Литература. Феллер В. Введение в теорию вероятностей и ее приложения. М.: «Мир», 1970. Карлин С. Основы теории случайных процессов. М.: «Мир», 1971. Доцент Валландер С.С. 1. Стохастическая модель эпидемии (тема НЕ прикладная!!). Лит. G.Grimmett. Probabilities on graphs. 2009. 2. Случайные деревья. Лит. M.Drmota. Random trees. 2009. Доцент Пусев Р.С. 1. Теоремы сравнения для вероятностей малых уклонений гауссовских процессов (для обучающихся по направлению «Математика»). В недавних статьях [1,2] был предложен метод доказательства теорем сравнения для вероятностей малых уклонений весовых L2-норм гриновских гауссовских процессов. С помощью этого метода были доказаны теоремы сравнения в случае, когда весовые функции являются невырожденными (отделенными от нуля и бесконечности) и достаточно гладкими. Цель работы – получение теорем сравнения для малых уклонений L2-норм винеровского процесса (и родственных ему процессов) с некоторыми вырожденными весами. 1. Я. Ю. Никитин, Р. С. Пусев, “Точная асимптотика малых уклонений для ряда броуновских функционалов”, ТВП, 57:1 (2012), 98–123 2. А. И. Назаров, Р. С. Пусев, “Теоремы сравнения для вероятностей малых уклонений весовых L2-норм гриновских гауссовских процессов”, Алгебра и анализ, 25:3 (2013), 131–146 2. Оценка параметров и проверка гипотез для логистического распределения (для обучающихся по направлению «Математика и компьютерные науки»). Цель работы – предложить, исследовать и реализовать в виде пакета для системы R алгоритмы для вычисления оценок максимального правдоподобия параметров логистического распределения, а также разработать пакет для R для проверки согласия с логистическим распределением и исследовать с его помощью некоторые характеристики критериев. Литература у руководителя. Доцент Русаков О.В. 1. Пуассоновские процессы со случайным запаздыванием. Рассматриваются пуассоновские потоки. Каждое событие такого потока фиксируется через случайное время – время запаздывания. В результате возможна перестановка натурального порядка событий исходного пуассоновского потока. При этом порождается вероятностная мера на элементах группы подстановок (перестановок) при каждом фиксированном количестве событий пуассоновского потока на некотором заданном временном интервале. Предлагается исследовать эти вероятностные меры для случая, когда запаздывания независимы, одинаково распределены и распределение времени запаздывания имеет закон Гамма-распределения. Работа предполагает компьютерное моделирование. 2. Пуассоновские субординаторы для последовательностей типа авторегрессии первого порядка с дискретно распределённым шумом. Изначально задаётся последовательность авторегрессии первого порядка с шумом, имеющим распределение в конечном множестве атомов. Известно, что если коэффициент регрессии по модулю меньше единицы, то существует стационарное распределение, но оно может быть «экзотического» фрактального вида, в некоторых случаях имеющее сингулярный тип. Путём применения пуассоновской субординации (подчинения) мы такие последовательности вкладываем в непрерывное время. Предлагается исследовать суммы независимых субординаторов подобного вида. Задача имеет приложения в теории принятия решений и предполагает компьютерное моделирование. Литература: по обеим темам – у научного руководителя Доцент Солев В.Н. 1. Оценивание сигнала на фоне стационарного шума. Предположим, что наблюдается случайный процесс Y(t)=S(t)+X(t) на отрезке большой длины. Здесь S(t) – неизвестная функция, X(t) – стационарный процесс (помеха). Какую информацию о спектральных характеристиках помехи нужно знать, для того, чтобы эффективно оценивать неизвестный сигнал S(t)? 2. Метод наименьших квадратов. Предположим, что наблюдается случайный процесс Y(t)=S(t)+X(t). Здесь S(t) – детерминированная функция, лежащая в линейном множестве L, X(t) – случайный процесс с нулевым средним. Пусть d(.,.) – некоторая метрика в пространстве функций. Оценкой наименьших квадратов будем называть элемент из L, ближайший (в метрике d) к наблюдаемой функции Y(t). Предлагается исследовать точность оценивания методом наименьших квадратов в зависимости от выбора d и спектральных характеристик помехи X(t). Доцент Якубович Ю.В. 1. Свойства выборок из случайных симплексов. Предлагается исследовать свойства случайной точки случайного симплекса, натянутого на вектора Xi ei, i = 1,…,∞, где Xi – независимые случайные величины, а ei – базисные вектора в бесконечномерном пространстве. Литература предоставляется по запросу. 2. Локальная предельная теорема для решетчатых распределений специального вида. Предлагается изучить методы доказательства локальных предельных теорем для целочисленных случайных величин и применить их для доказательства локальной предельной теоремы для независимых случайных величин с не одинаковыми, но специальным образом связанными распределениями. Полученные результаты предполагается применить для доказательства существования предельной формы диаграмм Юнга при различных статистиках на диаграммах. Литература предоставляется по запросу.