МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Российская академия наук Московский физико-технический институт УДК 519.6(06) ББК 22.1 Т78 (государственный университет) Российский фонд фундаментальных исследований Федеральная целевая программа «Научные и научно-педагогические кадры инновационной России» на 2009--2013 годы Фонд содействия развитию малых форм предприятий в научно-технической сфере ТРУДЫ Т78 Труды 53-й научной конференции МФТИ «Современные проблемы фундаментальных и прикладных наук». Часть VII. Управление и прикладная математика. Том 2. — М.: МФТИ, 2010. — 144 с. ISBN 978-5-7417-0401-1 53-й НАУЧНОЙ КОНФЕРЕНЦИИ МФТИ Современные проблемы фундаментальных и прикладных наук Часть VII Управление и прикладная математика Второй том посвящен преимущественно направлениям, связанным с компьютерными технологиями: программированию, интеллектуальному анализу данных, системному программированию, системам математического обеспечения. Содержится большое количество приложений отмеченных технологий к решению конкретных востребованных задач математического моделирования, распознавания и прогнозирования. Том 2 УДК 519.6(06) ББК 22.1 Москва–Долгопрудный МФТИ 2010 ISBN 978-5-7417-0401-1 c ГОУ ВПО «Московский физико-технический институт (государственный университет)», 2010 ФУПМ-2 53-я научная конференция МФТИ 3 Секция информатики Программный комитет Кудрявцев Н.Н., чл.-корр. РАН, ректор института — председатель Кондранин Т.В., профессор, первый проректор — зам. председателя Стрыгин Л.В., доцент — учёный секретарь конференции Алфимов М.В., академик, директор Центра фотохимии РАН Андреев А.Ф., академик РАН, директор ИФП РАН Беляев С.Т., академик РАН, зав. кафедрой МФТИ Велихов Е.П., академик РАН, президент РНЦ «Курчатовский институт» Гуляев Ю.В., академик РАН, директор ИРЭ РАН Дмитриев В.Г., чл.-корр. РАН, зав. кафедрой МФТИ Иванников В.П., академик РАН, директор ИСП РАН Коротеев А.С., академик РАН, директор Центра им. М.В. Келдыша Кузнецов Н.А., академик РАН, зав. кафедрой МФТИ Макаров В.Л., академик-секретарь Отделения ОН РАН, дир. ЦЭМИ РАН Петров А.А., академик РАН, заведующий отделом ВЦ РАН Фортов В.Е., академик-секретарь Отделения ЭММПУ РАН Патон Б.Е., академик, президент НАН Украины Шпак А.П., академик, первый вице-президент НАН Украины Черепин В.Т., чл.-корр. НАН Украины, директор ФТЦ НАНУ Жданок С.А., академик-секретарь Отделения ФТН НАН Беларуси Гаричев С.Н., д.т.н., декан ФРТК Трунин М.Р., д.ф.-м.н., декан ФОПФ Негодяев С.С., к.т.н., декан ФАКИ Грознов И.Н., доцент, декан ФМБФ Тодуа П.А., профессор, декан ФФКЭ Вышинский В.В., профессор, декан ФАЛТ Шананин А.А., профессор, декан ФУПМ Леонов А.Г., профессор, декан ФПФЭ Кривцов В.Е., доцент, декан ФИВТ Ковальчук М.В., чл.-корр. РАН, декан ФНБИК Деревнина А.Ю., д.т.н., декан ФИБС Кобзев А.И., профессор, декан ФГН Алёхин А.П., профессор, зав. кафедрой Астапенко В.А., д.ф.-м.н., зав. кафедрой Белоусов Ю.М., профессор, зав. кафедрой Бугаёв А.С., академик РАН, зав. кафедрой Щелкунов Н.Н., доцент, зав. кафедрой Гуз С.А., доцент, зав. кафедрой Иванов А.П., профессор, зав. кафедрой Кваченко А.В., к.т.н., зав. кафедрой Никишкин В.А., к.ф.-м.н., зав. кафедрой Лукин Д.С., профессор, зав. кафедрой Максимычев А.В., д.ф.-м.н., зав. кафедрой Петров И.Б., профессор, зав. кафедрой Половинкин Е.С., профессор, зав. кафедрой Сон Э.Е., член-корр. РАН, зав. кафедрой Тельнова А.А., доцент, зав. кафедрой Трухан Э.М., профессор, зав. кафедрой Холодов А.С., чл.-корр. РАН, зав. кафедрой Энтов Р.М., академик РАН, зав. кафедрой УДК 519.63 С.Н. Агаханов, И.Е. Квасов sergahan@gmail.com, i.kvasov@gmail.com Московский физико-технический институт (государственный университет) Численное построение осредненной модели трещиноватого пласта в геологической среде В работе проводится построение осредненной модели трещиноватого пласта с использованием неструктурированных треугольных сеток. Для численного моделирования используется сеточно-характеристический метод [1], учитывающий физические особенности задачи и позволяющий явно выделять границы неоднородностей. Проводится сравнение волновых картин откликов от пласта трещин и осредняющего прямоугольника — однородной среды, замещающей трещиноватый пласт. Вводится норма разности сейсмограмм для поиска оптимальных упругих параметров (плотности, скорости звука) осредняющей среды. При разной плотности заполнения коридора трещинами вычисляются значения упругих характеристик, удовлетворяющих минимуму нормы разности сейсмограмм. Исследуется зависимость оптимальных параметров от плотности заполнения коридора. На рис. 1 показана волновая картина отклика от коридора трещин. На рис. 2 показана поверхность, аппроксимирующая норму при разных упругих параметрах прямоугольника. Видно, что функция разности сейсмограмм от скоростей звука в осредненной среде носит сложный характер и имеет пологий минимум, что затрудняет анализ закономерностей. На рис. 3 и 4 показаны графики зависимости эффективных параметров прямоугольника от плотности расположения трещин в пласте. Видно, что продольная скорость звука остается практически равной скорости звука вмещающего массива. Сдвиговая скорость звука при небольшом количестве трещин также близка к Секция информатики 5 6 53-я научная конференция МФТИ ФУПМ-2 скорости звука в окружающей среде, однако с ростом количества трещин мы наблюдаем монотонное (при большом количестве трещин — близкое к линейному) уменьшение сдвиговой скорости звука. Полученные результаты имеют важное практическое значение для сейсморазведки, позволяя строить численные модели реальных месторождений, в отличие от различных эмпирических соотношений [2]. Литература 1. Магомедов К.М., Холодов А.С. О построении разностных схем для уравнений гиперболического типа на основе характеристических соотношений // Ж. вычисл. матем. и матем. физ. — 1969. — Т. 9, № 2. — С. 373--386. 2. Молотков Л.А., Бакулин А.В. Эффективная модель слоистой упруго-пористой среды // ДАН. — 2000. — Т. 372, №1. — С. 108--112. Рис. 2. Поверхность, аппроксимирующая норму Рис. 1. Волновая картина отклика Рис. 3. График зависимости продольной скорости звука от плотности трещин Секция информатики 7 Рис. 4. График зависимости сдвиговой скорости звука от плотности трещин УДК 004.032.24 Е.П. Антышев eantyshev@mail.ru Московский физико-технический институт (государственный университет) Компания «Parallels» («SWsoft») Модель распределения ресурсов процессора и сетевого устройства Введение. Одним из факторов, определяющих выигрыш от использования параллельных алгоритмов, помимо возможности одновременного использования нескольких процессоров, является возможность одновременного использования других ресурсов операционной системы: сетевой полосы и диска. Здесь мы рассматриваем то подавляющее множество ситуаций, когда алгоритм носит линейный характер и выполнение каждой операции информационно зависимо от результатов предыдущей. В этих условиях становится невозможным использование overlapped-операций, неблокирующих сокетов и других методов, призванных решить данную проблему в рамках одного процесса или потока. 8 53-я научная конференция МФТИ ФУПМ-2 Если для выигрыша от распараллеливания программы за счет одновременного использования многих CPU существует инуитивно понятная формула — закон Амдаля [7], — то в случае одновременного использования нескольких ресурсов не обойтись без численного моделирования, подобного тому, что выполнено в данной работе. Основной сложностью для умозрительного моделирования подобных ситуаций является непредсказуемое «наложение» потребностей запросов, приводящее к сильному замедлению выполнения. Моделирование системы задач, использующих несколько общих ресурсов, необходимо и в задачах прикладного администрирования серверов, обслуживающих большое количество запросов; возникает необходимость предсказания поведения в критических ситуациях, таких, как единовременное скачкообразное повышение числа запросов, временный недостаток одного из ресурсов, вызванный процедурой бэкапа или другой активностью. В случае так называемой «живой» миграции виртуальных серверов также имеет место кратковременный недостаток ресурсов при сохранении числа поступающих запросов. Целью нашей работы являются разработка модели распределения ресурсов операционной системы среди системы идентичных задач и численное моделирование простого случая — выполняемые задачи используют только два ресурса: процессора и сетевого устройства (рис. 1, 2, 3, 4). Литература 1. Тормасов А.Г. Модель потребления ресурсов вычислительной системой // Вестник НГУ. Сер. Информационные технологии. — 2006. — Т. 4, Вып. 1. 2. Руссинович М ., Соломон Д. Внутреннее устройство Microsoft Windows. — СПб.: Русская редакция, 2008. — 992 с. 3. Лобанов А.И., Петров И.Б. Численные методы решения уравнений в частных производных. — URL: http://www.intuit.ru/department/calculate/nmdiffeq/ 4. Рябенький В.С. Введение в вычислительную математику: Учеб. пособие. — М.: Физматлит, 2000. — 296 с. 5. Бахвалов Н.С. Жидков Н.П. Кобельков Г.М. Численные методы. — М.: Бином, 2003. — 630 с. 6. Годунов С.К. Рябенький В.С. Разностные схемы (введение в теорию) — М.: Наука, 1977. — 440 с. Секция информатики 9 10 53-я научная конференция МФТИ ФУПМ-2 7. Foster I. Designing and Building Parallel Programs. — URL: http://www.mcs.anl.gov/ ∼ itf / dbpp / 8. Колмогоров А.Н., Фомин С. В Элементы теории функций и функционального анализа. — М.: Наука, 1981. 9. Арнольд В. И Обыкновенные дифференциальные уравнения. — М.: Наука, 1984. — 272 с. Рис. 3. Количество выполняющихся задач Рис. 1. Функции потребления процессора и сети одной задачей Рис. 4. Длина очереди процессора (сравнение с экспериментом) Рис. 2. Экспериментальная и смоделированная загрузка CPU Секция информатики 11 УДК 517.19 С.Л. Бабичев1,2 , А.К. Коньков1,2 , К.А. Коньков1 bs@phystechsoft.com, akonkov@strongdisk.ru, konkov@strongdisk.ru 1 Московский физико-технический институт (государственный университет) 2 ООО «Физтех-софт» Об оптимальном использовании ресурсов вычислительной системы для реализации модифицированной защищенной среды Модифицированная защищенная среда (МЗС), рассмотренная в [4, 5, 6], представляет собой слой программного обеспечения, находящийся между пользователем и оборудованием и интенсивно использует ресурсы вычислительной системы. При её функционировании создаётся ряд программных компонентов, в числе которых драйвер виртуального устройства ввода / вывода (ВУВВ), имитирующего жёсткий диск и сервис, обрабатывающий запросы ввода-вывода драйвера и преобразующий информацию согласно заданных алгоритмов. К драйверной компоненте, работающей в контексте ядра, запросы приходят в виде IRP-пакетов, драйвер сохраняет их в особой очереди, называемой RWPortal. Сервисная компонента, исполняющаяся в пользовательском контексте, с помощью специальных запросов управления вводом-выводом (IOCTL) обнаруживает появление таких запросов в этой очереди и обрабатывает их, модифицируя содержимое области данных внутри запросов. Указанная архитектура позволяет перенести основной обрабатывающий код из контекста ядра в пользовательский контекст и этим самым снимает всякие ограничения на использование механизмов обработки, невозможных в противном случае. Данный механизм неизбежно приводит к увеличению времени обработки запроса к ВУВВ. При прохождении через слой МЗС к времени обработки каждого IRP пакета добавляется время, состоящее из двух компонент — независимой от длины пакета (латентность) и зависимой (пропускная способность). Обе компоненты зависят от вычислительной мощности системы. Для увеличения пропускной способности можно использовать наличие дополнительных вычислительных ядер системы путём создания дополнительных вычислительных потоков (ДВП). Тради- 12 53-я научная конференция МФТИ ФУПМ-2 ционная реализация, при которой ДВП создаются в момент обслуживания, приводит к значительному росту накладных расходов на инициацию ДВП, включающую создание контекста ДВП, выделение виртуальной памяти, изменение таблиц страниц, а также на завершение ДВП, удаление контекста ДВП, модификацию таблицы страниц и перепланирование вычислительных потоков (ВП.) В данной работе с целью минимизации непроизводительных накладных расходов используется концепция пула ДВП. Проведено доказательство отсутствия тупиков в применяемой реализации данной концепции. Пул ДВП (ПДВП) — абстракция, представляющая из себя множество ДВП и предоставляющая методы для их использования. Создание ДВП происходит однократно, в момент создания самого пула. Дальнейшая работа с пулом происходит следующим образом: в случае появления запроса, допускающего параллельное исполнение на вычислительных ядрах, выдаётся запрос к ПДВП для определения наличия свободных ВП. При отсутствии свободных ВП запрос исполняется текущим ВП. При наличии свободных ВП запрос разбивается на подзапросы, которые исполняются независимо, по окончании исполнения ДВП возвращаются в пул. Данный подход позволяет минимизировать как количество переключений контекста ВП, так и совокупное время исполнения запроса в контексте МЗС. Обнаружение тупиков (locks) или доказательство их отсутствия обычно является одной из наиболее сложных задач при проектировании моделей. Для доказательства отсутствия тупиков (lockless) в данной модели ПНВП использована теория сетей Петри. Для реализации ПНВП используются стандартные синхронизирующие примитивы операционной системы и операции над ними. Каждый из примитивов синхронизации может быть описан в терминах сетей Петри. Пользуясь правилами композиции сетей Петри, можно создать совокупную сеть Петри. Обработка каждого запроса (IRP-пакета) может быть представлена в виде маршрута токена совокупной сети Петри. Для совокупной сети Петри построены входная и выходная матрицы и доказано, что не существует переходов с активностью 0, и, следовательно, совокупная сеть Петри модели не содержит тупиков. В данной работе показано удобство применения таких методов анализа вычислительных систем, как сети Петри для определения требуемых свойств модели, а именно отсутствию тупиков. Одним из возможных направлений продолжения работы может быть примене- Секция информатики 13 ние сетей Петри для автоматизированного построения и анализа параллельных алгоритмов в вычислительных системах с общей памятью. Литература 1. Питерсон Д. Теория сетей Петри и моделирование систем. — М.: Мир, 1984. — 264 с. 2. Tadao Murata Petri Nets: Properties, Analysis and Applications // Proceedings of the IEEE. — April 1989. — V. 77, N 4. — P. 541--580. 3. Vallejo F., Gregorio J.A., Gonzalez Harbour M., Drake J.M. Shared Memory Multiprocessor operating System with an Extended Petri Net Model // IEEE transactions on parallel and distributing systems. — July 1994. — V. 5, N 7. — P. 749--762. 4. Бабичев С.Л., Бобьяков А.С., Коньков А.К., Коньков К.А. Математическая модель защищенной компьютерной системы под управлением Windows // Труды 51-й научной конференции МФТИ «Современные проблемы фундаментальных и прикладных наук». — 2008. — Т. 2. — С. 56--57. 5. Бабичев С.Л., Бобьяков А.С., Коньков А.К., Коньков К.А. Эффективное использование ресурсов вычислительных систем при решении задач информационной безопасности // Труды 52-й научной конференции МФТИ «Современные проблемы фундаментальных и прикладных наук». Часть VII Управление и прикладная математика. — 2009. — Т 3. — С. 7--8. 6. Семененко В.Л., Бабичев С.Л., Бобьяков А.С., Коньков А.К., Коньков К.А., Телицын М.А. Защита корпоративной информации от внутренних угроз на основе метода доверенной загрузки системы // Труды 50-й научной конференции МФТИ. «Современные проблемы фундаментальных и прикладных наук». — 2007. — С. 174--175. 14 53-я научная конференция МФТИ ФУПМ-2 УДК 004.896 П.Н. Брунарский, А.Е. Устюжанин pbrunarskiy@gmail.com, andrey.u@gmail.com Московский физико-технический институт (государственный университет) Адаптивное кинодинамическое планирование движения колесного робота Задача автономного управления мобильными роботами имеет большое значение в современной науке и технике. Для ее эффективного и корректного решения необходимо учитывать не только кинематические ограничения, связанные с геометрическими свойствами робота и объектов окружающей среды, но и динамические — ограничения на движение тела, вызванные тем, что в реальном мире действуют законы сохранения, а объекты обладают массой, импульсом, энергией и к ним приложена некоторая сила. Кинодинамическое планирование [1] заключается в построении движения робота, переводящего его из начального состояния в конечное, с одновременным удовлетворением кинематических и динамических ограничений. При этом состояние робота в заданный момент времени определяется его конфигурацией и скоростью. В данной работе проведен обзор основных существующих подходов кинодинамического планирования [2]. Предложен новый подход для управления колесным роботом в условиях отсутствия полных данных об окружающей среде, когда планирование движения выполняется по мере поступления информации от сенсоров (ускорение, пройденный путь, расстояние до объектов). Рассматривается задача построения пути, оптимального по времени, по количеству управляющих действий. В результате применения предложенного метода кинодинамического планирования увеличивается маневренность робота, уменьшаются энергетические затраты на корректировку траектории, уменьшается время прохождения заданного пути по сравнению с аналогичными подходами. Данный подход хорошо зарекомендовал себя при использовании в экстремальных условиях — плохого сцепления с дорогой и при условии изменения коэффициента трения вдоль траектории движения ро- Секция информатики 15 бота. Также он применим в случае изменения массы робота в ходе его движения (сбор или сброс груза). Литература 1. Donald B.R., Xavier P.G., Canny J., Reif J. Kinodynamic planning // Journal of the ACM. — 1993. — V. 40, N. 5. — P. 1048--1066. 2. La Valle S.M. Planning Algorithms. — Cambridge: Cambridge University Press, 2006. — 842 p. 3. Сивухин Д.В. Общий курс физики. Т. 1. Механика. — М.: Наука, 1979. — 520 с. 16 53-я научная конференция МФТИ Литература 1. Работнов Ю.Н. Механика деформируемого твёрдого тела. — М.: Наука, 1988. 2. Магомедов А.М., Холодов А.С. Сеточно-характеристические численные методы. — М.: Наука, 1988. 3. Федоренко Р.П. Введение в вычислительную физику. — М.: Издательство Московского физико-технического института, 1994. УДК 519.633.2 А.В. Васюков, Д.В. Черников vasyukov@gmail.com, kolovert@bk.ru Московский физико-технический институт (государственный университет) Решение динамических задач механики деформируемого твердого тела на параллельных вычислительных системах с использованием неструктурированных сеток В работе рассматриваются вопросы разработки параллельной реализации сеточно-характеристического численного метода для решения задач механики деформируемого твердого тела в случае трех пространственных переменных и оценивается эффективность распараллеливания метода. Расчетная область перед началом расчета геометрически автоматически разделяется на подобласти, которые в дальнейшем рассчитывались отдельными процессорами независимо с синхронизацией значений на границах областей в конце каждого шага по времени. Подобласти представляют собой тетраэдры, что позволяет проводить расчет в случае областей со сложной геометрией. Исследование зависимости ускорения счета от количества задействованных вычислительных ядер показывает масштабирование, близкое к линейному, в диапазоне 1–64 вычислительного ядра (рис. 1). ФУПМ-2 Рис. 1 Секция информатики 17 УДК 519.6 А.Ю. Власов ayvlasov@parallels.mipt.ru Московский физико-технический институт (государственный университет) Распределение области интегрирования в параллельной реализации метода гладких частиц Среди задач механики деформируемого твердого тела особый интерес представляет моделирование разрушения, а также процессов, протекающих при сильных деформациях конструкций сложной геометрии. Среди них большое практическое значение имеют трехмерные задачи. Однако объемы данных в трехмерных задачах часто настолько велики, что оперативной памяти, доступной отдельно взятому процессору, не достаточно для хранения всех обрабатываемых данных. Кроме того, вычислительной мощности любого отдельно взятого процессора не достаточно для обработки всего объема данных за приемлемое время. Возникает необходимость решать такие задачи на многопроцессорных системах. Однако построение алгоритмов, в полной мере использующих возможности параллельных систем, является достаточно сложной задачей. Аспирантами и студентами МФТИ разработан [1] вычислительный комплекс, включающий параллельную реализацию оригинального алгоритма SPH [2], SPH с искусственной вязкостью, модифицированного алгоритма, использующего приближенное решение задачи Римана [3], гибридизированной схемы. Проведенное исследование комплекса показало, что ресурсы многопроцессорной системы в задачах сложной геометрии использовались неэффективно. «Узким» местом существовавшей реализации было распределение области интегрирования между процессорами. По результатам анализа описанных в литературе [4] алгоритмов разбиения области интегрирования был выбран, модифицирован для нашей реализации SPH и реализован алгоритм рекурсивной бисекции по координатам (RCB — Recusive Coordinate Bisection). Выбор был мотивирован простотой (в том числе простотой встраивания в комплекс) и достаточной эффективностью алгоритма на широком классе расчетных моделей. 18 53-я научная конференция МФТИ ФУПМ-2 В работе описан алгоритм RCB для параллельной реализации SPH, представлены результаты сравнения эффективности вычислительного комплекса с алгоритмом RCB и старым алгоритмом разбиT1 , где ения области. Под эффективностью понимается величина nT n T1 — время работы алгоритма на одном процессоре, Tn — время работы на n процессорах. Анализ производительности показал, что предложенный алгоритм распределения области интегрирования позволяет вычислительному комплексу эффективней использовать ресурсы многопроцессорных систем на задачах сложной геометрии (рис. 1, рис. 2), не ухудшая производительность на задачах с простой геометрией (рис. 3). Рис. 1. Эффективности старого алгоритма и RCB-алгоритма на задаче сложной геометрии — столкновение металлического ударника с многослойной мишенью Секция информатики 19 20 53-я научная конференция МФТИ ФУПМ-2 Литература Рис. 2. Эффективности старого алгоритма и RCB-алгоритма на задаче сложной геометрии — нормальное соударение двух перфорированных конструкций 1. Потапов А.П., Ройз С.И., Петров И.Б. Моделирование волновых процессов методом сглаженных частиц (SPH) // Математическое моделирование. — 2009. — № 7. — С. 20--28. 2. Monaghan J.J. An Introduction to SPH // Computer Physics Communications. — 1988. — V. 48. — P. 89--96. 3. Parshikov A.N., Medin S.A., Loukashenko I.I., Milekhin V.A. Improvements in SPH methods by means of interparticle contact algorithm and analysis of perforation tests at moderate projectile velocities // International Journal of Impact Engineering. — 2000. — V. 24. — P. 779--796. 4. Якобовский М. Обработка сеточных данных на распределенных вычислительных системах // Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов. — 2004. — Вып. 2. — С. 40--53. УДК 519.63:519.85 В.И. Голубев1 , Д.Е. Квасов2 , И.Е. Квасов1 W.Golubev@mail.ru, kvadim@hotmail.ru, i.kvasov@gmail.com 1 Московский физико-технический институт (государственный университет) 2 Нижегородский государственный университет им. Н.И. Лобачевского (Национальный исследовательский университет) Определение положения сейсмогеологических трещин при помощи численных методов глобальной оптимизации Рис. 3. Эффективности старого алгоритма и RCB-алгоритма на задаче простой геометрии — распад разрыва, область интегрирования: параллелепипед, равномерно заполненный частицами Знание свойств и типов геологических пород, находящихся на глубине нескольких километров, представляет большой интерес для разведочной сейсмологии, определяющей расположение нефтяных месторождений с помощью акустических волн. Это позволяет избежать дорогостоящих методов разведки (бурение скважин) и ускорить процесс определения точного залегания ресурсов. Секция информатики 21 В данной работе изучается обратная задача численного моделирования: требуется определить положение неоднородностей (трещин) в земной коре. Рассматривается упрощенный вариант данной задачи: имеется заполненная жидкостью трещина заданной протяжённости, расположенная во вмещающем массиве с известными упругими характеристиками. Тогда вектор z неизвестных параметров, определяющий геометрию области, содержит лишь две компоненты: глубина залегания трещины h, h1 h h2 , и угол ее наклона α, α1 α α2 . Одной из особенностей данной задачи является то, что информацию можно получать лишь из экспериментальных измерений, для получения которых используется акустическое зондирование. На поверхности земли в точках xi располагается серия сейсмоприёмников, на которых в моменты времени tj фиксируются вертикальные компоненты скорости частиц Ṽy (xi ,tj ) в отраженной волне. Ищется такое значение z, чтобы численно моделируемый отклик Vy (z,xi ,tj ) наименьшим образом отличался от экспериментального. Для численного моделирования в работе используется сеточно-характеристический метод [1], учитывающий физические особенности задачи и позволяющий ставить граничные и контактные условия в корректной форме. Таким образом, рассматриваемая задача формулируется как оптимизационная задача наименьших квадратов: min I(z), z ∈ D = [h1 ; h2 ] × [α1 ; α2 ], I(z) = [Vy (z,xi ,tj ) − Ṽy (xi ,tj )]2 . i (1) (2) j Функция (2) не имеет аналитического представления, и получение ее значений связано с проведением трудоемких численных экспериментов. Для решения задачи (1–2) применяется ряд быстрых методов глобальной оптимизации [2], разработанных для подобного класса сложных многоэкстремальных задач. Работа Квасова Д.Е. выполнена в рамках гранта Президента Российской Федерации для государственной поддержки молодых российских ученых — кандидатов наук (МК-3473.2010.1). Литература 1. Квасов И.Е., Петров И.Б., Челноков Ф.Б. Расчет волновых процессов в неоднородных пространственных конструкциях // Математическое моделирование. — 2009. — Т. 21, № 5. — С. 3--9. 22 53-я научная конференция МФТИ ФУПМ-2 2. Сергеев Я.Д., Квасов Д.Е. Диагональные методы глобальной оптимизации. — М.: Физматлит, 2008. — 352 с. УДК 519.63 В.И. Голубев, И.Е. Квасов W.Golubev@mail.ru, i.kvasov@gmail.com Московский физико-технический институт (государственный университет) Численное моделирование землетрясений в различных геологических породах В настоящей работе было проведено численное моделирование волновых процессов, происходящих в упругой среде при землетрясении. Авторы используют сеточно-характеристический метод [1], позволяющий строить корректные вычислительные алгоритмы как на краях области интегрирования, так и на контактных границах между слоями в многослойной [2], а также трещиноватой среде [3]. В качестве модели землетрясения было выбрано начальное возмущение типа «подвижка по разлому». В прямоугольной области на глубине 1,5 км длиной 500 м и шириной 80 м задавалась начальная скорость среды 10 см/с, направленная вдоль длинной стороны. Её направление в верхней части прямоугольника — вправо, а в нижней — влево. Было проведено моделирование для различных вмещающих сред: однородной, слоистой, среды с карстовой полостью, а также среды с кластером вертикальных газонасыщенных трещин. В результате моделирования было показано, что на удалении от гипоцентра распространяются четыре волны: две продольные и две поперечные. Амплитуда продольных волн заметно меньше амплитуды поперечных волн. При прохождении кластера вертикальных трещин происходит ослабление поперечной волны. При наличии карстовой полости непосредственно под эпицентром землетрясения наблюдается дифракция падающих волн, а также возникает большое число переотражённых волн вследствие отражения от дневной поверхности земли и верхней границы карстовой полости. Полученные результаты имеют важное практическое значение и могут использоваться для предсказания разрушительных воздействий землетрясений. Секция информатики 23 Литература 1. Магомедов К.М., Холодов А.С. О построении разностных схем для уравнений гиперболического типа на основе характеристических соотношений // Ж. вычисл. матем. и матем. физ. — 1969. — Т. 9, № 2. — С. 373--386. 2. Петров И.Б., Челноков Ф. Б . Численное исследование волновых процессов и процессов разрушения в многослойных преградах // Ж. вычисл. матем. и матем. физ. — 2003. — Т. 43, № 10. — С. 1562--1579. 3. Квасов И.Е., Петров И.Б., Челноков Ф.Б. Расчет волновых процессов в неоднородных пространственных конструкциях. // Математическое моделирование. — 2009. — Т. 21, № 5. — С. 3--9. УДК 004.432.2 Н.В. Заборовский turnik@mail.ru Московский физико-технический институт (государственный университет) Детектирование состояния гонки по исходному коду C / C++ В настоящее время автоматизированные виды анализа исходного кода приобрели большую популярность из-за возрастающего объёма и сложности. Одна из актуальных задач — проанализировать исходный код на предмет наличия в нём состояний гонки (race condition). В данной статье предлагается идея метода, позволяющего построить модель потока исполнения по исходному коду на языках C и С++, и способ дальнейшего статического анализа этой модели с целью детектирования состояний гонки. Речь идёт об обнаружении неразрешимых состояний гонок [1]. В модели будем использовать математическое описание исполнения потока в виде графа, вершинам которого сопоставлен набор переменных и последовательность выполняемых с ними операций. Нужно отметить, что на данном этапе предполагается определение, разделяемая переменная или нет, происходит «вручную». Описанный граф 24 53-я научная конференция МФТИ ФУПМ-2 будем называть расширенным графом потока управления (ECFG). Содержимое конкретной вершины может быть получено путём синтаксического анализа определенного участка кода, в результате чего будет выделен набор переменных и последовательность операций с ними. Есть определенный набор программных средств, позволяющих получить необходимое дерево синтаксического разбора (AST). В их числе библиотека VivaCore и Phoenix toolkit SDK. Следующий этап — построение графа потока управления (CFG). Очень мощная поддержка CFG-графов есть в Phoenix toolkit SDK. Заметим, что построенная описанным выше образом модель исполнения является, по сути, недетерминированным конечным автоматом. Теперь можно перейти к процедуре детектирования состояний гонки. ECFG-граф упрощается путём выбрасывания ненужных с точки зрения нашего анализа инструкций и «склеивания» вершин, если наличие ребра не вносит вклада. Далее определенным образом выделяется набор путей, и для каждой их пары строится граф совместного исполнения (JEG) [2]. Работая с построенным графом, мы используем классы эквивалентности [1], благодаря чему задача сводится к анализу редуцированного JEG-графа. Наконец, с помощью метода неопределенных коэффициентов и применения функции корректности [2] мы можем ответить, присутствуют ли в коде неразрешенные состояния гонки. Литература 1. Кудрин М.Ю., Соколов Е.В., Тормасов А.Г. Выявление состояний гонки с помощью графа совместного исполнения потоков // Научно-технические ведомости СПбГПУ, Серия «Информатика, телекоммуникации, управление». — СПб.: Изд-во Политехн. универ., 2009. — № 5 (83). — С. 125--134. 2. Кудрин М.Ю., Петров В.Н., Прокопенко А.С. Математическое моделирование структур, работающих на разделяемой памяти // XXXV Международная молодежная научная конференция «Гагаринские чтения», секция «Инфотелекоммуникационные технологии» — М.: МАТИ, 2009. — С. 24--25. Секция информатики 25 УДК 004.054 Ю.Ю. Зайтаев yunus@phystech.edu Московский физико-технический институт (государственный университет) Тестирование распределенного хранилища данных TorFS Важность тестирования как никогда велика. Сегодня тестирование рассматривается как деятельность, которую необходимо проводить на протяжении всего процесса разработки программных систем. Тщательное тестирование позволяет избежать накопления дефектов, а предотвратить проблему легче, чем бороться с ее последствиями. Было проведено тестирование некоторых модулей распределенного хранилища данных TorFS с регулируемой избыточностью на основе (n,k)-схемы, а именно модуля strgapi, ответственного за непосредственное взаимодействие с файловой системой пользователя TorFS, файл-сервера TorFS, интеграционное тестирование взаимодействия strgapi и файл-сервера, а также тестирование производительности алгоритмов (n,k)-схемы сборки-разборки файлов. При планировании тестирования указанных модулей были использованы комбинации техник, ориентированных на спецификацию, и техник, ориентированных на код (техники «белого» и «черного» ящиков). Также вначале было проведено исследовательское тестирование. Была использована система модульного тестирования Google C++ Testing Framework. В результате модульного тестирования были обнаружены некоторые дефекты модуля strgapi. Проведенные тесты покрывают ∼ 91 % исходного кода, то есть 91% строк исполняются хотя бы один раз. Тесты производительности алгоритмов сборки-разборки показали, что теоретические оценки скорости работы совпадают с полученными на практике. Литература 1. IEEE Computer Society 2004 SWEBOK Guide. 26 53-я научная конференция МФТИ ФУПМ-2 2. Graham D., van Veenendaal E., Evans I., Black R. Foundations of Software Testing: ISTQB Certification. — London: Cengage Learning EMEA, 2008. 3. Black R. Advanced Software Testing. — Santa Barbara: Rocky Nook, 2008. — V. 1. УДК 519.684.6, 598.913 А.М. Казённов1,2 , И.В. Морозов1,2 , С.Г. Семёнов1,2 kazennov@gmail.com, morozov@ihed.ras.ru, stasg7@gmail.com 1 2 Московский физико-технический институт (государственный университет) Объединённый институт высоких температур РАН Сравнение технологий программирования на графических ускорителях для задач молекулярно-динамического моделирования Метод молекулярной динамики (МД) широко применяется для моделирования статических и динамических свойств твердых тел, жидкостей и неидеальной плазмы [1--3]. Основной проблемой таких задач является их большая вычислительная сложность. Часто физика задачи требует применения моделей с большим числом частиц, что делает актуальным применение высокопроизводительных вычислительных систем, особенно если учесть тот факт, что задачи молекулярной динамики сравнительно хорошо распараллеливаются. В настоящее время производительность вычислительных систем повышается не за счет увеличения производительности отдельного процессора, а за счет увеличения числа вычислительных ядер в процессоре или вычислительных блоков в ядре. Наибольшая плотность вычислительных блоков, на данный момент, достигнута на видеокартах (GPU). Сейчас наиболее активно развиваются две технологии для использования видеоускорителей в научных и прикладных расчетах: CUDA и OpenCL. CUDA — программно-аппаратная архитектура, позволяющая производить вычисления с использованием графических процессоров NVIDIA последнего поколения. Её преимущество в том, что на данный момент она показывает большую производительность по Секция информатики 27 сравнению с OpenCL. Однако архитектуру CUDA поддерживает и развивает только производитель NVIDIA. OpenCL — фреймворк для написания компьютерных программ, связанных с параллельными вычислениями на различных графических ускорителях и многопроцессорных (многоядерных) системах с общей памятью. По этой причине разработка программ с использованием OpenCL является более перспективным направлением, так как эта технология поддерживается большим числом производителей оборудования. В данной работе в первую очередь было проведено исследование возможностей и быстродействия различных пакетов МД-моделирования, адаптированных для использования на GPU. В частности, были рассмотрены пакеты ACEMD, AMBER, Ascalaph, GROMACS, HALMD, HOOMD, LAMMPS, NAMD, VMD, OpenMM API. Особое внимание было уделено наличию потенциалов взаимодействия частиц, необходимых для моделирования конденсированных веществ и неидеальной плазмы. Среди указанных пакетов были выделены LAMMPS и HOOMD как наиболее подходящие для моделирования жидкостей и твердых тел в экстремальных состояниях. Результаты показали, что вычисления на GPU занимают гораздо меньше времени, чем на CPU. Прирост производительности достигал 10-ти раз. При расчетах на GPU пакет HOOMD показал себя лучше, нежели LAMMPS. Связано это с тем, что LAMMPS — более универсальный пакет, имеющий многочисленные возможности анализа МД-траектории. Поскольку на GPU реализована только процедура расчета взаимодействия между частицами, для всех остальных функций приходится выполнять копирование временных данных (например, списков ближайших соседей) с GPU на CPU, что существенно снижает быстродействие. Пакет HOOMD изначально разрабатывался для гибридных систем, включающих GPU, поэтому, несмотря на меньший набор потенциалов и средств анализа МД-траектории, он имеет лучшую оптимизацию. Второй целью данной работы было провести сравнение технологий CUDA и OpenCL, на основе которого выбрать оптимальный программный пакет для МД-моделирования релаксационных процессов в конденсированных веществах и неидеальной плазме. Тестирование проводилось на задаче N тел с кулоновском взаимодействием и с потенциалом Леннарда–Джонса. Предварительные результаты показали, что CUDA имеет большее быстродействие по сравнению с OpenCL на GPU, однако OpenCL превосходит OpenMP на традиционных многопроцессорных системах с общей памятью. 28 53-я научная конференция МФТИ ФУПМ-2 Литература 1. Kuksin A. Yu., Morozov I.V., Norman G.E., Stegailov V.V., Valuev I.A. Standard of molecular dynamics modelling and simulation of relaxation // Molecular Simulation. — 2005. — V. 31. — P. 1005. 2. Янилкин А.В., Жиляев П.А., Куксин А.Ю., Норман Г.Э., Писарев В.В., Стегайлов В.В. Применение суперкомпьютеров для молекулярно-динамического моделирования процессов в конденсированных средах // Вычислительные методы и программирование. — 2010. — Т. 11. — С. 111. 3. Морозов И.В., Норман Г.Э. Столкновения и плазменные волны в неидеальной плазме // ЖЭТФ. — 2005. — Т. 127, № 2. — С. 412. 4. Anderson J.A., Lorenz C.D., Travesset A. General purpose molecular dynamics simulations fully implemented on graphics processing units // Journal of Computational Physics. — 2008. — V. 227. — P. 5342. 5. Plimpton S. Fast Parallel Algorithms for Short–Range Molecular Dynamics // J. Comp. Phys. — 1995. — V. 117. — P. 1. УДК 519.63 И.Е. Квасов i.kvasov@gmail.com Московский физико-технический институт (государственный университет) Численное исследование анизотропии отклика приповерхностного возмущения от трещиноватого пласта В данной работе исследуется задача распространения приповерхностного возмущения в массивной породе, содержащей различные неоднородности — пустые или заполненные трещины. Получены численные решения задач о распространении волн в таких существенно неоднородных средах. Исследуется зависимость отклика от трещиноватого пласта в зависимости от параметров задачи: плотность расположения трещин, протяженность трещиноватого пласта, количество трещин, положение взрыва, наклон трещин, частота импульса. Секция информатики 29 30 53-я научная конференция МФТИ ФУПМ-2 Для характеристики несимметричности отклика необходимо ввести некую величину, которая была бы тем больше, чем больше различие между левыми и правыми частями отклика (относительно вертикальной прямой, проходящей через центр пласта трещин). При этом в случае полной симметрии отраженных волн эта величина должна принимать нулевое значение. Можно предложить следующее определение анизотропии отклика, удовлетворяющее сформулированным выше критериям: EL − ER , α= EL + ER где α — анизотропия отклика, EL — энергия левой части отклика, ER — энергия правой части отклика. В работе используется сеточно-характеристический метод на треугольных расчетных сетках с постановкой граничных условий на поверхности раздела между породой и трещиной, а также на свободных поверхностях в явном виде. Предлагаемый численный метод имеет большую общность и пригоден для исследования процессов взаимодействия сейсмических волн с неоднородными включениями, поскольку позволяет наиболее корректно конструировать вычислительные алгоритмы на границах области интегрирования и раздела сред. На рис. 1 показана одна из полученных зависимостей: анизотропия отклика от плотности расположения трещин в пласте. График этой зависимости демонстрирует интересную особенность: анизотропия достигает максимума при количестве трещин, равном 9. Можно предположить, что начальный рост анизотропии связан с увеличением энергии отклика (ведь падающая волна сама по себе анизотропна, так как распространяется под некоторым углом к вертикали), а дальнейший незначительный спад анизотропии связан с тем, что пласт трещин по своим свойствам все больше приближается к некоторой осредненной модели среды. Литература 1. Магомедов К.М., Холодов А.С. О построении разностных схем для уравнений гиперболического типа на основе характеристических соотношений // Ж. вычисл. матем. и матем. физ. — 1969. — Т. 9, № 2. — С. 373--386. 2. Квасов И.Е., Петров И.Б., Челноков Ф.Б. Расчет волновых процессов в неоднородных пространственных конструкциях // Математическое моделирование. — 2009. — Т. 21, № 5. — С. 3--9. Рис. 1 УДК 519.63 И.Е. Квасов i.kvasov@gmail.com Московский физико-технический институт (государственный университет) Аналитическое обоснование условия линейного проскальзывания на трещине Для математического моделирования сейсмических откликов от трещиноватых углеводородсодержащих геологических пород в сейсмологии традиционно используют осредненные модели или модели с эффективными коэффициентами среды [1--6], что влечет за собой необходимость введения некоторых эмпирических коэффициентов (например, коэффициенты податливости породы [2--5]), дополнительных гипотез (например, гипотеза линейного проскальзывания Секция информатики 31 [2]). В данной работе исследуется возможность аналитического решения задачи распространения волновых полей в породах с трещинами на основании системы уравнений механики деформируемого твердого тела [7--8] без введения каких-либо эмпирических параметров. В случае нормального падения волнового фронта на флюидонасыщенную трещину (что эффективно делает задачу одномерной) доказывается справедливость условия линейного проскальзывания, а также выводится аналитическое выражение для коэффициента податливости породы: ρc2 , K= d где ρ — плотность флюида, заполняющего трещину, c — скорость звука во флюиде, d — толщина трещины. Литература 1. Biot M.A. Mechanics of deformation and acoustic propagation in porous media // J. Apple Physics. — 1962. — V. 33, N. 4. — P. 1482--1498. 2. Hsu C.J., Schoenberg M. Elastic waves through a simulated fractured medium // Geophysics. — 1993. — V. 58, N. 7. — P. 964--977. 3. Молотков Л.А., Бакулин А.В. Эффективная модель слоистой упруго-пористой среды // ДАН. — 2000. — Т. 372, № 1. — С. 108--112. 4. Kozlov Е.А. Pressure-dependent seismic response of fractured rock // Geophysics. — 1969. — P. 885--897. 5. Thomsen L. Weak elastic anisotropy // Geophysics. — 1986. — V. 51. — P. 1954--1966. 6. Hudson J.A. Wave speeds and attention of elastic waves in materials containing cracks // Geophysical Journal of the Royal Astronomical Society. — 1981. — V. 64. — P. 133--150. 7. Кондауров В.И., Фортов В.Е. Основы термомеханики конденсированной среды. — М.: МФТИ, 2002. — 336 с. 8. Новацкий В.К. Теория упругости. — М.: Мир, 1975. — 872 с. 32 53-я научная конференция МФТИ ФУПМ-2 УДК 519.63 И.Е. Квасов, А.В. Санников, А.В. Фаворская i.kvasov@gmail.com, donxenapo@gmail.com, aleanera@yandex.ru Московский физико-технический институт (государственный университет) Численное моделирование пространственных динамических процессов сеточно-характеристическим методом на неструктурированных тетраэдральных сетках В работе предложены усовершенствованные методы пространственного численного моделирования распространения волн в сложных гетерогенных средах. При такой постановке трехмерных задач оптимальным является использование неструктурированных тетраэдральных сеток. Так как система уравнений математической модели состояния сплошной линейно-упругой среды [1] является гиперболической, и требуется аккуратный расчет волновых процессов, сообразно применение именно сеточно-характеристического метода [2] с использованием интерполяции [3] высоких порядков. Рассматриваются четыре задачи: моделирование торцевого удара в стенку куба, моделирование сферического взрыва в центре куба, моделирование приповерхностного сейсмического сферического взрыва в линейно-упругой среде и моделирование землетрясения в земной коре. Во всех четырех случаях область интегрирования представляет собою куб. На всех сторонах куба задано условие свободной границы. Использовалась интерполяция с ограничителем на основе кубической. На рис. 1, 2, 3 и 4 представлены результаты численного моделирования этих четырех задач соответственно. Густоте визуализированной среды соответствует модуль скорости, стрелочками показано ее направление. Видна картина возникающих волн: объемных сейсмических продольных и поперечных, а также поверхностных сейсмических волн. Секция информатики 33 34 53-я научная конференция МФТИ ФУПМ-2 Литература 1. Кондауров В.И., Фортов В.Е. Основы термомеханики конденсированной среды. — М.: МФТИ, 2002. 2. Магомедов К.М., Холодов А.С. Сеточно-характеристические численные методы. — М.: Наука, 1988. 3. Петров И.Б., Лобанов А.И. Лекции по вычислительной математике. — М.: Интернет–Университет информационных технологий, 2006. Рис. 2. Задача о сферическом взрыве в центре куба. Трехмерный случай Рис. 1. Задача о торцевом ударе. Трехмерный случай Секция информатики Рис. 3. Задача о приповерхностном сейсмическом сферическом взрыве. Трехмерный случай 35 36 53-я научная конференция МФТИ ФУПМ-2 Рис. 4. Моделирование землетрясения. Трехмерный случай УДК 517.958:531.12 С.Д. Кошман, А.П. Потапов koshman86@mail.ru, potapov@7ka.mipt.ru Московский физико-технический институт (государственный университет) Сравнение расчёта задачи деформируемого твёрдого тела улучшенным методом сглаженных частиц с экспериментом Современные задачи механики деформируемого тела в основном являются трехмерными, имеют сложную геометрию. При решении этих задач приходится иметь дело с большими деформациями, разрушениями моделируемых объектов и разлетом вещества. Численное решение такого рода задач сеточными методами сопряжено с боль- Секция информатики 37 шими трудностями, такими как построение трехмерной сетки, необходимостью ее периодической перестройки. Альтернативным вариантом решения такого класса задач является метод сглаженных частиц («Smoothed Particle Hydrodynamics» — SPH). Данный метод является бессеточным лагранжевым численным методом для расчетов процессов высокоскоростного соударения, а также иного интенсивного динамического нагружения тел, в особенности, когда имеет место существенное изменение топологии моделируемых обьектов (разлет вещества). Среда разбита на маленькие, по сравнению с характерными размерами рассчитываемой модели, элементы (частицы). Будем считать известными плотность, место положения, а также массу частицы. Производные вычисляются с помощью сплайн-интерполяции, в соответствии с чем каждая гладкая частица является точкой интерполяции, в которой известны параметры деформируемой среды. В данной работе, как и в большинстве других, используется самое простое и очевидное начальное расположение частиц — кубическая равномерная решетка. Для борьбы с нефизичными осцилляциями был введен метод с искусственной вязкостью. Также был реализован подход, использующий приближенное аналитическое решение задачи Римана. К методу Римана добавлена модель разрушения, эффект от учёта этой модели виден на рис. 1, 2. Подробнее об улучшениях метода см. [1]. Для верификации метода проводилось сравнение результатов рассчёта с экспериментом. В качестве эксперимента рассматривалось соударение стального цилиндрического ударника диаметром 8 мм и длиной 20 мм с дюралюминиевой цилиндрической мишенью диаметром 60 мм и длиной 60 мм, начальная скорость ударника 1380 м/с. Сам эксперимент описан в [2]. Литература 1. Потапов А.П., Ройз С.И., Петров И.Б. Моделирование волновых процессов методом сглаженных частиц (SPH) // Математическое моделирование. — 2009. — № 7. — С. 20--28. 2. Фомин В.М. [et al.]. Высокоскоростное взаимодействие тел. — Новосибирск: Издательство СО РАН, 1999. — С. 157--163. 38 53-я научная конференция МФТИ ФУПМ-2 Рис. 1. Срез модели, рассчитанной методом Римана и методом с искусственной вязкостью Рис. 2. Глубина проникания ударника в мишень от времени. Сравнение экспериментальной кривой, кривой из [2] посчитанной сеточным методом, вязкостной и римановской моделей Секция информатики 39 УДК 004.9 И.А. Крюков1,2 , О.Е. Хвостова1,3 , Е.Л. Авербух1 ilyakrukov@gmail.com, olga.khvostova@gmail.com, averbukh.lena@gmail.com 1 3 Нижегородский государственный технический университет им. Р.Е. Алексеева 2 ЗАО «Интел А/О» Государственный университет — Высшая школа экономики Использование меташаров для визуализации результатов моделирования движения сплошных сред Взаимодействие оползневых процессов с подводными сооружениями и трубопроводами представляет собой актуальную задачу. Оползание грунта вблизи опор мостов, трубопроводов и других подводных конструкций должно быть оценено и спроектировано для задач строительства новых и обслуживания уже построенных сооружений. Для моделирования такого класса задач со свободными границами, сопровождающиеся сильно-нелинейной деформацией в процессе движения, в настоящее время все большее распространение приобретают трехмерные бессеточные методы. В основном это различные вариации метода частиц. Помимо вычислительной сложности, такие методы характеризуются сложностью визуализации: восстановление поверхностей из неравномерно распределенного набора частиц, общее число которых может достигать миллиона. Существуют разные методы отрисовки поверхностей сплошной среды для анализа результатов математического моделирования. Среди них есть методы марширующих кубов [1] и трассировки лучей. В ходе исследования особенностей, плюсов и минусов этих методов выявлено, что наиболее подходящим в рамках рассматриваемой задачи является метод использования меташаров. Техника рендеринга Меташаров [2], позволяющая отрисовывать различные изоповерхности, была изобретена Джимом Блинном в начале 1980-х гг. Концепция меташаров близка к идеям метода гидродинамики сглаженных частиц [3], представляющего среду набором частиц. Оба метода используют гладкие скалярные функции, чтобы каждой точке в пространстве поставить в соответствие некоторое зна- 40 53-я научная конференция МФТИ ФУПМ-2 чение. Эти функции также называют сглаживающими ядрами. Без ограничений можно предположить, что среда, моделируемая методом сглаженных частиц, наиболее реалистично (натурально) представляется с помощью меташаров. В рамках настоящей работы была создана программа, которая позволяет визуализировать данные математического моделирования движения сплошных сред и сохранять изображения в графический формат. В работе представлена визуализация результатов моделирования с помощью меташаров. Особое внимание уделено визуализации и выделению поверхности среды. Рассмотрены альтернативные методы представления поверхностей и рендеринга, проведен анализ каждого, сравнение и определение подходящего для конкретных задач. Представленные результаты поисковой научно-исследовательской работы получены в рамках реализации мероприятия 1.2.1 «Проведение научных исследований научными группами под руководством докторов наук» ФЦП «Научные и научно-педагогические кадры инновационной России» на 2009--2013 годы, а также при поддержке грантов Президента РФ для молодых российских ученых — докторов наук (МД-99.2010.5) и РФФИ 10 05 00199а. Литература 1. William E.L., Harvey E.C. Marching Cubes: A high resolution 3D surface construction algorithm // Computer Graphics. — 1987. — V. 21, N. 4. 2. Blinn, J.F. A Generalization of Algebraic Surface Drawing // ACM Transactions on Graphics — 1982. — P. 235–256. 3. Mьller M., Charypar D., Gross M. Particle–Based Fluid Simulation for Interactive Applications // Proceedings of the 2003 ACM SIGGRAPH / Eurographics Symposium on Computer Animation. — 2003. — P. 154–159. Секция информатики 41 УДК 519.876 Б.Г. Кухаренко, Д.И. Пономарев petrov@mipt.ru, ponomarev-102@mail.ru Московский физико-технический институт (государственный университет) Применение нелинейной байесовской фильтрации при обработке сигналов трехмерного манипулятора Рассматривается применение нелинейной байесовской фильтрации к сигналам прецизионного акселерометра, являющегося чувствительным элементом трехмерного манипулятора. Фильтрация основана на расширенном фильтре Калмана и алгоритме ожидания и максимизации правдоподобия. Динамическая система описывается линеаризованными уравнениями: 42 53-я научная конференция МФТИ чи минимизации: ⎧ ⎫ ⎨ ⎬ (z − θΦ)T Q−1 (z − θΦ)j + J ln |Q| . min ⎭ θ,Q ⎩ j Приравнивая производные по θ нулю, получим линейные уравнения относительно θ и Q. Для повышения эффективности нелинейной байесовской фильтрации сигнала удаленного манипулятора необходимо увеличить размерность наблюдаемой последовательности (рис. 1). Это достигается добавлением к наблюдаемой последовательности y (рис. 2) ее первой разности Δy. Двумерный временной ряд Y = {y; Δy} обеспечивает байесовскую нелинейную фильтрацию при размерности пространства состояний L = 4 (рис. 3). В качестве критерия близости компонент, определенных в результате нелинейной байесовской фильтрации, к исходному сигналу используется их кросскорреляция без запаздывания. xt+1 = f (x̂t ,ut ) + Ax̂t (xt − x̂t ) + w, yt = g(x̂t ,ut ) + Cx̂t (xt − x̂t ) + v. Функции f и g определяются на основе радиальных базисных функI ций: z = i=1 hi ρi (x) + Ax + Bu + b + w, где w — гауссовый шум с нулевым средним значением и ковариационной матрицей Q, ρi (x) — радиальная базисная функция. Радиальная базисная функция имеет exp − 12 (x − ci )T Si−1 (x − ci ) [1]. Предполагавид: ρi (x) = |2πSi |−1/2 ется, что P (x,z,u) = J1 j Nj (x,z)δ(u − uj ). Логарифм правдоподобия для одного измерения: − 12 [z−ẑθ (x,u)]T Q−1 [z−ẑθ (x,u)]− 12 ln |Q|+const. Значения (x,z) не определены, поэтому максимум ожидаемого логарифма правдоподобия получается минимизацией квадратичной формы: ⎫ ⎧ ⎬ ⎨ Nj (x,z)[z − ẑθ (x,uj )]T Q−1 [z − ẑθ (x,uj )]dxdz + J ln |Q| . min ⎭ θ,Q ⎩ j x,z Используя обозначения: θ ≡ [h1 h2 ...hI ABb] и Φ ≡ [ρ1 (x)ρ2 (x)...ρI (x)xT uT 1]T , получаем выражение для зада- ФУПМ-2 Рис. 1. Наблюдаемая последовательность y = y(t) Секция информатики 43 44 53-я научная конференция МФТИ ФУПМ-2 Литература 1. Roweis S., Ghahramani Z. Learning nonlinear dynamical systems using the Expectation–Maximization algorithm // Kalman Filtering and Neural Networks / ed. by S. Haykin. — John Wiley & Sons. — 2001. — P. 175--220. УДК 004.651. 54/004.652 И.А. Микляев ivanmia1@rambler.ru Северодвинский филиал Санкт-Петербургского государственного морского технический университета Рис. 2. Нелинейная регрессия восстановленной последовательности x(k + 1) = f (x(k)) Рис. 3. Результат нелинейной фильтрации x = x(t) Формирование информационных систем на основе матричной универсальной объектно-реляционной базы данных с поддержкой древовидной структуры единицы информации Современные тенденции развития систем управления базами данных (БД) являются совмещение положительных качеств реляционных и объектных типов БД с максимальным исключением их недостатков. Матричная универсальная объектно-реляционная база данных (МУОРБД) частично, а в некоторых случаях и полностью снимает их недостатки. Всё информационное поле МУОРБД располагается в семимерном динамическом массиве. В основу теории МУОРБД была заложена структура теории баз данных, которая и реализована в логической модели универсальной базы данных [1]. Логическая модель универсальной базы данных включает в себя следующие сущности: «Сущность», «Экземпляр сущности», «Параметр», «Принадлежность», «Возможное значение параметра» и «Характеристика экземпляра сущности». Универсальный тип данных МУОРБД разработан на основе понижения системы счисления символов в поле базы данных, основанного на статистической информации об их использовании. Секция информатики 45 Универсальное приложение для работы с МУОРБД представляет собой всего две формы: форму администрирования МУОРБД и рабочую форму. В МУОРБД метаданные находятся в первых трёх таблицах МУОРБД, то есть сами представляют собой содержание этих таблиц. В МУОРБД реализован механизм наследования параметров сущностей. Механизм наследования параметров полностью доступен и на уровне содержания таблиц пользователя. В МУОРБД реализован механизм агрегации сущностей. Объединение метаданных МУОРБД и самих данных открывает возможность устанавливать взаимосвязь между ними. В универсальном приложении для МУОРБД реализованы рекурсивный комплексный ввод информации и рекурсивная комплексная фильтрация информации таблицы. Наличие универсального приложения МУОРБД позволяет проектировать информационные системы от результата. При использовании МУОРБД появляется возможность изменить иерархию традиционных основных этапов разработки информационных систем. Литература 1. Конноли Т., Бегг К. Базы данных. Проектирование, реализация и сопровождение. Теория и практика. — М.: Издательский дом «Вильямс», 2003. — 1440 с. 2. Микляев И.А., Ундозерова А.Н., Кудаева М.В. Универсальная логическая модель базы данных // Вестник Поморского университета 1/2010. Сер. «Естественные науки» — С. 93--99. 46 53-я научная конференция МФТИ ФУПМ-2 УДК 519.63 С.А. Панкратов pankratovsa@gmail.com Московский физико-технический институт (государственный университет) Численное исследование поведения различных моделей трещин в упругой среде В настоящей работе было проведено численное исследование поведения различных моделей трещин. При моделировании упругой среды использовался сеточно-характерестический метод [1], который позволяет строить аккуратные решения вблизи области контактных границ. Были проверены осредененные условия на разрезе Шоенберга [2], Хадсона и Феллера [3]. Модели сравнивались между собой и моделью трещины конечной толщины, заполненной вязко-упругой жидкостью. Сравнительные расчеты показали применимость осредненных моделей, и также были предложены идеи реализации других моделей на основе аналогичной идеи постановки контактных условий на разрезе. Полученные результаты позволяют утверждать, что осреденных модели дают хороший результат по точности совпадения сейсмограмм, а значит, могут быть использованы для численного моделирования геологических процессов. Литература 1. Магомедов К.М., Холодов А.С. О построении разностных схем для уравнений гиперболического типа на основе характеристических соотношений // Ж. вычисл. матем. и матем. физ. — 1969. — Т. 9, № 2. — С. 373--386. 2. Schlumberger–Doll Research, P.O. Box 307, Connecticut 06877, 1980. 3. Schoenberg M., Sayers C.M. Seismic anisotropy of fractured rock. Geophysics. — 1995. — V. 60, N. 1. Секция информатики 47 УДК 004.272.43 Д.А. Подлесных massiv@7ka.mipt.ru Московский физико-технический институт (государственный университет) Выбор оптимальной архитектуры ЭВМ для высокопроизводительных вычислений в зависимости от задачи В настоящее время существуют и активно развиваются вычисления на устройствах нетрадиционной архитектуры: графических процессорах общего назначеня (GPGPU) и программируемых логических интегральных схемах (ПЛИС). В связи с этим возникает задача выбора оптимальной архитектуры ЭВМ для конкретной задачи. Рост тактовой частоты процессоров в настоящее время замедлился. Увеличение производительности отдельного процессора достигается за счёт архитектурных улучшений. В связи с этим возникает задача выбора направления для совершенствования архитектуры процессора. Для вычислений важны различные параметры ЭВМ, причём относительная их важность зависит от конкретной задачи: тактовая частота, пиковая производительность; максимальная реализованная аппаратная точность; латентность, пропускная способность и объём оперативной памяти, латентность связи между вычислительными устройствами, аппаратная поддержка типичных операций. Производительность современных процессоров составляет порядка десятков Gflops, а видеокарт — порядка тысячи Gflops, систем на ПЛИС — нескольких тысяч Gflops. Процессоры могут использовать 128-битные вычисления с плавающей точкой, а видеокарты — только 32-битный (без снижения производительности). В ПЛИС существует возможность практически неограниченного наращивания точности (хотя более 256 бит вряд ли будет практически применимо в ближайшее время). Все эти значения со временем будут расти, но соотношения и, что более важно, отношения порядка между ними будут сохраняться. Соответственно не будет и оптимальной по всем параметрам архитектуры. 48 53-я научная конференция МФТИ ФУПМ-2 Для определения возможных архитектур можно ввести N-мерное пространство, в котором измерения соответствуют некоторым (важнейшим для конкретной задачи) из вышеупомянутых параметров (рис. 1). В нём отмечаются области, которые соответствуют комбинации параметров для каждой конкретной архитектуры или конкретной вычислительной системы. По жёстким ограничениям задачи строятся гиперплоскости — ограничения. Если возможно оценить время работы программы в зависимости от нескольких параметров, в допустимой области, ограниченной гиперплоскостями, выбирается минимум времени работы программы. На рис. 2 приведён пример, на котором отмечены 2 параметра: тактовая частота и объём оперативной памяти на одном устройстве. Гиперплоскость, соответствующая размеру модели, которую требуется держать в памяти на одном устройстве, ограничивает выбор. Рис. 1 Секция информатики 49 50 53-я научная конференция МФТИ ФУПМ-2 УДК 519.876 Д.И. Пономарев ponomarev-102@mail.ru Московский физико-технический институт (государственный университет) Использование алгоритма ожидания и максимизации правдоподобия для фильтрации сигналов трехмерного манипулятора Рассматривается применение линейной байесовской фильтрации к сигналам прецизионного акселерометра, являющегося чувствительным элементом трехмерного манипулятора. Фильтрация основана на сглаживающем фильтре Калмана и алгоритме ожидания и максимизации правдоподобия. ЛДС с дискретным временем описывается системой уравнений: Рис. 2 Литература 1. Карпов В.Е., Лобанов А.И., Подлесных Д.А. Сравнительные характеристики кластеров на базе процессоров Xeon и Istanbul для реальной вычислительной задачи // Высокопроизводительные параллельные вычисления на кластерных системах. Материалы Девятой международной конференции-семинара. — Владимир, 2009. 2. Лацис А.О. Параллельная обработка данных. — М.: Издательский центр «Академия», 2010. xk+1 = Fk+1 xk + wk , yk = Hk xk + vk . Выражение для логарифма правдоподобия: L = log P ({x},{y}) = − Tt=1 ( 12 [yt − Hxt ]T R−1 [yt − Hxt ]) − T − t=2 (− 12 [xt − F xt−1 ]T Q−1 [xt − F xt−1 ]) − T −1 2 log |Q| log 2π· − 12 [x1 − π1 ]T V1−1 [x1 − π1 ] 12 log |V1 | − T (p+k) 2 T 2 log |R| Дифференцируя функцию логарифма правдоподобия и приравнивая полученные выражения для производных к нулю, получаем новые оценки для данных параметров: T T • Матрица измерений: H new = ( t=1 yt x̂Tt )( t=1 Pt )−1 . • Ковариационная матрица измерений: T Rnew = T1 t=1 (yt ytT − H new x̂t ytT ). T T • Матрица перехода: F new = ( t=2 Pt,t−1 )( t=2 Pt−1 )−1 . • Ковариационная матрица шума 1 ( Tt=2 Pt − F new Tt=2 Pt−1,t ). Qnew = T −1 процесса: Секция информатики 51 52 53-я научная конференция МФТИ ФУПМ-2 • Начальное значение вектора состояния: π1new = x̂1 . • Начальное значение V1new = P1 − x̂1 x̂T1 . ковариационной матрицы: Таким образом, в каждой итерации алгоритма происходит оценивание параметров системы, так, что ожидаемый логарифм правдоподобия стремится к максимуму. Этот метод позволяет, имея только наблюдаемые данные, определять параметры системы, которые используются для применения сглаживающего фильтра Калмана. Данный алгоритм реализован программно и применен к реальным данным (рис. 1). Результат фильтрации представлен на рис. 2. Литература 1. Shumway R.H., Stoffer D.S. An approach to time series smoothing and forecasting using the EM algorithm // Journal of time series analysis. — 1982. — V. 3, N 4. — P. 253--264. Рис. 2. Результат линейной фильтрации УДК 519.6 С.И. Ройз linuxoid@7ka.mipt.ru Московский физико-технический институт (государственный университет) Реализация модели разрушения на основе откольной прочности материала в методе гладких частиц Рис. 1. Наблюдаемая последовательность Прикладным аспектом механики деформируемого тела является моделирование волновых процессов и процессов разрушения конструкций сложной геометрии, инициированных высокоскоростными соударениями или интенсивными импульсными нагрузками, приводящими в конечном итоге к частичному или полному их разрушению. Для численного моделирования данных явлений студентами и аспирантами МФТИ был разработан [1] вычислительный комплекс, реали- Секция информатики 53 зующий алгоритм SPH [2], наиболее подходящий для моделирования сильных деформаций и разрушений. В силу природы метода гладких частиц в нем уже заложена простейшая модель разрушения, использовавшаяся до настоящего времени. Считается, что разрушение имеет место, когда соседние частицы удалились друг от друга на расстояние, в два раза превышающее их радиус. Такая модель разрушений неточно описывает поведение хрупких материалов, не выдерживающих положительных напряжений, например, стекла или бетона. В настоящей работе предлагается использование модели разрушения на основе откольной прочности материала [3]. Для этого необходимо привести тензор напряжений к диагональному виду и сравнить главные напряжения с пороговым значением для данного материала. В случае превышения данный элемент обнуляется, тензор преобразуется обратным преобразованием, и расчет продолжается по существующей схеме. В работе приведены результаты расчетов распада разрыва, высокоскоростного соударения деформируемого ударника на бетонную преграду. Проведено сравнение результатов с результатами моделирования с использованием естественной модели разрушения. Литература 1. Потапов А.П., Ройз С.И., Петров И.Б. Моделирование волновых процессов методом сглаженных частиц (SPH) // Математическое моделирование. — 2009. — № 7. — С. 20--28. 2. Monaghan J.J. An Introduction to SPH // Computer Physics Communications. — 1988. — V. 48. — P. 89--96. 3. Канель Г.И., Разоренов А.В., Уткин В.Е., Фортов В.Е. Ударно-волновые явления в конденсированных средах. — М.: Янус–К, 1996. — С. 212--214. 54 53-я научная конференция МФТИ ФУПМ-2 УДК 002.001 В.В. Рыков rykov@phystech.edu Московский физико-технический институт (государственный университет) Модель понимания в информационных системах Проблема понимания становится все более важной в информатике. Значительная часть процессов понимания может быть отражена в классической семиотической схеме: знак–ментальный образ знака–ментальный образ денотата–денотат [4]. В данной статье разрабатывается эта классическая модель понимания для решения следующих проблем. Все чаще быстрые технологические изменения требуют адекватной реакции, то есть понимания как со стороны личности, так и общества в целом. Все более резкое увеличение объемов информации требует адекватной интерпретации и понимания. Скорость обоих процессов возрастает. Это напоминает фазовый переход, и этот переход должен произойти [1]. Также команды, состоящие из различных специалистов, часто имеют дело с проблемами взаимного непонимания в процессе разработки инноваций. Это так называемая проблема Knowledge Gap [2]. Отдельным людям и обществу в целом будет все труднее справляться со всеми этими проблемами и требованиями. Рано или поздно наступит момент, когда уже будет невозможно справиться с такими проблемами при использовании старых методов коммуникации и понимания. Новые методологии для понимания новых реалий должны быть основаны на традиции, но в то же время можно и нужно развивать и применять их эффективно в новых важных проблемных областях [2, 3]. В работе разрабатывается методология более эффективного развития и конструирования новых технологий на основе предлагаемой модели понимания как растущего объема информации, так и быстро возникающих новых технологий, а также понимания в коллективах. Эта методология базируется на технологиях понимания, лежащих в основании искусства. Действительно, произведения искусства легко и приятно воспринимаются, легко понимаются. Построенные на основе искусства методологии понимания будут реализовываться как технологии и в других формах, они уже создаются и развиваются. Секция информатики 55 Новая технология понимания, разрабатываемая в этой работе, поможет понять, использовать и развивать эти новые реалии. Литература 1. Капица С.П. Об ускорении исторического времени // Новая и новейшая история. — 2004. — №. 6. 2. Succeeding through service innovation. White Paper. — Cambridge: IBM, 2008 // URL: www-mmd.eng.cam.ac.uk/ssme/. 3. Роэм Д. Визуальное мышление. Решение проблем и продажа идей при помощи картинок на салфетке. — М.: ЭКСМО, 2009. 4. Рыков В.В. Обработка нечисловой информации. Управление знаниями. — М.: МФТИ, 2008. УДК 519.63 А.Ю. Субботина, А.В. Фаворская subbotinanna@gmail.com, aleanera@yandex.ru Московский физико-технический институт (государственный университет) Численное решение одномерной системы уравнений Прайда для пористой геологической среды В настоящее время появляется практический интерес к исследованию сейсмоэлектрического эффекта, что связано с потенциальной возможностью определения параметров пористой среды путем измерения возникающего электромагнитного поля. Сейсмоэлектрический эффект — это эффект возникновения электромагнитного поля при прохождении механического возмущения вдоль пористой среды, насыщенной проводящим электролитом. При прохождении акустической волны через пористую среду возникает относительное смещение между жидкостью и твердой фазой, таким образом, возмущение действует как источник тока, вызывающего электромагнитное поле, которое влияет на механическое возмущение и наоборот. Целью данной работы является исследование одномерной системы уравнений Прайда [1, 2], описывающей электроакустическое со- 56 53-я научная конференция МФТИ ФУПМ-2 пряжение в пористых средах и являющейся математической моделью сейсмоэлектрического эффекта. В основе процедуры решения системы уравнений Прайда для одномерного случая с выделенной осью лежат сеточно-характеристический метод [3] и метод матричной экспоненты. Систему можно представить в виде ∂t q = A∂x q + Rq. Исследование матрицы A с помощью программы «Mathematica 7» показало, что ее спектр имеет вид: ±c1 , ±c2 , 0. Нулевое собственное значение имеет кратность 2. Предрасчет всех необходимых для численного эксперимента матриц и векторов также производится при помощи программы «Mathematica 7» ввиду большого объема аналитической записи соответствующих формул. Совокупность этих матриц и векторов представляет собой полный набор входных данных. Численный эксперимент показал, что метод сходится по сетке. Проводились исследования для различных начальных электрических полей. На рис. 1, 2 представлены зависимости компоненты тензора напряжения t11 и давления p от координаты для различных шагов по времени при разрывном начальном электрическом поле. Литература 1. Pride S.R. Governing equations for the coupled electromagnetics and acous-tics of porous media // Phys. Rev. B., Condens. Matter. — 1994. — V. 50. — P. 15678--15696. 2. Biot M.A. Mechanics of deformation and acoustic propagation in porous media // J. Appl. Phys. — 1962. — V. 33, N. 4. — P. 1482--1498. 3. Магомедов К.М., Холодов А.С. Сеточно-характеристические численные методы. — М.: Наука, 1988. Секция информатики 57 58 53-я научная конференция МФТИ ФУПМ-2 УДК 519.876.5 Ю.В. Тименков, Д.В. Тименкова yuri@timenkov.ru, daria@timenkov.ru Московский физико-технический институт (государственный университет) Моделирование работы подсистемы хранения данных с учетом кэширования при операции резервного копирования Рис. 1. Зависимость компоненты тензора напряжения от координаты на различных шагах по времени при начальном разрывном электрическом поле Рис. 2. Зависимость давления от координаты на различных шагах по времени при начальном разрывном электрическом поле В современном мире поставщики услуг сталкиваются с все возрастающими требованиями к качеству. В эпоху широкого распространения информационных технологий и интернета наблюдается жесткая конкуренция в этой сфере. Поэтому недостаточно просто предоставлять какую-то услугу. Очень важно делать это качественно и нести ответственность за возможные сбои или отказы в обслуживании. Для обеспечения такой надежности, а также снижения стоимости услуги прибегают к различным средствам: кластеризация и избыточность хранилищ информации, регулярное резервное копирование данных, применение технологий виртуализации, позволяющим делать миграцию приложений с одной физической машины на другую. К сожалению, многие из подобных процессов требуют существенных ресурсов для успешного выполнения, а некоторые и вовсе не могут быть выполнены без прерывания услуги. Поэтому прежде чем приступать к длительной и ресурсоемкой сервисной операции, необходимо правильно оценить ее длительность и влияние на основную работу. Также при проведении сервисных работ важно знать время ее окончания, чтобы прогнозировать восстановление уровня сервиса до исходного. Чаще всего администраторы полагаются на свою интуицию, назначая операции на какое-то ночное время. Но такие оценки далеко не всегда точны, и чаще всего не учитывают худшего сценария. Существующие в настоящее время оценки прогресса исполнения операции полагаются только на процент выполненной работы (либо от начала выполнения, либо какое-то мгновенное значение) и не учитывают сложной взаимосвязи между различными видами ресурсов. Тем не менее именно этот факт является основной причиной, по которой процесс не может быть завершен вовремя. Секция информатики 59 В данном докладе представлена математическая модель распределения связанных ресурсов между потребителями. В качестве задачи рассматривается влияние дискового кэша на операцию резервного копирования по сети. Данный пример интересен тем, что на нем можно проследить, как связаны между собой приложения, критичные к различным ресурсам (процессору, жесткому диску, оперативной памяти, сети). В основу модели лег метод, описанный в [1]. Суть его заключается в том, что для описания перераспределения ресурсов используются хорошо известные из гидродинамики дифференциальные уравнения гиперболического типа. Ход исполнения каждого процесса описывается уравнениями, связывающими изменение плотности доступных ресурсов (по аналогии с течением газа) с внешними факторами (трение, вязкость, изменение формы сосуда). Использование сеточно-характеристического метода для численного решения уравнений (описанного в [2]) позволяет добиться более высокой точности и скорости вычисления по сравнению с простыми разностными схемами. В заключение производится сравнение данных численного анализа и реального эксперимента. Соответствие результатов обоих экспериментов позволяет судить о корректности выбранной модели. Литература 1. Тормасов А.Г. Модель потребления ресурсов вычислительной системой // Вестник НГУ. Сер. Информационные технологии. — 2006. — Т. 4, вып. 1. 2. Магомедов К.М., Холодов А.С. Сеточно-характеристические численные методы. — М.: Наука, 1988. 60 53-я научная конференция МФТИ ФУПМ-2 УДК 519.876.5 В.В. Тодосьев, А.Е. Устюжанин stoom.urchin@gmail.com, andrey.u@gmail.com Московский физико-технический институт (государственный университет) Анализ и моделирование поведения абонентов интернет-провайдера с использованием многоагентного подхода Системы принятия и поддержки решений играют важную роль в управлении производственными процессами. Имитационное моделирование — это разработка и выполнение на компьютере программной системы, отражающей структуру и функционирование (поведение) моделируемого объекта или явления во времени. Такую программную систему называют имитационной моделью этого объекта или явления [1]. Цель — сравнить агентное моделирование с более традиционным подходом — системной динамикой в приложении к моделированию поведения абонентов интернет-провайдера. Интернет-провайдер со всей совокупностью оборудования, насчитывающего сотни единиц, с десятками тысяч абонентов, с маркетинговыми акциями представляет собой сложную систему с неоднозначными причинно-следственными связями. Экспериментирование в таких условиях затянется на неприемлемо продолжительный срок и может привести к большим финансовым потерям. Как раз в такой ситуации желательно использование модели в качестве системы принятия и поддержки управленческих решений. В данной работе нас интересует система с большим количеством активных объектов (дома, люди). По приведенным ниже соображениям для решения поставленной задачи мы выбираем агентный подход: 1) для данного типа систем агентное моделирование является более универсальным и мощным, так как оно позволяет учесть сложные структуры поведения и индивидуальность объектов; 2) разрабатывая модель необязательно должна иметь информацию о глобальных зависимостях; 3) поддержка агентной модели проще: корректировки зачастую локализованы в небольшом фрагменте модели и не требуют глобальных изменений [2]. Секция информатики 61 В качестве основных факторов, влияющих на поведение агентов, предлагается использовать следующее: время суток, время года, качество предоставляемых услуг (надежность сети, доступность службы технической поддержки). Поскольку мы ограничены в вычислительных мощностях и максимально допустимое количество активных объектов в эксперименте не превышает 5000 (то есть количество подключенных абонентов не более 2000), то мы упростили схему подключения до следующей: центральный узел — домовой свитч — абонент. Первый месяц эксперимента в анализе не учитывается — он является подготовительным: модель приходит в рабочее состояние, то есть абоненты распределяются по состояниям, устанавливаются долгосрочные таймауты, такие как пребывание в состоянии закрытого отчетного периода. Поскольку таймауты соизмеримы с месяцем, то для начала сбора данных нам нужно получение эффекта возвращения абонентов, которые сильно просрочили платеж. В ходе работы было проведено сравнение двух подходов имитационного моделирования: системная динамика и агентное моделирование. Указаны преимущества агентного подхода при построении модели абонентов интернет-провайдера. Предложены основные факторы, влияющие на поведение агентов. Получены хорошие результаты прогнозирования количества подключенных абонентов и активных абонентодней: расхождения с реальными данными составляют 13 % и 1 % соответственно. Однако прогноз количества отключившихся абонентов существенно преувеличен (в 2.5 раза). Характер активности абонента в сети был существенно упрощен. Предположительно именно это обусловило неудачу в прогнозировании отключений, связанных с неудовлетворенностью абонента. Литература 1. Карпов Ю.Г. Имитационное моделирование систем. Введение в моделирование с AnyLogic5. — СПб.: БХВ-Петербург, 2009. — 400 с. 2. Борщев А.В. Практическое агентное моделирование и его место в арсенале аналитика // Exponenta Pro. Математика в приложениях. — 2004. — № 3--4. 62 53-я научная конференция МФТИ ФУПМ-2 УДК 004.428 А.Е. Устюжанин, Д.А. Смирнов andrey.u@gmail.com, aulust@gmail.com Московский физико-технический институт (государственный университет) Создание программной библиотеки распознавания графических маркеров для приложений, работающих с дополненной реальностью Дополненная реальность (англ. augmented reality, AR) — это термин, обозначающий дополнение реального мира любыми виртуальными объектами. В настоящее время существует много различных применений дополненной реальности, одним из которых является перспективно-корректное встраивание виртуального трехмерного объекта в изображение реального мира, поступающее, например, с вебкамеры. Это достигается путем быстрого поиска на изображении графических маркеров с известными размерами и анализа их ориентации в пространстве. Существует несколько решений, имеющих подобный функционал: ARToolKit, ARTag, ARToolKitPlus. Их недостатки заключаются в громоздкости, качестве распознавания, скорости работы, закрытости. Целью работы было создать простую, быструю и небольшую библиотеку для распознавания маркеров. Идея алгоритма заключается в поиске на бинаризованном изображении прямых, их объединение в четырехугольники и проверка, является ли он маркером. Перевод изображения в черно-белое осуществляется с помощью алгоритма определения границ Канни в силу того, что для обычных алгоритмов бинаризации необходима подгонка параметров под конкретный случай. Самая вычислительно сложная часть алгоритма — поиск прямых — для ускорения реализована в два этапа. На первом с изображения удаляются заведомо неверные линии, используя алгоритм, опубликованный в [1]. На втором этапе осуществляется определение параметров прямых с помощью вероятностного преобразования Хофа. Как показала практика, исходная прямая на изображении может быть распознана как две близко расположенные прямые. Поэтому перед группированием линий в четырехугольники производится слияние полученных на предыдущем шаге Секция информатики 63 отрезков. Простоты и небольшого размера исходного кода программы удалось добиться, используя кросс-платформенную библиотеку для машинного зрения OpenCV. Предложенный алгоритм был протестирован для распознавания как отдельного маркера, так и группы маркеров. При этом программа стабильно работала с производительностью не менее 15 кадров в секунду. Дальнейшие направления развития включают исследование возможности распараллеленной обработки и использование информации из предыдущих кадров для увеличения скорости и качества распознавания. 64 53-я научная конференция МФТИ ФУПМ-2 aleanera@yandex.ru узлах. Поскольку координаты точек пересечения зависят от выбора координатных осей, от шага интегрирования, точного вида сетки в окрестности точки, то желательно уметь интерполировать [2] их в любой точке. Также процедуры интерполяции могут быть востребованы в случае использования деформируемых сеток при введении новых треугольников (тетраэдров), значения в вершинах которых необходимо будет проинициализировать. В работе предложены методы полиномиальной, кусочно-линейной интерполяции и интерполяции с ограничителем для полиномов с первой по пятую степень включительно как на треугольных, так и на тетраэдральных сетках. На основе полученных формул была написана библиотека и проведено ее тестирование. Соответствующее тестирование показало, что использование ограничителя позволяет устранять возникающие для некоторых интерполируемых функций полиномиальные осцилляции и не портить их гладкость в ситуациях, когда осцилляций не возникает. Для демонстрации работы ограничителя на рис. 1, 2 приведены срезы полиномиальных интерполянтов и интерполятнов с ограничителем соответственно вдоль прямой, не пересекающей ни одной опорной точки в тетраэдре и параллельной оси, для разрывной интерполируемой функции. Нулем обозначается интерполируемая функция, остальные номера указывают на степень используемого полинома. Московский физико-технический институт (государственный университет) Литература Интерполяция высоких порядков на неструктурированных треугольных и тетраэдральных сетках 1. Магомедов К.М., Холодов А.С. Сеточно-характеристические численные методы. — М.: Наука, 1988. 2. Петров И.Б., Лобанов А.И. Лекции по вычислительной математике. — М.: Интернет-университет информационных технологий, 2006. Литература 1. Guru D.S., Shekar B.H., Nagabhushan P. A simple and robust line detection algorithm based on small eigenvalue analysis // Pattern Recognition Letters. — 2004. — V. 25 I. 1. — P. 1--13. УДК 519.63 А.В. Фаворская В ряде задач механики деформируемого тела, к примеру в задачах сейсмической разведки, используется сеточно-характеристический метод [1] на неструктурированных треугольных для двумерных задач и тетраэдральных для трехмерных задач сетках. Как правило, при выборе таких типов сеток ограничиваются методами первого порядка аппроксимации, так как вычисляются только значения в вершинах, а для определения функции более сложной, чем линейная требуются значения в большем числе точек. При использовании сеточно-характеристического метода возникает потребность определять решение на пересечении характеристики с предшествующим временным слоем исходя из значений в ближайших Секция информатики 65 66 53-я научная конференция МФТИ ФУПМ-2 УДК 517.977.5 В.С. Федоров feoff3@gmail.com Московский физико-технический институт (государственный университет) ООО «Даймонд Девелопмент» Планировка дисковой активности в ядре ОС Windows Рис. 1. Полиномиальные интерполянты в тетраэдре Рис. 2. Интерполянты с ограничителем в тетраэдре Жесткий диск — главное хранилище информации и данных в современных компьютерах. Кроме того, скорость доступа и блочная архитектура позволяет организовать в современных операционных системах перенос временно неиспользуемых крупных частей оперативной памяти на жесткий диск (далее swap, свопинг). Поэтому доступ к диску наряду с памятью и процессорным временем является важным системным ресурсом. Развитие современных компьютерных технологий требует разделения этого ресурса между задачами, группами задач и внутренними потребностями ядра операционной системы таким образом, чтобы каждая задача могла иметь гарантированный доступ к диску на том или ином временном интервале. При этом желательным является отсутствие простоев в работе диска, то есть использовать ресурс диска наиболее оптимально. В современных операционных системах есть механизмы оптимизации доступа к диску и привилегий доступа различным процессам. Эти алгоритмы реализованы на уровне драйвера блочного устройства. К подобным оптимизациям относятся приоритеты ввода-вывода ядра Windows Vista и лифты ядра Linux. Они оказываются неэффективны, так как современные жесткие диски обладают встроенными планировщиками, очередьми запросов и кэшами. Такие встроенные средства разрабатываются производителями оборудования в соответствии с реальным устройством диска и его топологии. Также методы привилегированного планирования запросов относятся только к операциям чтения, так как запись производится чаще всего асинхронно посредством системного процесса. В данной работе рассматривается возможность построения дискового планировщика в ядре ОС Windows на основе ранее разработанного монитора, производящего отождествление записываемых дан- Секция информатики 67 ных с реальным процессом-инициатором. Для осуществления планирования и оценки его эффективности используется математическая модель, основанная на вероятностных моделях сложных дисперсных сред Колмогорова–Обухова. В работе произведена попытка использования моделей и решений адаптивной оптики для задач прикладной информатики. Литература 1. Руссинович М., Соломон Д. Внутреннее устройство Microsoft Windows: Windows Server 2003, Windows XP и Windows 2000. — 4-е изд. — СПб.: Питер, 2006. — 992 с. 2. Бовет Д., Чезати М. Ядро Linux. — 3-е изд. — М.: BHV, 2007. — 1104 с. 3. Турбулентность. Принципы и применения / под ред. У. Фроста, Т. Моулдена. — М., 1980. — 553 с. 4. Обухов А.М. Турбулентность и динамика атмосферы. — Ленинград: Гидрометеоиздат, 1988. — 414 с. УДК 519.63 Г.С. Щелик german@faki.ru Московский физико-технический институт (государственный университет) Математическое моделирование сейсмических откликов от трещин сложной структуры сеточно-характеристическим методом В современной геологоразведке активно используются методы определения подземной структуры отложений посредством анализа сейсмических откликов от генерируемых на поверхности волн. Однако на практике анализ сейсмограмм откликов зачастую представляет собой сложную задачу, поэтому для качественного представления о подземной структуре и ее влиянии на вид отклика иногда могут быть полезны результаты численных экспериментов. В работе проводится анализ волновых полей и построение сейсмограммы отклика, полученного при падении на сложную трещи- 68 53-я научная конференция МФТИ ФУПМ-2 ну плоской продольной волны. В качестве исследуемых конфигураций рассматриваются различные варианты одиночных сплошных, изломанных и прерывистых трещин в бесконечно тонком приближении. Проводится качественный и количественный анализ зависимости структуры и амплитуды отклика от геометрических и физических параметров задачи. При моделировании используется система уравнений линейной теории упругости для твердого деформируемого тела [1]: ρv· = ∇ · T, T = λ(∇ · v)I + μ(∇ ⊗ v + v ⊗ ∇), где ρ — плотность материала, v — скорость движения среды в данной точке, ∇ — градиент по пространственным координатам, T — тензор напряжений Коши, λ, μ — параметры Ляме, I — единичный тензор, ⊗ — оператор тензорного произведения: (a ⊗ b)ij = ai bj . Для численного решения задачи используется сеточно-характеристический метод [2--3] на треугольных неструктурированных сетках. Данный метод учитывает физические особенности задачи и позволяет строить корректные численные алгоритмы на контактных границах трещин и границах области интегрирования. В качестве падающей волны берется импульс Берлаге частотой 80 Гц, являющийся приближением профиля волны от удаленного взрыва. Упругие характеристики в расчетной области: скорость продольных волн — c1 = 2000 м/с, скорость сдвиговых волн — с2 = 1333 м/с, плотность среды ρ = 2000 кг/м3 . Типовой размер трещины — 50 м. В результате работы получены картины волновых полей и построены модельные сейсмограммы для типовых конфигураций сложных трещин. По этим данным качественно установлено влияние параметров таких структур на вид и амплитуду волновых фронтов отклика. Получена экспериментальная зависимость этой амплитуды от длины промежутков в прерывистой трещине. График зависимости имеет кусочно-линейный вид. На рис. 1, 2 приведены типовой вид отклика и модельная сейсмограмма для случая пустой прерывистой трещины. Наработки и результаты работы имеют важное значение для построения корректных моделей сложных трещинообразных объектов, часто встречающихся в геологической практике. Секция информатики 69 70 53-я научная конференция МФТИ ФУПМ-2 Литература 1. Кондауров В.И., Фортов В.Е. Основы термомеханики конденсированной среды. — М.: МФТИ, 2002. 2. Магомедов А.М., Холодов А.С. Сеточно-характеристические численные методы. — М.: Наука, 1988. 3. Петров И.Б., Холодов А.С. Численное исследование некоторых динамических задач механики деформируемого твёрдого тела сеточно-характеристическим методом // Журнал вычислительной математики и математической физики. — 1984. — Т. 24, № 5. — С. 722--739. Рис. 1. Волновая картина отклика для пустой прерывистой трещины Рис. 2. Сейсмограмма отклика для пустой прерывистой трещины. По оси х — время, по оси y — смещение приемника в горизонтальном направлении 72 Секция проблем интеллектуального анализа данных, распознавания и прогнозирования УДК 51-7 А.В. Булычев bulytchev.isa.ran@gmail.com Институт системного анализа РАН Экспертные системы обеспечения безопасности регионов России, основанные на технологии анализа данных Data Mining Проблема принятия решений в области обеспечения безопасности регионов России является актуальной и тесно связанной с решением системной задачи развития регионов. Решение другой актуальной задачи направлено на снижение рисков и затрат на ликвидацию последствий чрезвычайных ситуаций природного и техногенного характера, своевременное реагирование и разработку превентивных мероприятий на поступающую информацию. В работе решена задача прогнозирования критических отклонений в виде формализованного правила в сложных социально-экономических системах. Предполагается, что, начиная с некоторого момента времени, процесс перестает быть контролируемым и существенно возрастает вероятность опасных последствий; при этом в каждый момент времени процесс может протекать без нарушения спецификаций его работы. Направлением повышения эффективности принимаемых решений является использование технологий интеллектуального анализа данных «Data Mining»: исследование и обнаружение «машиной» (алгоритмами) в данных знаний, которые ранее не были известны, нетривиальны, практически полезны [1; 2; 3]. Сложность состоит в решении плохоформализованной задачи поиска и порождении гипотез о переходе состояний объекта 53-я научная конференция МФТИ ФУПМ-2 в «критическую» область и формализации внутрисистемных закономерностей [4]. Производственно-технологические региональные процессы описываются динамикой нескольких показателей. Решается задача построения прогноза комплексного показателя безопасности X(x1 , x2 , ..., xn ) на будущие периоды и определения показателей, оказывающих наибольшее значение на его величину, где x1 , x2 , ..., xn — выбранные показатели региона (экономические, социальные и др.). Для построения плотности вероятности используются байесовские апостериорные функции плотности вероятности p(θ|y), полученные с помощью случайных выборок значений комплексного показателя безопасности за разные периоды, из которых формируется комитет с решающим правилом усреднения (комитет состоит примерно из 50 функций, θ — вектор математического ожидания и дисперсии). Имеется выборка значений X(x1 , x2 , ..., xn ) за n периодов: y = (y1 , ..., yn ). Обозначая y = (y1998 , y1999 , y2000 , y2001 , y2002 , y2003 ), определяется прогнозное значение интегрального показателя X(x1 , x2 , ..., xn ) каждого из регионов (математическое ожидание) на будущий период: M (y2004 |y) = y2004 p(y2004 |y)p(y2004 |θ,y)p(θ|y)dθdy2004 . R Rθ Это значение сравнивается с критическим, которое рассчитывается индивидуально для каждого региона как выборочное среднее величин X(x1 , x2 , ..., xn ) за определенные периоды. Таким образом, разработан новый метод прогнозирования динамики сложных производственных систем на примере региональной информации с формализацией критических отклонений в виде алгебраических правил. Он позволяет выделять классы регионов, для которых схожа стратегия обеспечения безопасности, что приводит к более эффективному распределению ресурсов и синхронизации обеспечения безопасности регионов России, а также позволяет использовать успешный опыт обеспечения безопасности. (Работа выполнена при финансовой поддержке РФФИ, проект № 10-07-00352). Литература 1. Булычев А.В., Бритков В.Б. Методы анализа больших объемов слабоструктурированной информации // Информационные технологии и вычислительные системы. — 2010. — Т. 8. — С. 36--44. Секция проблем интеллектуального анализа данных, распознавания и прогнозирования 73 2. Арсеньев С.Б., Бритков В.Б., Маленкова Н.А. Использование технологии анализа данных в интеллектуальных информационных системах // Управление информационными потоками: Сборник трудов Института системного анализа РАН. — 2002. — С. 47--68. 3. Рудаков К.В. Об алгебраической теории универсальных и локальных ограничений для задач классификации // Распознавание, классификация, прогноз: Математические методы и их применение. — 1988. — Вып. 1. — С. 176--200. 4. Бритков В.Б., Булычев А.В. Информационное моделирование сложных плохоформализуемых систем // VIII Всероссийская школасеминар «Прикладные проблемы управления макросистемами». Тезисы докладов. — Апатиты.: КНЦ РАН, 2010. — С. 6--7. УДК 519.65 А.А. Зайцев likzet@gmail.com Московский физико-технический институт (государственный университет) Выбор моделей нелинейной регрессии с анализом гиперпараметров Рассматривается задача выбора модели нелинейной регрессии. Задача состоит в отыскании модели нелинейной регрессии оптимальной структуры и оценке ее параметров на заданной выборке. Для выбора модели предлагается оценивать информативность компонент модели и строить модель, содержащую наиболее информативные компоненты. В качестве информативности компонент модели используются оценки значений гиперпараметров, параметров распределения параметров модели. К. Бишоп в [1] опубликовал способ оценки значений гиперпараметров на основе связанного байесовского вывода. В.В. Стрижов в [2] разработал алгоритм оценки информативности компонент модели на основе этого подхода. В данной работе предложен алгоритм для порождения и выбора моделей нелинейной регрессии, наследующий идеи этого алгоритма. Алгоритм позволяет оценивать информативность отдельных компонентов модели и создавать модели, набор компонент которых наиболее информативен. 74 53-я научная конференция МФТИ ФУПМ-2 Для порождения существенно нелинейных моделей используется генетический алгоритм. На первом шаге алгоритма порождается начальный набор моделей. На следующих шагах происходит порождение новых популяций с использованием мутации и скрещивания лучших моделей, полученных на предыдущем шаге алгоритма, и затем — модификация множества наилучших моделей с использованием множества порожденных на текущем шаге моделей. Для реализации генетического алгоритма применяется два подхода. В первом мы минимизируем сумму квадратов регрессионных невязок и не вводим оценку информативности при настройке параметров модели. Во втором мы максимизируем правдоподобие модели [1], используя оценки значений гиперпараметров, соответствующие компонентам модели. Такой подход позволяет оценить информативность компонент модели по значению гиперпараметров, соответствующих компонентам модели. Оценка информативности используется при выборе компонент модели для скрещивания и мутации. Для сравнения используемых алгоритмов был проведен вычислительный эксперимент. Его результаты говорят о том, что предложенный подход применим к задаче выбора нелинейных регрессионных моделей. Литература 1. Bishop C. Pattern recognition and machine learning. — Singapore: Springer, 2006. — 749 P. 2. Strijov V., Weber G-W . Nonlinear regression model generation using hyperparameter optimization // Computers and mathematics with applications 60. — 2010. — P. 981--988. Секция проблем интеллектуального анализа данных, распознавания и прогнозирования 75 УДК 004.93 А.В. Зухба a__l@mail.ru Московский физико-технический институт (государственный университет) Оценка оптимальности жадного алгоритма отбора эталонных объектов в методе ближайшего соседа Пусть имеется множество объектов X и конечное множество ответов Y . Задача классификации состоит в том, чтобы по обучающей выборке пар «объект–ответ» X L = (xi ,yi )L i=1 построить отображение a : X → Y , минимизирующее число ошибок классификации как на обучающей выборке, так и на неизвестной контрольной выборке. Алгоритм ближайшего соседа относит объект к тому же классу, к которому принадлежит ближайший к нему (в смысле заданной на X функции расстояния) объект обучающей выборки. Рассмотрим модификацию этого алгоритма, предполагающую предварительный отбор из выборки X L некоторого подмножества эталонных объектов, по которым и будет проводиться классификация. Для простоты рассмотрим случай двух классов, |Y | = 2. Задача отбора эталонов тесно связана с известной задачей дискретной оптимизации о покрытии множества подмножествами. Дано конечное множество X и такое семейство F его подмножеств, что каждый элемент множества X принадлежит хотя бы одному подмножеству из F . Задача состоит в том, чтобы найти подмножество C ⊆ F минимальной мощности, элементы которого покрывают все множество X. Теорема 1. Жадный алгоритм поиска покрывающего подмножества C∗ ⊆ F является приближенным алгоритмом с полиномиальным временем работы и находит множество C ⊆ F такое, что |C| |C ∗ | · H(max{|S| : S ∈ F }), где H — гармоническое число [2]. Теорема 2. Поиск эталонного множества, гарантирующего заданное качество классификации, сводится к задаче о покрытии множества подмножествами. При этом жадный алгоритм находит множество Ω, для которого |Ω| |Ω ∗ | · H(max{|S| : S ∈ F }), где каждое множество объектов S связано с некоторым объектом (претендентом в эталоны), находящимся к ним ближе, чем ближайший объект чужо- 76 53-я научная конференция МФТИ ФУПМ-2 го класса. Под Ω∗ понимается минимальное по мощности множество эталонов, гарантирующих данное качество классификации. Большинство применяемых на практике алгоритмов отбора эталонов являются жадными [1, 2]. Полученные оценки позволяют оценить, насколько число найденных с их помощью эталонов может отличаться от оптимального, а также, подходят ли жадные алгоритмы для отбора эталонов в заданной выборке при заданной функции расстояния. Литература 1. Загоруйко Н.Г. Прикладные методы анализа данных и знаний. — Новосибирск: ИМ СО РАН, 1999. 2. Иванов М.Н., Воронцов К.В. Отбор эталонов, основанный на минимизации функционала полного скользящего контроля // Всеросс. конф. ММРО-14. — М. МАКС Пресс, 2009. 3. Кормен Т.Х., Лейзерсон С.Е., Ривест Р.Л. Алгоритмы. Построение и анализ / пер. с англ. под ред. А. Шеня. — М.: МЦНМО, 2002. УДК 004.932.2 А.В. Куракин1 , Л.М. Местецкий1,2 alekseyvk@yandex.ru 1 2 Московский физико-технический институт (государственный университет) Московский государственный университет им. М.В. Ломоносова Распознавание жестов ладони на основе анализа скелетного представления силуэта ладони Распознавание жестов имеет много потенциальных практических применений и поэтому является активно развивающейся областью компьютерного зрения. Успешное продвижение в решении этой задачи позволит упростить взаимодействие пользователя и компьютера за счет использования жестов, а также позволит упростить взаимодействие глухонемых людей с автоматизированными системами. Одной частной задачей в этой области является распознавание жестов человеческой ладони. В литературе рассматриваются различные подходы к решению задачи, в частности использование специальных Секция проблем интеллектуального анализа данных, распознавания и прогнозирования 77 перчаток и маркеров [1], использование нескольких камер [2] или слежение за рукой без специальных приспособлений [3]. В данной работе распознавание жестов выполняется за счет анализа изображения ладони полученного с помощью web-камеры. Сам процесс распознавания состоит в бинаризации изображения ладони с целью выделить ее силуэт, построении скелетного представления [4, 5] и анализа полученного скелетного представления. Скелетное представление значительно упрощает анализ формы ладони, по сравнению с другими методами [3] и позволяет эффективно определять такие характеристики ладони, как количество видимых пальцев, координаты кончиков пальцев, оснований пальцев и координаты центра ладони. Пример ладони с построенным скелетом и помеченными кончиками и основаниями пальцев, а также с помеченным центром ладони приведен на рис. 1. Для экспериментальной проверки адекватности и точности данного метода была реализована программная демонстрация, которая позволила с помощью жестов выполнять перемещение, масштабирование и вращение объектов на экране компьютера (рис. 2). 78 53-я научная конференция МФТИ ФУПМ-2 Рис. 1. Результат построения скелета и выделения пальцев для силуэта ладони Литература 1. Wang R.Y., Popoviґc J. Real-time hand-tracking with a color glove // ACM Transactions on Graphics. — V. 28(3). — P. 63:1--63:8. 2. Schlattman M., Klein R. Simultaneous 4 gestures 6 dof real-time two-hand tracking without any markers // Proceedings of the 2007 ACM symposium on Virtual reality software and technology. — 2007. — P. 39–42. 3. Dhawale P., Masoodian M., Rogers B. Bare-hand 3d gesture input to interactive systems // Proceedings of the 7th ACM SIGCHI New Zealand chapter’s international conference on Computer-human interaction. — 2006. — P. 25–32. 4. Местецкий Л.М. Непрерывная морфология бинарных изображений: фигуры, скелеты, циркуляры. — М.: ФИЗМАТЛИТ, 2009. — 288 С. 5. Beristain A., Grana M. A stable skeletonization for tabletop gesture recognition // Lecture Notes in Computer Science. — 2010. — V. 6016 — P. 610–621. Рис. 2. Кадр из программы, демонстрирующей управление с помощью жестов Секция проблем интеллектуального анализа данных, распознавания и прогнозирования 79 УДК 004.93’12 В.И. Мендус1 , В.А. Петрухин2 , Н.А. Вязовик2 , Е.В. Кривцов2 , А.И. Корниенко2 Mendus.VI@vtb24.ru, vapetr@gmail.com, vyazovick@cmit.mipt.ru, egorkrivtsov@gmail.com, aleksej.kornienko@gmail.com 1 2 ВТБ24 Московский физико-технический институт (государственный университет) Ускорение принятия решений по диспутным циклам международных платежных систем с целью повышения качества обслуживания Все больше платежей совершается электронным образом с использованием банковских карт и международных платежных систем (МПС), таких как VISA и Master Card. При этом, разумеется, невозможно избежать возникновения спорных ситуаций между банком и клиентом. Типовые примеры: при оплате дважды списывается сумма, или оказывается, что с потерянной (украденной) карты произведены платежи. В таких случаях клиент подает претензию в банк, опротестовывает операции, которые считает ошибочными, с целью возврата денежных средств. Банк в свою очередь начинает диспутный цикл по правилам МПС. Формально решение должно быть принято в течение 45--180 дней. Разумеется, клиенты не хотят ждать так долго. В то же время специалисты банка накапливают опыт, выделяют определенные закономерности — при каких параметрах транзакции она будет опротестована, скорее всего, успешно. И хотя банк обязан провести диспутный цикл до конца, он может с целью повышения качества обслуживания вернуть деньги клиенту досрочно, если уверенность прогноза достаточно высокая. Для этого требуется высокоточная модель, которая строится на основе накопленной истории опротестований и чьей задачей является предсказание результатов диспутных циклов поступающих претензий с целью ускорения принятия решений по ним. Набор признаков транзакции определяется правилами МПС, а также добавляются данные, указываемые в претензии (причина оспаривания операции, наличие необходимых документов и пр.). Предварительно все номинальные признаки преобразовываются в бинарные, 80 53-я научная конференция МФТИ ФУПМ-2 а линейные отображаются на отрезок (0,1) по значению эмпирической функции распределения в данной точке. Поскольку признаков получается очень много, важно провести отбор наиболее значимых признаков. Не все признаки всегда заполнены, и большинство из них заведомо не может оказывать влияния на будущее решение. Предлагается два алгоритма построения модели — с использованием логистической регрессии [1] и с использованием нейронных сетей [2]. Для каждого алгоритма необходимо подбирать свои параметры обучения, поскольку различаются возможности обучения и требуемое для этого время. Требуется особая внимательность при выборе контрольной выборки для проверки модели, так как в различные периоды характер претензий меняется неоднородно. После запуска модели в эксплуатацию необходим постоянный мониторинг точности предсказаний, так как меняются и правила МПС, и характер мошенничеств с кредитным картами, а также опыт сотрудников банка (человеческий фактор). При снижении точности требуется накопление исторических данных в новых условиях и переобучение модели. Полученная статистическая модель дополняется моделью, построенной на основе накопленного опыта сотрудников банка. Используемые правила включают параметры, чьи значения могут настраивать специалисты банка. Это позволяет оперативно производить тонкую настройку при изменениях правил МПС, не дожидаясь накопления новых данных для переобучения статистической модели. Задача по своей природе схожа с известной задачей кредитного скоринга [3]. В частности, поэтому для решения задачи была выбрана логистическая регрессия в качестве одной из моделей. Однако есть ряд отличий. Например, в задачах кредитного скоринга у нас фактически есть данные только по клиентам, которым дали кредит. Здесь же мы знаем результаты всех жалоб, и нам необходимо правильно классифицировать новые объекты. Литература 1. Hosmer D., Lemeshow S. Applied logistic regression. — New York: John Wiley & Sons, Inc., 2000. — 376 p. 2. Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. — М.: Горячая линия-Телеком, 2002. — 382 с. Секция проблем интеллектуального анализа данных, распознавания и прогнозирования 81 3. Siddiqi N. Credit Risk Scorecards: Developing and Implementing Intelligent Credit Scoring. — Hoboken: John Wiley & Sons, Inc., 2005 — 208 p. УДК 519.226.3 С.И. Панарин 82 Исследование тем русскоязычных блогов с помощью модели Latent Dirichlet Allocation В работе рассматривается применение модели тем (topic model) Latent Dirichlet Allocation (LDA) [1] для исследования тем русскоязычных блогов. Эта модель описывает распределение тем в коллекции документов, причем каждый документ может принадлежать сразу нескольким темам. Модель определяет вероятность реализации вектора w из N слов в документе: N p(zn |θ)p(wn |zn ,β) dθ, p(w|α,β) = p(θ|α) n=1 zn где α,β — детерминированные параметры модели, p(θ|α) — распределение тем в документе, p(wn |zn ,β) — распределение слов для темы zn . Тема рассматривается как полиномиальное распределение на множестве слов. Для оценки искомых распределений тем в документах и слов в темах используется байесовский подход. Для модели LDA доступны несколько программных реализаций, которые обрабатывают данные, подготовленные в специальном формате. В докладе разработана программа на языке Python, подготавливающая данные в нужном формате, получая полные тексты записей русскоязычных блогов и используя библиотеку русской морфологии ‘pymorphy’. Блоги определяются ссылками на RSS из файла feedlist. txt. В результате работы программа формирует два файла — vocab. txt (словарь) и docs. txt (количество появлений слов в каждом документе). Эти файлы затем обрабатываются функциями модуля ‘lda’ ФУПМ-2 для языка R. В результате выводится изображение с наиболее популярными темами и словами, имеющими максимальные вероятности в этих темах. В данной работе модель LDA применяется к 119 записям блогов проекта Хабрахабр (http://www.habr.ru/). Примеры автоматически выделенных тем: «продукт, заказ, бизнес, магазин, цена»; «usb, разъем, плата, устройство, pci»; «шрифт, буква, символ, дизайнер, начертание». Литература spanarin@hse.ru Государственный университет — Высшая школа экономики 53-я научная конференция МФТИ 1. Blei D. [et al.] Latent Dirichlet Allocation // Journal of Machine Learning Research. — 2003. — N. 3. — P. 993--1022. УДК 004.93 М.Е. Панов panov.maxim@gmail.com Московский физико-технический институт (государственный университет) Метод нейтральной точки для компенсации пропусков в обучающей совокупности при обучении распознаванию образов по методу опорных векторов В задачах распознавания образов часто встречается проблема пропущенных значений признаков в обучающей совокупности. В результате мы не можем использовать объекты с пропущенными значениями признаков для обучения методами, работающими в пространстве всех признаков (например, метод опорных векторов [1]). На данный момент в литературе по распознаванию образов проблема пропущенных значений признаков решается несколькими основными способами [2, 3, 4, 5]. Однако ни один из этих подходов не является полностью удовлетворительным. В данной работе предлагается заменять пропущенные значения признаков с помощью метода нейтральной точки, изначально предложенного в [6] для случая разделенной обучающей совокупности, состоящей из непересекающихся Секция проблем интеллектуального анализа данных, распознавания и прогнозирования 83 подмножеств объектов, в пределах каждого из которых известны значения только одного признака. Идея метода заключается в замещении пропущенных измерений некоторого признака такими его значениями, которые не смещают решающее правило в процессе обучения в сторону одного из классов. В [6] показано, что в случае разделенной обучающей совокупности метод нейтральной точки теоретически эквивалентен методу комбинирования классификаторов, известному в литературе как Sum Rule [7]. В данной работе также предлагается модификация метода нейтральной точки для отдельных признаков, в которой нейтральная точка строится не по одному признаку, а по некоторому их подмножеству. Так построенные нейтральные точки, в отличие от нейтральных точек для отдельных признаков, учитывают взаимную корреляцию признаков. Эксперименты, проведенные на биометрической базе данных Biosecure DS2 [8], показывают, что метод нейтральной точки позволяет улучшить обобщающую способность метода опорных векторов по сравнению с обучением по неполной совокупности объектов и простыми методами заполнения пропусков. Литература 1. Vapnik V. Statistical Learning Theory. — John–Wiley & Sons, Inc, 1998. 2. Nandakumar K., Jain A.K., and Ross A. Fusion in multibiometric identification systems: What about the missing data? // InICB. — 2009. — P. 743--752. 3. Fatukasi O., Kittler J., and Poh N. Estimation of missing values in multimodal biometric fusion // IEEE Conference on Biometrics: Theory, Applications and Systems. — Washington, D.C., 2009. — P. 1--6. 4. Lucas–Cuesta J.M., de Cordoba Herralde R., D’Haro Enriquez L.F. Applying feature reduction analysis to a pprlm-multiple gaussian language identification system // Articulo en actas de las V Jornadas de Tecnologia del Habla. — Bilbao, 2008. — P. 29--32. 5. Lin T.I., Lee J.C., Ho H.J. On fast supervised learning for normal mixture models with missing information // Pattern Recognition. — 2006. — N. 6. — P. 1177--1187. 6. Windridge D., Mottl V., Tatarchuk A., Eliseyev A. The neutral point method for kernel-based combination of disjoint training data 84 53-я научная конференция МФТИ ФУПМ-2 in multimodal pattern recognition problem // LNCS. Proc. Multiple Classifier Systems. — 2007. — V. 4472. — P. 13--21. 7. Kittler J., Hatef M., Duin R.P.W., and Matas J. On Combining Classifiers // IEEE Trans. Pattern Analysis and Machine Intelligence. — 1998. — V. 20, N. 3. — P. 226--239. 8. Poh N., Bourlai T., Kittler J. A multimodal biometric test bed for quality dependent, cost-sensitive and client-specific score-level fusion algorithms // Pattern Recognition. — 2009. УДК 004.93 Е.А. Полежаева lena_polejaeva@mail.ru Московский государственный университет им. М.В. Ломоносова Инкрементные методы в коллаборативной фильтрации, влияние временного фактора и объема данных Методы коллаборативной фильтрации (collaborative filtering, CF) используются в рекомендующих системах и системах управления взаимоотношениями с клиентами (CRM) для автоматического формирования персональных предложений. В матрице исходных данных Y = (yur )nxd строки соответствуют n клиентам, столбцы d — объектам, в ячейках находятся оценки предпочтительности. Матрица Y разреженная, то есть имеет большое число пропусков. Задача состоит в том, чтобы для произвольного клиента спрогнозировать оценки предпочтительности объектов по всем незаполненным ячейкам в строке матрицы Y . В современных приложениях CF исходные данные могут иметь большие объёмы (миллионы клиентов и объектов) и поступать в реальном масштабе времени. В этом случае важны два требования инкрементности: метод должен эффективно работать как при появлении новых клиентов и объектов, так и при обновлении значений в матрице исходных данных. Предлагается метод, который объединяет в себе оба типа инкрементности, используя инкрементное сингулярное разложение (ISVD) [1] и обобщенный алгоритм обучения Хебба (GHA) [2]. ISVD позволяет эффективно добавлять новые объекты, а GHA — новых клиен- Секция проблем интеллектуального анализа данных, распознавания и прогнозирования 85 тов. При этом для построения начального SVD используется GHA, так как GHA заполняет пропуски в Y так, что применение SVD для Y становится возможным. При добавлении нового клиента GHA не требует полной перенастройки алгоритма, что очень важно при работе с большими данными. Совместное применение ISVD и GHA дает неплохие результаты в условиях постоянных обновлений в матрице Y. Эксперименты на модельных и реальных данных (MovieLens — 943 клиента, 1683 объекта, 10000 заполненных ячеек Y ) показали, что объем данных и временной фактор влияют на скорость сходимости алгоритма. При увеличении числа клиентов (строк Y ) растет скорость сходимости алгоритма (от 1000 итераций при 600 клиентах до 40 — на 940-м клиенте). Зависимость среднеквадратичной ошибки от объема данных является выпуклой функцией. При увеличении объема данных ошибка уменьшается. Измерения времени выполнения также показывают, что предложенный метод может быть полезен в современных динамических приложениях CF. Литература 1. Brand M. Fast low-rank modifications of the thin singular value decomposition // Linear Algebra and Its Applications. — 2006. — V. 415, N. 1. — P. 20--30. 2. Gabor T., Istvan P., Bottyan N., Domonkos T. Scalable Collaborative Filtering Approaches for Large Recommender Systems // The Journal of Machine Learning Research. — 2009. — V. 10. — P. 623--656. 86 53-я научная конференция МФТИ ФУПМ-2 УДК 519.216.3 А.А. Романенко alexromsput@gmail.com Московский физико-технический институт (государственный университет) Об одном обобщении агрегирующего алгоритма В. Вовка При прогнозировании временных рядов обычно используются вероятностные предположения о природе исходных данных, проверить справедливость которых практически невозможно. Существует альтернативный взгляд на проблему прогнозирования временных рядов, в котором вероятностные предположения заменяются на теоретикоигровые [1]. Игрой G называется тройка Ω,Γ,λ, где Ω — множество исходов, Γ — множество допустимых предсказаний, λ : Ω × Γ → R+ — функция потерь. Алгоритмом прогнозирования называется функция A : Ω∗ → Γ, которая по конечной последовательности ω ∈ Ω∗ выдает прогноз γT +1 следующего её элемента ωT +1 : γT +1 = A(ω1 , ..., ωT ). Потери от прогнозирования последовательности ω определяются про цессом потерь LossA (ω1 , ..., ωT ) = Tt=1 λ(ωt ,γt ). Пусть имеется N алгоритмов прогнозирования A1 , ..., AN , которые будем называть экспертами. Агрегирующий алгоритм AA прогнозирует ω , используя в каждый момент времени прогнозы экспертов: (1) (N ) (j) AA(ω1 , ..., ωt , γt+1 , ..., γt+1 ) = γt+1 , где γt+1 — прогноз j-го эксперта. Агрегирующий алгоритм В. Вовка AA взвешивает в экспоненциальном пространстве ошибки прогнозов экспертов, затем, используя решающее правило Σ, делает следующего элемента после прогноз N (j) , где exp(−η · Loss ( ω )) · p довательности: γT +1 = Σ log Aj 0 j=1 (j) p0 — вес эксперта j в начальный момент времени, η > 0 — параметр алгоритма. При прогнозировании временного ряда мы имеем дело с игрой G = [Y1 ,Y2 ],[Y1 ,Y2 ],(ω − γ)2 , где [Y1 ,Y2 ] — отрезок из R. В качестве экспертов рассматриваются постоянные регрессоры: γt = θ · xt , где xt — сигнал, θ ∈ Rn . Если в качестве сигнала взять предсказания n алгоритмов прогнозирования, то AA будет композицией алгоритмов прогнозирования. В работах В. Вовка и его учеников рассмотрен част- Секция проблем интеллектуального анализа данных, распознавания и прогнозирования 87 ный случай G, когда −Y1 = Y2 = Y > 0, а начальное распределение 2 весов экспертов задается функцией p(θ) = (ηa/π)n/2 exp(−ηa · θ ). Алгоритм AA в этом случае называется агрегированной регрессией AAR [2]. Для него доказана оценка качества: 2 LossAAR ( ω ) inf (Lossθ ( ω ) + a θ )+ θ +NY2 ln 1 TY 2 + 1 . a 88 53-я научная конференция МФТИ ФУПМ-2 УДК 519.254 К.С. Скипор skiporkonstantin@mail.ru Московский физико-технический институт (государственный университет) Метод наименьших углов для логистической регрессии В данной работе предложен обобщенный алгоритм GAAR для общего случая игры G и для него получена оценка качества: 2 LossGAAR ( ω ) inf (Lossθ ( ω ) + a θ )+ θ 1 1 2 2 + N (Y2 − Y1 ) ln T (max(|Y1 |,|Y2 |)) + 1 4 a и показано экспериментально, что в частном случае −Y1 = Y2 = Y > 0 он работает не хуже AAR, а в общем случае, когда среднее значение ряда не равно нулю, превосходит его по качеству прогнозирования. Литература 1. Vovk V. A game of prediction with expert advice // Journal of Computer and System Sciences. — 1998. — N. 56. — P.153--173. 2. Busuttil S. [et al.]. Improving the aggregating algorithm for regression // Proceedings of the 25th IASTED International Conference on Artificial Intelligence and Applications (AIA, 2007). — 2007. — P. 347--352. В данной работе предлагается алгоритм последовательного добавления признаков в модели логистической регрессии (Least Angle Logistic Regression, LALR). Алгоритм основан на методе наименьших углов, рассмотренного для линейных моделей в [1], с использованием линеаризации [2] iфункционалаμiлогарифма правдоподобия: (μ) = m i=1 (y μi − ln(1 + e )), где μ(β) = Xβ. На каждом шаге алгоритма имеется активное множество индексов A, которому соответствует матрица активных признаков XA , входящих в текущую модель, и его дополнение Ac . Решается задача максимизации приращения логарифма правдоподобия: Δ(μ(γ)) = (μA + XA γ) − (μA ) → max γ при условии, что скорость роста функционала по любому активному признаку не меньше скорости роста функционала по любому неактивному признаку: d d (μA + XA γ + xj α) = dα (μA + XA γ + xd α)α=0 , где j ∈ A dα α=0 и d ∈ Ac . Линеаризация этих условий приводит к задаче линейного программирования (ЗЛП). Для этой задачи определяется сокращенное множество ее потенциальных решений Υ. Далее определяется оптимальный вектор параметров γ ∗ и ему соответствующий новый активный индекс d∗ , который добавляется в активное множество A. Теорема 1. Если ЗЛП имеет решение γ ∗ , то γ ∗ ∈ Υ, причем γ ∗ = argminγ∈Υ + {Δ(μ(γ))linearizing }, где «min+ » означает, что минимум берется только из положительных значений. Секция проблем интеллектуального анализа данных, распознавания и прогнозирования 89 Следствие 1. На каждом шаге алгоритма при линеаризации справедливо: абсолютная корреляция вектора остатков на любой активный признак одинакова и больше абсолютной корреляции на любой неактивный признак. Теорема 1 доказывает корректность предложенного алгоритма. Следствие 1 представляет собой аналог свойства алгоритма LARS для линейных моделей: на каждом шаге алгоритма вектор остатков лежит на биссекторе добавленных признаков. Основное свойство предложенного алгоритма состоит в том, что количество шагов алгоритма равно количеству признаков. Работа алгоритма проиллюстрирована задачей изучения факторов риска ишемических заболеваний сердца «South African Heart Disease», см. [3]. Результаты работы алгоритма представлены на рис. 1. 90 53-я научная конференция МФТИ ФУПМ-2 Литература 1. Hastie T., Efron B., Tibshirani R., Johnstone I. Least Angle Regression // Annals of statistics. — 2004. — V. 32, N. 2. — P. 407--499. 2. Madigan D., Ridgeway G. Discussion of the least angle regression // Annals of statistics. — 2004. — V. 32, N. 2. — P. 465--469. 3. Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning. — New York: Springer, 2001. УДК 519.213.2 А.А. Харин aaharin@yandex.ru Современная гуманитарная академия Теорема о существовании разрывов в шкале вероятностей. Непрерывный случай В настоящем докладе развивается и уточняется теорема [1]. Если математическое ожидание M стремится к границе конечного интервала [A,B], то конечные (n < ∞) центральные моменты стремятся к нулю, в том числе для границы A: |E(X − M )n | 2(B − A)n−1 (M − A) −→M→A 0. Если на конечном интервале какой-либо конечный центральный момент E(X − M )n , например дисперсия, не может приближаться к нулю ближе, чем на rdispers > 0, то математическое ожидание тоже не может приближаться к границе этого интервала ближе, чем на rexp ect > 0, в том числе для A Рис. 1. Оценка параметров с помощью алгоритма LALR для данных «South African Heart Disease». Вертикальные линии соответствуют шагам алгоритма. Данные стандартизованы с нулевым средним и единичной дисперсией 0 < rexp ect ≡ rdispers (M − A). 2(B − A)n−1 Если между частотой F и границами шкалы вероятностей [0,1] существуют ненулевые разрывы, то между вероятностью P и границами шкалы вероятностей существуют такие же разрывы, в той мере, в какой P является пределом F при стремлении числа испытаний к бесконечности. Секция проблем интеллектуального анализа данных, распознавания и прогнозирования 91 Теорема была применена для ряда приложений, в том числе [2] и [3]. Литература 1. Харин А.А. Теорема о существовании разрывов в шкале вероятностей // Труды 9-й Международной конференции по финансовоактуарной математике и эвентоконвергенции технологий. — 2010. 2. Харин А.А. О разрывах в шкале вероятностей и о некоторых проблемах моделирования // Труды 3-й Международной конференции «Математическое моделирование социальной и экономической динамики». — 2010. 3. Харин А.А. Теорема о существовании разрывов в шкале вероятностей, как математический базис принципа неопределенного будущего // Труды 10-й международной научной школы «Моделирование и анализ безопасности и риска в сложных системах». — 2010. Секция систем математического обеспечения УДК 519.685.7 А.А. Бездушный andrey.bezdushny@gmail.com Московский физико-технический институт (государственный университет) Вычислительный центр им. А.А. Дородницына РАН Автоматизация разработки интернет-информационных систем на базе OWL-онтологий Целью работы является разработка технологии, ориентированной на автоматизацию проектирования и реализацию информационных web-систем и приложений. Основными направлениями автоматизации являются: • Создание и настройка визуального представления данных. Зачастую реализуемая система должна обладать некими стандартными стилем и дизайном, соблюдаемыми во всем приложении. Система должна упрощать как смену дизайна целиком, так и отдельных его частей. • Обеспечение минимальной функциональности манипулирования данными. По сформулированной модели данных предметной области и соответствующим параметрам необходимо генерировать фрагменты системы / приложения, реализующие основные операции работы с данными, а именно: создание и удаление объектов, просмотр и изменение свойств объекта, а также поиск по атрибутам объекта. Предлагаемое решение определяет три этапа моделирования приложения: описание структуры данных (модель предметной области), Секция систем математического обеспечения 93 создание модели взаимодействия с пользователем и определения ограничений целостности данных. Структура данных описывается с помощью языка OWL. Выразительность модели данных OWL существенно богаче выразительности модели ООП. В частности, OWL определят наследование не только классов, но и свойств. А по средствам OWL аннотаций легко определять метаданные. Модель визуального представления данных должна обеспечивать упомянутое в начале работы требование о соблюдении общего дизайна приложения. Это требование реализуется заданием набора типовых шаблонов визуализации. Шаблоны обеспечивают компоновку визуальной среды пользователя и представление в ней данных. Каждому классу данных, определенному на этапе создания модели предметной области, может быть поставлен в соответствие один или более шаблон визуализации. Метаданные такого рода определяются с помощью OWL аннотаций к классу. Подсистема определения ограничений позволяет задавать языково-зависимые выражения для атрибута. Таким образом, можно расширить семантику атрибута на уровне объекта. В качестве платформы для реализации решения, описанного выше, была выбрана web-платформа на базе языка Java. Визуализация (отображение) данных предметной области для этой платформы определяется «типом отображения», «шаблоном отображения» и «каркасом отображения». Каркас отображения определяет компоновку визуальной среды пользователя, может использоваться для отображения любого класса определенного в модели предметной области. Шаблон отображения определяет визуализацию конкретного атрибута или класса целиком (например, атрибут типа строка может быть визуализирован в виде поле ввода или же простым текстом). Тип отображения определяет соответствие между атрибутами хранимых классов и шаблонами отображения (например, при выводе атрибута типа строка на просмотр будет использован шаблон, выводящий строку простым текстом, а при выводе на редактирование — в виде поля ввода). По умолчанию, определены четыре типа отображения данных: на просмотр, на редактирование, на поиск и списком. Каждому объекту предметной области в схеме могут быть поставлены в соответствие метаданные о визуализации этого объекта в указанных типах отображения. На основе этих метаданных для каждого хранимого класса 94 53-я научная конференция МФТИ ФУПМ-2 генерируются стандартные страницы: индекс, просмотр, поиск и редактирование. Таким образом, задав в схеме шаблоны и описав метаданные о визуализации класса, мы получаем сгенерированные страницы просмотра / редактирования / поиска, а также возможность использовать метаданные о модели данных при написании произвольных пользовательских страниц. Литература 1. Rossi G., Pastor O., Schwabe D., Olsina L. Web Engineering: Modelling and Implementing Web Applications. 2. Михеев П. Н, Меденников А. М, Бездушный А.Н. Проектирование информационных веб-порталов в ИСИР. 3. Бездушный А.А. Применение интерактивных Web-интерфейсов в системе Научный Институт РАН // Труды 52-й научной конференции МФТИ «Современные проблемы фундаментальных и прикладных наук». — 2009. — Т. 2. — С. 121--122. УДК 004.031.42 А.А. Захаров andreya@sufler.ru Вычислительный центр им. А.А. Дородницына РАН Современная система управления электронными библиотеками Современный мир предъявляет повышенные требования к информационным системам, и эти требования в полной мере относятся и к ЭБ. К ним относятся в первую очередь следующие требования: — интеграции с другими информационными системами; — распределённость; — следование стандартам; — уход от документоподобных объектов; — контроль качества ресурсов. В нашем проекте системы управления электронной библиотекой (СУЭБ) мы старались удовлетворить в той или иной мере все эти требования. Секция систем математического обеспечения 95 В основе проекта СУЭБ лежит платформа «Научный Институт РАН». Схема метаданных значительно расширена относительно базовой описаниями публикаций, авторов, музейных предметов и мультимедийных данных. Кроме того, введена адаптивная часть схемы, позволяющая администраторам настраивать схему метаданных после установки СУЭБ без её перекомпиляции. При построении схемы и СУЭБ в целом были использованы ведущие мировые стандарты в данной области, такие как DELOS, OAIS, CIDOC-CRM, OAI-PMH, Dublin Core и другие. Разработанная СУЭБ легко интегрируется в OAI-PMH сети распределённого поиска и каталогизации как в качестве сервера, так и клиента. Кроме того, реализован протокол обмена данными Единого научного информационного пространства (ЕНИП) РАН, что позволяет интегрировать установки СУЭБ в ЕНИП. Также возможен импорт метаданных из форматов CIDOC-CRM+RDF и RUSMARC. СУЭБ установлена в ЭБ «Научное наследие России», в настоящее время данная ЭБ насчитывает более 3000 публикаций со сканированными полными текстами, более 1500 записей персон и более 100 музейных предметов. Контроль качества ресурсов обеспечивается отдельной системой подготовки публикаций, внутри которой происходит обработка поступающих сканированных образов, подготовка метаданных, а также окончательный контроль перед опубликованием в ЭБ. В планах дальнейшего развития СУЭБ стоит развитие средств интеграции с другими ЭБ, создание собственной системы подготовки публикаций, поддержка новых форматов хранения данных, а также переход на новую программную платформу. Литература 1. Бездушный А.Н., Бездушный А.А., Нестеренко А.К. [и др.]. Информационная web-система Научный институт на платформе ЕНИП. — М.: ВЦ РАН, 2007. 2. Захаров А.А. Логическая модель цифровых библиотек в онтологии ЕНИП // Электронные библиотеки: перспективные методы и технологии, электронные коллекции: Труды XI Всероссийской научной конференции RCDL’2009. — Петрозаводск: КарНЦ РАН, 2009. — C. 487. 96 53-я научная конференция МФТИ ФУПМ-2 УДК 519.686.4 А.А. Каленкова akalenkova@ultimeta.ru Вычислительный центр им. А.А. Дородницына РАН Использование системы автоматической верификации и оптимизации потоков работ для анализа процессов обработки информационных ресурсов в электронной библиотеке Процессы обработки информационных ресурсов в электронных библиотеках, как и все производственные процессы, состоящие из подзадач, которые выполняются различными участниками и программными приложениями, нуждаются в строгой формализации и автоматизации исполнения. Широкое распространение имеет теория потоков работ: потоком работ принято считать формальное описание процедуры передачи данных и управления между участниками процесса в соответствии с определенными правилами его выполнения, системы управления потоками работ в свою очередь решают задачи определения и исполнения потоков работ [1]. Единый управляющий механизм и строгая формализация описания производственного процесса на некотором языке обеспечивают: • координацию потока управления и потока данных; • полную автоматизацию отдельных участков процесса (появляется возможность взаимодействия с «программными» исполнителями заданий в рамках некоторого унифицированного интерфейса); • модульность процесса, повторное использование описаний; • хорошую управляемость процессом, доступ к данным любого активного этапа; • четкое ролевое разделение участников процесса; • возможность сбора статистики выполнения процесса для последующего анализа; Секция систем математического обеспечения 97 • а также возможность применения унифицированных алгоритмов оптимизации процесса. Современные системы управления потоками работ позволяют интегрировать как программные, так и человеческие ресурсы, и эффективно решающие указанные задачи. В настоящее время определенное внимание уделяется алгоритмам автоматического анализа потоков работ — их верификации и оптимизации. Эти алгоритмы особенно необходимы там, где процессы имеют объемную и запутанную структуру. Так, например, процессы обработки информационных ресурсов в электронных библиотеках достаточно сложны, так как в них участвуют несколько организаций, между которыми идет интенсивный обмен данными и возможны ветвления. Нами был предложен новый алгоритм верификации потоков работ [2], вычислительная сложность которого полиномиальна. В ходе работы этого алгоритма определяются условия выполнения атомарных действий, что позволило также создать алгоритм оптимизации потоков работ по времени выполнения — алгоритм автоматического распараллеливания действий, независящих по данным. В отличие от известных алгоритмов структурной оптимизации потоков работ, базирующихся на применении шаблонных преобразований [3--4], предлагаемый алгоритм оптимизации распараллеливает поток работ, содержащий произвольные ветвящиеся структуры. Эти алгоритмы были реализованы в Системе автоматической верификации и оптимизации потоков работ [5]. Целью этой работы является формализация процессов обработки информационных ресурсов в рамках ЭБ «Научное наследие России» [6] и оценка применимости Системы автоматической верификации и оптимизации потоков работ для их анализа. Литература 1. Terminology & Glossary / Workflow Management Coalition. — 1999. — http://www.wfmc.org/Download-document/WFMC-TC-1011Ver-3-Terminology-and-Glossary-English.html. 2. Kalenkova A. A . Application of If–Conversion to Verification and Optimization of Workflows // Programming and Computer Software. — 2010. — V. 36, N. 5. — P. 276--288. 3. Netjes M. , Reijers H.A., Aalst W.M.P. On the Formal Generation of Process Redesigns // First International Workshop on Model–Driven Engineering For Business Process Management. — 2008. — P. 49–60. 98 53-я научная конференция МФТИ ФУПМ-2 4. Cao H. , Jin H., Wu S., Tao Y. PGWFT: A Petri Net Based Grid Workflow Verification and Optimization Toolkit // Advances in Grid and Pervasive Computing. Third International Conference. — 2008. — P. 48–58. 5. Каленкова А.А. , Серебряков В.А., Бездушный А.Н. Система автоматической верификации и оптимизации потоков работ // Телематика: Труды XVII всероссийской научно-методической конференции. — СПб.: 2010. — С. 381--382. 6. Захаров А.А. , Филиппов В.И. Поддержка цифровых библиотек и музейных объектов в среде ЕНИП // Электронные библиотеки: перспективные методы и технологии, электронные коллекции: Труды XI Всероссийской научной конференции RCDL’2009. — Петрозаводск: 2009. — С. 487. УДК 519.688 К.А. Кузнецов K.Kuznetcov@gmail.com Московский государственный университет им. М.В. Ломоносова Автоматизированная информационная система учета и аналитической обработки выпускных квалификационных работ студентов Высшей школы бизнес-информатики На сегодняшний день исследователи, занимающиеся глобальным изучением рынков и отраслей экономики страны, сталкиваются с отсутствием инструментов, позволяющих им накапливать и анализировать большие объемы информации о различных компаниях. Даже в случаях, когда имеется достаточный объем данных для исследования, отсутствие программных продуктов для их структуризации и анализа заставляет прибегать к услугам аналитических компаний. Подобная ситуация возникла в Высшей Школе Бизнес–Информатики (ВШБИ), где в рамках учебного процесса был накоплен значительный объем данных о различных компаниях. В связи с этим, было предложено создать автоматизированную информационную систему (АИСВШБИ) учета, накопления и аналитической обработки имеющейся в распоряжении ВШБИ информации. Секция систем математического обеспечения 99 Хранимые в АИС ВШБИ сведения о компаниях, их подразделениях и сотрудниках, проектах и бизнес-связях будут использоваться студентами для решения учебных задач. Также под контролем преподавателей студенты будут добавлять в систему новые сведения о компаниях. Как правило, такая информация собирается студентами в рамках подготовки своих выпускных квалификационных работ. Поэтому АИС ВШБИ должна хранить полные тексты различных публикаций с привязкой к извлеченной из них информации и возможностью атрибутно-полнотекстового поиска. Помимо функций хранилища данных система должна содержать средства для организации учебного процесса. Необходимо обеспечить средства аутентификации пользователей с разграничением прав доступа к ресурсам системы. Также важным требованием является гибкость конфигурации системы, возможность расширения схемы хранимых данных и добавления новых функциональных модулей. Базовым требованиям к АИС ВШБИ удовлетворяет разработанная в ВЦ РАН информационная система «Научный Институт РАН». НИ РАН предоставляет средства для ведения административно-организационного справочника, содержащего информацию об организационной структуре научного института и его сотрудниках, их научных трудах и проектах. Учитывая сходство предметных областей, было принято решение начать разработку АИС ВШБИ на базе НИ РАН. Разработка разбита на три этапа. На первом этапе предлагается адаптировать имеющийся функционал АИС «НИ РАН» к простейшей модели АИС ВШБИ. На втором этапе необходимо проанализировать программы студенческих практикумов и расширить схему данных таким образом, чтобы она включала в себя все используемые в них понятия. На третьем этапе планируется вывести систему за рамки учебной работы и превратить ее в инструмент для исследовательской работы. Для этого при содействии специалистов предметной области необходимо формально описать различные неформальные методики, используемые экономистами и менеджерами при анализе деятельности компаний, и соответствующим образом расширить схему данных. На данный момент первый этап близится к своему концу. В его рамках была создана демо-версия веб-портала АИС ВШБИ на базе НИ РАН. Основным изменениям подвергся класс Организация. К нему были добавлены такие свойства как число сотрудников, организационно-правовая форма, отрасль, производимые продукты и т.п. Добавлена связь поставщики-потребители между организациями. Остальные классы практически не менялись. 100 53-я научная конференция МФТИ ФУПМ-2 Литература 1. Бездушный А.А., Бездушный А.Н., Серебряков В.А., Филиппов В.И. Интеграция метаданных Единого Научного Информационного Пространства РАН — М.: Вычислительный центр РАН, 2007. — 238 С. 2. Бездушный А.А., Бездушный А.Н., Нестеренко А.К., Серебряков В.А., Сысоев Т.М., Теймуразов К.Б., Филиппов В.И. Информационная Web-система «Научный институт» на платформе ЕНИП — М.: Вычислительный центр РАН, 2007. — 248 С. 3. Серебряков В.А., Бездушный А.Н., Жижченко А. Б . Интегрированная система информационных ресурсов РАН и технология разработки цифровых библиотек — М.: Программирование, 2000. 4. Бездушный А.А., Бездушный А.Н., Нестеренко А.К., Серебряков В.А., Сысоев Т.М. Предложения по наборам метаданных для научных информационных ресурсов ЕНИП РАН // Журнал ЭБ. — 2004. — Т. 7, Вып. 5. УДК 007.51 И.В. Машинцев mashintsev@gmail.com Московский физико-технический институт (государственный университет) ЗАО «Объединённая система моментальных платежей» Бизнес-процессы и архитектура информационной системы «Деканат» Одним из важнейших условий успешного функционирования любого вуза является эффективный обмен информацией между подразделениями института. В настоящее время, несмотря на достаточно хорошую укомплектованность компьютерами деканатов МФТИ, процессы информационного обмена в институте архаичны и не оптимальны. При проектировании ИС проведен экспертный анализ бизнес-процессов и сформулированы функции деканата, которые необходимо Секция систем математического обеспечения 101 автоматизировать. Все бизнес-процессы, происходящие в деканате, можно разделить на: • ведение личного дела студента, • ведение учебной карточки студента, • назначение стипендии, материальной помощи студенту, • учет текущей успеваемости студента, • учет сдачи зачетов и экзаменов студента, 102 53-я научная конференция МФТИ Литература 1. Дейт К. Введение в системы баз данных. — СПб.: Издательский дом «Вильямс», 2000. — 848 с. 2. Конноли Т., Бегг К., Страчан А. Базы данных: проектирование, реализация и сопровождение. Теория и практика. — М.: Издательский дом «Вильямс», 2000. — 1120 с. 3. Вендров А.М. CASE-технологии. Современные методы и средства проектирования информационных систем. — М.: Финансы и статистика, 1998. — 176 с. • перевод на новый курс, выпуск, отчисление студента. Структура системы основана на технологии клиент-серверной архитектуры и обеспечивает сохранность данных и одновременную работу десятков пользователей, при этом есть возможность при наличии общей базы строго разграничивать доступ. При разработке архитектуры базовой функциональности системы за основу была взята классическая многозвенная архитектура (рис. 1). К представлению относится вся информация, непосредственно отображаемая пользователю: сгенерированные html-страницы, таблицы стилей, изображения. Уровень представления охватывает все, что имеет отношение к общению пользователя с системой. К главным функциям слоя представления относятся отображение информации и интерпретация вводимых пользователем команд с преобразованием их в соответствующие операции в контексте логики и данных. Уровень логики содержит основные функции системы, предназначенные для достижения поставленной перед ним цели. К таким функциям относятся вычисления на основе вводимых и хранимых данных, проверка всех элементов данных и обработка команд, поступающих от слоя представления, а также передача информации уровню данных. Уровень доступа к данным — это подмножество функций, обеспечивающих взаимодействие со сторонними системами, которые выполняют задания в интересах приложения, средства объектно-реляционного отображения — прямого и обратного преобразования из реляционной модели данных в объектную. ФУПМ-2 Рис. 1. Обобщенная архитектура системы «Деканат» Секция систем математического обеспечения 103 УДК 004.9 Т.М. Сысоев tim@ccas.ru Межведомственный суперкомпьютерный центр РАН Алгоритм преобразований XML-документа с сохранением допустимых иерархических отношений При внедрении электронного документооборота часто возникает задача построения электронных документов на основе информации, содержащейся в каком-либо хранилище. В связи с тем, что основные офисные пакеты в настоящий момент позволяют сохранять свои документы в формате XML [1, 2], итоговый результат может быть представлен в виде XML-файла, при этом в процессе построения могут быть использованы стандартные технологии для создания и обработки XML-документов. Использование шаблонов, которые сами являются документами с простым языком для подстановки переменных, условных выражений средствами организации циклов удобно для пользователей, поскольку они самостоятельно могут вносить исправления в шаблон, связанные, например, с оформлением некоторых его частей, применяя обычный офисный пакет. Для генерации документа необходимо взять его шаблон и выполнить описанные в нём преобразования. Основными операциями, которые при этом возникают, являются удаление фрагмента текста между двумя произвольными позициями в документе и копирование фрагмента текста между двумя произвольными позициями в заданную третью позицию. Обозначим как [X, Y ] все элементы, которые находятся в списке вершин, полученных обходом дерева документа алгоритмом поиска в глубину между X и Y , исключая эти вершины (в офисном пакете этому множеству может соответствовать выделение части документа). Для реализации операций удаления и копирования оказалось удобным работать со специальными фрагментами документа, которые определяются двумя элементами C и E, такими, что E является потомком (возможно, не непосредственным) у элемента C. Если выписать все дочерние элементы C, полученные обходом дерева алгоритмом поиска в глубину, начиная с элемента C, то мы получим 104 53-я научная конференция МФТИ ФУПМ-2 список, в котором присутствует E. Во фрагмент документа, заданный элементами C и E и обозначаемый далее как (C, E), входят все элементы этого списка, следующие после E. Например, в (C, C) входят все дочерние элементы C. Особенностью определённых таким образом фрагментов является то, что, реализовав операции их удаления и копирования, мы сможем выполнять эти же операции для любого множества [X, Y ], сводя их к операциям над фрагментами. В свою очередь, к операциям копирования и удаления фрагментов предъявляется требование сохранения структуры: отношения родитель–потомок между элементами в документе, полученном после выполнения операции, должны соответствовать отношениям в документе до выполнения операции. Например, если в исходном документе элемент LI является потомком элемента U L, то в преобразованном документе не должно быть ситуации, когда он является потомком элемента P . Для выполнения этого требования при операции копирования может потребоваться удаление существующих, либо создание новых элементов. Литература 1. Open Document Format for Office Applications (OpenDocument) v1.1. — http://docs.oasis-open.org/office/v1.1/OS/OpenDocument-v1.1. pdf. — OASIS, 2007. 2. Office Open XML File Formats. — http://www.ecma-international. org/publications/standards/Ecma-376.htm. — Ecma International, 2008. Секция систем математического обеспечения 105 УДК 65.011.56 Ф.В. Ярёменко yaremenkofv@gmail.com Вычислительный центр им. А.А. Дородницына РАН 106 53-я научная конференция МФТИ ФУПМ-2 • Разграничение доступа к данным и функционалу системы на основе авторизации пользователей. • Поддержка иерархии и связей между документами. • Управление версиями документов. Создание системы электронного документооборота на основе рабочих потоков • Web-интерфейс, который даёт возможность использовать систему на любой рабочей станции, в том числе с ПО с открытым исходным текстом. На сегодняшний день всё больше государственных и частных государственных организаций частные компании внедряют системы электронного документооборота (СЭД). Основной задачей СЭД является автоматизация передвижения документов между сотрудника и организациями и предоставление средств построения и управления маршрутами. СЭД создаёт условия для повышения эффективности работы с документами, корреспонденцией, поручениями, обращениями граждан, а также автоматизации управления бизнес-процессами предприятия. Внедрение СЭД позволяет упорядочить систему делопроизводства по всем функциям управления в соответствии с современными моделями организации. Одним из важнейших результатов использования системы электронного документооборота является сокращение затрат на управление. Также СЭД является неотъемлемой частью электронного правительства. [1] Целью работы является создание системы электронного документооборота. Использование рабочих потоков в качестве основы для построения СЭД позволяет не только реализовывать передвижение документов по произвольным маршрутам, но и эффективно интегрировать документооборот с другими бизнес-процессами, принятыми на предприятии. Современные системы электронного документооборота должны удовлетворять следующим требованиям: • В СЭД кроме автоматизации документооборота и делопроизводства также должны входить подсистема электронного архива и нормативно-информационная система. • Поддержка контекстного поиска в теле документов. • Графический редактор маршрутов. • Поддержка территориально-распределённых структур организаций предприятий. Первым этапом работы по созданию СЭД будет построение модели документооборота. Необходимо описать узлы маршрутов передвижения документов и функции контроля исполнения в терминах рабочих потоков. Для решения этой задачи необходимо определить все сущности, бизнес-процессы и агенты предметной области. Важно учитывать, что модели для предприятий, придерживающихся функциональному и процессному подходу в работе, могут различать, поэтому необходимо подготовить решение, удовлетворяющее обеим концепциям. Далее на основе разработанной модели будут реализовываться ядро системы и основные типы узлов маршрута. За основу реализации рабочих потоков предлагается использовать Jboss jBPM. Следующими этапами разработки является создание подсистемы контроля исполнения и оповещения, а также web-интерфейс. На начальном этапе предлагается определить движение документа как процесс, в котором переход от одного узла к другому происходит в одной из трёх ситуаций: • Управление поручениями и резолюциями. Назначение сроков исполнения и ответственных лиц позволяет контролировать выполнение процессов документооборота. • Изменение состояния документа (состояния документа могут быть разными, и их набор определяется моделью; например: на рассмотрении, подписан, дорабатывается и т.д.) • ЭЦП для юридически-значимого документооборота. • Изменение ответственного лица или лиц Секция систем математического обеспечения 107 • События по таймеру • Списание документа в архив Каждый документ может участвовать в 0-n рабочих потоках. Одним потоком может описываться движение только одного документа. Далее, соединяя несколько потоков (параллельно или последовательно), можно конструировать потоки, которые описывают реально движение документов на предприятии. Литература 1. Саттон М. Дж. Д. Корпоративный документооборот. Принципы, технологии, методология внедрения. — М.: Азбука, 2002. — 446 с. Секция системного программирования и программной инженерии УДК 004.92 А.Е. Бобков1 , И.П. Казанский2 , С.В. Клименко2 , А.В. Леонов2 alexbobkov@list.ru, i.kazansky@mail.ru, Stanislav.Klimenko@gmail.com, spanishflyer@gmail.com 1 2 Московский физико-технический институт (государственный университет) Институт физико-технической информатики Исследование и разработка методов создания и изменения интерактивных трехмерных геоцентрических моделей рельефа в системах виртуального окружения В данной работе рассматриваются вопросы создания трехмерного рельефа на базе такого виртуального глобуса и его дальнейшего изменения, вопросы создания интерактивного приложения. В конце рассматривается приложение с рельефом для проекта создания виртуальной модели Долины гейзеров. В названии работы существенно, что модель рельефа интерактивна и трехмерна. Трехмерность означает, что на экране модель представлена в виде трехмерной полигональной сетки, которая визуально похожа на реальный рельеф. Интерактивность означает обновление модели на экране с частотой не менее 30 кадров в секунду, что позволяет гладкое и «отзывчивое» движение камеры по трехмерной сцене. Поэтому основная проблема в создании интерактивной трехмерной модели рельефа звучит так: как использовать большой объем (гигабайты и петабайты) исходных данных на жестком диске, чтобы показать на экране рельеф с небольшим числом вершин и небольшим Секция системного программирования и программной инженерии 109 размером текстур, который мог бы обновляться с частотой 30 кадров в секунду? Была разработана интерактивная трехмерная модель Долины гейзеров (рис. 1). В качестве исходных данных использовался спутниковый снимок GeoEye-1 с разрешением 0.5 метров на пиксель и карта высот с разрешением 2.5 метра на пиксель, сделанная на основе стереопары Cartosat. Для создания трехмерного рельефа применялась программа VirtualPlanetBuilder, которая генерирует дерево тайлов в родном формате инструментария OpenSceneGraph. Поверх рельефа нанесены метки и пути, обозначающие места расположения гейзеров, термальных аномалий, реки, дорожки и другие объекты. Для хранения этой информации используется формат KML. Для работы с KML используется библиотека libkml. Приложение написано с использованием фреймворка Аванго [3][4], который является надстройкой над OpenSceneGraph. 110 53-я научная конференция МФТИ ФУПМ-2 Литература 1. Losasso F., Hoppe H. Geometry clipmaps: Terrain rendering using nested regular grids // ACM Trans. on Graphics (Proc. SIGGRAPH 2004). — 2004. — P. 769--776. 2. Клименко С.В., Никитин И.Н., Никитина Л.Д. Аванго. Cистема разработки виртуальных окружений. — М.–Протвино, 2006. — 252 с. 3. Tramberend H. Avocado: A distributed virtual reality framework // VR ’99: Proceedings of the IEEE Virtual Reality. — 1999. — P. 14. 4. Roland Kuck [et al.]. Improving the avango vr / ar framework — lessons learned // Virtuelle und Erweiterte Realitat: 5. Workshop der GI-Fachgruppe VR / AR. — 2008. — P. 209–220. УДК 004.852 Д.В. Дорофеев danvik05@mail.ru Физико-технический учебно-научный центр НАНУ Институт кибернетики им. В.М. Глушкова НАНУ Автоматическое распознавание тематики устной речи Рис. 1. Модель Долины гейзеров Основными задачами работы является: разработка и экспериментальная проверка методов определения тематики речевого высказывания на реальных данных, в качестве которых выступали радиопередачи на различные темы. Показано, что даже при очень низком качестве распознавания слов, можно добиться приемлемого качества классификации тематики. Задача распознавания слитной речи исключительно сложна и на сегодняшний день до сих пор не решена [1]. Поэтому предпринимаются попытки упростить её для решения специфических задач, например для определения тематики разговора, что может быть использовано для выявления потенциально опасных телефонных переговоров. Научная новизна заключается в том, что подобные работы для русской речи не проводились или не опубликованы. Информация о Секция системного программирования и программной инженерии 111 подобных исследованиях существует на английском языке и представлена рядом работ [2, 3], выполненных по заказу военных ведомств США. Для преобразования речи в текст использовалась дикторонезависимая система автоматического распознавания слитной русской речи с размером словаря 28 тыс. слов. Основной сложностью в работе алгоритма является низкий показатель качества распознавания. Причина в том, что аккустическая модель обучалась на другом канале связи. Интересно было проверить: а будет ли вообще работать алгоритм на таких данных. Функционалом качества являлась суммарная ошибка классификации при исключении контрольного объекта из обучающей выборки (LOO — Leave One Out). Из характерных особенностей задачи стоит выделить то, что количество признаков на 2 порядка превосходит число объектов, по которым обучается алгоритм. К тому же матрица объекты — признаки сильно разряженная, поэтому не удалось придумать адекватную метрику между объектами и использовать метрические алгоритмы классификации. Самым лучшим вариантом оказался статистический байесовский подход, базирующийся на частотных характеристиках встречаемости определённых слов в текстах разных тематик. Для сокращения размерности задачи используются метод отбора признаков. Проведена серия вычислительных экспериментов в среде MATLAB на модельных данных (распознанных человеком) и реальных данных (распознанных программой). Модельные использовались для выявления зависимостей, а сильно зашумлённые реальные для проверки устойчивости алгоритма. Вероятностный подход в этом случае демонстрирует приемлемое качество классификации, ошибка (по критерию LOO) составила около 25% при разбиении на 5 тематик. Это при том, что ошибка в распознавании слов (WER — Word Error Rate) была около 90 — 95%. Для дальнейших исследований необходимо улучшить качество распознавания речи, используя подходящие модели языка и акустическую модель под используемый канал связи, которая сохраняет высокую эффективность при работе с сигналом, кодированным с помощью наиболее распространенных современных кодеков: MPEG, GSM, WMA. 112 53-я научная конференция МФТИ ФУПМ-2 Литература 1. Huang X., Acero A., Hon H. Spoken Language Processing. — Prentice–Hall Inc, 2001. 2. Timothy J.H., Margolis A. Discriminative feature weighting using MCE training for topic identification of spoken audio recordings. — USA, Massachusetts: MIT Lincoln Laboratory Lexington. 3. Richardson F., Timothy J.H. Topic identification from audio recordings using word and phone recognition lattices. — USA, Massachusetts: MIT Lincoln Laboratory Lexington. УДК 004.052.2, 004.75 Г.А. Дубовик, В.А. Петрухин dubglan@gmail.com, vapetr@gmail.com Московский физико-технический институт (государственный университет) Мониторинг высокораспределённых систем Задача верификации времени исполнения или мониторинга заключается в своевременном обнаружении аномальных отклонений в поведении вычислительных систем. В ходе мониторинга событий (event-based monitoring) средство верификации анализирует поток событий, генерируемых целевой системой, и производит контроль выполнения определённых формальных критериев. В случае распределённых систем наибольший интерес представляют критерии, определяющие свойства коллективного поведения элементов системы, находящихся в различных сетевых узлах. Однако следует заметить, что верификация подобных критериев крайне сложна, так как требует либо централизованной обработки поступающих данных, либо построения сложного распределённого алгоритма. Централизованные системы мониторинга обладают ограниченной надёжностью и масштабируемостью. Кроме того, они неприменимы, если период генерации событий сравним со временем доставки сообщений в центральный узел системы верификации. Это не позволяет применять централизованный мониторинг для верификации высокораспределённых систем, состоящих из тысяч узлов. Альтернативным Секция системного программирования и программной инженерии 113 методом является децентрализованный мониторинг, в ходе которого события обрабатываются локальными элементами системы верификации, взаимодействующими между собой. Нами был разработан и реализован алгоритм DEKMA, позволяющий верифицировать конечно-автоматные критерии в средах с ненадёжной доставкой сетевых сообщений [1]. В отличие от ряда методов децентрализованного мониторинга [2], он не сужает выразительность автоматных критериев. Нами было доказано, что в случае мгновенной доставки сообщений DEKMA обладает свойством полноты верификации и не теряет корректности при задержках или потерях сообщений. Его основным недостатком в сравнении с методами, не учитывающими задержек сетевого взаимодействия (например, [3]), является большая вычислительная сложность: O(N ∗ T ) против O(N ), где N — количество узлов целевой системы, а T — число переходов в конечном автомате, соответствующем критериям. Литература 1. Дубовик Г.А. Мониторинг высоко распределённых многоагентных систем // Магистерская диссертация. — М.: МФТИ, 2010. 2. Sen K., Vardhan A., Agha G., Rosu G. Efficient Decentralized Monitoring of Safety in Distributed Systems // In Proceedings of 26th International Conference on Software Engineering. — 2004. — P. 418--427. 3. Zhou W., Sokolsky O., Loo B., Lee I. DMaC: Distributed Monitoring and Checking // In Proceedings of 9th International Workshop on Runtime Verification. — 2009. — P. 184--201. 114 53-я научная конференция МФТИ ФУПМ-2 УДК 65.014.1 Д.Ю. Маркус markusmipt@gmail.com Московский физико-технический институт (государственный университет) Количественная оценка сложности задач управления экономической системой В связи с возрастающей сложностью управления экономикой становятся актуальными задачи количественной оценки суммарной сложности экономической системы страны. Это будет важно, например, для того, чтобы впоследствии можно было строить соответствующие комплексы автоматизации производственных процессов на предприятиях на основе количественной оценки сложности решаемых задач, а не на экспертных оценках людей, которые зачастую могут быть предвзятыми или просто неточными. Одними из немногих работ в этой области были работы В. Глушкова [1, 2], который в 60-е годы двадцатого века оценил сложность задач управления экономикой СССР. Однако эти данные сильно устарели, и к тому же при их оценке мало учитывались особенности рыночной экономики, преобладающей в настоящее время в России. В этой работе помимо оценки сложности задач государственного планирования будет оценена сложность задач управления предприятиями в рамках рыночной экономики. Целью данной работы является получение количественной оценки сложности экономики страны в терминах числа арифметических операций, необходимых для оптимальной работы экономической системы страны. В начале работы будут рассмотрены понятия информационных барьеров, их связь со сложностью задач управления экономикой. Задача оценки сложности экономической системы будет разбита на три подзадачи. Из всех объективно необходимых задач управления экономической системой будет выделено три основных: планирование развития экономики на государственном уровне, задача оптимизации прибыли предприятиями и задача согласования сроков поставок продукции между предприятиями — заказчиками и предприятиями поставщиками. Затем для каждой из этих задач будет построена соот- Секция системного программирования и программной инженерии 115 ветствующая математическая модель, описывающая поведение предприятий или государства. После этого будет подсчитана и проанализирована сложность каждой из этих задач. Далее будет представлен комплексный анализ полученных результатов. Литература 1. Глушков В.М. Макроэкономические модели и принципы построения ОГАС. — М.: Статистика, 1975. — 160 c. 2. Глушков В.М., Валах В.Я. Что такое ОГАС? — М.: Наука, 1981. — 160 с. УДК 004.93’12 В.И. Мендус1 , Т.А. Караваева1 , В.А. Петрухин2 , Н.А. Вязовик2 , Е.В. Кривцов2 , А.И. Корниенко2 Mendus.VI@vtb24.ru, Tatiana.Karavaeva@gmail.com, vapetr@gmail.com, vyazovick@cmit.mipt.ru, egorkrivtsov@gmail.com, aleksej.kornienko@gmail.com 1 2 ВТБ24 Московский физико-технический институт (государственный университет) Поддержка принятия решений в диспутных циклах банковских международных платежных систем Все больше платежей совершается электронным образом с использованием банковских карт и международных платежных систем (МПС), таких как VISA и Master Card. При этом, разумеется, невозможно избежать возникновения спорных ситуаций между банком и клиентом. Типовые примеры: при оплате дважды списывается сумма, или оказывается, что с потерянной (украденной) карты произведены платежи. В таких случаях клиент подает претензию в банк, опротестовывает операции, которые считает ошибочными, с целью возврата денежных средств. Банк в свою очередь начинает диспутный цикл по правилам МПС. Формально решение должно быть принято в течение 45--180 дней. Разумеется, клиенты не хотят ждать 116 53-я научная конференция МФТИ ФУПМ-2 так долго. В то же время специалисты банка накапливают опыт, выделяют определенные закономерности — при каких параметрах транзакции она будет опротестована, скорее всего, успешно. И хотя банк обязан провести диспутный цикл до конца, он может с целью повышения качества обслуживания вернуть деньги клиенту досрочно, если уверенность прогноза достаточно высокая. Для этого требуется высокоточная модель, которая строится на основе накопленной истории опротестований, и чьей задачей является предсказание результатов диспутных циклов поступающих претензий с целью ускорения принятия решений по ним. Набор признаков транзакции определяется правилами МПС, а также добавляются данные, указываемые в претензии (причина оспаривания операции, наличие необходимых документов и пр.). Предварительно все номинальные признаки преобразовываются в бинарные, а линейные отображаются на отрезок (0,1) по значению эмпирической функции распределения в данной точке. Поскольку признаков получается очень много, важно провести отбор наиболее значимых признаков. Не все признаки всегда заполнены, и большинство из них заведомо не может оказывать влияния на будущее решение. Предлагается два алгоритма построения модели — с использованием логистической регрессии [1] и с использованием нейронных сетей [2]. Для каждого алгоритма необходимо подбирать свои параметры обучения, поскольку различаются возможности обучения и требуемое для этого время. Необходима особая внимательность при выборе контрольной выборки для проверки модели, так как в различные периоды характер претензий меняется неоднородно. После запуска модели в эксплуатацию необходим постоянный мониторинг точности предсказаний, так как меняются и правила МПС, и характер мошенничеств с кредитным картами, а также опыт сотрудников банка (человеческий фактор). При снижении точности требуется накопление исторических данных в новых условиях и переобучение модели. Полученная статистическая модель дополняется моделью, построенной на основе накопленного опыта сотрудников банка. Используемые правила включают в себя параметры, чьи значения могут настраивать специалисты банка. Это позволяет оперативно производить тонкую настройку при изменениях правил МПС, не дожидаясь накопления новых данных для переобучения статистической модели. Задача по своей природе схожа с известной задачей кредитного скоринга [3]. В частности, поэтому для решения задачи была выбрана Секция системного программирования и программной инженерии 117 логистическая регрессия в качестве одной из моделей. Однако, есть ряд отличий. Например, в задачах кредитного скоринга у нас фактически есть данные только по клиентам, которым дали кредит. Здесь же мы знаем результаты всех жалоб, и нам необходимо правильно классифицировать новые объекты. Литература 1. Hosmer D., Lemeshow S. Applied logistic regression. — New York: John Wiley & Sons, Inc., 2000. — 376 p. 2. Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. — М.: Горячая линия-Телеком, 2002. — 382 с. 3. Siddiqi N. Credit Risk Scorecards: Developing and Implementing Intelligent Credit Scoring. — Hoboken: John Wiley & Sons, Inc., 2005. — 208 p. УДК 519.8 С.Н. Нечуйвитер snechuiviter@gmail.com Физико-технический учебно-научный центр НАНУ Особенности восстановления экспертного опыта из экспертных высказываний В наше время создание экспертных систем широко распространено. Однако проблема агрегации экспертного опыта до сих пор не решена. Предлагаемый метод предполагает использование результатов исследования механизма образования и представления знаний у экспертов [1] для оценки распределения вероятностей вариантов экспертного опыта, который привел к образованию именно наблюдаемых знаний экспертов. Экспертный опыт может быть легко агрегирован, в том числе и с автоматическими измерениями, и использован для прогнозирования. Темой доклада является сравнение предлагаемого метода извлечения экспертного опыта (МИЭО) с методом построения алгебраической композиции высказываний экспертов. Можно показать наличие следующих отличий рассматриваемых подходов: 118 53-я научная конференция МФТИ ФУПМ-2 1) для классификации новых точек для композиции экспертов нужны высказывания экспертов по новым точкам, в то время как МИЭО может это сделать исключительно на основании предыдущих высказываний; 2) для настройки композиции экспертов необходимо привлечение контрольной выборки, данные из которой только оптимизируют комбинацию, но не могут добавить в нее новую закономерность, тогда как МИЭО позволяет извлечь новые закономерности и из контрольной выборки; 3) для адаптации композиции экспертов к новым данным необходимы обучение экспертов новым данным и последующая переоценка обучающей и контрольной выборки, тогда как МИЭО позволяет включить новые данные напрямую в ранее извлеченный «опыт» и автоматически настроить процедуру классификации; 4) композиция экспертных мнений является формальной надстройкой, в то время как МИЭО предполагает исследование механизма образования и представления знаний у экспертов; 5) существуют практически эффективные алгоритмы построения композиции экспертов, тогда как на текущем этапе исследований МИЭО носит переборный характер и требует значительных вычислительных ресурсов. Метод извлечения экспертного опыта из экспертных знаний может существенно расширить возможности извлечения и агрегации экспертного знания, уточнить границы их применимости, а также может помочь автоматизировать накопление знаний. Ввиду таких возможностей предполагается продолжить исследование с целью понижения вычислительной сложности метода. Литература 1. Ларичев О.И. Вербальный анализ решений. — М.: Наука, 2006. — 181 с. Секция системного программирования и программной инженерии 119 УДК 519.688 А.А. Пантелеймонов1,2 , А.В. Гапон1 , Ю.Н. Манойло1,2 pandrew@icyb.kiev.ua, avg@icyb.kiev.ua, ymanoylo@saybervizhn.ru 1 2 Институт кибернетики им. В.М. Глушкова НАНУ Физико-технический учебно-научный центр НАНУ Оптимизация транспортного уровня системы комплексной обработки событий В сегодняшней ИТ-среде генерируются постоянные потоки данных во многих сферах деятельности человека, начиная от мониторинга финансовых рынков и производительности сетей до отслеживания бизнес процессов и радиочастотной идентификации. Для обработки таких потоковых данных необходимы технологии и средства, способные работать в режиме «реального времени» (конечно же, тут стоит сказать, что существует задержка на обработку и для каждой конкретной бизнес задачи она своя, в каких-то случаях она может составлять 1 секунду, а в других несколько миллисекунд или же, наоборот, минуту). В данном случае такой подход противопоставляется прежде всего традиционному подходу, предполагающему периодическую загрузку пакета данных в общее хранилище из множества потоковых источников и последующую их обработку. Недостаток такого традиционного подхода в том, что он фактически обращен в прошлое и не учитывает самую свежую информацию [1]. Для автоматизации реакции на те или иные события, в частности, применяются средства комплексной обработки событий. Комплексная обработка событий (CEP, Complex Event Processing) — это технология быстрой обработки событий и определения шаблонов во множественных потоках событийных данных, корреляции событий, иерархий событий и отношений между событиями, такими, как причинно-следственная связь [2, 3]. В рамках проведённых работ была предложена реализация CEPкаркаса в виде сети узлов, соединенных между собой типизированными асинхронными каналами, внутрь которых помещаются обработчики событий. Предусмотрена как адресная доставка событий в конкретный канал (по идентификатору), так и широковещательная рассылка по принципу совместимости типов события и канала [4]. 120 53-я научная конференция МФТИ ФУПМ-2 Распределенная модель обработки, допускающая встраивание различных транспортов (CORBA, RMI, SOAP), скрыта на уровне CEPканалов. Реализован как вариант привязки любого узла топологии к конкретному физическому адресу, так и поднятие нескольких локальных копий одного и того же узла на разных физических адресах [5]. Для оптимизации межсерверного обмена сообщениями был опробован протокол QTP, реализация которого входит в библиотеку с открытым исходным кодом QDS (Quick Data Signaling) [6]. Были произведены замеры производительности передачи сообщений, которые в выбранной модели тестирования показали улучшения на 30% по сравнению с RMI-транспортом. На практике предлагаемый CEP-каркас, дополненный адаптерами соответствующих протоколов и обработчиком, реализующим алгоритмы анализа стоимости транзакций, был применен для построения масштабируемой системы маршрутизации финансовых FIX-потоков [7]. Также он был положен в основу системы мониторинга общего назначения. Литература 1. Свинарев С. BI на все времена. — http://www.oracle.com/globa l/ru/oramag/mar2009/total_bi_pcweek.html. 2. Complex event processing. — http://en.wikipedia.org/wiki/Comp lex_Event_Processing. 3. Luckham D. The Power of Events: An Introduction to Complex Event Processing in Distributed Enterprise Systems. — Addison–Wesley, 2002. — 400 p. 4. Пантелеймонов А.А., Гапон А.В., Манойло Ю.Н., Щетинин Д.И., Черевко О.В. Комплексная обработка событий // Труды 52-й научной конференции МФТИ Современные проблемы фундаментальных и прикладных наук. — М.: 2009. — Ч. VII. — С. 34--35. 5. Фаулер М. Архитектура корпоративных программных приложений. — М.: Вилямс, 2006. — 544 с. 6. Quick Data Signaling. — http://sourceforge.net/projects/qds/. 7. What is FIX protocol? — http://www.fixprotocol.org/what-is-fix. shtml. Секция системного программирования и программной инженерии 121 УДК 004.72 Т.В. Пустовой1,2 , А.А. Манаенкова2 pustovoy@phystech.edu, manaenkova.anna@gmail.com 1 Физико-технический учебно-научный центр НАНУ 2 Московский физико-технический институт (государственный университет) Подсистема формирования индивидуальных расписаний студентов, как компонент системы поддержки дистанционного и смешанного обучения с учетом стандартов третьего поколения Персонализированные учебные планы и расписания занятий являются одним из важнейших компонентов образовательных стандартов третьего поколения. Поэтому реализация подсистемы, позволяющей учащимся строить свои образовательные траектории, является приоритетной задачей при разработке электронной системы поддержки обучения. Для реализации этой задачи был разработан модуль для персонализированной образовательной среды (PLE) SIMLearn[1], на базе которого процесс использования и построения индивидуальных расписаний происходит следующим образом: 1. На основании информации от кафедр учебной частью формируются «профили обучения». Под профилем обучения тут подразумевается совокупность предметов, присутствие которой в расписании характерно для группы учащихся. 2. Студент в начале года формирует свое учебное расписание, на которое влияет: • базовый профиль обучения, который задает фактически институтский цикл предметов, • дополнительный профиль обучения, который определяет, например, набор предметов для факультетского или кафедрального курса, • набор курсов по выбору, свободно выбираемых студентом, • персональные изменения к расписанию, например, перестановка семинаров и лекций. 122 53-я научная конференция МФТИ ФУПМ-2 3. Студенты и преподаватели, ведущие курсы, автоматически подписываются на получение информации об изменении в расписании курсов, которые они читают или слушают. Использование подсистемы формирования индивидуального учебного расписания позволяет наглядно представить информацию обо всей учебной активности в одном месте, с одной стороны, адресно и своевременно получать информации об изменении в учебном процессе — с другой. Кроме того, подсистема позволяет оперативно извещать о событиях, которые могут повлечь изменения в расписании. Литература 1. Пустовой Т.В., Манаенкова А.А. SIMLearn — система поддержки дистанционного и смешанного обучения с учетом стандартов третьего поколения // Труды 52-й научной конференции МФТИ «Современные проблемы фундаментальных и прикладных наук». — М., МФТИ, 2009. Т. 7.2. — С. 26–28. УДК 519.246.85 А.В. Путря AVPutrya@gmail.com Московский физико-технический институт (государственный университет) Институт физико-технической информатики Анализ трендовых торговых стратегий на фондовом рынке Существует широкоизвестный класс трендовых торговых стратегий, описываемый во многих учебных пособиях по техническому анализу. Стратегии из этого класса часто используются как начинающими, так и продвинутыми трейдерами. Большинство таких стратегий были созданы в США и протестированы на исторических данных торговых инструментов американских фондовых рынков [1]. Представляет интерес проанализировать работоспособность этих стратегий на инструментах относительно молодого Российского фондового рынка, относящегося к категории развивающихся, со сравни- Секция системного программирования и программной инженерии 123 тельно небольшим объемом капитализации и числом сделок. В данной работе в качестве инструментов анализа используются в основном т.н. «голубые фишки», то есть наиболее ликвидные бумаги на Российском рынке. Спецификация любой трендовой торговой стратегии заключается в способе выявления тренда, выявления точки входа в позицию и точки выхода из нее. Параметрами стратегии можно считать характерный временной интервал занятия позиции, критерии фиксации прибыли, а также порядок используемых экстремумов. Задачей данной работы является определение оптимальных параметров стратегии для исследуемых ценных бумаг [2]. Как известно, трейдинг принято разбивать на три категории по характерным временам занятия позиции — скальпинг, интрадей и свинг-трейдинг [3]. В данном исследовании не будут затрагиваться аспекты скальперской торговли, будут проанализированы только стратегии для интрадея (5-минутного интервала) и свинг-трейдинга (часового и дневного интервалов). Тестируемые стратегии описаны на встроенном языке программирования в торгово-аналитической программе WealthLab. Путем изменения некоторых параметров модели находится такая область их значений, в которой данная стратегия является наиболее прибыльной. Кроме того, при более глубоком анализе этих областей параметров можно ответить на вопрос, является ли найденная стратегия устойчивой относительно будущих торговых сессий. Литература 1. Демарк Т. Технический анализ — новая наука. — М.: Евро, 2009. 2. Пардо Р. Разработка, тестирование и оптимизация торговых систем. — М.: Интернет–Трейдинг, 2002. 3. Найман Э. Малая энциклопедия трейдера. — М.: Вира–Р Альфа Капитал, 1999. 124 53-я научная конференция МФТИ ФУПМ-2 УДК 004.422.81 Д.А. Смирнов1 , В.Ф. Захарушкин1,2 dasmirnov@rambler.ru, zakharushkin@mail.ru 1 2 Московский физико-технический институт (государственный университет) Педагогическая академия последипломного образования Автоматизации проведения экспертиз с оценкой точности полученного решения Экспертиза — исследование специалистом или специалистами каких-либо вопросов, для решения которых требуются специальные знания в некоторой области науки. Для проведения экспертиз применяются различные методы организации, наиболее популярным является метод экспертного опроса [1]. Данный метод подразумевает участие группы специалистов в анализе и решении рассматриваемой проблемы. Его можно разбить на следующие этапы: анализ исследуемой ситуации, выбор группы экспертов, выбор способа измерения экспертных оценок, процедуру оценки экспертов и их работы, анализ полученных данных [2]. Основными недостатками подобного метода являются отсутствие аналитических данных о точности принятого решения и компетентности выбранной комиссии, а также отсутствие формального критерия о принятии решения комиссией. Для преодоления описанных недостатков была разработана методика проведения экспертизы, которая позволяет получить численные данные по точности созданной комиссии, рассматривая ее как единое целое, а также формализовать критерий получения решения экспертной комиссии и оценить точность этого решения. Созданная по этой методике экспертная система реализована в виде web-портала, что позволяет упростить доступ к ней как со стороны экспертов, так и со стороны организаторов экспертиз. Это дает возможность эффективно проводить экспертизы при существенном распределении экспертов по различным структурам организатора экспертизы или даже при привлечении сторонних экспертов. Кроме того, данная система является кроссплатформенной, что снимает ограничения на операционную систему как на сервере системы, так и на компьютерах пользователей. Секция системного программирования и программной инженерии 125 Разработанная система позволит производить оценку качества реализации различного рода проектов, исследований и разработок. В настоящее время производится апробация созданной системы на базе Федерального института развития образования и Педагогической Академии последипломного образования Московской области. Литература 1. Литвак Б. Экспертная информация: методы получения и анализа. — М.: Радио и связь, 1982. 2. Социология: Энциклопедия. — М.: Книжный Дом, 2003. УДК 004.422.81 Д.А. Смирнов1 , В.Ф. Захарушкин1,2 dasmirnov@rambler.ru, zakharushkin@mail.ru 1 2 Московский физико-технический институт (государственный университет) Педагогическая академия последипломного образования Разработка методики получения оценки точности экспертного решения При проведении экспертиз одной из ключевых задач является принятие итогового решения комиссии экспертов. Применяются различные методы, но в большинстве из них эта задача решается эвристически, что может существенно снижать точность полученного решения или приводить к принятию неправильного решения по некоторому вопросу. Кроме того, сама точность выбранного решения не является аналитической величиной, следовательно, не может быть использована при численном анализе. Для преодоления описанных недостатков была разработана методика проведения экспертизы, которая позволяет получить численные данные по точности созданной комиссии, рассматривая ее как единое целое, а также формализовать критерий получения решения экспертной комиссии и оценить точность этого решения. Эта методика была внедрена в систему автоматизированного проведения экспертных оценок. Суть данного метода заключается в том, что предварительно эксперты и экспертизы оцениваются, что позволяет ранжировать 126 53-я научная конференция МФТИ ФУПМ-2 как знания самих экспертов, так и сложность экспертизы по заранее оговоренным областям знаний. Это дает возможность получить оценку точности экспертной комиссии, созданной в рамках каждой экспертизы. В дополнение к этому для выбора итогового решения комиссии был применен метод медианы Кемени [1], модифицированный для численного анализа ответов эксперта, что позволило оценить не только точность ответа комиссии, но и корреляцию мнения каждого эксперта с экспертным мнением комиссии. Разработанные методы реализованы в качестве программного комплекса и позволяют производить оценку качества реализации различного рода проектов, исследований и разработок. В настоящее время производится апробация данных методов, использованных в системе автоматизированного проведения экспертных оценок, на базе Федерального института развития образования и Педагогической Академии последипломного образования Московской области. Литература 1. Орлов А.И. Экспертные оценки: учеб. пособие. — М.: ИВСТЭ 2002. УДК 004.451.86 Е.С. Чернов mypches@mail.ru Московский физико-технический институт (государственный университет) Инструменты кросс-разработки и установки программных пакетов операционной системы Linux Всех разработчиков для Linux можно условно разделить на две группы: разработчиков основных компонентов Linux (upstream-разработчиков) и независимых разработчиков программ (Independent Software Vendor). Проблема распространения программы для первой группы не возникает — разработчики дистрибутивов сами собирают программу в окружении своего дистрибутива и помещают её в Секция системного программирования и программной инженерии 127 свои репозитории. Разработчики второй группы при распространении своего продукта сталкиваются с проблемой «пакетной несовместимости». Дело в том, что программы принято распространять в виде программных пакетов [1] — файлов специальных форматов, содержащих в упакованном виде непосредственно программу и метаданные для нее (название, версию, архитектуру, текстовое описание, контрольную сумму, а также список зависимостей). Проблема «пакетной несовместимости» состоит в том, что в общем случае невозможно корректно установить пакет, собранный для одного дистрибутива, на другой. Причин этого может быть несколько. 1. Разные форматы пакетов (самые популярные — rpm и deb). 2. Бинарная несовместимость программы. 3. Разные имена зависимостей для разных дистрибутивов (программа установки пакета не может определить, установлены ли другие программы, необходимые для работы данной). Первая проблема в целом решается с помощью инструмента конвертации между форматами пакетов — alien. Вторая проблема решается с помощью стандартизации интерфейсов и библиотек Linux (см. стандарт LSB [2] и инструмент AppChecker). Последняя проблема остается нерешенной и встает как перед разработчиками, так и перед пользователями. Фактически в процессе сборки и установки пакетов единственным этапом, который не поддается автоматизации, является определение корректных названий зависимостей для целевого дистрибутива. Целью данной работы является разработка инструментов, решающих данную проблему как для разработчиков (которые собирают пакеты), так и для пользователей (которые их устанавливают). Первый инструмент — плагин для инструмента конвертации между форматами пакетов alien. Данный плагин добавляет возможность конвертировать пакеты между дистрибутивами (например, можно преобразовать пакет rpm, собранный для openSUSE, в пакет для Fedora), при этом меняется и список зависимостей. Второй инструмент — Cross-distro Installer. Он позволяет устанавливать пакеты, собранные для одного дистрибутива, на другой. При этом происходит определение корректного списка зависимостей и их разрешение. 128 53-я научная конференция МФТИ ФУПМ-2 Определение списка зависимостей происходит на основе веб-службы, хранящей информацию о пакетах и зависимостях всех поддерживаемых дистрибутивов. Литература 1. Foster–Johnson E. RPM Guide. — Indianapolis, Indiana: Wiley Publishing., Inc. 2003. — C. 3--6. 2. Хорошилов А.В. Linux Standard Base: история успеха. — М.: ИСП РАН, 2006. — Т. 10. — С. 29--50. УДК 51.51-76 А.И. Щетинин alexander.shche@gmail.com Институт кибернетики им. В.М. Глушкова НАНУ Анализ последовательности ДНК бактерий. Поиск консервативных последовательностей ДНК эволюционно близких бактерий Биоинформатика — это применение статистических и вычислительных методов в области молекулярной биологии. Сам термин ввел в 1979 году голландский ученый биолог Paulien Hogeweg для изучения информатических подходов в биосистемах. В конце 80-х годов прошлого столетия этот термин стал широко применяться по отношению к изучению геномов и генетики, а также в изучении ДНК последовательностей. Еще ранее фундаментальными кибернетическими проблемами в биологии и медицине широко занимались советские ученые. Так, советские научные школы под руководством всемирно известных академиков П.К. Анохина и В.М. Глушкова получили не только новые теоретические, но и серьезные практические результаты в этом направлении [1]. Новый импульс современному развитию биоинформатики дан в работах директора ИК НАН Украины, академика НАН Украины И.В. Сергиенко и члена-корреспондента НАН Украины А.М. Гупала, которые предложили для построения оптимальных процедур Секция системного программирования и программной инженерии 129 распознавания и статистического анализа генома принципиально новые основания индуктивной математики [2]. После старта в 1990 году проекта Human Genome Project (HGP) — «Геном Человека» — [4] и успешного его завершения в 2003 году эффективность применения биоинформатического подхода к изучению молекулярной биологии стала очевидной в мировом научном сообществе. Результатом проекта «Геном Человека» явилось следующее: было установлено, что последовательность ДНК человека состоит из трех миллиардов пар оснований и включает около 30 тысяч генов. Более половины размера генома занимают различные виды повторяющихся последовательностей, их роль пока не понятна. В оставшейся половине 1.1% генома составляют экзоны, 24% — интроны, 75% — межгенная ДНК. Учеными ИК им. В.М. Глушкова НАН Украины на основе методов индуктивной математики были исследованы первичные, вторичные, третичные структуры белка. Ими были предложены методы предсказания вторичной структуры белка на основе байесовских процедур распознавания (Гупал А.М., Белецкий Б.А., Васильев С.В. [3]). Настоящая работа находится в русле вышеуказанного (биоинформатического) современного научного направления и посвящена анализу последовательности ДНК бактерий, в том числе поиску консервативных последовательностей в ДНК эволюционно близких бактерий. Консервативные последовательности являются важными последовательностями генома вследствие того, что они сохраняются в течение эволюции, а несущественные последовательности (неконсервативные) подвержены случайным мутациям. Выявление и исследование консервативных последовательностей способно открыть новые аспекты эволюции живых организмов. Поэтому поиск и анализ консервативных последовательностей ДНК в геномах, в том числе и в геномах бактерий (как «полигона» живой природы), является чрезвычайно важной практической и теоретической задачей в биоинформатике и молекулярной биологии. В работе обоснована и выбрана экспериментальная база для выполнения анализа ДНК бактерий и поиска консервативных последовательностей в геномах эволюционно близких бактерий — геномы 25 бактерий из GenBank’a NCBI. [5] Предложены модели и алгоритмы анализа ДНК бактерий и поиска консервативных последовательностей. 130 53-я научная конференция МФТИ ФУПМ-2 Литература 1. Анохин П.К. Очерки по физиологии функциональных систем. — М.: Медицина, 1975. — 447 с. 2. Гупал А.М., Сергиенко И.В. Оптимальные процедуры распознавания. — Киев: Наук. Думка, 2008. — 232 с. 3. Белецкий Б.А., Васильев С.В., Гупал А.М. Предсказание вторичной структуры белков на основе байесовских процедур распознавания // Проблемы управления и информации. — 2007. — № 1. — С. 61--69. 4. Официальный сайт проекта Геном Человека. — URL: http://www.ornl.gov/sci/techresources/Human_Genome / home. shtml. 5. N C B I , National Center for Biotechnology Information. Website. — URL: http://www.ncbi.nlm.nih.gov. УДК 004.421.4 Е.И. Щетинин eugene_schet@mail.ru Московский физико-технический институт (государственный университет) Разработка и реализация алгоритмов выявления развернутых циклов в трассе В современном обществе задачи обратной инженерии и информационной безопасности становятся все более актуальными. Такие задачи помогает решать программная среда динамического анализа бинарного кода TrEx [1], разрабатываемая в ИСП РАН. Данная среда служит для решения задач сертификации ПО, задач восстановления формата данных и прочих задачи, которые не могут быть решены с помощью статического анализа бинарного кода, а также с помощью отладчика. Программные инструменты среды базируются на анализе потоков данных в трассе исполнения программы и позволяют выполнять быстрое прототипирование специфических для каждого отдельного Секция системного программирования и программной инженерии 131 случая алгоритмов. Трасса — непрерывная последовательность выполняемых на процессоре инструкций и снимки внутреннего состояния процессора при выполнении каждой инструкции. Среда TrEx реализует методику анализа, подробное рассмотрение которой можно найти в работе [2]. Рассматривается задача восстановления формата сообщений, используемых программой в рамках некоторого протокола [3]. Основными компонентами протокола являются автомат состояний протокола и набор форматов сообщений, входящих в протокол. Реализация алгоритма восстановления существенно опирается на граф потока управления. Но при компиляции, в случае применения различных оптимизаций, вид CFG искажается. Одной из таких оптимизаций является разворачивание циклов, широко применяемое в современных компиляторах. Алгоритм задачи восстановления для полей в сообщении типа структура основан на предположении, что на каждой итерации цикла обрабатывается как одна структура. Однако после разворачивания циклов это предположение нарушается, и алгоритм работает не верно. В работе был предложен и реализован алгоритм поиска развернутых циклов. Алгоритм был встроен в отдельный модуль-расширение (независимый программный плагин, подключаемый к среде TrEx). Модуль может быть отключен из среды по желанию пользователя. Литература 1. Падарян В.А., Гетьман А.И., Соловьев М.А. Программная среда для динамического анализа бинарного кода. — 2009. 2. Тихонов А.Ю., Аветисян А.И., Падарян В.А. Извлечение алгоритма из бинарного кода на основе динамического анализа // Труды XVII общероссийской научно-технической конференции «Методы и технические средства обеспечения безопасности информации». — СПб: 2008. — С. 109. 3. Гетьман А.И., Падарян В.А. Методы восстановления форматов данных // Материалы конференции РусКрипто’2010. — URL: http://ruscrypto.org/netcat_files / File / ruscrypto.2010.038. zip 132 53-я научная конференция МФТИ ФУПМ-2 УДК 681.14 Д.И. Щетинин schetinin.d@gmail.com Институт кибернетики им. В.М. Глушкова НАНУ Программные шаблоны распределенных вычислений в языке Java Шаблон Master–Worker [1] содержит две логических сущности: сущность Master и один или несколько экземпляров сущности Worker [1]. Master инициирует вычисления, создав набор задач, затем помещает их в пространство общего доступа и ожидает момента, когда задачи будут взяты сущностями Worker. Обычно пространство общего доступа представляет собой очередь с общим доступом. Существуют и другие реализации, такие, как кортежное представление данных — реализация ассоциативной памяти, которая предоставляет ячейки для хранения кортежей данных. Одно из преимуществ использования шаблона Master–Worker в том, что алгоритм автоматически распределяет вычислительную нагрузку на узлы Worker. Алгоритм обычно хорошо масштабируется как в случае, когда число задач значительно превышает число рабочих узлов, так и в случае приблизительного совпадения числа задачи и рабочих узлов. В работе был исследован шаблон для случая одного вычислительного узла и многозадачного приложения — реализован класс ExecutorServiceImplинтерфейсаExecutorService из пакета java. util. concurrent 5-й версии Java. Также были проведены исследования для случая распределенных вычислений в среде, состоящей из различных вычислительных модулей (кластерная сеть, элементами которой являются обычные рабочие станции с установленным экземпляром приложения и ОС) [2]. Предложенные реализации показали, что можно довольно удобно преобразовывать ранее разработанный код для многозадачных приложений в код приложения, запускаемого в распределенной вычислительной среде. В дальнейшем планируется исследование и дальнейшее использование шаблона Blackboard–Metaphor[3] в распределенной вычислительной среде. Используя этот шаблон, мы планируем построить систему сбора параметров обобщенной динамической системы и вычислить все прогнозируемые состояния ОДС за указанное время. Секция системного программирования и программной инженерии 133 Литература 1. Mattson T.G., Sanders B.A., Massingill B.L. Patterns for Parallel Programming. — Addison–Wesley Professional, 2004. 2. Щетинин Д.И., Петрухин В.А. Алгоритмы проектирования состояний обобщенных динамических систем // Труды 8-й научной конференции «Полет». Компьютерные технологии. Инженерия программного обеспечения. — К.: НАУ Украины, 2008. — 80 с. 3. Vranes S., Luсin M. Blackboard metaphor in tactical decision making. A Development Strategy for Minimal Maintance Information Systems. — European Journal of Operational Research, 1992. — V. 61. — P. 86--97. 134 53-я научная конференция МФТИ ФУПМ-2 Список представленных организаций Университеты и другие учебные учреждения Государственный университет — Высшая школа экономики Московский государственный университет им. М.В. Ломоносова Московский физико-технический институт (государственный университет) Нижегородский государственный технический университет им. Р.Е. Алексеева Нижегородский государственный университет им. Н.И. Лобачевского (Национальный исследовательский университет) Педагогическая академия последипломного образования Северодвинский филиал Санкт-Петербургского государственного морского технический университета Современная гуманитарная академия Исследовательские институты Вычислительный центр им. А.А. Дородницына РАН Институт кибернетики им. В.М. Глушкова НАНУ Институт системного анализа РАН Институт физико-технической информатики Межведомственный суперкомпьютерный центр РАН Объединённый институт высоких температур РАН Физико-технический учебно-научный центр НАНУ Коммерческие компании ВТБ24 ЗАО «Интел А/О» ФУПМ-2 53-я научная конференция МФТИ 135 136 53-я научная конференция МФТИ ЗАО «Объединённая система моментальных платежей» ФУПМ-2 Именной указатель Компания «Parallels» («SWsoft») ООО «Даймонд Девелопмент» ООО «Физтех-софт» А Авербух Е.Л. 39 Агаханов С.Н. 4 Антышев Е.П. 7 Б Захарушкин В.Ф. 124, 125 Зухба А.В. 75 К Д Казанский И.П. 108 Казённов А.М. 26 Каленкова А.А. 96 Караваева Т.А. 115 Квасов Д.Е. 20 Квасов И.Е. 4, 20, 22, 28, 30, 32 Клименко С.В. 108 Коньков А.К. 11 Коньков К.А. 11 Корниенко А.И. 79, 115 Кошман С.Д. 36 Кривцов Е.В. 79, 115 Крюков И.А. 39 Кузнецов К.А. 98 Куракин А.В. 76 Кухаренко Б.Г. 41 Дорофеев Д.В. 110 Дубовик Г.А. 112 Л Бабичев С.Л. 11 Бездушный А.А. 92 Бобков А.Е. 108 Брунарский П.Н. 14 Булычев А.В. 71 В Васюков А.В. 15 Власов А.Ю. 17 Вязовик Н.А. 79, 115 Г Гапон А.В. 119 Голубев В.И. 20, 22 Маркус Д.Ю. 114 Машинцев И.В. 100 Мендус В.И. 79, 115 Местецкий Л.М. 76 Микляев И.А. 44 Морозов И.В. 26 Н Нечуйвитер С.Н. 117 П Леонов А.В. 108 Панарин С.И. 81 Панкратов С.А. 46 Панов М.Е. 82 Пантелеймонов А.А. 119 Петрухин В.А. 79, 112, 115 Подлесных Д.А. 47 Полежаева Е.А. 84 Пономарев Д.И. 41, 50 Потапов А.П. 36 Пустовой Т.В. 121 Путря А.В. 122 М Р Манаенкова А.А. 121 Манойло Ю.Н. 119 Ройз С.И. 52 Романенко А.А. 86 Рыков В.В. 54 З Заборовский Н.В. 23 Зайтаев Ю.Ю. 25 Зайцев А.А. 73 Захаров А.А. 94 ФУПМ-2 53-я научная конференция МФТИ 137 С У Ч Санников А.В. 32 Семёнов С.Г. 26 Скипор К.С. 88 Смирнов Д.А. 62, 124, 125 Субботина А.Ю. 55 Сысоев Т.М. 103 Устюжанин А.Е. 14, 60, 62 Черников Д.В. 15 Чернов Е.С. 126 Ф Щ Фаворская А.В. 32, 55, 63 Федоров В.С. 66 Щелик Г.С. 67 Щетинин А.И. 128 Щетинин Д.И. 132 Щетинин Е.И. 130 Т Тименков Ю.В. 58 Тименкова Д.В. 58 Тодосьев В.В. 60 Х Харин А.А. 90 Хвостова О.Е. 39 Я Ярёменко Ф.В. 105 138 53-я научная конференция МФТИ ФУПМ-2 Содержание Секция информатики . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Агаханов С.Н., Квасов И.Е. Численное построение осредненной модели трещиноватого пласта в геологической среде. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Антышев Е.П. Модель распределения ресурсов процессора и сетевого устройства . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Бабичев С.Л., Коньков А.К., Коньков К.А. Об оптимальном использовании ресурсов вычислительной системы для реализации модифицированной защищенной среды . . . . . . . . . . . . . . . . . . . . 11 Брунарский П.Н., Устюжанин А.Е. Адаптивное кинодинамическое планирование движения колесного робота . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 Васюков А.В., Черников Д.В. Решение динамических задач механики деформируемого твердого тела на параллельных вычислительных системах с использованием неструктурированных сеток . . . . . . . . . . . . . 15 Власов А.Ю. Распределение области интегрирования в параллельной реализации метода гладких частиц . . . . . . . . 17 Голубев В.И., Квасов Д.Е., Квасов И.Е. Определение положения сейсмогеологических трещин при помощи численных методов глобальной оптимизации. . . . . . . . . . . . . . . 20 Голубев В.И., Квасов И.Е. Численное моделирование землетрясений в различных геологических породах . . . . . . . . 22 Заборовский Н.В. Детектирование состояния гонки по исходному коду C / C++ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 Зайтаев Ю.Ю. Тестирование распределенного хранилища данных TorFS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 Казённов А.М., Морозов И.В., Семёнов С.Г. Сравнение технологий программирования на графических ускорителях для задач молекулярно-динамического моделирования . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Квасов И.Е. Численное исследование анизотропии отклика приповерхностного возмущения от трещиноватого пласта . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 ФУПМ-2 53-я научная конференция МФТИ 139 Квасов И.Е. Аналитическое обоснование условия линейного проскальзывания на трещине . . . . . . . . . . . . . . . . . . . 30 Квасов И.Е., Санников А.В., Фаворская А.В. Численное моделирование пространственных динамических процессов сеточно-характеристическим методом на неструктурированных тетраэдральных сетках . . . . . . . . . . 32 Кошман С.Д., Потапов А.П. Сравнение расчёта задачи деформируемого твёрдого тела улучшенным методом сглаженных частиц с экспериментом. . . . . . . . . . . . . . 36 Крюков И.А., Хвостова О.Е., Авербух Е.Л. Использование меташаров для визуализации результатов моделирования движения сплошных сред . . . . . . . . . . . . . . . . . . 39 Кухаренко Б.Г., Пономарев Д.И. Применение нелинейной байесовской фильтрации при обработке сигналов трехмерного манипулятора . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 Микляев И.А. Формирование информационных систем на основе матричной универсальной объектно-реляционной базы данных с поддержкой древовидной структуры единицы информации . . . . . . . . . . . . . 44 Панкратов С.А. Численное исследование поведения различных моделей трещин в упругой среде . . . . . . . . . . . . . . . 46 Подлесных Д.А. Выбор оптимальной архитектуры ЭВМ для высокопроизводительных вычислений в зависимости от задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 Пономарев Д.И. Использование алгоритма ожидания и максимизации правдоподобия для фильтрации сигналов трехмерного манипулятора . . . . . . . . . . . . . . . . . . . . . . . 50 Ройз С.И. Реализация модели разрушения на основе откольной прочности материала в методе гладких частиц . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 Рыков В.В. Модель понимания в информационных системах . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 Субботина А.Ю., Фаворская А.В. Численное решение одномерной системы уравнений Прайда для пористой геологической среды . . . . . . . . . . . . . . . . . . . . . . . . . 55 Тименков Ю.В., Тименкова Д.В. Моделирование работы подсистемы хранения данных с учетом кэширования при операции резервного копирования . . . . . . . . . . . . . . . . . . . . . 58 140 53-я научная конференция МФТИ Тодосьев В.В., Устюжанин А.Е. Анализ и моделирование поведения абонентов интернет-провайдера с использованием многоагентного подхода . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Устюжанин А.Е., Смирнов Д.А. Создание программной библиотеки распознавания графических маркеров для приложений, работающих с дополненной реальностью . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Фаворская А.В. Интерполяция высоких порядков на неструктурированных треугольных и тетраэдральных сетках . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Федоров В.С. Планировка дисковой активности в ядре ОС Windows . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Щелик Г.С. Математическое моделирование сейсмических откликов от трещин сложной структуры сеточно-характеристическим методом . . . . . . . . . . . . . . . . ФУПМ-2 . . . . . . 60 . . . . . . 62 . . . . . . 63 . . . . . . 66 . . . . . . 67 Секция проблем интеллектуального анализа данных, распознавания и прогнозирования . . . . . . . . . . . . . . . . . . . . . . . . . 71 Булычев А.В. Экспертные системы обеспечения безопасности регионов России, основанные на технологии анализа данных Data Mining . . . . . . . . . . . . . . . . 71 Зайцев А.А. Выбор моделей нелинейной регрессии с анализом гиперпараметров . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 Зухба А.В. Оценка оптимальности жадного алгоритма отбора эталонных объектов в методе ближайшего соседа . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 Куракин А.В., Местецкий Л.М. Распознавание жестов ладони на основе анализа скелетного представления силуэта ладони . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 Мендус В.И., Петрухин В.А., Вязовик Н.А., Кривцов Е.В., Корниенко А.И. Ускорение принятия решений по диспутным циклам международных платежных систем с целью повышения качества обслуживания. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 Панарин С.И. Исследование тем русскоязычных блогов с помощью модели Latent Dirichlet Allocation . . . . . . . . . . . . . . 81 ФУПМ-2 53-я научная конференция МФТИ 141 Панов М.Е. Метод нейтральной точки для компенсации пропусков в обучающей совокупности при обучении распознаванию образов по методу опорных векторов . . . . . . 82 Полежаева Е.А. Инкрементные методы в коллаборативной фильтрации, влияние временного фактора и объема данных . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 Романенко А.А. Об одном обобщении агрегирующего алгоритма В. Вовка . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 Скипор К.С. Метод наименьших углов для логистической регрессии . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 Харин А.А. Теорема о существовании разрывов в шкале вероятностей. Непрерывный случай . . . . . . . . . . . . . . . . . . . . . . . . 90 Секция систем математического обеспечения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 Бездушный А.А. Автоматизация разработки интернет-информационных систем на базе OWL-онтологий . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 Захаров А.А. Современная система управления электронными библиотеками . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 Каленкова А.А. Использование системы автоматической верификации и оптимизации потоков работ для анализа процессов обработки информационных ресурсов в электронной библиотеке . . . . . . . . . . . . . . . . . . . . . . . . 96 Кузнецов К.А. Автоматизированная информационная система учета и аналитической обработки выпускных квалификационных работ студентов Высшей школы бизнес-информатики . . . . . . . . . . . . . . . . . . . . . . . 98 Машинцев И.В. Бизнес-процессы и архитектура информационной системы «Деканат» . . . . . . . . . . . . . . . . . . . . . 100 Сысоев Т.М. Алгоритм преобразований XML-документа с сохранением допустимых иерархических отношений. . . . . 103 Ярёменко Ф.В. Создание системы электронного документооборота на основе рабочих потоков . . . . . . . . . . . . . 105 Секция системного программирования и программной инженерии . . . . . . . . . . . . . . . . 108 142 53-я научная конференция МФТИ ФУПМ-2 Бобков А.Е., Казанский И.П., Клименко С.В., Леонов А.В. Исследование и разработка методов создания и изменения интерактивных трехмерных геоцентрических моделей рельефа в системах виртуального окружения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 Дорофеев Д.В. Автоматическое распознавание тематики устной речи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 Дубовик Г.А., Петрухин В.А. Мониторинг высокораспределённых систем . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 Маркус Д.Ю. Количественная оценка сложности задач управления экономической системой . . . . . . . . . . . . . . . . . . . . . . 114 Мендус В.И., Караваева Т.А., Петрухин В.А., Вязовик Н.А., Кривцов Е.В., Корниенко А.И. Поддержка принятия решений в диспутных циклах банковских международных платежных систем . . . . . . . . . . . 115 Нечуйвитер С.Н. Особенности восстановления экспертного опыта из экспертных высказываний . . . . . . . . . . 117 Пантелеймонов А.А., Гапон А.В., Манойло Ю.Н. Оптимизация транспортного уровня системы комплексной обработки событий . . . . . . . . . . . . . . . . . . . . . . . . . . 119 Пустовой Т.В., Манаенкова А.А. Подсистема формирования индивидуальных расписаний студентов, как компонент системы поддержки дистанционного и смешанного обучения с учетом стандартов третьего поколения . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 Путря А.В. Анализ трендовых торговых стратегий на фондовом рынке . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 Смирнов Д.А., Захарушкин В.Ф. Автоматизации проведения экспертиз с оценкой точности полученного решения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 Смирнов Д.А., Захарушкин В.Ф. Разработка методики получения оценки точности экспертного решения . . . . . . . . . 125 Чернов Е.С. Инструменты кросс-разработки и установки программных пакетов операционной системы Linux. . . . . . . 126 Щетинин А.И. Анализ последовательности ДНК бактерий. Поиск консервативных последовательностей ДНК эволюционно близких бактерий . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 ФУПМ-2 53-я научная конференция МФТИ 143 Щетинин Е.И. Разработка и реализация алгоритмов выявления развернутых циклов в трассе . . . . . . . . . . . . . . . . . . 130 Щетинин Д.И. Программные шаблоны распределенных вычислений в языке Java . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 Список представленных организаций . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 Именной указатель . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 ТРУДЫ 53-й НАУЧНОЙ КОНФЕРЕНЦИИ МФТИ Современные проблемы фундаментальных и прикладных наук Часть VII Управление и прикладная математика Том 2 Составители: Е.Г. Молчанов, А.В. Гасников Редакторы: В.А. Дружинина, И.А. Волкова, О.П. Котова, Л.В. Себова Компьтерная вёрстка: А.В. Чудновский Корректоры: Е.Ю. Чиркина, А.О. Кулагина, В.Ю. Арзамасов, Д.М. Мазилкин, И.А. Смоленцев, Ю.А. Мардашова Издательская группа: Э.Г. Кюн, Е.А. Аникушкина, Г.М. Голубева, И.Н. Самохвалова Подписано в печать 12.11.2010. Формат 60 × 84 1 /16 . Бумага офсетная. Печать офсетная. Усл. печ. л. 9,25. Уч.-изд. л. 9,0. Тираж 100 экз. Заказ № 41 ГОУ ВПО «Московский физико-технический институт (государственный университет)» Издательский центр оперативной полиграфии 141700, Московская обл., г. Долгопрудный, Институтский пер., д. 9