Корчак Антон Борисович

На правах рукописи Корчак Антон Борисович МЕТОД УСКОРЕНИЯ ЧИСЛЕННОГО РЕШЕНИЯ СИСТЕМ ОДУ И ЕГО ПРИМЕНЕНИЕ ДЛЯ ПРОГРАММНОГО КОМПЛЕКСА МОДЕЛИРОВАНИЯ СВЕРХБОЛЬШИХ ИНТЕГРАЛЬНЫХ СХЕМ Специальность 05.13.18 – Математическое моделирование, численные методы и комплексы программ. АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук Москва-2011 1 Работа выполнена на кафедре вычислительной математики Московского физико-технического института (государственного университета) Научный руководитель: кандидат физико-математических наук, доцент Евдокимов Алексей Витальевич Официальные оппоненты: доктор физико-математических наук, старший научный сотрудник Поляков Сергей Владимирович кандидат физико-математических наук, доцент Ширков Петр Дмитриевич Ведущая организация: Институт автоматизации проектирования РАН Защита состоится 1 декабря 2011 г. в 10.30 час. на заседании диссертационного совета Д 212.156.05 при Московском физико-техническом институте (государственном университете) по адресу 141700, Московская обл., г. Долгопрудный, Институтский пер., д. 9, ауд. 903 КПМ. Автореферат разослан « 29_» октября _2011г. Ученый секретарь диссертационного совета Д 212.156.05, кандидат физико-математических наук О.С. Федько 2 ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность темы. На сегодняшний день все более актуальными становятся задачи моделирования реальных технических, физиологических, экономических и др. процессов, описываемых системами обыкновенных дифференциальных уравнений (ОДУ) высокой размерности. Большинство таких задач требуют высокопроизводительных и распределенных вычислений. Одной из областей, остро нуждающихся в новых подходах к моделированию, является быстро развивающаяся микроэлектроника. Проектирование КМОП СБИС (Сверхбольших Интегральных Схем — до 1 миллиона элементов на кристалле — с Комплементарной логикой на транзисторах Металл-Окисел-Полупроводник) представляет собой независимое моделирование на электрическом, логическом и топологическом уровнях. Чисто электрический уровень, включающий в себя полное решение системы ОДУ, описывающей интегральную схему (ИС), не реализуем для задач большой размерности. Логический подход, обеспечивающий возможность полного моделирования с верификацией функциональности, теряет свою применимость при переходе на глубоко субмикронные и нанометровые полупроводниковые технологии. Для этих технологий рассмотрение ИС как цифровой схемы не представляется возможным — становятся существенными перекрестные помехи, индуктивность и сопротивление шин питания и «земли» и т.п. Все это приводит к потребности возврата на «медленный» электрический уровень моделирования и повышению актуальности проблемы ускоренного моделирования СБИС. Наиболее интересные способы ускорения моделирования получены на стыке электрического и логического подходов — применение DCCCдекомпозиции, учет латентности подсхем, а также использование характеризации. Элементы логического моделирования зачастую основываются на событийном подходе, а также используют эвристические допущения, приводящие к тому, что оценки ожидаемой погрешности результата моделирования носят весьма неопределенный характер. До сих пор малое варьирование значений параметров ИС не приводило к существенным изменениям результатов, а потому погрешность серии расчетов полагалась эквивалентной оцененной погрешности одного расчета. Однако с уменьшением элементов схемы существенно снижается достоверность такого предположения, и все больший интерес представляет проектирование СБИС с контролем точности. Модификация алгоритмов численного решения систем ОДУ в сочетании с особенностями схемотехнического моделирования в данной работе позволили создать новую 3 вычислительную модель для ускоренного моделирования КМОП СБИС с контролем точности. Цели и задачи работы. Целями диссертационной работы являются: 1) создание подхода к ускоренному распределенному моделированию динамических задач, описываемых системами ОДУ большой размерности, с контролем точности; 2) разработка соответствующего семейства алгоритмов и комплекса программ для решения конкретных научных и технических проблем в области моделирования интегральных схем. Для достижения поставленных целей решались следующие основные задачи:  разработка подхода к ускоренному численному решению динамических задач большой размерности;  разработка, обоснование и тестирование вычислительных алгоритмов расчета декомпозированной задачи с применением современных компьютерных технологий, включая параллельные вычисления;  исследование свойств разностных задач, формируемых в результате применения алгоритмов расчета, и создание методов оценки и контроля точности вычислительного эксперимента;  применение предложенного подхода для ускорения логикоэлектрического уровня моделирования интегральных схем с высокой достоверностью;  создание системы компьютерного моделирования динамических задач в приложении к проектированию КМОП СБИС. Объекты и методы исследования. В диссертационной работе предложен и исследован новый подход к ускорению численного решения больших слабосвязанных систем ОДУ, не имеющих ярко выраженной осциллирующей составляющей решения. Подход затрагивает как уровень формирования модели (с применением декомпозиции на подсистемы), так и уровень вычислительного алгоритма (с применением стандартных численных методов для подсистем). В качестве конкретизации подхода предложен алгоритм ускоренного и распределенного решения декомпозированных задач, основанный на применении различных численных методов и шагов для подзадач. Проведены исследования алгоритма, а также обоснованы методы оценки и контроля точности расчета. В ходе аналитических исследований использовались теория распределенного проектирования, теория графов, теория ОДУ, методы вычислительной математики. 4 «Экспериментальная» часть работы проводилась на основании компьютерного моделирования. Большая часть результатов получена с помощью предложенной системы моделирования, реализованной на языке Java с применением современных информационных технологий. Система представляет собой комплекс программ для ускоренного моделирования КМОП СБИС, позволяющий контролировать точность вычислений. Комплекс включает в себя модуль загрузки данных ИС, модуль формирования системы ОДУ, расчетную программу для декомпозированной системы (с набором подключаемых к ней реализаций численных методов), а также поспроцессор. Сравнения проводились с данными, полученными при помощи пакетов Spectre Cadence, HSPICE Synopsys и AlfaSim ИППМ РАН. Научная новизна. Все выводы и результаты, приведенные в диссертации, являются оригинальными. В частности,  разработан новый подход к ускоренному моделированию декомпозируемых динамических задач, описываемых системами ОДУ, в котором ускорение достигается за счет дополнительной неустранимой погрешности — на уровне модели, а не численного метода;  при использовании алгоритма параллельного решения декомпозированных систем ОДУ подход дает большее ускорение при распределенном расчете динамических задач — как на машинах с общей памятью, так и на кластерных структурах;  обоснована применимость правила Рунге для оценки точности и контроля шага интегрирования на базе предложенного алгоритма;  управление точностью расчета при ускоренном моделировании КМОП СБИС впервые осуществлено на базе детерминированных математических формул, что позволяет получать решение с высокой достоверностью — в отличие от существующих эвристических приемов ускорения.    На защиту выносятся следующие положения и результаты: подход к формированию моделей динамических систем для обеспечения ускоренного решения прикладных задач на основе декомпозиции системы обыкновенных дифференциальных уравнений; алгоритм эффективного расчета с возможностью проведения ускоренного распределенного моделирования с контролем точности; аналитическое исследование численного интегрирования в рамках подхода — исследование порядка аппроксимации, оценки 5   погрешности и метода контроля точности решения расщепленных задач, полученного на основе этих оценок; реализация системы моделирования — программного комплекса для ускоренного моделирования динамических (гетерогенных) задач; обоснование применимости подхода для ускоренного моделирования КМОП СБИС нанометрового диапазона на логико-электрическом уровне под управлением заданной точности с совместным использованием структурной и блочно-матричной декомпозиций. Достоверность положений и результатов, выносимых автором на защиту диссертации, обеспечивается проведенными аналитическими исследованиями численных методов, реализуемых вычислительным алгоритмом, и согласованностью результатов алгоритма с результатами моделирования в общепринятых схемотехнических пакетах. Вычислительные эксперименты для различных динамических (в том числе гетерогенных) задач продемонстрировали возможность применения подхода к формированию модели для решения прикладных задач. Программный пакет прошел верификацию на стандартных тестах. Теоретическая и практическая значимости. Предложенные методы ускоренного моделирования, а также их численная реализация, вносят вклад в теорию математического моделирования как схемотехнических задач (КМОП СБИС), так и в целом динамических задач, описываемых (жесткими) системами обыкновенных дифференциальных уравнений высокой размерности. С практической точки зрения, проведенные исследования могут быть полезны при автоматизации схемотехнического проектирования. В работе удалось решить ряд проблем, обычно возникающих при проектировании интегральных схем для технологий 90 нм и ниже, обеспечивая высокую достоверность результатов. Последнее обстоятельство очень важно для современного схемотехнического проектирования. Алгоритм расчета позволяет осуществлять более детальную декомпозицию по отношению к структурному уровню (DCCC-декомпозиция), предоставляя возможность ускоренного моделирования задач с разветвленными шинами «земли» и питания, а также приблизиться к решению проблем оптимизации моделирования IR-drop. Апробация работы. Результаты работы докладывались, обсуждались и получили высокие оценки специалистов на всероссийских и международных конференциях и семинарах ведущих институтов. 6       49-я–52-я научные конференция МФТИ «Современные проблемы фундаментальных и прикладных наук», ноябрь 2006–2009 гг., Москва. XV Международная конференции «Математика. Компьютер. Образование», январь 2007 г., Дубна. XXIII Международная научная конференция «Математические методы в технике и технологиях – MMTT-23», июнь 2010 г., Саратов. Вторая окружная научно-техническая конференция молодых ученых и специалистов, февраль 2010 г., Москва. Вторая международная научная школа для молодёжи «Прикладные математика и физика: от фундаментальных исследований к инновациям», июнь 2011 г., Москва. Семинары кафедры вычислительной математики МФТИ, научные семинары ФУПМ (2008–2011 гг.). Публикации. Результаты по теме диссертационного исследования опубликованы в 14-ти работах:  статей в журналах, рекомендованных ВАК для публикации материалов диссертации — 2 [11, 14],  статей в прочих изданиях — 4 [4, 6, 8, 12],  тезисов докладов на конференциях — 8. Личный вклад автора. Все результаты, изложенные в диссертации, получены лично автором. Автору также принадлежит ведущая роль в написании комплекса программ, интерпретации результатов и исследование свойств разностных схем. Научному руководителю к.ф.-м.н. Евдокимову А.В. принадлежит постановка задач проводимых исследований, участие в обсуждении и интерпретации результатов, техническая поддержка при проектировании и реализации расчетной программы. Д.т.н. Гаврилов С.В., руководитель сектора автоматизации топологического проектирования Института проблем проектирования в микроэлектронике (ИППМ РАН), активно помогал автору в освоении моделей СБИС и других схемотехнических особенностей работы, а также в анализе и интерпретации результатов. Связь с научными проектами. В основу диссертационного исследования положены работы, выполненные в Московском физико-техническом институте 7 (государственном университете) и Институте проблем проектирования в микроэлектронике РАН в рамках проектов:  МНТЦ №2143;  РФФИ 09-07-00077-a. Структура и объем диссертации. Диссертация состоит из введения, пяти глав, заключения и списка литературы. Общий объем диссертации составляет 112 стр., содержит 55 рисунков, 2 таблицы и список литературы из 46 наименований. ОСНОВНОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ Во введении обоснована актуальность и важность исследуемых проблем, сформулированы цели и задачи диссертационной работы. Отмечается научная новизна, практическая ценность и апробация работы. В разделе введения «Существующие подходы» приводится обзор современного состояния методов ускоренного моделирования. Существующие подходы к решению больших систем условно можно разделить на два основных класса. Одни подходы сосредотачиваются на алгоритмах распараллеливания программного кода численных методов (причем безо всякого изменения самих методов), другие делают акцент на сокращении вычислительных затрат за счет специальных эвристических приемов (обычно вытекающих из «физики задачи»). Первый класс применительно к системам ОДУ не дает существенного прироста в скорости (по сравнению, например, с системами уравнений в частных производных). Во втором классе, характерном для некоторых прикладных областей (например, для микроэлектроники), меньшее внимание уделяется точности решения. Некоторое промежуточное положение занимают современные методы по многоскоростному (multi-rate) решению систем ОДУ. В них предлагаются различные формулы для расчета нескольких групп переменных, соответствующих различным шагам интегрирования (кратным друг другу), и экономия вычислительных затрат достигается за счет меньшего числа операций, требуемых для расчета «медленных» переменных (соответствующих большим шагам) в промежуточные моменты времени. Такие методы интегрирования достаточно хорошо изучены с точки зрения оценки точности. Как недостаток, экономия вычислительных ресурсов у них получается не слишком существенной, а вопрос о распараллеливании многоскоростных методов не рассматривается. В первой главе рассматриваются вопросы численного решения систем обыкновенных дифференциальных уравнений. В обзоре численных методов идет речь об общей поставке задачи. Основной сложностью решения больших систем дифференциальных уравнений является существенное 8 различие скорости протекания процессов, описываемых ими. Учет всех быстрых процессов на численном уровне заставляет использовать либо очень малый шаг интегрирования, приводящий к росту числа арифметических операций, либо применять специальные классы численных методов (жесткоустойчивые методы для жестких систем), дающие устойчивые разностные задачи при умеренном шаге, но способные приводить к качественно неверному решению. Уменьшение же шага интегрирования приводит к возрастанию числа требуемых шагов, и как следствие, к неприемлемому росту временных затрат на решение больших систем. Обычно число арифметических операций, требуемых для выполнения одной итерации численного решения, нелинейно зависит от размерности задачи. Классические методы решения систем обладают высокой достоверностью результатов, хорошо изученными свойствами сходимости (в том числе устойчивости в применении к жестким задачам) и разнообразием методов оценки точности и выбора шага интегрирования. Однако использование таких методов для решения задач большой размерности сводится на нет, когда встает вопрос об оптимизации скоростных характеристик расчета. Вместе с тем, разработка и поиск методов ускоренного моделирования, обладающих заданными свойствами, берут свое начало из классических методов. В разделе представлена классификация методов по применимости, — как для задач микроэлектроники, так и в рамках алгоритма ускоренного моделирования с точки зрения реализации контроля точности. В частности выделяются одношаговые методы Рунге-Кутты и Розенброка. Из методов Розенброка особое внимание уделено W-методам, обеспечивающих требуемую устойчивость при модифицированной матрице Якоби. Во второй главе излагаются особенности проектирования интегральных схем и современные проблемы моделирования. Традиционный маршрут проектирования КМОП СБИС включает в себя последовательное независимое решение задач анализа на этапах логического, схемотехнического (или электрического), топологического проектирований. Рис. 1 Пример линейной интегральной схемы. 9 Нижнюю и наиболее точную оценку дают методы полного электрического моделирования на предельно низком транзисторном уровне (типа Spice) для заданных входных последовательностей. Однако эти методы не могут обеспечить полноту и надежность проектирования для схем большой размерности с большим числом внешних входов, к которым относятся СБИС. Таким образом, верификация сложного проекта на уровне точного схемотехнического моделирования весьма затруднительна. Пример моделирования интегральной схемы на электрическом уровне представлен на рис. 1. В диссертационной работе применялся метод узловых потенциалов, основанный на правилах Кирхгофа и законе Ома, для формирования систем алгебро-дифференциальных уравнений. 0  j9  j8 , 0  j8  j6  j7  j3 ,  0  j7  j2  j5 , 0  j7  j2  j 5 , 0  j5  j6  j4 ,  1 1 1  dx2 dt  j2  C2 , dx3 dt  j3  C3 , dx4 dt  j4  C4 ,  0  x2  x4  R0  j5 , 0  x3  x4  R1  j6 , 0  x3  x2  R2  j7 , 0  x1  x3  R3  j8 .  Для проектирования нелинейных элементов схемы — транзисторов — использовалась модель Shichman-Hodges (MOS level 1). Альтернативные методы логического и логико-электрического моделирования наоборот позволяют для цифровых схем проводить полное моделирования, обеспечивая не только верификацию логических функций, но и отсутствие различных рисков сбоя, однако не гарантируют достоверности результата ввиду упрощения моделей при переходе на более высокий уровень проектирования. При переходе на глубоко субмикронные и нанометровые полупроводниковые технологии вероятность сбоя возрастает, и ключевой проблемой логического анализа становится детальный учет влияния различных схемотехнических и топологических эффектов на логику работы и на быстродействие схемы. Кроме того, переход к новым технологиям кардинально увеличивает цену ошибки, поскольку возрастает стоимость пробной партии ИС. Размеры элементов СБИС приблизились к фундаментальным физическим пределам, и поведение элементов цифровых цепей стало аналоговым. В цифровых СБИС стали существенными перекрестные помехи, индуктивность и сопротивление шин питания, «земли» и межсоединений, взаимные индуктивности, электромиграция атомов и т.п. Таким образом, применение чисто логического подхода не представляется возможным. Современные тенденции в логическом моделировании тяготеют к использованию моделей электрического уровня. 10 Вместе с тем, для увеличения скорости электрического моделирования в последнее время стали широко использоваться методы, первоначально разработанные для логического моделирования и основанные на DCCC-декомпозиции (декомпозиции на структурном уровне) и латентности подсхем (временной неактивности), а также использование табличных моделей, получаемых в результате характеризации. На логическом уровне ИС описывается неориентированным графом. Анализ цифровых схем, основанный на теории графов, позволяет разбивать граф схемы на подграфы — подсхемы элементов, связанных по постоянному току (сокращенно DCCC). Этот аппарат позволяет на уровне «физики задачи» осуществлять декомпозицию схемы, а с ней и декомпозицию системы уравнений, описывающую эту схему на схемотехническом уровне. Ниже (см. рис. 4) представлен простой пример двух DCCC-блоков одной ИС. Попытки совместить скорость логического моделирования с точностью схемотехнического моделирования привели к появлению различных гибридных систем ускоренного электрического и смешанного логико-электрического моделирования. Общая закономерность в их характеристиках состоит в том, что с ростом быстродействия программы или предельного размера моделируемой цепи уменьшается точность и достоверность полученного результата за счет принятия различного рода допущений (в частности, о пассивности подсхем) и упрощений при переходе к моделям более высокого уровня. Событийный подход к моделированию, а также наличие эвристической составляющей, приводят к тому, что оценки ожидаемой погрешности результата моделирования носят весьма неопределенный характер. Нет никаких гарантий невыхода за допустимую точность при применении подхода к произвольной ИС. Создание механизма пересчета модели за требуемый промежуток времени в рамках такого подхода является весьма затруднительным. Таким образом, остро стоит потребность в создании подхода к ускоренному моделированию КМОП СБИС с оценкой и контролем точности. Реализация такого подхода возможна, если на проблему моделирования смотреть как на проблему ускоренного решения больших системы ОДУ с контролем точности. Третья глава посвящена изложению предложенного в диссертации подхода к ускоренному моделированию, а также описанию пакета программ. Вводится класс задач, на который ориентировано приложение подхода. Снижение размерности задачи за счет декомпозиции системы на несколько подсистем является одним из самых эффективных способов увеличения скорости расчета. Однако, например, распараллеливание систем ОДУ, расщепленных на подсистемы, наталкивается на проблему чрезмерного потока данных между процессорами и на проблему неравномерности 11 загрузки процессоров, и они обе снижают эффект от распараллеливания. Эти две проблемы невозможно решить одновременно при условии сохранения прежней модели и точной постановки разностной задачи для нее. Решение обеих проблем возможно за счет модификации исходной задачи, тогда снижение вычислительных затрат достигается ценой некоторого роста погрешности аппроксимации исходной дифференциальной задачи. Причем применение данной идеи к выделенному классу задач — слабосвязанным системам ОДУ (см. ниже) — вносит в итоговую погрешность решения лишь небольшой вклад. Кроме противоречий в выборе шага интегрирования, при решении больших систем уравнений вычислитель сталкивается с проблемой выбора численного метода. Часто применение одного численного метода ко всей системе уравнений является малоэффективным или невозможным с точки зрения устойчивости. В то же время, по отношению к подсистемам исходной системы оказывается эффективным применение разных методов (или одного метода с разным набором параметров). Определение 1. Общей подматрицей двух (линейных) систем называется матрица пересечения этих систем по общим неизвестным — матрица, составленная из коэффициентов перед неизвестными, входящими в оби системы уравнений. Определение 2. Две системы называются слабосвязанными, если 1) ранг их общей подматрицы много меньше рангов матриц обеих систем, 2) степень связанности — норма общей подматрицы — много меньше норм обеих матриц. Определение 3. Линейные слабосвязанные системы уравнений — системы, которые при помощи равносильных преобразований можно представить в виде совокупности подсистем, попарно слабосвязанных. Определение 4. Нелинейными слабосвязанными системами уравнений называются системы, являющиеся слабосвязанными в линеаризованном представлении. В случае с линейными системами можно дать более наглядную интерпретацию. Линейные слабосвязанные системы уравнений — системы, матрица которых приводится к блочно-диагональному виду. Ранг матриц блочного пересечения (см. рис. 2) определяет количество переменных, по которым две подсистемы слабо связанны между собой. Координаты матриц пересечения указывают на эти переменные. Нормы матриц определяют степени связанности подсистем. Положим, что задача задается нестационарной системой (системой ОДУ), которую можно разделить на несколько нестационарных подсистем. Каждая подсистема или набор подсистем может решаться отдельным 12 решателем, учитывающим свойства конкретной подсхемы и применяющим численным метод со своими параметрами. Одним из важнейших численных параметров для динамических систем является шаг по времени (шаг интегрирования), именно этот параметр определяет зависимость решателей друг от друга. Если шаги по времени одинаковы, то численное решение декомпозированной задачи алгоритмически не отличается от решения исходной задачи, однако если шаги различные, то требуется применение сложного алгоритма синхронизации. Идея подхода заключается в создании такого алгоритма периодической синхронизации множественных процессоврешателей. Рис. 2 Пример приведения матрицы к блочно-диагональному виду. Рассмотрим задачу Коши для системы ОДУ (1) du dt  f u,t , ut0  u0 , uR n . Максимальный шаг интегрирования среди всех подсистем будем называть макрошагом всего расчета; это определение можно распространить на подмножество подсистем; отношения шага подсистемы к макрошагу будем называть кратностью. Не вдаваясь в технические особенности алгоритма, предлагается следующая схема синхронизации решателей (см. рис. 3). Следует отметить, что на схеме представлена синхронизация только между соседними решателями, в то время как в реальности имеет место попарная синхронизация многих решателей. Рис. 3 Схема решения в а) последовательном и б) параллельном режимах. 13 Ключевым в алгоритме является независимость вычислительной работы решателей на протяжении одного макрошага — состояние решателя известно только на границах макрошага (см. описание существующих подходов выше). По окончанию каждого макрошага происходит взаимная синхронизация решателей посредством обмена значениями собственных или интерфейсных параметров (переменных в случае ОДУ). В алгоритме четко различаются акты прямой (точечная линия на рис. 3) и обратной (пунктирная линия на рис. 3) синхронизации. При прямой синхронизации обновляются интерфейсные переменные решателя, при обратной — интерфейсные параметры других решателей. На рисунке синхронизация отображена по отношению к нижним решателям. Следует обратить внимание на то, что при такой стратегии процессов синхронизации (прямой и обратной) макро-расчет представляет собой последовательный (или в некоторых случаях квази-последовательный) процесс (см. рис. 3а). Распараллеливание таких расчетов является бесполезным (или невозможным). Если теперь рассмотреть стратегию, в которой все решатели могут начинать свои макрошаги вычислений со «старыми» данными и обмениваться «новыми» лишь в конце макрошага, то мы получим строго распараллеливающийся расчет (см. рис. 3б). Таким образом, появляется возможность проводить моделирование в многопроцессорных вычислительных средах, что не является свойственным для систем ОДУ (см. выше). Отрицательной стороной такой стратегии является то, что все решатели проводят вычисления, основываясь на устаревших значениях параметров других решателей. На примере простой линейной системы размерности 2 можно продемонстрировать понятную математическую интерпретацию работы алгоритма ускорения. Пусть матрица системы a b   . M   c d Классический явный метод Эйлера без модификаций (кратность 1) имеет следующий вид  xn1  xn  axn  byn ,   yn1  yn  cxn  dyn . Тогда соотношения метода расчета с ускорением для случая кратности k в параллельном режиме (пример работы алгоритма для кратности 3 представлен на рис. 3б) выглядит следующим образом. 14  xn 1  xn  k axn  bykn ,   y kn 1  y kn   cxn  dykn ,  y kn  2  y kn 1   cxn  dykn 1 , (2)  ...  y kn  k 1  y kn  k  2   cxn  dykn  k  2 ,   y k ( n 1)  y kn  k 1   cxn  dykn  k 1 . Отрицательной стороной такой стратегии является то, что появляется дополнительная неустранимая погрешность, обусловленная запаздыванием данных. Зато такая стратегия позволяет легко полностью распараллелить расчеты. Полностью последовательные (рис. 3а) и полностью параллельные (рис. 3б) расчеты являются предельными стратегиями проведения расчетов. Одна из ключевых особенностей подхода заключается в том, что определенность в выборе моментов времени синхронизации решателей позволяет оценивать погрешность на итерации, и как следствие всего расчета в целом. В четвертой главе рассматриваются вопросы оценки и контроля точности методов численного решения в рамках алгоритма ускоренного моделирования, а также обосновываются соответствующие формальные утверждения. Подробно исследуются подходы оценки точности расчета, а также приводятся наиболее востребованные методы выбора шага интегрирования для классических методов. Детерминированность в алгоритме синхронизации расчетных моделей обеспечивает возможность оценки точности моделирования для любого режима распараллеливания. Для примера, описанного выше (2), проводится строгий вывод погрешности модифицированного метода и ее сравнение с погрешностью классического метода. В примере подробно рассматривается классический анализ «неклассического» метода, формируемого в рамках алгоритма. Для наглядности приводится явный метод Эйлера (1-ого порядка точности), выводится погрешность интегрирования. При оценке погрешности будем предполагать, что система описывает поведение двух гетерогенных физических процессов — bc  ad , a  0 и d  a , что всегда можно получить перестановкой строк в матрице, компонента x будет являться «медленной», а y — «быстрой». Для собственных значений тогда справедливо  x   y . В d 0 . Для определенности базисе из собственных векторов решение представляется в виде 15       tnx *  1 ktn 2x  2  O  2 ,  xn  C1e  * tn y 1 t n k 1d 2  k2y  2  O  2 .   y n  C2 e Тогда погрешность численного метода (2) составляет   xn*  C1t n e tn x k2x  2  O  2 ,       yn*  C2t n k 1d 2  k2y e n y  2  O  2 . t  Погрешность «медленной» компоненты не превышает погрешность соответствующей компоненты классического метода Эйлера. Погрешность «быстрой» компоненты y n* линейно растет с ростом кратности шагов по отношению к погрешности метода Эйлера при фиксированном шаге «быстрой» компоненты и пропорционально увеличивающимся шаге «медленной»; скорость роста определяется разностью d 2  2y ~ bc a  d . Однако при некоторых соотношениях параметров системы величина y n* может быть существенно меньше погрешности, вносимой методом Эйлера — t  C2t n 2y e n y  2 . В таком случае условие на кратность шагов, при котором погрешность модифицированного метода не будет превышать погрешность классического метода k  d a  d  bc . Из полученного результата видно, что чем больше разбегание скоростей процессов a  d , тем большую кратность шагов можно использовать. Величина погрешности определяется степенью связности или разнородностью процессов, а именно произведением bc . Чем больше разнородность (меньше произведение bc ), тем большую кратность шагов можно применять. Результаты позволяют судить о корректности предпосылок формирования подхода к ускоренному расчету систем ОДУ, а также создания алгоритма синхронизации. В том числе, следует еще раз подчеркнуть, что полученные выводы могут быть обобщены как на задачи любой размерности, так и на методы любого порядка, как явные, так и неявные. В последующем разделе демонстрируется падение порядка аппроксимации модифицированных в рамках подхода методов интегрирования. На примере (неявного) метода трапеций (2-ого порядка точности) показывается снижение порядка до 1-ого. В дополнении приводятся методы для повышения порядка метода при необходимости. 16 Операторное представление дифференциальной задачи (1) имеет 0, t  0, du dt  f t , u , t  0,  следующий вид: Lu   F , где Lu    и F 0  u0, t  0; u , t  0.   Пусть исходная разностная задача записывается в виде L u  F , где L — разностный оператор, F — проекция F на расчетную сетку. Модифицированную разностную задачу ускоренного моделирования обозначим как L* u  F . Имеют место следующие утверждения.     Утверждение 1. Если разностная задача L u  F аппроксимирует исходную дифференциальную задачу Lu   F с порядком p , то модифицированная разностная задача для декомпозированной системы L* u  F также аппроксимирует исходную дифференциальную задачу, при   этом для порядка p * метода справедливо соотношение 1 p*  p . При равенстве шагов интегрирования порядки обеих разностных схем совпадают. В диссертационной работе данное утверждение доказывается для схем явного метода Эйлера (1-ого порядка) и неявного метода трапеций (2ого порядка). Экспериментально показывается падение порядка до 1 для метода Рунге-Кутты 4-ого порядка. Строгий анализ устойчивости даже для линеаризованных разностных задач является весьма затруднительным и в рамках данной работы не проводится. Рассмотрение данного вопроса аналогично случаю w-методов. Однако в работе подчеркиваются результаты экспериментов, согласно которым сходящееся решение при ускоренном моделировании может быть получено в существенно большем диапазоне шагов интегрирования, чем при обычном расчете. Утверждение 2. Если модифицированная разностная задача *  L u  F , основанная на аппроксимирующей численной схеме, устойчива, то для оценки погрешности решения применимо правило Рунге. В 4-ой главе подробно разбираются существующие подходы к построению методов выбора шага интегрирования, а также приводятся обоснования возможности применения последних к предлагаемому подходу. В частности делается заключение, что наиболее приемлемым является правило Рунге для оценки главного члена погрешности расчета. Хотя механизм, основанный на методе Рунге, требует существенного увеличения числа арифметических операций (в 3 раза) по отношению к одной итерации решения, он обеспечивает оценку точности и коррекцию шага в рамках требуемой точности. Однако следует заметить, что альтернативой 17   адаптивным методам является эвристический механизм предсказания следующего шага интегрирования в ожидании не превышения ошибки на следующем шаге заданной точности. Такой алгоритм обеспечивает очень быстрый расчет с адаптивным шагом, вычисляемым на основании простых и нересурсоемких критериев (в отличие от правила Рунге). Существенным недостатком такого механизма является не столько эвристичность (применение всевозможных пороговых коэффициентов), сколько отсутствие обратной связи. Применение подобных алгоритмов относится к событийному подходу к моделированию. В таких подходах не предполагается возможность движения назад, то есть, не может быть организован контроль точности. Поскольку выбор шага контролируется предсказанием, основанным на экстраполяции, то политика выбора шага является осторожной, не позволяя шагу быть очень большим (шаг берется меньше, предсказанного). Выбор небольшого шага объясняется не только тем, чтобы попасть в ожидаемый диапазон точности, но и по причине степенного возрастания ошибки предсказания с увеличением шага (из-за экстраполяции). В пятой главе приводятся результаты моделирования типовых задач микроэлектроники. На примере этих задач удается продемонстрировать возможности и преимущества излагаемого подхода. Суть подхода покажем на простой линейной интегральной схеме. Рассмотрим несложную RC-схему (см. рис. 4) с характерными значениями параметров элементов (ёмкостей на «землю» и сопротивлений), описываемую линейной системой ОДУ. Из параметров системы (см. рис. 5) видно, что она может рассматриваться как слабосвязанная с коэффициентом жесткости порядка 100. Рис. 4 Декомпозиция на структурном уровне. Декомпозиция может быть осуществлена как на структурном (или топологическом) уровне (см. рис. 4) так и на блочно-матричном уровне, без привязки к физике задачи, оперируя только дифференциальными уравнениями и их свойствами (см. рис. 5). 18 Рис. 5 Блочно-матричная декомпозиция. В рассматриваемом примере результаты декомпозиций (структурной и математической) совпали. Пунктирной линией выделены «медленная» подсхема и соответствующая подсистема уравнения, остальная часть — «быстрая» подсхема. Рис. 6 Ускорение моделирования ИС для различных кратностей шагов. На рис. 6 представлено ускорение при расчете системы в зависимости от степени кратности, а на рис. 7 показано влияние алгоритма синхронизации на итоговую погрешность расчета. Прирост скорости расчета в 4.5 раза при отсутствии существенного увеличения погрешности достигается даже для линейных систем относительно не большой размерности. Для нелинейных 19 систем большой размерности декомпозиция на большее число подсистем будет давать существенно большее ускорение. Рис. 7 Абсолютная погрешность моделирования ИС для различных кратностей шагов. Важно обратить внимание на тот факт, что, несмотря на огрубление моделирования «быстрой» части, на погрешности «медленной» части это сильно не сказывается. Рис. 8 Декомпозиция внутри DCCC-блока. 20 На рис. 8 приведен пример ИС характерный для технологий 90 нм и ниже. Наличие подобных подсхем, представляющих собой неделимый DCCC-блок, служит серьезным препятствием для ускоренного моделирования. Подобный характер имеет схема с IR-drop (падением напряжения на внутреннем активном сопротивлении), описанная во второй главе диссертационной работы. Особо остро эта проблема проявляется на схемам, состоящих более чем из 10000 элементов. Однако с математической точки зрения декомпозиция системы обеспечивает не только прирост в скорости расчета, но и повышает устойчивость разностной задачи. Результат моделирования описанной выше интегральной схемы с адаптивным алгоритмом выбора шага представлен на рис. 9. Шаги интегрирования подсхем брались одинаковыми. Механизм контроля точности обеспечивает расчет с погрешностью, не выходящий за пределы 2%. На практике также большой интерес представляет анализ поведения или реакции на сигнал выделенной подсхемы. Расчет изолированной подсхемы не представляется возможным, поэтому задача стоит в минимизации вычислительных затрат, требуемых для учета влияния всей схемы на интересующую подсхему. На основе предложенного подхода эту задачу легко решить, т.е. смоделировать только интересующую часть схемы, не расходуя лишние ресурсы на остальную часть подсхемы, рассчитывая ее с очень большим шагом. Рис. 9 Выбор шага сетки (при кратности 1) для получения решения с точностью 2%. В заключении приводятся основные результаты диссертации. 21 ОСНОВНЫЕ РЕЗУЛЬТАТЫ ДИССЕРТАЦИИ 1) Предложен подход к формированию моделей динамических систем для обеспечения ускоренного численного решения декомпозируемых динамических задач, описываемых системами ОДУ большой размерности, основанный на независимом интегрировании подсистем различными численными методами с обменом параметрами подзадач. 2) Разработан алгоритм эффективного расчета ОДУ с возможностью проведения ускоренного распределенного моделирования с контролем точности, основанным на аналитическом исследовании численного интегрирования. Ускорение вносит дополнительную контролируемую неустранимую погрешность. 3) Создан соответствующий комплекс программ, состоящий из программ загрузки и анализа данных и формирования систем ОДУ для различных предметных областей, расчетного модуля и программы постпроцессора. Комплекс позволяет с высокой скоростью по сравнению с традиционными подходами моделировать динамические (гетерогенные) задачи. 4) Метод ускоренного численного решения систем ОДУ, включающий декомпозицию на блочно-матричном уровне, соответствующие алгоритм и комплекс программ применены в системе компьютерного ускоренного распределенного моделирования сверхбольших интегральных схем на логико-электрическом уровне с возможностью контроля заданной точности. Публикации автора по теме диссертации 1. 2. 3. 4. 5. Корчак А.Б. Система интеграции гетерогенных моделей (расчетных программ) // Труды 49-й научной конференции МФТИ. Аэрофизика и космические исследования. — М.: МФТИ, 2006. С. 64–65. Корчак А.Б. Решение слабосвязанных систем дифференциальных уравнений // Труды 50-й научной конференции МФТИ «Современные проблемы фундаментальных и прикладных наук»: Часть VII. Управление и прикладная математика. Том 2. — М.: МФТИ, 2007. — С. 129–131. Корчак А.Б. Система интеграции гетерогенных моделей и ее применение к расчету слабосвязанных систем дифференциальных уравнений // Тезисы докладов XV Международной конференции «Математика. Компьютер. Образование». Дубна, 2007. — С. 86. Корчак А.Б., Евдокимов А.В. Система интеграции гетерогенных моделей динамических систем // Моделирование и обработка информации. — М.: МФТИ, 2008. — С. 4–9. Корчак А.Б. Метод расчёта расщеплённых систем дифференциальных уравнений с кратными шагами // Труды 51-й научной конференции 22 6. 7. 8. 9. 10. 11. 12. 13. 14. МФТИ «Современные проблемы фундаментальных и прикладных наук»: Часть VII. управление и прикладная математика. Том 2. — М.: МФТИ, 2008. — С. 124–128. Корчак А.Б., Евдокимов А.В. Система интеграции гетерогенных моделей и ее применение к расчету слабосвязанных систем дифференциальных уравнений // Математика. Компьютер. Образование: Сб. научных трудов. Том. 2. Под ред. Г.Ю.Ризниченко и А.Б.Рубина. — М.-Ижевск: НИЦ "Регулярная и хаотическая динамика". 2008. — С. 140–149. Корчак А.Б., Евдокимов А.В. Контроль точности ускоренного моделирования СБИС на электрическом уровне // Труды 52-й научной конференции МФТИ «Современные проблемы фундаментальных и прикладных наук»: Часть VII. Управление и прикладная математика. Том 3. — М.: МФТИ, 2009. — С. 62–64. Корчак А.Б., Евдокимов А.В. Система интеграции гетерогенных моделей и ее применение к расчету слабосвязанных систем дифференциальных уравнений // Компьютерные исследования и моделирование. т. 1, № 2. — 2009 — С. 127–136 Корчак А.Б., Евдокимов А.В. Алгоритм синхронизации решателей расщепленных систем дифференциальных уравнений при моделировании КМОП СБИС // XXIII Международная научная конференция «Математические методы в технике и технологиях — MMTT-23» — Саратов, 2010. — С. 149–151. Корчак А.Б. Моделирование КМОП СБИС с контролем скорости и точности // Тезисы докладов 2-ой окружной научно-технической конференции молодых ученых и специалистов. — М.-Зеленоград, 2010. — С. 24. Корчак А.Б., Евдокимов А.В. Метод параллельного расчёта расщеплённых систем дифференциальных уравнений с кратными шагами // Труды МФТИ. – Том 2, №2 г. Долгопрудный, 2010. – С. 77-85. Корчак А.Б., Гаврилов С.В., Евдокимов А.В. Метод ускоренного моделирования интегральных схем с оценкой точности // Информационные технологии моделирования и управления, №5 (70), 2011. — С. 534-543 Корчак А.Б. Ускоренное схемотехническое моделирование с контролем точности // Вторая международная научная школа для молодёжи «Прикладные математика и физика: от фундаментальных исследований к инновациям». Сб. научных трудов. — М.: МФТИ, 2011. — С. 56-58. Корчак А.Б., Гаврилов С.В., Евдокимов А.В. Метод ускоренного моделирования интегральных схем с оценкой точности // Системы управления и информационные технологии — №3 (45), 2011. — С. 75–80. 23 Корчак Антон Борисович МЕТОД УСКОРЕНИЯ ЧИСЛЕННОГО РЕШЕНИЯ СИСТЕМ ОДУ И ЕГО ПРИМЕНЕНИЕ ДЛЯ ПРОГРАММНОГО КОМПЛЕКСА МОДЕЛИРОВАНИЯ СВЕРХБОЛЬШИХ ИНТЕГРАЛЬНЫХ СХЕМ Автореферат Подписано в печать 24.10.2011. Формат 60  84 1/16. Усл. печ. л. 1,0. Тираж 80 экз. Заказ № 703 . Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Московский физико-технический институт (государственный университет)» Отдел оперативной полиграфии «Физтех-полиграф» 141700, Московская обл., г. Долгопрудный, Институтский пер., 9 24

Корчак Антон Борисович

Похожие документы

Разделы

Поддержка

Корчак Антон Борисович

Похожие документы

Добавить этот документ в коллекции

Добавить этот документ в сохраненные

Предложите, как улучшить StudyLib