МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ИНСТИТУТ РАДИОТЕХНИКИ, ЭЛЕКТРОНИКИ И АВТОМАТИКИ (ТУ) Факультет: Кибернетики Кафедра: Биомедицинская Электроника КУРСОВАЯ РАБОТА “Моделирование кинетики роста в условиях химиотерапии” Дисциплина: “Моделирование в медицине” Работу выполнил студент группы КМ-1-xx: ФИО _______________________ Проверила преподаватель: Бабушкина Нина Александровна ______________________ МОСКВА 200х 2 Содержание Титульный лист…………………………………………………………….…………1 Содержание………………………………………………………………….…….......2 Введение…………………………………………………………………….…………3 1. Задание…………..…………………………………………………………….…….3 2. Аппроксимация исходных данных………………………………………….……..3 2.1. Выбор функции…………………………………………………………....3 2.2. Аппроксимация в MathCAD………………………………………….…..4 2.3. Выбор оптимальной функции…………………………………………....4 2.4. Метод наименьших квадратов……………………………………………5 2.5. Расчёт коэффициентов с помощью МНК…………………………….....7 2.6. Итерационный метод наискорейшего спуска…………………………...8 2.7. Программа расчёта коэффициентов методом наискорейшего спуска…8 2.8. Расчёт коэффициентов методом наискорейшего спуска…………..…..10 2.9. Результаты……………………………………………………………..….12 3. Расчёт биологических параметров………………………………………………...12 3.1. Время жизни организма без лечения и запас жизненных сил…….…...12 3.2. Дозовая зависимость…………………………………………………..….12 3.3. Расчёт времени жизни организма после курса лечения……………......13 Заключение…………………………………………………………………………….16 Список литературы………………………………………………………………..…..17 3 Введение Метод моделиpования в медицине является сpедством, позволяющим устанавливать все более глубокие и сложные взаимосвязи между теоpией и опытом. В последнее столетие экспеpиментальный метод в медицине начал наталкиваться на опpеделенные гpаницы, и выяснилось, что целый pяд исследований невозможен без моделиpования. Если остановиться на некотоpых пpимеpах огpаничений области пpименения экспеpимента в медицине, то они будут в основном следующими: - - вмешательство в биологические системы иногда имеет такой хаpактеp, что невозможно установить пpичины появившихся изменений (вследствие вмешательства или по дpугим пpичинам); некотоpые теоpетически возможные экспеpименты неосуществимы вследствие низкого уpоня pазвития экспеpиментальной техники; большую группу экспериментов, связанных с экспериментированием на человеке, следует отклонить по моpально-этическим сообpажениям. Но моделиpование находит шиpокое пpименение в области медицины не только из-за того, что может заменить экспеpимент. Оно имеет большое самостоятельное значение, котоpое выpажается в целом pяде пpеимуществ: - - с помощью метода моделиpования на одном комплексе данных можно pазpаботать целый pяд pазличных моделей, по-pазному интеpпpетиpовать исследуемое явление, и выбpать наиболее плодотвоpную из них для теоpетического истолкования. в пpоцессе постpоения модели можно сделать pазличные дополнения к исследуемой гипотезе и получить ее упpощение. в случае сложных математических моделей можно пpименять ЭВМ. откpывается возможность пpоведения модельных экспеpиментов (модельные экспеpименты на подопытных животных) . Все это ясно показывает, что моделиpование выполняет в медицине самостоятельные функции и становится все более необходимой ступенью в пpоцессе создания теоpии, а также позволяет проводить прогноз развития заболеваний, действия терапии. 1. Задание Смоделировать развитие опухоли. Рассчитать время жизни при введении химиотерапии в дозе D = 0.2 МПД. Количество введений – 10 раз с интервалом t 3 суток Исходные данные: N(t) – объём опухоли, t – дни измерения размера опухоли. t, суток 19 22 26 29 34 36 39 46 47 48 50 52 53 56 60 N, у.е. объёма 0,3 1 2 2,3 3,3 4 4,5 7 8,5 11 11,5 9 14,5 15 13 2. Аппроксимация исходных данных 2.1. Выбор функции 4 Визуальный анализ кинетики роста опухоли позволяет предположить, что экспериментальные данные можно аппроксимировать экспоненциальной или степенной функцией. Экспоненциальная функция: N ( t ) N 0e t Степенная функция: N( t ) t (2.1) (2.2) 2.2. Аппроксимация в MathCAD Подбор коэффициентов производился в пакете Mathcad 11 Pro с помощью функции minimize(), реализующая минимизацию суммы квадратов отклонений (СКО) численным итерационным методом градиентного спуска. Экспоненциальная: N 0 0.603 0.055 N( t ) 0.603e 0.055t Степенная функция: 8.810 4 2.388 N( t ) 8.810 4 t .2.388 Рис. 2.1. Аппроксимация исходных данных экспоненциальной и степенной функциями 5 Чтобы выбрать функцию с большей корреляцией с исходными данными, необходимо просчитать сумму квадратов отклонений (СКО) между исходными точками и аппроксимированными аналитической функцией. n СКО [ N( t i ) N( t i ,,)]2 (2.5) i 1 Экспонциальная функция: n СКО1 [ N( t i ) N 0 e t i )] 2 (2.6) i 1 СКО1 33.32 при N 0 0.603 0.055 Степенная функция: n СКО 2 [ N( t i ) t i )] 2 (2.7) i 1 СКО 2 26.02 при 8.8104 2.388 Т.к. СКО2 < СКО1, степенная функция лучше аппроксимирует исходные данные. Функция N( t ) 8.810 4 t .2.388 обеспечивает наилучшую аппроксимацию исходных данных. 2.4. Метод наименьших квадратов Рассмотрим задачу оценки коэффициентов парной линейной регрессии. Предположим, что связь между х и у линейна: у = +х. Здесь имеется в виду связь между всеми возможными значениями величин х и у, то есть для генеральной совокупности. Наличие случайных отклонений, вызванных воздействием на переменную у множества других, неучтенных в нашем уравнении факторов и ошибок измерения, приведет к тому, что связь наблюдаемых величин xi и yi приобретет вид уi=+хi+єi,. Здесь єi. - случайные ошибки (отклонения, возмущения). Задача состоит в следующем: по имеющимся данным наблюдений {xi}, {уi} оценить значения параметров и , обеспечивающие n 2 минимум величины СКО [ y i y] . Если бы были известны точные значения i 1 отклонений єi, то можно было бы (в случае правильности предполагаемой линейной формулы) рассчитать значения параметров и . Однако значения случайных отклонений в выборке неизвестны, и по наблюдениям xi и уi можно получить оценки параметров a и b, которые сами являются случайными величинами, поскольку соответствуют случайной выборке. Пусть а - оценка параметра , b - оценка параметра . Тогда оцененное уравнение регрессии будет иметь вид: 6 yi=а+bxi+еi, (2.8) где еi - наблюдаемые значения ошибок єi. Для оценки параметров и воспользуемся МНК, который минимизирует СКО фактических значений уi от расчетных. Минимум ищется по переменным а и b. Для того, чтобы полученные МНК оценки а и b обладали желательными свойствами, сделаем следующие предпосылки об отклонениях єi: 1. 2. 3. 4. величина єi является случайной переменной; математическое ожидание єi равно нулю: М (єi) = 0; дисперсия є постоянна: D(єi) = D(єi) = 2 для всех i, j; значения єi независимы между собой. Откуда вытекает, в частности, что 0 при i j , cov( i j ) 2 при i j . (2.9) Известно, что, если условия (1 - 4) выполняются, то оценки, сделанные с помощью МНК, обладают следующими свойствами: 1. Оценки являются несмещенными, т.е. математическое ожидание оценки каждого параметра равно его истинному значению: М(а) =; М(b)=. Это вытекает из того, что М(єi) = 0, и говорит об отсутствии систематической ошибки в определении положения линии регрессии. 2. Оценки состоятельны, так как дисперсия оценок параметров при возрастании числа наблюдений стремится к нулю: lim D( a ) 0 ; lim D( b ) 0 . Иначе n n говоря, если п достаточно велико, то практически наверняка а близко к , а b близко к : надежность оценки при увеличении выборки растет. 3. Оценки эффективны, они имеют наименьшую дисперсию по сравнению с любыми другими оценками данного параметра, линейными относительно величин уi . [1] Перечисленные свойства не зависят от конкретного вида распределения величин єi, тем не менее обычно предполагается, что они распределены нормально N(0;y2). Эта предпосылка необходима для проверки статистической значимости сделанных оценок и определения для них доверительных интервалов. При ее выполнении оценки МНК имеют наименьшую дисперсию не только среди линейных, но среди всех несмещенных оценок. Если предположения (3 - 4) нарушены, то есть дисперсия возмущений непостоянна и/или значения є. связаны друг с другом, то свойства несмещенности и состоятельности сохраняются, но свойство эффективности - нет. Рассмотрим теперь процедуру оценивания параметров парной линейной регрессии а и b. Для того, чтобы функция СКО (2.5) достигала минимума, необходимо равенство нулю ее частных производных: 7 n СКО 2 ( y i a bx i ) 0 a i 1 СКО n 2( y i a bx i ) x i 0 i 1 b n n y na b x i 0 i i 1 i 1 n n n y i x i a x i bx i 2 0 i 1 i 1 i 1 (2.10) (2.11) Откуда n y i x i x i y i b n x i2 (x i ) 2 2 a y bx y i x i x i x i y i n x i2 (x i ) 2 (2.12) 2.5 Расчёт коэффициентов МНК Степенную функцию, нелинейную по параметрам, нужно привести к линейному виду: N( t ) t Логарифмируем: ln( N( t )) ln( ) ln( t ) Линеаризуем исходные данные: ti ln(ti) 19 22 26 29 34 36 39 46 47 48 50 52 53 56 60 2,944 3,091 3,258 3,367 3,526 3,584 3,664 3,829 3,85 3,871 3,912 3,951 3,97 4,025 4,094 Ni 0,3 1 yi -1,2 0 2 2,3 3,3 4 4,5 7 8,5 11 11,5 9 14,5 15 13 0,693 0,833 1,194 1,386 1,504 1,946 2,14 2,398 2,442 2,197 2,674 2,708 2,565 n СКО [ N i t i )] 2 i 1 y i ln( N i ) 15 ( y i ln ln( t i )) СКО 2 0 i 1 СКО 15 2( y i ln ln( t i )) ln( t i ) 0 i 1 Из 2.13 и 2.14 находим : 15 15 15 15 ln( t ) y ln( t ) i i i y i i 1 i 1 i 1 15 15 15 (ln( t )) 2 ( ln( t )) 2 i i i 1 i 1 15 15 y ln( t i ) i i 1 i 1 exp( ) 15 15 15 y 15 ln ln( t i ) i i 1 i 1 15 15 15 y i ln( t i ) ln ln( t i ) (ln( t i )) 2 i 1 i 1 i 1 (2.13) (2.14) 8 n 15 число экспериментальных точек ln( t ) 54.94 (ln( t )) 202.99 y 23.48 ln( t ) y 91.44 i 2 i i i i 1591.44 54.9423.48 63.21 15202.99 54.94 2 26.45 2.39 23.48 2.3954.94 ) exp( 7.2) 8.810 4 exp( 15 Следовательно, аппроксимирующая функция будет иметь вид: N( t ) 8.810 4 t .2.39 2.6. Итерационный метод наискорейшего спуска. Рассмотрим метод наискорейшего спуска с шагом, длина которого зависит от свойств минимизируемой функции, или метод Ньютона. Он основан на квадратической аппроксимации минимизируемой функции в окрестности точки x (k), где (k) – номер итерации Минимум квадратической функции легко найти, приравнивая ее градиент нулю. Можно сразу же вычислить положение экстремума и выбрать его в качестве следующего приближения к точке минимума. Новая итерация вычисляется по формуле: x ( k 1) x ( k ) x ( k ) (2.16) Пусть f(x) - минимизируемая фукнция с векторным аргументом a [ x 1 ,x 2 ,...,x n ]T . Алгоритм наискорейшего спуска реализует итерационную процедуру движения к минимуму из произвольно выбранной точки начального приближения в направлении наиболее сильного уменьшения функции, определенном в окрестности текущего значения аргумента минимизируемой функции. Такое направление противоположно направлению, задаваемому вектором градиента f ( x ) минимизируемой функции f(x): f ( x ) [ f f f T , ,..., ] x 1 x 2 x n (2.17) Вычисляя точку нового приближения по формуле (2.16) и разлагая f(x(k+1)) в ряд Тейлора, получим формулу квадратической аппроксимации fкв(x(k+1)): f ( x ( k 1) ) f ( x ( k ) x ( k ) ) f кв ( x ( k 1) ) , где 1 f кв ( x ( k 1) ) f ( x ( k ) )[f ( x ( k ) )] T x ( k ) [x ( k ) ]T 2 f ( x ( k ) )x ( k ) 2! 2 f ( x ( k ) ) - матрица вторых производных: (2.18) 9 2f 2f x 12 x 1x 2 2f 2f 2 (k) f ( x ) x x x 22 2 1 2f 2f x n x 1 x n x 2 2f x 1x n 2f x 2 x n 2f x 2n (2.19) Условие минимума fкв(x(k+1)) по x ( k ) : f кв ( x ( k 1) ) 0 . Вычислим градиент f кв ( x ( k 1) ) из (2.18): f кв (x ( k 1) ) f кв (x ( k ) ) 2 f кв (x ( k ) )x ( k ) 0 (2.20) Для учета фактических особенностей минимизируемой функции будем использовать в (2.20) значения градиента и матрицы вторых производных, вычисленных не по аппроксимирующей fкв(x), а непосредственно по минимизируемой функции f(x). Заменяя fкв(x) в (2.20), найдем длину шага x ( k ) : x ( k ) [ 2 f ( x ( k ) )] 1 f ( x ( k ) ) (2.21) Итак, последовательность вычислений для реализации алгоритма метода Ньютона: 1. Произвольно задать точку начального приближения x(0) 2. В цикле по номеру итерации k=0,1… вычислить: a. Значение вектора градиента f ( x ( k ) ) по формуле (2.17) b. Значение матрицы вторых производных 2 f ( x ( k ) ) по формуле (2.19) c. Значение матрицы, обратной матрице вторых производных d. Значение шага x ( k ) по формуле (2.21) e. Новое значение приближения x(0) по формуле (2.16) 3. Закончить итерационный процесс при достижении нужного приближения.[2] 2.7. Программа расчёта коэффициентов методом наискорейшего спуска За минимизируемую функцию возьмём сумму квадратов отклонениий (СКО) между исходными точками и аппроксимированными аналитической функцией: n n i 1 i 1 СКО [ N( t i ) N( t i ,,)] 2 [ N( t i )t i )] 2 (2.22) 10 2.8. Результаты расчёта коэффициентов методом наискорейшего спуска За начальные приближения выберем: За начальные приближения выберем: 0.001 2 Для случая со степенной функцией формулы (2) и (4) имеют следующий вид: СКО [ СКО СКО T , ] 2 СКО 2 СКО 2 2 СКО 2 СКО 2 СКО 2 Итерации: 11 1. Первая итерация. ( 0) 0.001 ( 0) 2 4 0.610 0.17 (1) 9.410 4 (1) 2.17 2. Вторая итерация. (1) 9.410 4 (1) 2.17 4 0.210 0.13 ( 2) 9.210 4 ( 2) 2.30 3. Третяя итерация. ( 2) 9.210 4 ( 2) 2.30 4 0.210 0.04 (3) 910 6 (3) 2.35 4. Четвёртая итерация. (3) 910 6 (3) 2.35 4 0.110 0.03 ( 4) 8.910 6 ( 4) 2.37 5. Пятая итерация. 12 ( 4) 8.910 6 ( 4) 2.37 4 0.110 0.02 ( 4) 8.810 6 ( 4) 2.39 Итерационный цикл закончен, т.к. результат вычисления коэффициентов совпал с рассчитанными на ПК: 8.810 6 2.39 N(t )8.8104 t .2.39 2.9. Результаты Коэффициенты аппроксимирующей степенной функции были рассчитаны тремя способами: на ПК, безытерационным методом наименьших квадратов (метод нормальных уравнений) и методом наискорейшего спуска (метод Ньютона). Все они дали одинаковые результаты с точностью 0.01. 3. Расчёт биологических параметров. 3.1. Время жизни организма без лечения и запас жизненных сил. Время жизни организма без лечения (Tж(до)) рассчитывается как последний день в исходных данных плюс трое суток. Tж(до) = 60+3 = 63 суток Запас жизненных сил определяют как площадь под аналитической кривой от начала заболевания до летального исхода. Т ж ( до) Z p ( до) 0 63 N( t )dt 8.810 4 t .2.388dt 394.119 0 3.2. Дозовая зависимость. (3.1) 13 Рис. 3.2. График дозовой зависимости Задержку роста опухоли определяют по данным дозовой зависимости. Вводимая доза: D=0.2 МПД Режим введения доз: 10 раз через t 3 суток Задержка роста опухоли: (D) D tg () D MAX 0.24 0,8 суток 1 МПД (3.2) 3.3. Расчёт времени жизни организма после курса лечения. Величина запаса жизненных сил не меняется со временем и является величиной постоянной. На основании этого факта можно произвести расчёт времени жизни организма после курса лечения. Поскольку при введении дозы препарата происходит задержка роста опухоли, представим этот процесс в виде аналитической кусочнопрерывной функции из 11 интервалов: первый – до первого введения дозы, остальные после соответствующего введения дозы с задержкой в 1 сутки (Рис.3.3). Время жизни организма рассчитывается как: it Zi N (t )dt i ( i 1)t (3.3) 14 3 N1 ( t ) N( t ) 8.810 4 t .2.388 для t (0;3) Z1 N1 ( t ) 0.0027 0 N 2 ( t ) N( t (D)) 8.810 4 ( t 0.8) .2.388 6 для t (3;6) Z 2 N 2 ( t ) 0.013 3 N 3 ( t ) N( t 2(D)) 8.810 4 ( t 1.6) .2.388 9 для t (6;9) Z 3 N 3 ( t ) 0.034 6 N 4 ( t ) N( t 3(D)) 8.810 4 ( t 2.4) .2.388 12 для t (9;12) Z 4 N 4 ( t ) 0.069 9 N 5 ( t ) N( t 4(D)) 8.810 4 ( t 3.2) .2.388 15 для t (12;15) Z 5 N 5 ( t ) 0.119 12 N 6 ( t ) N( t 5(D)) 8.810 4 ( t 4) .2.388 18 для t (15;18) Z 6 N 6 ( t ) 0.186 15 N 7 ( t ) N( t 6(D)) 8.810 4 ( t 4.8) .2.388 21 для t (18;21) Z 7 N 7 ( t ) 0.27 18 N 8 ( t ) N( t 7(D)) 8.810 4 ( t 5.6) .2.388 24 для t (21;24) Z 8 N 8 ( t ) 0.373 21 N 9 ( t ) N( t 8(D)) 8.810 4 ( t 6.4) .2.388 27 для t (24;27) Z 8 N 9 ( t ) 0.497 24 N10 ( t ) N( t 9(D)) 8.810 4 ( t 7.2) .2.388 30 для t (27;30) Z 9 N10 ( t ) 0.641 27 4 N11 ( t ) N( t 10(D)) 8.810 ( t 8) .2.388 для t 30 Необходимо проверить, не умрёт ли организм до окончания цикла лечения. Для этого просчитаем расход запаса жизненных сил до последнего введения: 10 it N (t )dt 2.204 i 1 i Z p до 324.119 , следовательно, организм не погибнет до ( i 1)t окончания цикла лечения. 15 Рис. 3.3.Увеличенный фрагмент кинетики роста Пунктирная линия: график роста опухоли до лечения. Жирная линия: график роста опухоли после лечения. Т.к. запас жизненных сил величина постоянная и не зависит от производимой терапии, расчёт времени жизни после лечения будет производиться по следующей формуле: 10 it i 1 ( i 1)t Z p ( после) Z p ( до) Т ж ( после) N i ( t )dt N 11 (3.4) ( t )dt 10 t Т ж ( после) 8.810 4 ( t 8) .2.388 dt 324.119 – 2.204 = 321.915 (3.5) 10 t Расчёт интеграла (3.5) производился в системе MathCAD: Т ж ( после) 70.6 суток - время жизни после лечения. 16 Заключение Развитие опухоли лучше всего аппроксимирует степенная функция. Организм выдержит полный цикл лечения из 10 введений доз уровня 0.2 МПД и умрёт через 70.6 суток после начала лечения, что на 7.6 суток больше, чем без лечения. Рис. 4.1. Смоделированный график развития опухоли до летального исхода. Пунктиром отмечен график развития опухоли до лечения. 17 СПИСОК ЛИТЕРАТУРЫ 1. Пыльнов Ю.В. Регрессионный анализ полиномиальных моделей. – М.: МИРЭА, 1994, 56 с. 2. Ван дер Варден Б.Л. Математическая статистика. – М: Эдиториал УРСС, 2006, 435 c. 3. Дрейпер Н., Смит Г. Прикладной регрессионный анализ. Множественная регрессия. Изд.2, перераб. и доп. –М.: Диалектика, 2007, 912 с.