МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ИНСТИТУТ РАДИОТЕХНИКИ, ЭЛЕКТРОНИКИ И АВТОМАТИКИ (ТУ) Факультет: Кибернетики Кафедра: Биомедицинская Электроника КУРСОВАЯ РАБОТА “Моделирование развития гепатомы ” Дисциплина: “Моделирование в медицине” Работу выполнил студент группы КМ-1-хх: ФИО ______________________ Проверила преподаватель: Бабушкина Нина Александровна ______________________ МОСКВА 200х 2 Содержание Титульный лист…………………………………………………………….………1 Содержание………………………………………………………………….……...2 Введение…………………………………………………………………….………3 1. Описание опухоли…………………………………………………………….…3 2. Аппроксимация исходных данных………………………………………….….3 2.1. Выбор функции………………………………………………………..3 2.2. Аппроксимация в MathCAD…………………………………………..4 2.3. Выбор оптимальной функции………………………………………...5 2.4. Метод наименьших квадратов…………….………………………….6 2.5 Расчёт коэффициентов МНК………………………………………….7 2.6. Итерационный расчёт коэффициентов функции…………………….9 2.7. Результаты…………………………………………………………….13 3. Расчёт биологических параметров…………………………………………….13 3.1. Время жизни организма без лечения и запас жизненных сил……..13 3.2. Дозовая зависимость………………………………………………….13 3.3. Расчёт времени жизни организма после курса лечения…………....14 Заключение……………………………………………………………………..….18 Список литературы………………………………………………………………..19 3 ВВЕДЕНИЕ Задание: смоделировать развитие гепатомы. Рассчитать время жизни при введении дозы химиотерапии. Экспериментальные данные: N(t) – объём опухоли, t – дни измерения размера опухоли. t, суток 5,5 6 7 8 10 11 12 14 N (объём) 0,3 0,55 0,75 1,4 2,65 3,3 4,1 4,3 Количество введения доз препарата: 3 раза Вводимая доза: D=0.4 МПД Интервал введения дозы: t 4 суток 1. Описание опухоли Гепатома (Hepatoma) - злокачественная опухоль печени, развивающаяся из зрелых клеток печени. В странах Запада у людей со здоровой печенью этот вид опухоли встречается крайне редко, однако она часто развивается у больных, страдающих циррозом печени, особенно после перенесенного ими гепатита В. В странах Африки и других тропических странах гепатома распространена достаточно широко. Возможными причинами ее развития являются плесени и различные токсические вещества, которые могут попасть в пищеварительный тракт человека. Гепатомы часто синтезируют альфафетопротеин, наличие которого в крови является убедительным свидетельством развития в организме гепатомы. Также гепатому используют как экспериментальную опухоль на животных. Рис.1.1 Эхограмма гепатомы (получена на УЗ-сканере Medison SonoAce-9900) 2. Аппроксимация исходных данных 2.1. Выбор функции Визуальный анализ распределения данных позволяет предположить, что исходные данные можно аппроксимировать S-образными функциями: функцией Гомперца и логистической (сигмоидом, или функцией Фишера). Все они имеют три неизвестных параметра. Функция Гомперца: N(t ) N e e t (2.1) 4 Логистическая: N( t ) N 1 e t (2.2) 2.2. Аппроксимация в MathCAD Подбор коэффициентов производился в пакете Mathcad 2001 Professional с помощью функций lgsfit(vx, vy, vg) и genfit(vx, vy, vg, F). Функция lgsfit(vx, vy, vg) осуществляет расчёт логистической регрессии по данным времени vx и размера опухоли vy методом градиентного спуска. За начальное приближение берётся произвольный вектор vg. Функция genfit(vx, vy, vg, F) позволяет рассчитывать аппроксимирующую функцию любого вида. Для это вводится дополнительный параметр F, который является вектором частных производных по параметрам аппроксимирующей функции. Расчёты в MathCAD дали следующие результаты: Функция Гомперца: N 5.20 21.3 0.35 N( t )5.2e21,3e (2.3) 0 , 35t Логистическая функция: N 4.63 420.68 0.64 N( t ) 4.63 1 420.68e 0.64t (2.4) 5 Рис. 2.1. Аппроксимация исходных данных логистической и функцией Гомперца. 2.3. Выбор оптимальной функции Чтобы выбрать функцию с большей корреляцией с исходными данными, необходимо просчитать сумму квадратов отклонений (СКО) между исходными точками и аппроксимированными аналитической функцией. n СКО[ N( t i ) N( t i , N ,,)]2 (2.5) i 1 Функция Гомперца: n СКО1 [ N ( t i ) N e e )] 2 t i 1 (2.6) СКО1 0.168 Логистическая функция: n N СКО 2 [ N( t i ) )] 2 t 1 e i 1 СКО 2 0.09 (2.7) Т.к. СКО2 < СКО1, логистическая функция лучше аппроксимирует исходные данные. 6 N( t ) 4.63 1420.68e 0.64t 2.4. Метод наименьших квадратов Рассмотрим задачу оценки коэффициентов парной линейной регрессии. Предположим, что связь между х и у линейна: у = +х. Здесь имеется в виду связь между всеми возможными значениями величин х и у, то есть для генеральной совокупности. Наличие случайных отклонений, вызванных воздействием на переменную у множества других, неучтенных в нашем уравнении факторов и ошибок измерения, приведет к тому, что связь наблюдаемых величин x i и yi приобретет вид уi=+хi+єi,. Здесь єi. - случайные ошибки (отклонения, возмущения). Задача состоит в следующем: по имеющимся данным наблюдений {xi}, {уi} оценить значения n 2 параметров и , обеспечивающие минимум величины СКО [ y i y] . Если бы i 1 были известны точные значения отклонений єi, то можно было бы (в случае правильности предполагаемой линейной формулы) рассчитать значения параметров и . Однако значения случайных отклонений в выборке неизвестны, и по наблюдениям xi и уi можно получить оценки параметров a и b, которые сами являются случайными величинами, поскольку соответствуют случайной выборке. Пусть а - оценка параметра , b - оценка параметра . Тогда оцененное уравнение регрессии будет иметь вид: yi=а+bxi+еi, (2.8) где еi - наблюдаемые значения ошибок єi. Для оценки параметров и воспользуемся МНК, который минимизирует СКО фактических значений уi от расчетных. Минимум ищется по переменным а и b. Для того, чтобы полученные МНК оценки а и b обладали желательными свойствами, сделаем следующие предпосылки об отклонениях єi: 1. 2. 3. 4. величина єi является случайной переменной; математическое ожидание єi равно нулю: М (єi) = 0; дисперсия є постоянна: D(єi) = D(єi) = 2 для всех i, j; значения єi независимы между собой. Откуда вытекает, в частности, что 0 при i j , cov( i j ) 2 при i j . (2.9) Известно, что, если условия (1 - 4) выполняются, то оценки, сделанные с помощью МНК, обладают следующими свойствами: 1. Оценки являются несмещенными, т.е. математическое ожидание оценки каждого параметра равно его истинному значению: М(а) =; М(b)=. Это вытекает из того, что М(єi) = 0, и говорит об отсутствии систематической ошибки в определении положения линии регрессии. 2. Оценки состоятельны, так как дисперсия оценок параметров при возрастании числа наблюдений стремится к нулю: lim D( a ) 0 ; n lim D( b ) 0 . Иначе говоря, если п достаточно велико, то практически n наверняка а близко к , а b близко к : надежность оценки при увеличении выборки растет. 3. Оценки эффективны, они имеют наименьшую дисперсию по сравнению с любыми другими оценками данного параметра, линейными относительно величин уi . [1] 7 Перечисленные свойства не зависят от конкретного вида распределения величин є i, тем не менее обычно предполагается, что они распределены нормально N(0;y2). Эта предпосылка необходима для проверки статистической значимости сделанных оценок и определения для них доверительных интервалов. При ее выполнении оценки МНК имеют наименьшую дисперсию не только среди линейных, но среди всех несмещенных оценок. Если предположения (3 - 4) нарушены, то есть дисперсия возмущений непостоянна и/или значения є. связаны друг с другом, то свойства несмещенности и состоятельности сохраняются, но свойство эффективности - нет. Рассмотрим теперь процедуру оценивания параметров парной линейной регрессии а и b. Для того, чтобы функция СКО (2.5) достигала минимума, необходимо равенство нулю ее частных производных: n СКО 2 ( y i a bx i ) 0 a i 1 СКО n 2( y i a bx i ) x i 0 b i 1 n n y na b x i 0 i i 1 i 1 n n n y i x i a x i bx i 2 0 i 1 i 1 i 1 (2.10) (2.11) Откуда n y i x i x i y i b n x i2 (x i ) 2 2 a y bx y i x i x i x i y i n x i2 (x i ) 2 (2.12) 2.5 Расчёт коэффициентов МНК Логистическую функцию, нелинейную по параметрам, нужно привести к линейному виду: 8 N( t ) N 1 e t N 1 e t N( t ) N 1 e t N( t ) Логорифмир уем: N 1) ln( e t ) N( t ) N ln( 1) ln( ) t N( t ) ln( Т.к. N стоит в y(t), которое для метода МНК должно быть определено, возьмём первое приближение N = 4.63 исходя из рассчитанного в п.2.2. Преобразуем экспериментальные данные: ti 5,5 6 7 8 10 11 12 14 Ni 0,3 0,55 0,75 1,4 2,65 3,3 4,1 4,3 3,995 3,374 3,051 2,385 1,661 1,394 1,115 1,051 yi n СКО [ N i i 1 y i ln( N )] 2 t 1 e N 1) Ni 8 ( y i ln t i СКО 2 0 i 1 СКО 8 2( y i t i ) t i 0 i 1 Из 2.13 и 2.14 находим : 8 8 8 8 t y t yi i i i i 1 i 1 i 18 8 (t i ) 2 8t i2 i 1 i 1 8 8 ti y i i 1 exp( i 1 ) 8 n 8 число экспериментальных точек t 73.5 t 740.25 y 1.34 t y 28.504 i 2 i i i i 8 18 y 8 ln ti i i 1 i 1 8 8 8 y i t i ln t i t i 2 i 1 i 1 i 1 (2.13) (2.14) 9 828.504 73.51.34 332.64 73.5 2 8740.25 519.75 0.64 1.34 0.6473.5 ) exp( 6.048) 420.7 exp( 8 Следовательно, аппроксимирующая функция будет иметь вид: N( t ) 4.63 1 420.7e 0.64t 2.6. Итерационный расчёт коэффициентов функции Рассмотрим метод наискорейшего спуска с шагом, длина которого зависит от свойств минимизируемой функции, или метод Ньютона. Он основан на квадратической аппроксимации минимизируемой функции в окрестности точки x (k), где (k) – номер итерации Минимум квадратической функции легко найти, приравнивая ее градиент нулю. Можно сразу же вычислить положение экстремума и выбрать его в качестве следующего приближения к точке минимума. Новая итерация вычисляется по формуле: x ( k 1) x ( k ) x ( k ) (2.15) Пусть f(x) - минимизируемая фукнция с векторным аргументом a [ x 1 ,x 2 ,...,x n ]T . Алгоритм наискорейшего спуска реализует итерационную процедуру движения к минимуму из произвольно выбранной точки начального приближения в направлении наиболее сильного уменьшения функции, определенном в окрестности текущего значения аргумента минимизируемой функции. Такое направление противоположно направлению, задаваемому вектором градиента f ( x ) минимизируемой функции f(x): f ( x ) [ f f f T , ,..., ] x 1 x 2 x n (2.16) Вычисляя точку нового приближения по формуле (2.15) и разлагая f(x(k+1)) в ряд Тейлора, получим формулу квадратической аппроксимации fкв(x(k+1)): f ( x ( k 1) ) f ( x ( k ) x ( k ) ) f кв ( x ( k 1) ) , где 1 f кв ( x ( k 1) ) f ( x ( k ) )[f ( x ( k ) )] T x ( k ) [x ( k ) ] T 2 f ( x ( k ) )x ( k ) 2! 2 f ( x ( k ) ) - матрица вторых производных: 2f 2f x 12 x 1x 2 2f 2f 2 f ( x ( k ) ) x x x 22 2 1 2f 2f x n x 1 x n x 2 2f x 1x n 2f x 2 x n 2f x 2n (2.17) (2.16) 10 Условие минимума fкв(x f кв ( x ( k 1) ) из (2.20): ) по x (k+1) (k) : f кв ( x ( k 1) f кв ( x ( k 1) ) f кв ( x ( k ) ) 2 f кв ( x ( k ) )x ( k ) 0 ) 0 . Вычислим градиент (2.18) Для учета фактических особенностей минимизируемой функции будем использовать в (2.19) значения градиента и матрицы вторых производных, вычисленных не по аппроксимирующей fкв(x), а непосредственно по минимизируемой функции f(x). Заменяя fкв(x) в (2.19), найдем длину шага x ( k ) : x ( k ) [ 2 f ( x ( k ) )] 1 f ( x ( k ) ) (2.20) Итак, последовательность вычислений для реализации алгоритма метода Ньютона: 1. Произвольно задать точку начального приближения x(0) 2. В цикле по номеру итерации k=0,1… вычислить: a. Значение вектора градиента f ( x ( k ) ) по формуле (2.16) b. Значение матрицы вторых производных 2 f ( x ( k ) ) по формуле (2.17) c. Значение матрицы, обратной матрице вторых производных d. Значение шага x ( k ) по формуле (2.20) e. Новое значение приближения x(0) по формуле (2.15) 3. Закончить итерационный процесс при достижении нужного приближения.[2] За минимизируемую функцию возьмём сумму квадратов отклонений (СКО) между исходными точками и аппроксимированными аналитической функцией: n n N СКО [ N( t i ) N( t i , N ,,)] 2 [ N( t i ) )] 2 t 1e i 1 i 1 (2.21) За начальные приближения выберем: N 4 420 1 Для случая с логистической функцией формулы (2.16) и (2.18) имеют следующий вид: СКО [ СКО СКО СКО T , , ] N 2 СКО N 2 2 СКО 2 СКО N 2 СКО N 2 СКО N 2 СКО 2 2 СКО 2 СКО N 2 СКО 2 СКО 2 Программа в MathCAD в таком случае выглядит следующим образом: 11 Итерации: 1. Первая итерация. N (0 ) 4 ( 0 ) 420 ( 0 ) 1 4.232 СКО 183.231 0.12 11.64 0.16 100.072 2 СКО 0.16 0.195 0.763 100.072 0.763 23.068 12 0.41 0.35 0.2 N (1) 4.41 (1) 420.35 (1) 0.8 2. Вторая итерация. N (1) 4.41 (1) 420.35 (1) 0.8 3.168 СКО 3.878 0.07 10,4 0.53 99.1 2 СКО 0.53 0.223 0.93 99.1 0.93 30.107 0.17 0.14 0.2 N (2 ) 4.58 ( 2 ) 420.49 ( 2 ) 0 .6 3. Третяя итерация. N (2 ) 4.58 ( 2 ) 420.49 ( 2 ) 0 .6 2.103 СКО 3.41 0.06 10.3 0.237 6.96 2 СКО 0.237 0.95 0.122 6.96 0.122 0.397 0.03 0.11 0.07 N (3) 4.61 ( 3) 420.6 ( 3) 0.67 4. Четвёртая итерация N (3) 4.61 ( 3) 420.6 ( 3) 0.67 0.28 0.03 0.09 N (4 ) 4.63 ( 4 ) 420.67 ( 4 ) 0.65 1.17 СКО 2.43 0.05 11.64 0.517 4.46 2 СКО 0.517 0.95 0.52 4.46 0.52 0.589 13 Итерационный цикл закончен, т.к. результат вычисления коэффициентов совпал с рассчитанными на ПК (п.2.2) с точностью 0.1. N 4.63 420.67 0.65 N( t ) 4.63 1 420.67e 0.65t 2.7. Результаты Коэффициенты аппроксимирующей логистической функции были рассчитаны тремя способами: на ПК, безытерационным методом наименьших квадратов (метод нормальных уравнений) и методом наискорейшего спуска (метод Ньютона). Все они дали одинаковые результаты с точностью 0.1. 3. Расчёт биологических параметров. 3.1. Время жизни организма без лечения и запас жизненных сил. Время жизни организма без лечения (Tж(до)) рассчитывается как последний день в исходных данных плюс трое суток. Tж(до) = 14+3 = 17 суток Запас жизненных сил определяют как площадь под аналитической кривой от начала заболевания до летального исхода. Т ж ( до) Z p ( до) 0 17 4.63 dt 35,041 0.64 t 1 420 . 68 e 0 N( t )dt 3.2. Дозовая зависимость. (3.1) 14 Рис. 3.2. График дозовой зависимости Задержку роста опухоли определяют по данным дозовой зависимости. Количество введения доз препарата: 3 раза Вводимая доза: D=0.4 МПД Интервал введения доз: t 4 суток Задержка роста опухоли: (D) D tg () D MAX 0.431.2 сутки 1 МПД (3.2) 3.3. Расчёт времени жизни организма после курса лечения. Величина запаса жизненных сил не меняется со временем и является величиной постоянной. На основании этого факта можно произвести расчёт времени жизни организма после курса лечения. Поскольку при введении дозы препарата происходит задержка роста опухоли, представим этот процесс в виде аналитической кусочнопрерывной функции из 4 интервалов: первый – до первого введения дозы, остальные после соответствующего введения дозы с задержкой в 4 суток (Рис.3.3). До введения дозы: 4.63 N1 ( t ) N( t ) 1 420.68e 0.64t 3 для t (0;3) Z1 N1 ( t ) 0.013 0 После первого введения дозы в момент t 3 суток N 2 ( t ) N( t (D)) 4.63 1 420.68e 0.64( t 1.2) 6 для t (3;6) Z 2 N 2 ( t ) 0.755 3 После второго введения дозы в момент t 6 суток 4.63 N 3 ( t ) N( t 2(D)) 1 420.68e 0.64( t 2.4 ) 9 для t (6;9) Z 3 N 3 ( t ) 5.472 6 После третьего введения дозы в момент t 9 суток 4.63 N 4 ( t ) N( t 3(D)) для t 9 1 420.68e 0.64( t3.6) 15 Необходимо проверить, не умрёт ли организм до окончания цикла лечения. Для этого просчитаем расход запаса жизненных после 3-х введений: Z1 Z2 Z3 6.24 Zpдо 35.194 , следовательно, организм не умрёт до окончания цикла лечения. Соответственно, время жизни организма после курса лечения можно получить из следующего уравнения запаса жизненных сил: Т ж ( после) Z p ( после) Z1 Z 2 Z 3 N 3 t 4 ( t )dt Z p ( до) (3.3) 16 Рис. 3.3. Пунктирная линия: график роста опухоли до лечения. Жирная линия: график роста опухоли после лечения. По формуле (3.3) рассчитываем время жизни после цикла лечения: Т ж ( после) N 3 t Т ж ( после) 3 t 4 ( t )dt Z p ( до) (Z1 Z 2 Z 3 ) 4.63 dt 35.194 – 6.24 = 28.954 1 420.68e 0.64( t 3.6) (3.4) 17 Расчёт интеграла (3.4) производился в системе MathCAD: Т ж ( после) 20.5 суток 18 Заключение Развитие опухоли лучше всего аппроксимирует логистическая S-образная (сигмоидная) функция. Организм выдержит полный цикл лечения из 3 введений доз уровня 0.4 МПД с промежутком в 4 дня и умрёт через 20.5 суток, что на 3.5 суток больше, чем в отсутствии лечения. Рис. 4.1. Смоделированный график развития опухоли до летального исхода. Пунктиром отмечен график развития опухоли до лечения. 19 СПИСОК ЛИТЕРАТУРЫ 1. Пыльнов Ю.В. Регрессионный анализ полиномиальных моделей. – М.: МИРЭА, 1994, 56 с. 2. Ван дер Варден Б.Л. Математическая статистика. – М: Эдиториал УРСС, 2006, 435 c. 3. Дрейпер Н., Смит Г. Прикладной регрессионный анализ. Множественная регрессия. Изд.2, перераб. и доп. –М.: Диалектика, 2007, 912 с. 4. http://www.medslv.ru/ - Медицинский словарь - Гепатома