Применение метода многомерного регрессионного анализа к задаче реконструкции размеров сосудов Приведем общие сведения из теории многомерного регрессионного анализа (Крамер, Математические методы статистики, издательство «МИР», Москва, 1975). Рассмотрим n случайных величин 1,...,n и случайную величину , которая линейно зависит от величин 1,...,n : a0 a11 a22 ... ann Пусть над многомерной наблюдений. Обозначим: случайной величиной j (1,...,n , ) xij – значение случайной величины yi – значение случайной величины в i -ом наблюдении, i 1,..., m ; проведено m ( j 1,..., n ) при i -ом наблюдении, i 1,..., m ; Задача многомерного регрессионного анализа состоит в нахождении значений коэффициентов a0 , a1 , a2 ,..., an (методом наименьших квадратов), что позволяет по известным значениям случайных величин 1,...,n спрогнозировать значение случайной величины . Иными словами, задача регрессионного анализа состоит в том, чтобы найти коэффициенты регрессии a1 , a2 ,..., an и свободный член a0 на основе замеров ( x1i ,..., xni , yi ), которые доставляют минимум функции: m ( yi a a1x1i a2 x2i ... an xni )2 i 1 0 без ограничений на (1) a0 , a1,..., an . Функцию (1) называют также среднеквадратичной ошибкой приближения. В нашем случае случайная величина (1,...,n , ) представляет собой вектор, составленный из размеров сосудов: 7 диаметров и 6 высот: Применительно к задаче реконструкции формы сосудов в качестве независимых переменных выступают известные замеры параметров сосудов (высот и диаметров) (см. рисунок), а в качестве зависимой переменной – параметр, значение которого требуется восстановить. Чтобы определить коэффициенты регрессии, дифференцируем функцию (1) по каждому из n+1 неизвестных коэффициентов a0 , a1 ,..., an и получаем таким образом n+1 уравнение: m ( yi a0 a1x1i ... an xni ) 0 i 1 , (1,а) m ( yi a0 a1x1i ... an xni ) x1i 0 , i 1 (2,а) . . . . . . . . . . . . . . . . . . . m ( yi a0 a1x1i ... an xni ) xni 0 i 1 (n+1,а) Открываем скобки и получаем: m m m m y a0 a x ... an xni 0 i 1 i 1 i 1 i 1 m i 1 i m i 1 1 m , m x a x a x x ... an xni x1i 0 yi 1i i 1 i 0 1 i 1 i i 1 1 1 (1,b) , (2,b) i 1 . . . . . . . . . . . . . . . . . . . . . . . . . . m m m m i 1 i 1 i 1 i 1 yi xni a0 xni a1x1i xni ... an xni xni 0 (n+1,b) Делим правую и левую часть уравнения (1,b) на m и получаем: a0 y a1 x1 a2 x2 ... an xn (1,c) Где y формуле - выборочное среднее значение случайной величины y , определяемое по 1 m i y , m i 1 m x j - выборочное среднее значение величины j , j 1, n ; x j 1 xij m i 1 Подставляем полученное значение a0 в оставшиеся n уравнений ((2б),…,(n+1б)): m i 1 m m x ( y a1 x1 a2 x2 ... an xn )x a x x yi 1i i 1 i 1 i 1 i i 1 1 1 ... m an xni x1i 0 i 1 , (2,c) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . m m m m i 1 i 1 i 1 i 1 yi xni ( y a1 x1 a2 x2 ... an xn )xni a1x1i xni ... an xni xni 0 (n+1,c) Преобразуем уравнения системы: m m m m m m i 1 i 1 i 1 i 1 i 1 i 1 a1x1i x1i ... an xni x1i a1 x1 x1i ... an xn x1i yi x1i y x1i , (2,d) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . m m m m m m a1x1i x1i ... an xni x1i a1 x1 xni ... an xn xni yi xni y xni i 1 i 1 i 1 i 1 i 1 (n+1,d) i 1 Разделим обе части всех уравнений на m и, сгруппировав однородные члены, получим: m m m a1 ( 1 x1i x1i x1 x1) ... an ( 1 xni x1i xn x1) 1 yi x1i y x1 , m i1 m i1 m i1 (2,e) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . m m m a1 ( 1 x1i xni x1 xn ) ... an ( 1 xni xni xn xn ) 1 yi xni y xn m i1 Как известно, m i1 1 m i i xk xl xk xl cov( xk , xl ) m i 1 ковариации между k -ой и l -ой с.в. (размерами следующую систему уравнений: m i1 - выборочный (n+1,e) коэффициент сосуда) . Таким образом, получаем cov( x1, x1)a1 cov(x2 , x1)a2 ... cov(xn , x1)an cov( y, x1), (2,f) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . cov( x1, xn )a1 cov( x2 , xn )a2 ... cov(xn , xn )an cov( y, xn ). (n+1,f) Для решения этой системы мы используем метод Гаусса решения систем линейных алгебраических уравнений (http://bspu.secna.ru/~pvv/mathpage/calcmath/complex/part2/part22_a.htm#p4). После чего из a0 уравнения (1,c) находим свободный член по формуле: a0 y a1 x1 a2 x2 ... an xn . Задачу восстановления размеров можно решать по любому числу n>0 известных параметров сохранившейся части. Рассмотрим пример. Пусть известны все размеры сосуда, кроме диаметра устья по венчику ( d1 ): Имеются данные по 26 целым сосудам (аналогичного типа): На основе исходных данных вычисляются статистические характеристики и на их основе находятся коэффициенты регрессии и свободный член. Из корреляционной матрицы видно, что между многими размерами сосуда существует тесная линейная связь и, следовательно, можно ожидать для них хорошего прогноза. (Так, при известном диаметре основания горловины ( d 3 ) мы точнее всего можем предсказать диаметры - d1, d2 , d4 , а так же высоту h2 .) Величину d1 запишем приближённо: d1 a0 a2d2i ... a7d7i a8h1i ... a13h6i , Таким образом, свободный член 26 i 1,...,26; мы отыскиваем коэффициенты регрессии a2,..., a13 и a0 на основе размеров 26-ти целых сосудов, минимизируя функцию: (d1 a0 a2d2i ... a7d7i a8h1i ... a13h6i )2 , i 1 a0 , a2 ,..., a13 . i 1,...,26; относительно На основе вычисленной матрицы ковариации строим систему линейных уравнений: cov( x2 , x2 )a1 cov( x3 , x2 )a2 ... cov( x13 , x2 )an cov( y, x2 ), cov( x2 , x3 )a1 cov( x3 , x3 )a2 ... cov( x13 , x3 )an cov( y, x3 ), . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . cov( x2 , x13 )a1 cov( x3 , x13 )a2 ... cov( x13 , x13 )an cov( y, x13 ). 1 26 i i где cov( xk xl ) xk xl xk xl , k 2,...,13; l 1,...,13; - коэффициент ковариации 26 i 1 между k -ым и l -ым размерами сосуда. Решаем эту систему методом Гаусса. Свободный член 0 находится по формуле: a a0 d1 a2 d2 ... a7 d7 a8 h1 ... a13 h6 . Коэффициенты регрессии, рассчитанные на основе ранее упоминаемых размеров 26-ти целых сосудов: a2 =0,912; a3 =-0,15; a4 =0,306; a5 =-0,445; a6 =0,195; a7 =0,088; a8 =0.217; a9 =0.196; a10 =-0.142; a11 =0.234; a12 =0.21; a13 =-0.129; a0 =6.390. То есть Таким образом, спрогнозированное значение d1=61мм. Оценить качество прогноза по значению диаметра d1 можно при помощи графика, описывающего контур сосуда. График строится на основе метода сплайн-интерполяции. Как видим, сплайн-интерполяция выполнена удовлетворительное качество реконструкции формы сосуда. правильно, достигнуто