Определение размеров сферических частиц по угловой

advertisement
ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3
В.В. БЕРДНИК, В.А. ЛОЙКО
Представительство компании Técnicas de Investigación Hidrogeológica S.A., Madrid, España, в г. Казань
Институт физики им. Б.И. Степанова НАН Беларуси, Минск
berdnik@pochta.ru
ОПРЕДЕЛЕНИЕ РАЗМЕРОВ СФЕРИЧЕСКИХ ЧАСТИЦ ПО
УГЛОВОЙ ЗАВИСИМОСТИ РАССЕЯННОГО
ИЗЛУЧЕНИЯ МЕТОДОМ НЕЙРОННЫХ СЕТЕЙ
Предложен метод восстановления радиуса сферических однородных
непоглощающих частиц по угловой зависимости излучения, рассеянного в
интервале углов 10o–60o. Возможности метода исследованы на частицах с
радиусом от 0.6 мкм до 13,6 мкм и относительном показателе преломления от 1,015 до 1,28 при длине волны падающего на частицу излучения
 = 0,476 мкм. Средняя относительная погрешность в пределе малых погрешностей измерения составляет 0,3 % и не превышает 5 %. При мультипликативном шуме в 20 % она увеличивается до 0,7 %.
Ключевые слова: дисперсные частицы, рассеяние света, определение
размеров, нейронные сети
Введение
Проблема определения размеров отдельной частицы по угловой зависимости рассеянного излучения относится к обратным задачам оптики
светорассеивающих сред. Она имеет практические применения в медицине, технологии и других областях и весьма актуальна в связи с быстрым
развитием технических средств для измерения излучения, рассеянного
отдельными частицами [1].
В большинстве работ, посвященных этой проблеме, исследовалась задача восстановления параметров сферических однородных частиц. Она
представляет самостоятельный интерес, а также служит тестовой задачей
для методов, предназначенных для восстановления параметров неоднородных и несферических частиц. Предложено несколько подходов для ее
решения.
В [2] авторы использовали метод подбора, основанный на многократном решении прямой задачи рассеяния по теории Ми и нахождении таких
параметров, при которых отклонение рассчитанных данных от измеренУДК 004.032.26(06) Нейронные сети
89
ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3
ных становится минимальным. В рамках этого метода в пределе малых
погрешностей измерения может быть получено строгое решение обратной
задачи рассеяния. Метод естественно обобщается на случай неоднородных и несферических частиц. Характерная для обратных задач неустойчивость проявляется в существовании многих локальных минимумов целевой функции. Таким образом, необходимо решать задачу поиска глобального экстремума функции многих переменных, что является сложной
проблемой, особенно в условиях шумов. Существенным недостатком при
практическом использовании этого метода является также большое время,
затрачиваемое на вычисления.
В ряде работ были предложены достаточно простые эвристические
формулы, которые можно использовать для быстрой приближенной оценки параметров частицы по данным многоуглового рассеяния. В [3] для
определения размеров частиц использовали пропорциональность размера
частиц и характерной частоты k. Эту частоту находили по положению
максимума модуля Фурье-преобразования от произведения функции Ханнинга на угловую зависимость рассеянного излучения. Угловую зависимость рассеянного излучения определяли на интервале 10 o–70o. Средняя
относительная погрешность восстановления радиуса при неизвестном
показателе преломления частиц составляет 3,6 %.
В работе [4] метод нейронных сетей высокого порядка применен для
определения параметров сферических частиц при изменении радиуса в
интервале 0,6 мкм до 10,6 мкм и относительного показателя преломления
частиц в интервале от 1,02 до 1,38. В качестве входных параметров
нейронной сети использовали набор функционалов угловой зависимости
излучения рассеянного в интервале углов 10о–70о. Средняя погрешность
восстановления радиуса составила 0,04 мкм.
Целью работы является разработка метода обработки данных, позволяющего увеличить точность определения размера частиц.
Постановка задачи и формирование вектора входных переменных
Рассмотрим задачу восстановления радиуса R частицы по угловой зависимости интенсивности рассеянного излучения, измеренного в интервале углов 10о–60о. Радиус частиц меняется в интервале 0,6 m – 13,6 m,
относительный показатель преломления в интервале 1,015–1,28, длина
волны падающего излучения в среде  = 0,476 m. Выбранный интервал
изменения параметров характерен для биологических частиц.
УДК 004.032.26(06) Нейронные сети
90
ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3
На опыте обычно измеряют не интенсивность, а сигнал U (l ; R, n) , пропорциональный интенсивности излучения, рассеянного под разными углами и зависящий от параметров частицы:
(1)
U (l , R, n)  aI (l , R, n) l  1, 2,..., L ,
где I (l , R, n) – интенсивность излучения, рассеянного частицей с радиусом R и показателем преломления n под углом l ; L – размерность входного сигнала (количество углов, под которыми измеряется рассеянное
излучение); а – коэффициент пропорциональности.
В предлагаемом методе, также как и в [3], используется сильная корреляционная связь между характерной частотой k и радиусом частицы R.
Однако характерную частоту k мы определяли иначе. Вместо измеряемого сигнала U (l , R, n) мы вводили сигнал Y (l , R, n) :
Y (l , R, n) 
U (l , R, n)
,
(2)
1 L U (l , R, n)
I (l )  
L l 1 I (l )
где I (l ) – усредненная по параметрам угловая зависимость рассеянного
излучения.
Чтобы найти I (l ) (а также для обучения нейронной сети, как будет
указано ниже), мы формировали базу данных, состоящую из угловых зависимостей интенсивности рассеянного излучения I (l , R , n ) ( = 1, 2,…
А, А – количество примеров в базе данных), рассчитываемых на основе
теории Ми [5] для частиц с параметрами p из заданной области изменения параметров при освещении частицы неполяризованным излучением.
1 A
Используя эту базу данных, вычисляли I (l )   I (l , R , n ) . В реA 1
зультате усреднения исчезают осцилляции угловой зависимости рассеянного излучения, характерные для монодисперсных частиц, и I (l ) является монотонной функцией.
Сигнал (2) является инвариантным относительно линейных однородных преобразований. Поэтому для моделирования Y (l , R, n) можно использовать интенсивности рассеянного излучения, рассчитываемые по
теории Ми. Кроме того, диапазон изменения сигнала Y (l , R, n) при изменении угла меньше чем диапазон изменения интенсивности рассеянного
излучения, поскольку при делении на I (l ) исключается сильно вытянутая средняя компонента, характерная для оптически мягких биологичеУДК 004.032.26(06) Нейронные сети
91
ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3
ских частиц.
Затем мы находили проекции ym сигнала Y (l , R, n) на векторы из базиса Карунена-Лоэва [6]:
Y ,
(3)
ym   Y (l , R, n)  H lm
l
Y – первые K векторов ковариационной матрицы
где H lm
Y
Clm

1 A
 Y (l , R , n )Y (m , R , n ),
A 1
и вычисляли сигнал Z (l )  Z (l , R , n ) :
K 1
Y
Z (l )  Y (l , R, n)   ym H lm
.
m 0
(4)
Характерную частоту k мы определяли как частоту, при которой модуль Фурье-преобразования сигнала Z l , определяемого формулой (4),
достигает максимума:
L 1
2kl 
k  arg max  Z (l ) exp  i
(5)
.
L 

l 0
Как показали численные расчеты, если использовать значения интенсивности излучения, рассеянного на интервале [10o, 60o], то при K = 4 и
при изменении параметров в области 0,6 m < R < 13,6 m, 1,015 < n <
< 1,28 положение глобального максимума модуля Фурье-преобразования
является однозначной и гладкой функцией от R. Поэтому для нахождения
характерной частоты можно использовать эффективные алгоритмы сортировки по возрастанию.
На рис.1 a показана корреляционная зависимость между радиусом частицы R и характерной частотой k, найденной по (2)–(5). Как видно из
этого рисунка, корреляция в целом близка к линейной. Эту корреляцию
можно использовать для определения радиуса частиц. Если воспользоваться линейной аппроксимацией зависимости радиуса от k, то средняя
относительная погрешность восстановления радиуса составляет 2,3 %, что
более чем в полтора раза меньше погрешности 3,6 %, полученной в [3]
при использовании функции Ханнинга.
На рис. 1,b эта зависимость показана в увеличенном виде для малых
размеров частиц. В этой области линейность нарушается. Поэтому для
описания корреляционной зависимости R = (k) мы использовали аппроксимацию квадратичным сплайном: на сетке ki = 1,828; 2,292; 2,755; 3,219;
УДК 004.032.26(06) Нейронные сети
92
ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3
3,682; 4,146; 4,61; 5,073; 5,536; 6; 49,168.
12
R  (k )   B (k ) S ,
(6)
1
где  – номер базисного сплайна (общее количество квадратичных базисных сплайнов равно 12), B (k ) – базисные сплайны, S – коэффициенты
сплайна, которые определяли методом наименьших квадратов.
Рис. 1. Зависимость радиуса от характерной частоты k
При этом средняя относительная погрешность восстановления радиуса
частиц составляет 1,8 %.
Формирование и обучение нейронной сети
Разность ( R, n)  R  (k ) зависит от R и n. Анализ показал, что эта
зависимость описывает не очень сильно искривленную поверхность. Поэтому можно уменьшить погрешность определения радиуса частицы, если
удастся с хорошей точностью аппроксимировать функцию ( R, n) , используя достаточно просто вычисляемые функционалы от Y (l , R, n) .
В качестве такого аппроксиматора мы использовали нейронную сеть
прямого распространения [6]. В качестве функционалов применяли характерную частоту k, параметры ym , определяемые соотношением (3), а такУДК 004.032.26(06) Нейронные сети
93
ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3
же проекции zm модуля сигнала Z (l ) (см. формулу (4)) на векторы H lmZ :
Z
,
zm   Z (l )  Hlm
(7)
l
где HlmZ – первые K векторов ковариационной матрицы
1 A
 Z (l , R , n ) Z (m , R , n ) .
A 1
Значения k, ym и zm с помощью линейного преобразования нормировали так, чтобы нормированные значения kn , knm и zm изменялись от –1
ClmZ 
до 1 при изменении параметров в области 0,6 m < R < 13,6 m, 1,015 <
< n < 1,28. Нормированные значения kn , knm и znm использовали в качестве вектора входных параметров yiin для нейронной сети.
Элементом такой нейронной сети является нейрон, который вычисляет
взвешенную сумму подаваемых на его вход сигналов и преобразует результат в соответствии с нелинейной функцией активации. Сигналы с выходов нейронов первого слоя через систему перераспределения сигналов
подаются на входы нейронов второго слоя, которые таким же образом
обрабатывают сигнал и подают его на вход нейронов следующего слоя.
Сигнал с выхода N-слойной нейронной сети прямого распространения,
аппроксимирующий функцию   yiin ( R, n)  , может быть записан следующим образом:



(8)



k
i
где y1i  yiin , y 2j , …, ysN 1 , ykN – сигналы, подаваемые на вход 1-го, 2-го, …,
  yiin ( R, n)   F  wlN   wlkN ykN  F  w1j   w1ji yi1  yiin  ,
N 1
N-1 го, N-го слоя нейронной сети, w1ji , w2ji , …, wks
, wlkN – весовые ко-
эффициенты нейронов 1-го, 2-го, …, N–1-го, N-го слоя сети, w обозначает
множество весовых коэффициентов, F(x) – функция активации нейронов.
Предполагается, что все нейроны имеют одинаковую функцию активации. В качестве функции активации применяют нелинейную
S-образную функцию.
Чтобы обучить нейронную сеть, нужно найти весовые коэффициенты
нейронов всех слоев из условия
1 A
2
V    R  (k )   ( w, yiin )   min ,
(9)
2 1
УДК 004.032.26(06) Нейронные сети
94
ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3
где индекс  = 1, 2, …, A, A – количество примеров в обучающей базе
данных.
Для решения этой оптимизационной задачи мы применяли limited
memory BFGS method [7]. При практическом применении метода необходимо задать начальную точку и вычислять частные производные функции
 ( w, yiin ) по неизвестным весовым коэффициентам. При вычислении
производных применяли метод обратного распространения ошибки.
Проведение расчетов и оценка погрешностей
После того, как найдены коэффициенты нейронной сети, аппроксимирующей функцию   yiin ( R, n)  , радиус частицы определяется следующим
образом:
12
Re   B (k ) S    yiin ( R, n)  .
(10)
1
Теперь рассмотрим погрешности восстановления радиуса с использованием такой нейронной сети. Точность восстановления искомых параметров характеризуют ошибки двух типов. Ошибки первого типа характеризуют точность аппроксимации параметров при отсутствии ошибок задания входных данных. Погрешности второго типа показывают устойчивость восстановления параметров с помощью нейронной сети к ошибкам
измерения.
На рис. 2 показана зависимость относительной погрешности восстаR
новления радиуса  R  1  e , где Re – восстановленное значение радиуR
са, от исходных значений радиуса и показателя преломления частиц при
нулевых погрешностях измерения. При нахождении функции   yiin  использовали нейронную сеть с одним внутренним слоем, содержащую 40
нейронов во внутреннем слое. Как видно из этого рисунка, максимальные
погрешности до R = 5 % возникают в области R < 2m.
Среднюю относительную погрешность R восстановления радиуса
оценивали, находя среднее арифметическое относительных погрешностей
для 104 образцов с параметрами из области изменения параметров. Она
составляет R  0,3 %. Среднее квадратичное отклонение исходных значений радиуса от восстановленных значений составляет 0,018 мкм, что боУДК 004.032.26(06) Нейронные сети
95
ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3
лее чем в два раза меньше погрешности, полученной в [4] с помощью
нейронных сетей высокого порядка.
Мы моделировали ошибки измерения, умножая интенсивности излучения на 1  3  u , где u – случайная величина, равномерно распределенная на интервале [–1,1],  – среднеквадратичное отклонение шума
входных данных. На рис. 3 показано, как меняется погрешности восстановления параметров при увеличении мультипликативного шума при использовании соотношения (5) и с применением трехслойной нейронной
сети прямого распространения с 40 нейронами во внутреннем слое для
аппроксимации функции   yiin ( R, n)  в соответствии с (8).
Рис. 2. Зависимость относительной погрешности восстановления радиуса
Р
УДК 004.032.26(06) Нейронные сети
96
ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3
ис. 3. Зависимость средней относительной погрешности определения радиуса
от мультипликативного шума по формуле (6) (кривая 1) и по (10) (кривая
2)
Заключение
Определение характерной частоты в соответствии с (3)–(5) позволяет в
полтора – два раза уменьшить погрешность определения радиуса частиц
по сравнению с методом, основанным на использовании окна Ханнинга.
Предложена аппроксимация функции   yiin ( R, n)  с помощью нейронной сети. Метод определения радиуса с использованием этой аппроксимации позволяет до величины 0.3% уменьшить относительную погрешность восстановления радиуса в условиях малых шумов измерения по
сравнению с методом определения радиуса по формуле (6), но обладает
меньшей устойчивостью к шумам.
Список литературы
1. Maltsev V.P. Scanning flow cytometry for individual particle analysis //
Review of Scientific Instruments. 2000. V. 71. № 1. P. 243–255.
2. Zakovic S., Ulanowski Z.J., Bartholomew-Biggs M.C. Using global optimization for a microparticle identification problem with noise data // Journal
of Global Optimization. 2005. V. 32. № 3. P. 325–347.
3. Semyanov K.A., Tarasov P.A., Zharinov A.E., Chernyshev A.V.,
Hoekstra A.G., and Maltsev V.P. Single-particle sizing from light scattering by
spectral decomposition // Appl. Opt. 2004. V. 43. № 26. P. 5110–5115.
4. Berdnik V.V., Gilev K., Shvalov A., Maltsev V. P., Loiko V.A. Characterization of spherical particles using high-order neural networks and scanning
flow cytometry // J. of Quantitative Spectrosc. & Radiat. Transfer. 2006. V.102.
№ 1. P. 62–72.
5. Babenko V.A., Astafyeva L.G., Kuzmin V.N. Electromagnetic scattering in disperse media. Berlin: Springer Praxis Publishing, 2003. 233 р.
6. Хайкин C. Нейронные сети: полный курс, 2-е изд., испр.: Пер. с
англ.
М.: ООО «Изд. Дом Вильямс». 2006. 1104 с.
7. Liu D. and Nocedal J. On the limited memory BFGS method for large
scale optimization // Mathematical Programming B. 1989. V. 45. № 1–3. P.
503–528.
УДК 004.032.26(06) Нейронные сети
97
ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3
УДК 004.032.26(06) Нейронные сети
98
Download