ISBN 978-5-7262-1782-6 НЕЙРОИНФОРМАТИКА-2013. Часть 3 Д.А. ТАРХОВ, А.Г. РОМАНОВА Санкт-Петербургский государственный политехнический университет dtarkhov@gmail.com НЕЙРОСЕТЕВОЙ ПОДХОД К ЗАДАЧАМ ИДЕНТИФИКАЦИИ ИСТОЧНИКОВ ЗАГРЯЗНЕНИЯ ОКРУЖАЮЩЕЙ СРЕДЫ В статье рассмотрены проблемы, возникающие на пути создания иерархических интеллектуальных систем мониторинга и прогнозирования состояния окружающей среды, которые предлагается создавать с помощью нейросетевого моделирования. Данные системы позволят минимизировать вредные воздействия техносферы на население и природу, спрогнозировать возникновение чрезвычайных ситуаций и принять меры по их предотвращению, смягчению последствий и их ликвидации. Ключевые слова: нейросетевое моделирование, мониторинг, прогнозирование, окружающая среда, иерархические интеллектуальные системы *** Быстрый рост загрязнённости окружающей среды ставит острую проблему сохранения экологических систем и здоровья человека. Важной задачей науки в настоящее время является прогноз изменения экосистем под влиянием естественных и антропогенных факторов. Назрела необходимость создания иерархической системы экологического мониторинга от локального уровня, отслеживающего загрязнения атмосферы промышленными выбросами в масштабе предприятия (района) до глобального – масштаба всей планеты. Такая система, в частности, позволит фиксировать количество выбросов от предприятий и идентифицировать наиболее загрязняющие из них, а также оценить реальный вклад отдельных источников в загрязнение воздуха. Отметим некоторые проблемы в применении классических подходов к созданию соответствующих моделей. Локальный уровень поставленной задачи предполагает, что будет рассматриваться несколько промышленных предприятий, выбрасывающих в атмосферу заданное количество вредных аэрозолей в выбранном районе. Пусть в заданном регионе G с полной границей S расположены n промышленных объектов, УДК 004.032.26(08) Нейронные сети 149 ISBN 978-5-7262-1782-6 НЕЙРОИНФОРМАТИКА-2013. Часть 3 ежесекундно выбрасывающих Qi аэрозолей, i 1, 2,..., n , состав которых будем считать одинаковым. В области G выделим m экологических зон Gk, k 1, 2, , m , для которых заданы предельно допустимые концентрации выпавшего за интервал времени 0, Ò аэрозоля. В результате традиционная математическая постановка задачи [1-3] примет вид уравнения диффузии для интенсивности ( x, y, z, t ) аэрозольной субстанции от n индустриальных объектов: n (1) div(u) v Qi i t z z i 1 с граничными условиями: f s на , на 0 , 0 на H . z z Здесь u – скорость воздушного потока; – оператор Лапласа по переменным ( x, y) ; для цилиндрической области G с полной границей S 0 H , где боковая поверхность цилиндра – граница рассматриваемого региона, 0 – подстилающая поверхность, H – верхняя граница рассматриваемой области; – коэффициент, описывающий скорость распадения (поглощения) аэрозоля, и v – коэффициенты горизонтальный и вертикальный диффузии; i ( x, y, z; xi , yi , zi ) – дельтаобразная функция, которая локализована в малой окрестности i -ого предприятия (при вычислениях заменяется, например, быстроубывающим гауссианом). На решениях задачи (1) строится функционал T Yk dt Pc dG , 0 (2) Gk который характеризует санитарную дозу аэрозоля, выпавшего в области экологической зоны Gk. Особенность реальной постановки задачи, формализуемой уравнением (1) и соответствующими граничными условиями, состоит в том, что входящие в неё параметры не являются константами и известны с некоторой погрешностью. Для многоуровневой системы такие параметры (скорость воздушного потока, концентрация загрязнений на границе региона f s и т.д.) часто определяются решением задачи на другом уровне иерархии. Вычисления при большом числе наборов параметров требуют нерационально больших затрат вычислительных ресурсов. Кроме того, в реальных ситуациях трудно определить саму границу 150 УДК 004.032.26(08) Нейронные сети НЕЙРОИНФОРМАТИКА-2013. Часть 3 ISBN 978-5-7262-1782-6 региона S и условия на ней. Обычно, вместо них, наряду с дифференциальными уравнениями, бывает задана дополнительная информация, например, в виде приближенно известных данных наблюдений (измерений с помощью датчиков, размещённых в некотором наборе точек области G ). Предлагаемый нами подход [4,5] позволяет объединить разнородную информацию о системе в нейросетевой модели. Данный подход может быть эффективно применён для решения обратных задач и задач, поставленных некорректно или данных в неклассической постановке. Подобные задачи возникают, например, в случаях, когда определяющие моделируемую систему характеристики известны не точно, необходимо исследовать поведение решения в зависимости от некоторого параметра или идентифицировать значение параметра по данным измерений. К таким задачам, в частности, относятся задачи определения Qi по данным наблюдений. Для решения подобных задач общий подход, изложенный в [4,5], нуждается в следующей модификации. Пусть в постановку задачи p (3) A(u, r) g (r), u u (x, r), x (r) R , B(u, r) f (r ) (r) (здесь оператор A определяет уравнение, оператор B задает начальнокраевые условия) входят параметры r (r1 ,..., rk ) , меняющиеся на некоторых интервалах: ri (ri ; ri ), i 1,..., k . Ищем приближённое решение задачи (3) в виде выхода искусственной нейронной сети заданной архитектуры N u(x, r) ci hi (x, r, ai ) , (4) i 1 веса которой – линейно входящие параметры ci и нелинейно входящие параметры a i – определяются в процессе поэтапного обучения сети на основе минимизации функционала ошибки вида M M J (u ) A(u (x j , r j )) g (x j , r j ) B(u (xj , rj )) f (xj , rj ) . j 1 2 2 (5) j 1 УДК 004.032.26(08) Нейронные сети 151 ISBN 978-5-7262-1782-6 НЕЙРОИНФОРМАТИКА-2013. Часть 3 Здесь {x j , rj }Mj1 – периодически перегенерируемые пробные точки в k области (rj ) (ri ; ri ) , {xj , rj }Mj 1 – пробные точки на её границе i 1 (rj ) ; 0 штрафной параметр. Предлагается строить иерархическую интеллектуальную систему мониторинга и прогнозирования состояния окружающей среды на основе постоянно подстраиваемых под новые данные нейросетевых моделей и пересылки таких моделей от одного уровня иерархии к другому. Иерархическая система мониторинга реализуется на нескольких уровнях, каждому из которых соответствует свой набор математических моделей, описывающих распространение загрязнений и другие важные для рассматриваемых задач величины, например скорость ветра, температуру воздуха и т.д. Данные модели обычно имеют вид или уравнений в частных производных с граничными и начальными условиями, или таблиц (баз данных) с результатами наблюдений (измерения интересующих параметров). В реальной ситуации, обычно имеется информация обеих типов, причём часть её, например все или часть граничных и начальных условий могут быть неизвестны. Как говорилось выше, на основе всей этой информации можно построить параметризованную нейросетевую модель. При классическом подходе для того, чтобы учесть воздействие от соседних областей, а также от внешних условий, нужно пересылать большой массив информации. При изменении каких-либо внешних параметров, придется формировать другой информационный массив, и так до бесконечности. Мы предлагаем пересылать от информационной системы, соответствующей одной области в информационную систему, соответствующую другой области или другому уровню иерархии вместо большого массива чисел упомянутую выше готовую параметризованную нейросетевую модель, в которой уже заложены зависимости от возможного изменения внешних условий. В качестве примера приведём нейросетевое решение задачи с обращением времени. В данной задаче начальное распределение концентрации вредного вещества в воздухе рабочей зоны в начальный момент времени восстанавливается по его конечному распределению. При этом конечная концентрация может отличаться от начальной на несколько порядков. Как это обычно делается при построении и исследовании математических моделей, переходим в уравнении и краевых условиях к безразмерным величинам, рассматривая в качестве искомой 152 УДК 004.032.26(08) Нейронные сети ISBN 978-5-7262-1782-6 НЕЙРОИНФОРМАТИКА-2013. Часть 3 функции и её аргументов отношения соответствующих величин к характерным для задачи константам. Прямая задача. Ищется функция u( x, t ), x [0;1], t [0; T ] , ut uxx ,( x; t ) (0;1) (0; T ) , u( x;0) ( x), x (0;1), u (0; t ) 0, t [0; T ], u(1; t ) 0, t [0; T ]. Обратная задача. Ищется функция u( x, t ), x [0;1], t [0; T ] , удовлетворяющая условиям ut u xx , удовлетворяющая условиям: u( x; T ) f ( x), x (0;1), u (0; t ) 0, t [0;T ], u(1; t ) 0, t [0; T ]. Функция φ( x) u( x,0) в этой постановке задачи неизвестна и подлежит нахождению. Будем искать решение обратной задачи в виде нейросетевого приближения ne u ( x, t ) ci e ai ( x xi ) 2 bi ( x xi )( t ti ) di ( t ti )2 . (6) i 1 Здесь веса (параметры) нейросети вводятся следующим образом wi (ci , ai , bi , di , xi , ti ), i 1,..., ne . Подбор весов осуществлялся через минимизацию функционала ошибки, который в данной задаче имел вид: J1 (w) b J b (w) d J d (w) , где w (w1 ,.., wne ) – вектор весов сети; J1 (w) ut ( j , j ) uxx ( j , j ) – слагаемое, отвечающее дифференN 2 j 1 циальному уравнению; Nb J b (w ) u 2 (0, j ) u 2 (1, j ) – слагаемое, отвечающее граничным j 1 условиям; Nd J d (w ) u ( x j , T ) f ( x j ) 2 – слагаемое, отвечающее значениям j 1 температуры в конечный момент времени; b , d 0 – «штрафные» множители. УДК 004.032.26(08) Нейронные сети 153 ISBN 978-5-7262-1782-6 Здесь в слагаемых перегенерируемые 0, , 1, j j Nb j 1 НЕЙРОИНФОРМАТИКА-2013. Часть 3 J1 (w) и J b (w) используются периодически пробные точки , j j N – j 1 в области , – на частях границы. Устойчивого приближения и без привлечения дополнительной информации о решении в такой постановке получить не удаётся. Приведём результаты двух способов привлечения подобной информации. Первый способ состоит в замене нескольких слагаемых в J d (w ) слагаемыми, соответствующими начальному условию. Вычислительный эксперимент показал, что достаточно использовать одно значение, т.е. предполагается, что мы знаем начальное условие в одной точке. Приведём некоторые результаты вычислений для случая N = 200, Nb = =50, Nd = 50. Нейроны добавляются по одному с отбраковкой. Для обучения сети (минимизации функционала) наиболее эффективным оказалась комбинация метода облака и метода RProp [4,5]. Отбраковывается нейрон, приводящий к увеличению функционала ошибки на тестовом множестве (множестве точек, полученных после упомянутой выше перегенерации). В первом эксперименте число попыток добавить нейрон 10, число нейронов 11 (отбраковки нет). и и–f 1.0 0.8 0.08 0.06 0.6 0.04 0.4 0.02 0.2 0.2 0.2 0.4 0.6 0.8 1.0 x Рис. 1. Восстановление начальных условий 154 0.4 0.6 0.8 1.0 х Рис. 2. Ошибка восстановления начальных условий УДК 004.032.26(08) Нейронные сети u ( x, 0) f ( x ) ISBN 978-5-7262-1782-6 НЕЙРОИНФОРМАТИКА-2013. Часть 3 Рис. 3. Ошибка восстановления решения Во втором эксперименте число попыток добавить нейрон 20, число нейронов 21 (отбраковки нет). Рис. 4. Восстановление начальных условий Рис. 5. Ошибка восстановления начальных условий u ( x, 0) f ( x ) Рис. 6. Ошибка восстановления решения В третьем эксперименте число попыток добавить нейрон 50, число нейронов 48 (отбраковано 3 нейрона). УДК 004.032.26(08) Нейронные сети 155 ISBN 978-5-7262-1782-6 Рис. 7. Восстановление начальных условий НЕЙРОИНФОРМАТИКА-2013. Часть 3 Рис. 8. Ошибка восстановления начальных условий u ( x, 0) f ( x ) Рис. 9. Ошибка восстановления решения Рис. 1-3 показывают, что уже сеть из 11 нейронов даёт приближённое решение задачи с точностью, достаточной для большинства инженерных приложений (обычно в подобных задачах точность модели в виде краевой задачи не выше). Такую сеть можно использовать в качестве аналитического приближённого решения. Если подобная точность недостаточна, её можно легко повысить, что показывают рис. 4-9. В приведенных численных экспериментах и далее использовался эволюционный алгоритм настройки структуры растущей сети на основе добавления нейронов по одному с дальнейшей отбраковкой этого нейрона. Такой алгоритм позволяет добиться почти линейной зависимости времени обучения сети от числа нейронов, что важно для задач, в которых требуется получить высокую точность. Второй способ состоит в использовании вместо известной точки, соответствующей начальному времени, одной или нескольких случайных 156 УДК 004.032.26(08) Нейронные сети ISBN 978-5-7262-1782-6 НЕЙРОИНФОРМАТИКА-2013. Часть 3 точек внутри области. Данная постановка задачи формализует ситуацию, когда проводятся измерения в промежуточные моменты времени. Ниже использовались 5 таких точек, число попыток добавить нейрон 1559, число нейронов 51. Рис. 10. Восстановление начальных условий Рис. 8. Ошибка восстановления начальных условий u ( x, 0) f ( x ) Рис. 12. Ошибка восстановления решения Результаты, опубликованные в работах [4-7] показывают, что предложенный метод построения устойчивых нейросетевых моделей весьма эффективен для задач с неточно заданными параметрами, с обновляемой разнородной информацией об объекте или процессе, для плохо поставленных или некорректных задач. Именно такие задачи встречаются при мониторинге, анализе и прогнозе атмосферных загрязнений, обеспечении экологической безопасности и сбережения здоровья людей. Мы убеждены, что нейросетевые технологии станут основой для построения иерархических информационно-аналитических систем мониторинга и прогнозирования состояния окружающей среды. Список литературы УДК 004.032.26(08) Нейронные сети 157 ISBN 978-5-7262-1782-6 НЕЙРОИНФОРМАТИКА-2013. Часть 3 1. Марчук Г.И. Математическое моделирование в проблеме окружающей среды. М.: Наука, 1982. 2. Дымников В.П. (ред.) Современные проблемы вычислительной математики и математического моделирования. М.: Наука, 2005. 3. Белов П.Н. Антропогенное загрязнение природной среды и оценка его уровня методом математического моделирования// Вестн. Моск. ун-та. Сер. 5, География. 1990. № 5. С.16–24. 4. Тархов Д.А. Нейронные сети: модели и алгоритмы. М.: Радиотехника, 2005. 5. Васильев А.Н., Тархов Д.А. Нейросетевое моделирование. Принципы. Алгоритмы. Приложения. СПб.: Изд-во СПбГПУ, 2009. 6. Васильев А.Н., Тархов Д.А. Нейросетевое решение задачи о пористом катализаторе// Научно-технические ведомости СПбГПУ. Физико-математические науки, 2008. №6 (67). С.110-113. 7. Васильев А.Н., Тархов Д.А. Параметрические нейросетевые модели для уравнения теплопроводности. Классическая и неклассическая задачи. Материалы IX Международной конференции по неравновесным процессам в соплах и струях (NPNJ'2012), 25-31 мая 2012 г., Алушта. М.: Изд-во МАИ-ПРИНТ, 2012. 158 УДК 004.032.26(08) Нейронные сети