5. Тишин И.В.&quot

реклама
КОНЦЕПЦИЯ АДАПТИВНОГО ПОВЕДЕНИЯ ПРОСТЕЙШЕГО
ИСКУССТВЕННОГО БИОЦЕНОЗА
Автор: Тишин Игорь Владимирович, студент гр. 610701 ФКП БГУИР
inish@rambler.ru
Руководитель: Кривоносова Т.М., ст.преп.каф.ВМиП БГУИР
tanjamk@mail.ru
С давних времен человек хотел создать искусственную жизнь,
достаточно вспомнить средневековых гомункулусов – «людей из пробирки» и
големов – тоже людей, но глиняных/железных, которые управлялись с
помощью магии либо просто механически. Таким образом, еще в давние
времена к проблеме создания искусственной жизни было два подхода:
1) чисто биологический (и условно-искусственный), где мы или берем
исходный материал (клетку, можно со слегка подкорректированным геномом) у природы, или пытаемся создать эту клетку сами (что пока совсем не
получается) и ждем, когда эта клетка разовьется в необходимое нам живое
существо;
2) сами с нуля из «небиологических» материалов стараемся создать
нечто подобное тому, что видим бегающим и прыгающим вокруг себя.
Материалы могут быть самыми различными: начиная от той самой глины и
кончая попытками создать жизнь (или хотя бы теоретически обосновать
возможность создания) на основе кремния.
С первым подходом на взгляд непосвященного все более-менее ясно, и
«ребенок из пробирки» почти перестал считаться чудом, со вторым же не все
ясно, причем, чем дальше шагает прогресс, тем больше неясностей становится. Древним (и не очень) мастерам было более-менее понятно, чего от них
ждут – вот они и делали разных механических уток, умеющих плавать, да
пианистов в натуральную величину, способных играть не хуже живых. А вот
современным ученым, не подходит простое копирование внешности того,
что они видят – они хотят, чтобы творения научной мысли еще и уподобились прототипу в поведении. Поскольку никто достоверно не знает, из чего
это поведение состоит и как возникает, то сделать ничего не могут.
И вот начали появляться программы, в которых целью ставилось
максимально возможно приблизить поведение неких виртуальных существ
или групп различных существ к поведению реальных живых организмов.
Хочется упомянуть клеточный автомат «Жизнь» Дж.Конвэя, которому до сих
пор посвящено огромное количество статей в периодике и в сети Internet.
Отдельно стоит рассказать о разработанном в 70-х в СССР проекте
«Животное» М.М. Бонгарда, где существо было оснащено манипуляторами и
с их помощью могло выполнять ряд действий с объектами в виртуальном
пространстве.
2
Позже, в начале 90-х появилось направление исследований
«Адаптивное поведение». Организаторами первой международной
конференции по «Адаптивному поведению» (1990 г., Париж) были ЖанАркадий Мейер и Стюарт Вильсон. Основная цель этого направления
исследований – конструирование и исследование искусственных (в виде
компьютерной
программы
или
робота)
«существ»,
способных
приспосабливаться к внешней среде.
Эти организмы называются «аниматами» (от англ. animal (животное)
и robot: animal + robot = animat). Направление очень сильно отличается от
бионики, так как бионика пытается скопировать механизмы, уже
изобретенные природой, а адаптивное поведение подразумевает воплощение
в аниматах фундаментальных принципов поведения живых существ – то,
что отличает поведение живых организмов от поведения машин.
На рис. 1 представлена схема простейшего организма, состоящая из
набора сенсоров (в данном случае – восьми), сходящихся к виртуальному
мозгу, органа движения (внизу) и органа потребления энергии (вверху).
Р и с. 1. С хем а п р о стей ш его о р ган и зм а
Предлагаем вашему вниманию попытку реализации концепции адаптивного поведения – искусственный биоценоз, который живет и развивается по
разработанным нами правилам.
Место жизнедеятельности аниматов в данной реализации – это поле
n*n клеток. Поле свернуто в тор, таким образом, оно является и
безграничным и замкнутым одновременно – анимат, зашедший за одну из
границ тут же появится с противоположной стороны. Так мы не
ограничиваем свободу движения анимата и не допускаем движения за
границу поля видимости. Поле покрыто слоем «почвы» разной толщины. На
почве растут растения, травоядные поедают растения, хищники, в свою
очередь, поедают травоядных. Каждое живое существо стремится
накапливать энергию. Растения получают энергию из почвы и от солнца,
3
травоядные – из растений, а хищники – от травоядных. Если анимат умер
естественной смертью, то запасенная им энергия возвращается в почву, так
обеспечивается круговорот энергии.
Рассмотрим основные характеристики каждого из видов аниматов.
 Растения, в принципе, не являются аниматами, так как «умеют»
только поглощать энергию из окружающей среды путем фотосинтеза и из
почвы, и по достижении определенного энергетического уровня делятся.
Срок их жизни ограничен.
 Травоядные – могут передвигаться по полю, есть растения и
размножаться. Обладают некоторой разумностью, так как могут отвечать на
внешние раздражители. Имеют 16 сенсоров, от которых получают
информацию о состоянии внешней среды и состоянии организма. Могут
принимать сигналы только от непосредственно примыкающих клеток. На
основании всех этих сведений травоядные принимают решение о движении в
ту или иную сторону. Передвигаться могут на одну клетку по горизонтали
или одну клетку по вертикали. После поедания растения поглощают
накопленную растением энергию. По достижении определенного уровня
энергии размножаются. Если травоядное долгое время не находил пищи, то
энергия убывает и по достижении нуля наступает смерть.
 Хищники – очень похожи на травоядных, однако едят мясо и зона
восприятия расширена. Таким образом, этот тип аниматов сможет заметить
пищу до того, как пища сумеет заметить его, и выработать боле правильную
со своей точки зрения линию поведения.
Анимат может принимать решения на основе приобретенного опыта
и «показаний» сенсоров. Показания с сенсоров идут на входы нейронной
сети. Сама сеть представляет собой однослойный персептрон с числом
входов равным числу сенсоров и числом выходов равным числу действий,
которые может выполнить анимат. В данном случае 16 входов и 4 выхода
(рис. 2).
На основе входных данных сеть выдает действие, которое должно
принести наибольшую энергетическую выгоду анимату. Действие
выполняется, и если в результате этого энергия существа снизилась, то
действие признается ошибочным и веса сети корректируются
соответствующим образом. Вот так, методом многочисленных проб и
ошибок, анимат будет обучаться правильному поведению. А если не сможет
обучиться, то будет съеден тем, кто смог обучиться первым, или просто сам
собой умрет с голоду и не даст потомство. А тот, кто смог обучиться сможет
дать потомство, и такая линия поведения закрепится. Самих действий,
которые может предпринимать организм немного – передвижение влево,
вправо, верх и вниз, поглощение пищи и размножение. Если имеется доступ
к пище, то пища поглощается только, если организм «голоден».
4
Σ
Σ
f
Σ
f
f
Σ
f
Рис. 2. Схема нейронной сети
Важным моментом является процесс размножения организма –
размножение бесполое – почкованием. Когда организм накапливает
достаточно энергии, и вокруг нет опасности, то отпочковывается детеныш с
начальным энергетическим запасом и унаследованным от родителя геномом.
Под геномом анимата понимаем совокупность весов нейронной сети – ведь
только от значений весов и зависит все поведение анимата. Однако при
почковании в геноме случайным образом могут с небольшой долей
вероятности изменяться значения весов. В результате этих «мутаций»
детеныш может оказаться не во всем похож на родителя, а то и быть
полностью отличным по поведению. Случайные изменения в геноме, в
принципе, помогают в развитии популяции в целом – иногда нейронная сеть
отдельного организма может уйти в так называемый локальный минимум,
когда на совокупность входных данных будет выдаваться действие, не самое
выгодное в данной ситуации.
Например, когда в окружающих травоядное (Т) клетках есть и хищник
(Х), и растение (Р) (рис. 3а), тогда самым выгодным будет переместиться в
клетку с кустиком (рис. 3б). Однако от перемещения в пустую клетку мы
тоже ничего не потеряем (рис. 3в).
Если сеть приняла решение в пользу пустой клетки, то такое решение
не будет признано ошибочным, и в следующий раз сеть поступит так же.
Однако, если в результате мутации вес связи изменится, то вполне возможно,
что в дальнейшем анимат будет выбирать клетку с растением вместо пустой.
Однако, будут случаи, когда изменение весов приведет к фатальным
изменениям в поведении – например, травоядное вместо бегства будет
выбирать приближение к хищнику – такие аниматы будут погибать и не
оставят потомства.
5
Таким образом, через ряд поколений анимат придет к наиболее
выгодной линии поведения – в данном случае реализован генетический
алгоритм в его, так сказать, натуральном виде.
а)
б)
в)
Рис. 3. Простейшая схема поведения
Действительно, в ходе прогонов на компьютере аниматы «учились»
есть и «убегать» от хищников.
Через несколько поколений поведение довольно усложнилось: «звери»
научились обходить препятствия и даже выбираться из очень простеньких
лабиринтов. Однако дальше обучение не идет – выбранный способ
взаимодействия с окружающим миром оказался не очень хорошим,
поскольку являлся «реактивным», то есть реакция присутствует только тогда,
когда присутствует раздражитель, а когда раздражитель исчезает, то и
реакция прекращается. Другим способом взаимодействия со средой может
оказаться способ, когда анимат заранее предсказывает с помощью нейронной
сети то, что должно произойти в следующий момент времени и в
соответствии с этим строит свое поведение. Так же можно пойти по такому
пути, когда раздражитель вызывает к действию какую-либо ответную
реакцию, которая продолжается некоторое время после исчезновения
раздражителя.
В процессе дальнейшей разработки в программе будет реализован один
из этих способов взаимодействия. И тогда, возможно, поведение аниматов
станет более осмысленным.
Список использованных источников
1. Радиотехника – 2003, № 3.
2. Радиотехника и электроника – 2004 – Т. 49, № 12 – С. 1452 – 1462.
3. Нейрокомпьютеры: разработка и применение – 2005, №№ 4, 6, 8, 9.
4. Нейрокомпьютеры: разработка и применение – 2006, №№ 4, 5.
Скачать