Нейросетевые технологии в обработке и защите данных Лекция 3. Принципы параллельной обработки. Организация вычислений в многопроцессорных системах и сетях 1 Нейронные искусственные сети, успешно применяемые для решения задач классификации, прогнозирования и управления, обеспечивают предельное распараллеливание алгоритмов, соответствующих нейросетевой технологии обработки данных. 2 Нейрокомпьютеры как новый класс устройств вычислительной техники являются модельным отображением особенностей, присущих процессам переработки информации в живых организмах, таким как самоорганизация, обучение, адаптация. Возможности нейронных сетей, недоступные для традиционной математики, позволяют создавать системы для решения задач управления, распознавания образов, диагностики заболеваний, автоматического анализа документов и многих других приложений. 3 Методология системного моделирования Система – совокупность объектов, компонентов или элементов произвольной природы, образующих некоторую целостность в том или ином контексте. Важнейшими характеристиками любой системы являются ее структура и процесс ее функционирования. Под структурой системы понимается устойчивая во времени совокупность взаимосвязей между ее элементами или компонентами. Вложенность элементов одной системы в другую определяет подсистему. Важнейшей характеристикой процесса функционирования системы является ее состояние. Модель – представление о системе, отражающее наиболее существенные закономерности ее структуры и процесса функционирования и зафиксированное в некоторой форме. 4 Этапы системного моделирования • Анализ проблемной ситуации; • Структуризация предметной области и построение модели; • Выполнение вычислительных экспериментов с моделью; • Применение результатов вычислительных экспериментов; • Коррекция или доработка модели. 5 Методология нечеткого моделирования Методология нечеткого моделирования не заменяет и не исключает методологию системного моделирования, а конкретизирует последнюю применительно к процессу построения и использования нечетких моделей сложных систем. Нечеткая модель – информационнологическая модель системы, построенная на основе теории нечетких множеств и нечеткой логики. Одним из характерных признаков сложности построения модели является неопределенность в представлении структуры или поведении системы- оригинала. 6 Аспекты модельных представлений Неопределенность могут характеризовать следующие аспекты модельных представлений: Неясность или нечеткость границ системы; Неоднозначность семантики отдельных терминов; Неполнота модельных представлений в связи с решением слабо формализуемых проблем; Противоречивость отдельных компонентов модельных представлений или требований к модели сложной системы; Неопределенность наступления тех или иных событий для прогнозирования состояния системы в будущем. 7 Методы разработки масштабируемых систем Обработка данных осуществляется в реальном масштабе времени, если время обработки соизмеримо со временем протекания процесса. Любое распределенное приложение может быть рассмотрено как система массового обслуживания с бесконечной очередью и случайным потоком заявок. Наиболее важным показателем таких систем является среднее время ожидания заявок. Для множества одноканальных и многоканальных систем массового обслуживания с произвольным потоком заявок и произвольным распределением времени обслуживания оценка производительности таких систем сводится к нахождению максимального времени ожидания заявки в очереди. Способы расчета количественных характеристик производительности распределенных приложений будут изучаться на пятом курсе в специальном курсе «» 8 Модель географически распределенных дата-центров При необходимости анализа выборки данных, отвечающему ряду критериев (временные ограничения, наличие всплесков определенного вида и др.), в распределенной системе генерируется запрос в аналитический центр, направляемый ко всем доступным дата-центрам. По получении запроса каждый дата-центр регистрирует его, анализирует его на предмет безопасности и выполняет его локально. При наличии отвечающих запросу выборок сигнальных данных, исполнительная среда дата-центра производит указанную первичную обработку данных, после чего отсылает результаты запроса в аналитический центр. 9 Модель географически распределенных дата-центров MapReduse является подходящим шаблоном выполнения распределенных запросов. При получении запроса исполнительная среда компилирует запрос с проверкой вредоносного кода, а выполняемая затем первичная обработка включает конвертацию выборки в подходящий для последующего анализа формат данных. Для эффективного выполнения поисковых запросов необходим механизм поддержки приоритетности поисковых фильтров на основе весов, выполнять запросы следует в порядке возрастания их «тяжести» . 10 Причина повышенного внимания к ИНС кроется в: • Потенциальных возможностях выполнения интеллектуальных операций и существенного увеличения критерия производительность/стоимость в сравнении с традиционными компьютерами, суперЭВМ и параллельными вычислительными системами. • Массовый параллелизм вычислений имеет принципиальное значение для нейрокомпьютеров и является их свойством. Для нейрокомпьютерных технологий обработки изображений также характерна их предварительная обработка. 11 • С помощью нейрокомпьютеров решаются не формализуемые или плохо формализуемые задачи. В их алгоритмы решения включается процесс обучения на реальном экспериментальном материале. • Теория искусственных нейронных сетей – логическая основа нейрокомпьютеров. Искусственная нейронная сеть – сеть с конечным числом слоев из однотипных элементов. 12 Нечеткие нейронные сети или гибридные сети призваны объединить в себе достоинства нейронных сетей и систем нечеткого вывода. С одной стороны, они позволяют разрабатывать и представлять модели систем в форме правил нечетких продукций, которые обладают наглядностью и простотой содержательной интерпретации, c другой стороны, для построения правил нечетких продукций используются возможности нейронных сетей. 13 Нечеткие нейронные сети ANFIS – адаптивная система нечеткого вывода (Adaptive-Network-Based Fuzzy Inference System), предложенная Янгом (Jang) в начале девяностых годов, реализована в пакете расширения Fuzzy Logic Toolbox (пакете нечеткой логики) системы MATLAB . ANFIS является одним из первых вариантов гибридных нейро-нечетких моделей. Архитектура нейро-нечеткой сети изоморфна нечеткой базе знаний. В нейро-нечетких сетях используются дифференцируемые реализации треугольных норм, а также гладкие функции принадлежности. 14 МАТЕМАТИЧЕСКИЕ ОСНОВЫ НЕЧЕТКИХ СИСТЕМ Нечеткая логика предназначена для формализации неточных или приближенных рассуждений, позволяющих более адекватно описывать ситуации с неопределенностью. Понятие нечетких множеств (англ.: fuzzy sets) как обобщение обычных (четких) множеств было введено американским ученым Л. Заде в 1965 г. Традиционный метод представления элемента множества А состоит в применении характеристической функции A (x,) , которая равна 1, если этот элемент принадлежит к множеству А, или равна 0 в противном случае. 15