Uploaded by kurkova_0106

kyber lec1

advertisement
Киберфизические
системы
Киберфизическая система (англ. cyber-physical system, или
CPS)
—
информационно-технологическая
концепция,
подразумевающая интеграцию вычислительных ресурсов в
физические сущности любого вида, включая биологические и
рукотворные объекты.
Концептуальная
включающая
схема
основные
взаимодействий
киберфизической
составные
части
и
системы,
виды
их
Киберфизические платформы как результат слияния интернета вещей, людей и сервисов
Ключевые технологии
Интернет вещей
Термин «интернет вещей» (Internet of Things, IoT) впервые был
использован в 1999 году, когда сотрудник Procter & Gamble Кевин
Эштон предложил использовать для оптимизации логистики
корпорации радиочастотные метки (radio–frequency identifi
cation, RFID).
Промышленный интернет вещей (Industrial Internet of Things,
IIoT)
-
система
объединенных
компьютерных
сетей
и
подключенных промышленных (производственных) объектов со
встроенными датчиками и ПО для сбора и обмена данными, с
возможностью
удаленного
контроля
и
управления
в
автоматизированном режиме без участия человека.
Подробнее про IoT, аналитические отчеты на https://www.pwc.ru/
Схема взаимодействия персонала
и киберфизических систем на
предприятиях Индустрии 4.0
типа «умная фабрика»
Российская система IIoT "Диспетчер" (https://www.intechnology.ru/)
Российская система IIoT "Foreman" (http://monitoringcnc.ru/)
Аппаратный блок на станке
Система IIoT от DMG MORI (CELOS) (https://ru.dmgmori.com/)
Подробнее о системе в официальном видео https://www.youtube.com/watch?v=5vEplmef4RM
Умный город (Smart cities)
Умный город - это градостроительная концепция интеграции множества информационных и коммуникационных
технологий (ИКТ), в том числе систем Интернета вещей (IoT) для управления городской инфраструктурой:
транспортом, образованием, здравоохранением, системами ЖКХ, безопасности и т.д.
Британский институт стандартов (British Standard Institution, BSI) описывает умный город, как «эффективную
интеграцию физических, цифровых и человеческих систем в искусственно созданной среде с целью обеспечить
устойчивое, благополучное и всестороннее будущее для граждан».
ИКТ позволяют городской власти напрямую взаимодействовать с сообществами и городской инфраструктурой, и
следить за тем, что происходит в городе, как город развивается, и какие способы позволяют улучшить качество
жизни. За счет использования датчиков, интегрированных в режиме реального времени, накопленные данные
от городских жителей и устройств обрабатываются и анализируются.
Концепция развития "Москва 2030 умный год" https://2030.mos.ru/
Облачные технологии и большие данные (Big Data)
Облачные
технологии
(или
облачные
вычисления, cloud computing) – технологии
распределенной обработки цифровых данных,
с помощью которых компьютерные ресурсы
предоставляются интернет-пользователю как
онлайн-сервис.
Облака бывают трех типов: публичные (Public
Cloud), частные (Private Cloud) и гибридные
(Hybrid Cloud).
Виды облачных сервисов
Облачные сервисы распределяются бывают трех типов:
•
«Инфраструктура как услуга» — IaaS (Infrastructure as a Service). К инфраструктуре относят вычислительные ресурсы:
виртуальные серверы, хранилища, сети и т.п. Примеры: Microsoft Azure, Amazon Web Services, Google Cloud Infrastructure, IBM
Cloud, Oracle Cloud Infrastructure и др.
•
«Платформа как услуга» — PaaS (Platform as a Service). Ключевое отличие PaaS от IaaS в том, что здесь у вас есть
определенные инструменты, например: система управления базами данных, среда машинного обучения или обработки big
data, промышленный IoT. Примеры: SAP Cloud, Microsoft Azure, Heroku, AWS Lambda (Amazon), Google App Engine и др.
•
«Программное обеспечение как услуга» — SaaS (Software as a Service). Примеры: электронная почта, онлайн-чаты, форумы,
социальные сети и др.
Выделяют также:
•
Disk as a Service (DaaS) - Диск (облачного хранилища) как услуга (пример, Яндекс Диск)
•
Security as a Service (SECaaS) - Кибербезопасность как услуга (пример, Solar MSS - Ростелеком)
•
Business Process as a Service (BPaaS) - Бизнес-процесс как услуга (пример, онлайн бухгалтерия)
•
Video Conferencing as a Service (VCaaS) - Видеоконференцсвязь как услуга (пример, MS Teams, он одновременно и как SaaS)
И так далее подробнее про другие виды сервисов: https://market.cnews.ru/news/top/2019-10-30_oblachnye_servisy_istoriya
Искусственный интеллект
Искусственный интеллект (ИИ; англ. artificial intelligence, AI) — свойство интеллектуальных систем выполнять
творческие функции, которые традиционно считаются прерогативой человека.
Машинное обучение (англ. machine learning, ML) — класс методов искусственного интеллекта, характерной
чертой которых является не прямое решение задачи, а обучение в процессе применения решений множества
сходных задач. Для построения таких методов используются средства математической статистики, численных
методов, математического анализа, методов оптимизации, теории вероятностей, теории графов, различные
техники работы с данными в цифровой форме.
Наука о данных (англ. data science) — раздел информатики, изучающий проблемы анализа, обработки и
представления данных в цифровой форме. Объединяет методы по обработке данных в условиях больших
объёмов и высокого уровня параллелизма, статистические методы, методы интеллектуального анализа данных
и приложения искусственного интеллекта для работы с данными, а также методы проектирования и разработки
баз данных.
Цикл Гартнера для новых технологий, 2020 году, выделяет следующие тренды:
•
Цифровой я ("Digital me").
•
Модульные платформы ("Composable enterprise").
Платформы для удаленной работы.
•
Алгоритмическое доверие - проверка достоверности
данных (информации) специальным алгоритмам.
•
Формирующий
ИИ
("Formative
AI").
Динамически
адаптироваться с течением времени или автоматическое
создание новых моделей для решения конкретных
проблем.
•
Не только кремний ("Beyond silicon"). Новые процессы и
материалы в полупроводниковой индустрии.
Подробнее:
https://www.gartner.com/smarterwithgartner/5-
trends-drive-the-gartner-hype-cycle-for-emerging-technologies2020/
Основные методы
машинного
обучения
Оригинальная статья на английском:
https://vas3k.com/blog/machine_learning/
Перевод на русский: https://vas3k.ru/blog/machine_learning/
Классические алгоритмы машинного обучения
Обучение с учителем (Supervised learning)
Обучение с учителем (Supervised learning) — один из разделов машинного обучения, посвященный решению следующей задачи:
Имеется множество объектов (ситуаций) и множество возможных ответов (откликов, реакций). Существует некоторая зависимость
между ответами и объектами, но она неизвестна. Известна только конечная совокупность прецедентов — пар «объект, ответ»,
называемая обучающей выборкой. На основе этих данных требуется восстановить зависимость, то есть построить алгоритм,
способный для любого объекта выдать достаточно точный ответ. Для измерения точности ответов определённым образом
вводится функционал качества.
Под учителем понимается либо сама обучающая выборка, либо тот, кто указал на заданных объектах правильные ответы.
Классификация
Разделяет объекты по заранее известному признаку. Носки по цветам, документы по языкам, музыку по жанрам.
Сегодня используют для:
• Спам-фильтры
• Определение языка
• Поиск похожих документов
• Анализ тональности
• Распознавание рукописных букв и цифр
• Определение подозрительных транзакций
Наиболее часто используемые алгоритмы: Наивный Байес, Деревья Решений, Логистическая Регрессия,
метод K-ближайших соседей, Машины Опорных Векторов
Регрессия
Регрессия (англ. Regression) — метод моделирования зависимости между зависимой переменной y и одной или несколькими
независимыми переменными x1,x2,…,xn. В случае нескольких независимых переменных регрессия называется множественной (англ.
multivariate regression). Цель регрессионного анализа состоит в том, чтобы оценить значение непрерывной выходной переменной
по значениям входных переменных.
Сегодня используют для:
• Прогноз стоимости ценных бумаг
• Анализ спроса, объема продаж
• Медицинские диагнозы
• Любые зависимости числа от времени
Популярные алгоритмы: Линейная или Полиномиальная Регрессия
Обучение без учителя (Unsupervised learning)
Обучение без учителя (Unsupervised learning) — один из разделов машинного обучения, который изучает широкий
класс задач обработки данных, в которых известны только описания множества объектов (обучающей
выборки), и требуется обнаружить внутренние взаимосвязи, зависимости, закономерности, существующие
между объектами.
Кластеризация
Кластеризация (англ. cluster analysis) — задача группировки множества объектов на подмножества (кластеры) таким образом, чтобы
объекты из одного кластера были более похожи друг на друга, чем на объекты из других кластеров по какому-либо критерию.
Сегодня используют для:
• Сегментация
рынка
(типов
покупателей,
лояльности)
• Объединение близких точек на карте
• Сжатие изображений
• Анализ и разметки новых данных
• Детекторы аномального поведения
Популярные алгоритмы: Метод K-средних, Mean-Shift, DBSCAN
Уменьшение Размерности (Обобщение)
Снижение размерности — это преобразование данных, состоящее в уменьшении числа переменных путём
получения главных переменных. Преобразование может быть разделено на отбор признаков и выделение
признаков.
Сегодня используют для:
• Рекомендательные Системы
• Красивые визуализации
• Определение тематики и поиска похожих документов
• Анализ фейковых изображений
• Риск-менеджмент
Популярные алгоритмы: Метод главных компонент (PCA), Сингулярное разложение (SVD), Латентное
размещение Дирихле (LDA), Латентно-семантический анализ (LSA, pLSA, GLSA), t-SNE (для визуализации)
Поиск правил (ассоциация)
Обучение ассоциативным правилам или поиск ассоциативных правил — это метод обучения машин на базе
правил обнаружения интересующих нас связей между переменными в большой базе данных.
Сегодня используют для:
• Прогноз акций и распродаж
• Анализ товаров, покупаемых вместе
• Расстановка товаров на полках
• Анализ паттернов поведения на веб-сайтах
Популярные алгоритмы: Apriori, Euclat, FP-growth
Обучение с подкреплением
Обучение с подкреплением (англ. reinforcement learning) — один из способов машинного обучения, в ходе которого испытуемая
система (агент) обучается, взаимодействуя с некоторой средой. Откликом среды на принятые решения являются сигналы
подкрепления, поэтому такое обучение является частным случаем обучения с учителем, но учителем является среда или её
модель. Некоторые правила подкрепления базируются на неявных учителях, например, в случае искусственной нейронной среды,
на одновременной активности формальных нейронов, из-за чего их можно отнести к обучению без учителя.
Сегодня используют для:
•
Самоуправляемых автомобилей
•
Роботов пылесосов
•
Игр
•
Автоматической торговли
•
Управления ресурсами предприятий
Популярные алгоритмы: Q-Learning, SARSA, DQN, A3C, Генетический Алгоритм
Ансамбли
Ансамбли – сочетание сразу нескольких алгоритмов, которые учатся одновременно и исправляют ошибки друг
друга. На сегодняшний день именно они дают самые точные результаты.
Сегодня используют для:
• Все
примеры,
где
подходят
классические алгоритмы (но работают
точнее)
• Поисковые системы
• Компьютерное зрение
• Распознавание объектов
Популярные алгоритмы: Random Forest, Gradient Boosting (CatBoost, LightGBM, XGBoost)
Нейросети и глубокое обучение
Нейронная сеть (также искусственная нейронная сеть, ИНС) — математическая модель, а также её программное
или аппаратное воплощение, построенная по принципу организации и функционирования биологических
нейронных сетей — сетей нервных клеток живого организма.
Сегодня используют для:
• Вместо
всех
вышеперечисленных
алгоритмов вообще
• Определение объектов на фото и видео
• Распознавание и синтез речи
• Обработка изображений, перенос стиля
• Машинный перевод
Популярные архитектуры: Перцептрон, Свёрточные Сети (CNN), Рекуррентные Сети (RNN), Автоэнкодеры
Умная энергетика
Структура традиционной электрической сети,
построенной по иерархическому принципу
Структура Smart Grid с беспроводной
информационной сетью управления
Ключевые требования к новой электроэнергетике (ценности)
1. Доступность – обеспечение потребителей электроэнергией в зависимости от того, когда и где она им
необходима, и в зависимости от оплачиваемого качества.
2. Надежность – возможность противостояния физическим и информационным негативным воздействиям
без тотальных отключений или высоких затрат на восстановительные работы, максимально быстрое
восстановление (самовосстановление).
3. Экономичность – оптимизация тарифов на электрическую энергию для потребителей и снижение
общесистемных затрат
4. Эффективность – максимизация эффективности использования всех видов ресурсов и технологий при
производстве, передаче распределении и потреблении электроэнергии
5. Органичность с окружающей средой - снижение негативных воздействий на окружающую среду
6. Безопасность – не допущение ситуаций в электроэнергетике, опасных для людей и окружающей среды.
Подробнее https://csr-nw.ru/files/csr/file_category_632.pdf
Источники
• Как
искусственный
интеллект
может
https://habr.com/ru/company/itmai/blog/494498/
улучшить
киберфизические
системы?
Download