Министерство науки и высшего образования Российской Федерации Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования Санкт-Петербургский горный университет КУРСОВАЯ РАБОТА По дисциплине Интеллектуальные технологии и представления знаний_______________ (наименование учебной дисциплины согласно учебному плану) ПОЯСНИТЕЛЬНАЯ ЗАПИСКА Тема работы: Интеллектуальные технологии и представления знаний в задачах управления и анализа Автор: студент гр. ОЦЕНКА: САМ-17 _________________ (подпись) / Островская И.С. (Ф.И.О.) _____________ Дата: ___________________ ПРОВЕРИЛ: Руководитель работы доцент (должность) ________________ (подпись) Санкт-Петербург 2019 / Афанасьева О.В. / (Ф.И.О.) _ _ / Министерство науки и высшего образования Российской Федерации Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования Санкт-Петербургский горный университет УТВЕРЖДАЮ Заведующий кафедрой системного анализа и управления ______ /доц. Ильюшин Ю.В./ Кафедра системного анализа и управления КУРСОВАЯ РАБОТА По дисциплине Интеллектуальные технологии и представления знаний_____________ (наименование учебной дисциплины согласно учебному плану) ЗАДАНИЕ Студенту группы САМ-17 Островской И. С. (шифр группы) (подпись) _ (Ф.И.О.) 1. Тема работы Интеллектуальные технологии и представления знаний в задачах анализа и управления _ 2. Исходные данные к работе: вариант № 10. Создание базы знаний для фонотеки 3. Содержание пояснительной записки теоретическая часть, алгоритм создания базы знаний, выводы _____________________________________ 4. Перечень графического материала рисунки и таблицы _ 5. Срок сдачи законченной работы . Руководитель работы доцент ________________ (должность) Дата выдачи задания: _____________________ (подпись) /Афанасьева О.В./ (Ф.И.О.) Аннотация Целью данной работы является систематизация и углубление теоретических знаний, полученных за время обучения, приобретение и закрепление навыков самостоятельной работы. В ходе работы были практически применены методы проектирования информационных систем, выработаны навыки работы с БД, СУБД и БЗ. Работа содержит 30 страниц, 50 рисунков. Summary The purpose of this work is to systematize and deepen the theoretical knowledge gained during training, the acquisition and consolidation of the skills of independent work. In the course of the work, the methods of designing information systems were practically applied; skills of working with databases and DBMS were developed. Work contains 30 pages, 50 pictures Оглавление Введение ................................................................................................................... 4 1.Экспертные системы……………………………………………………………5 1.1. Понятие экспертной системы………………………………………………..5 1.2. Этапы проектирования экспертной системы………………………………7 1.3. Классификация экспертных систем…………………………………………8 1.4. Структура экспертной системы... ................................................................... 8 2.Процесс создания базы данных ................................................................. .......10 2.1. Описание состава и алгоритма работы базы данных ................................. 10 2.2.Даталогическая модель. .................................................................................. 12 2.3. Таблицы .......................................................................................................... 13 2.4. Алгоритм создания базы знаний...………………………...……………….20 2.5. Осуществление проверки качества данных……………...………………..25 Заключение..……………………………………………………….. .................... 29 Библиографический список……………………………………………………..30 3 Введение База знаний позволяет повысить эффективность работы с базой данных, а также упростить процесс извлечения необходимой информации для обычных пользователей. Целью данной работы является создание базы знаний с помощью среды Microsoft SQL Server Management Studio и приложения SQL Server 2019 Data Quality Services, которая будет предназначена для учета музыкальных аудиозаписей. 4 Экспертные системы Целью разработки (проектирования) базы данных является определение логической структуры. Разработка базы данных производится на основе описания предметной области. Это описание должно содержать совокупность документов с данными, необходимыми для загрузки в БД и другие сведения об объектах и процессах, характеризующих предметную область. Разработка базы данных должна начинаться с определения состава данных, подлежащих хранению в базе для обеспечения запросов пользователей. Далее должен производиться их анализ и структурирование. Существующие методы реляционных баз данных основаны на нормализации данных предметной области, которые представлены в документах внемашинной сферы. Этот процесс может быть выполнен на основе технологии разработки информационно-логической модели данных предметной области. Разработка информационно-логической модели данных предметной области базируется на описании предметной области, полученной в результате ее обследования. В процессе формализации необходимо определить состав логически взаимосвязанных нормализованных информационных объектов. Информационно-логическая модель данных предметной области позволит приступить к созданию БД средствами СУБД. На основе информационно-логической модели данных, которая отвечает требованиям нормализации данных, легко получить логическую структуру реляционной БД. Такая база будет отвечать требованиям, в том числе требованиям целостности и обеспечения однократного ввода данных. Понятие экспертной системы Экспертная система (ЭС) – компьютерная система, использующая знания эксперта для высокоэффективного решения задач в проблемной 5 области, для которой традиционные формальные методы решения неизвестны или неприменимы вследствие имеющихся ограничений. В настоящее время ЭС широко используется в самых различных областях. Отличительной чертой данного класса систем является использование для решения задач знаний опытного эксперта[1]. Кассы задач, в которых используются ЭС: интерпретация – составление смыслового описания ситуации по наблюдаемым данным – распознавание образов, понимание речи и т. п. (SPE - определение концентрации гамма-глобулина в крови); медицинская и техническая диагностика – определение причин неисправностей по результатам наблюдений (MYCIN - диагностика бактериальных инфекций); прогнозирование – определение вероятных последствий наблюдаемых ситуаций – предсказание погоды, урожая, курса валют и т.п. (PLANT/cd - определения потерь урожая от черной совки); планирование – определение последовательности действий, приводящих к желаемой цели – планирование действий робота, маршрута движения (TATR - планирование авиаударов по аэродромам противника); управление – целенаправленное воздействие на объект (применяется в задачах, где традиционные модели автоматического управления неприменимы или неэффективны: управление деловой активностью, боем, воздушным движением и т.п.); мониторинг – сравнение результатов наблюдений с ожидаемыми или желаемыми (медицинский и экологический мониторинг, атомные электростанции); обучение – диагностика, формирование и коррекция знания и навыков обучаемого GUIDON - обучение студентов-медиков (антибактериальная терапия);. 6 отладка - составление рецептов исправления неправильного функционирования системы. ONCOCIN - планирование химиотерапевтического лечения; ремонт - выполнение последовательности предписанных исправлений. TQMSTUNE - настройка масс-спектрометра. проектирование - построение конфигурации объектов при заданных ограничениях. XCON (R1) - выбор оптимальной конфигурации аппаратных средств (VAX). Этапы разработки экспертной системы Этап идентификации проблем — определяются задачи, которые подлежат решению, выявляются цели разработки, определяются эксперты и типы пользователей. Этап извлечения знаний — проводится содержательный анализ проблемной области, выявляются используемые понятия и их взаимосвязи, определяются методы решения задач. Этап структурирования знаний — выбираются ИС и определяются способы представления всех видов знаний, формализуются основные понятия, определяются способы интерпретации знаний, моделируется работа системы, оценивается адекватность целям системы зафиксированных понятий, методов решений, средств представления и манипулирования знаниями. Этап формализации — осуществляется наполнение экспертом базы знаний. В связи с тем, что основой ЭС являются знания, данный этап является наиболее важным и наиболее трудоёмким этапом разработки ЭС. Процесс приобретения знаний разделяют на извлечение знаний из эксперта, организацию знаний, обеспечивающую эффективную работу системы, и представление знаний в виде, понятном ЭС. Процесс приобретения знаний осуществляется инженером по знаниям на основе анализа деятельности эксперта по решению реальных задач. 7 Реализация ЭС — создаётся один или несколько прототипов ЭС, решающие требуемые задачи. Этап тестирования — производится оценка выбранного способа представления знаний в ЭС в целом[2]. Классификация экспертных систем 1. По связи с реальным временем Статические — решающие задачи в условиях не изменяющихся во времени исходных данных и знаний. Квазидинамические — интерпретируют ситуацию, которая меняется с некоторым фиксированным интервалом времени. Динамические — решающие задачи в условиях изменяющихся во времени исходных данных и знаний. 2. По решаемой задаче Интерпретация данных Диагностирование Мониторирование Проектирование Прогнозирование Сводное планирование Оптимизация Обучение Управление Ремонт Отладка Структура экспертной системы Разработка экспертных систем имеет ряд существенных отличий от разработки обычного программного продукта. Опыт создания экспертных систем показал, что использование при их разработке методологии, принятой 8 в традиционном программировании, либо сильно увеличивает количество времени, затраченного на создание экспертных систем, либо вовсе приводит к отрицательному результату[3]. Экспертные системы в общем случае подразделяются на статические и динамические. Стандартная статическая экспертная система состоит из следующих основных компонентов: 1) рабочей памяти, называемой также базой данных; 2) базы знаний; 3) решателя, называемого также интерпретатором; 4) компонентов приобретения знаний; 5) объяснительного компонента; 6) диалогового компонента. Рабочая память предназначена для получения и хранения исходных и промежуточных данных решаемой в текущий момент задачи. База знаний предназначена для хранения долгосрочных данных, описывающих конкретную предметную область, и правил, описывающих рациональное преобразование данных этой области решаемой задачи[4]. Решатель, называемый также интерпретатором, функционирует следующим образом: используя исходные данные из рабочей памяти и долгосрочные данные из базы знаний, он формирует правила, применение которых к исходным данным приводит к решению задачи. Компонент приобретения знаний автоматизирует процесс заполнения экспертной системы знаниями эксперта, т. е. именно этот компонент обеспечивает базу знаний всей необходимой информацией из данной конкретной предметной области[1]. Компонент объяснений разъясняет, как система получила решение данной задачи, или почему она это решение не получила и какие знания она при этом использовала. Данный компонент является очень важным во всей экспертной системе, поскольку он значительно облегчает тестирование 9 системы экспертом, а также повышает доверие пользователя к полученному результату и, следовательно, ускоряет процесс разработок. Диалоговый компонент служит для обеспечения дружественного интерфейса пользователя как в ходе решения задачи, так и в процессе приобретения знаний и объявления результатов работы[5]. Рисунок 1. Структура экспертной системы Статические экспертные системы чаще всего используются в технических приложениях, где можно не учитывать изменения окружающего среды, происходящие во время решения задачи. Процесс создания базы данных Описание состава и алгоритма работы базы данных База данных включает в себя: Таблицы (Треки, Альбомы, Исполнители, Пользователи, Плейлисты, Плейлист-трек, Исполнитель-пользователь, Пользователь-концерт, Жанры.) Запросы Хранимые процедуры 10 Концерты, Города, Определение информационных объектов Таблица 1 Информационные объекты Информационные Реквизиты Примечание объект информационного объекта Трек Номер трека Числовой, ключ Номер альбома Числовой Название трека Текстовый Длительность трека Числовой Текст песни Текстовый Номер альбома Числовой, ключ Номер артиста Числовой Номер жанра Числовой Дата выпуска Дата Название Текстовый Описание Текстовый Номер исполнителя Числовой, ключ Имя Текстовый Биография Текстовый Номер пользователя Числовой,ключ Имя пользователя Текстовый Номер плейлиста Числовой,Ключ Название трека Текстовый Номер пользователя Числовой Дата создания Дата Номер трека Числовой Номер плейлиста Числовой Исполнитель- Номер исполнителя Числовой пользователь Номер пользователя Числовой Концерты Номер концерта Числовой, ключ Номер артиста Числовой Город Текстовый Дата Дата Альбомы Исполнители Пользователи Плейлисты Плейлист-трек 11 Город Пользователь-концерт Жанры Номер города Числовой Название города Текстовый Страна Текстовый Номер концерта Числовой Номер пользователя Числовой Номер жанра Числовой Название жанра Текстовый Даталогическая модель Рисунок 2. Схема связи данных Таблицы Таблица «Треки» Рисунок 3. Структура таблицы «Треки» 12 Рисунок 4. Данные таблицы «Треки» Таблица «Альбомы» Рисунок 5. Структура таблицы «Альбомы» Рисунок 6. Данные таблицы «Альбомы» 13 Таблица «Исполнители» Рисунок 7. Структура таблицы «Исполнители» Рисунок 8. Данные таблицы «Исполнители» Таблица «Пользователи» Рисунок 9. Структура таблицы «Пользователи» Рисунок 10. Данные таблицы «Пользователи» 14 Таблица «Плейлисты» Рисунок 11. Структура таблицы «Плейлисты» Рисунок 12. Данные таблицы «Плейлисты» Таблица «Плейлист- трек» Рисунок 13. Структура таблицы «Плейлист-трек» 15 Рисунок 14. Данные таблицы «Плейлист-трек» Таблица «Исполнитель-пользователь» Рисунок 15. Структура таблицы «Исполнитель-пользователь» Рисунок 16. Данные таблицы «Исполнитель-пользователь» Таблица «Концерты» Рисунок 17. Структура таблицы «Концерты» 16 Рисунок 18. Данные таблицы «Концерты» Таблица «Город» Рисунок 19. Структура таблицы «Город» Рисунок 20. Данные таблицы «Город» Таблица «Пользователь-концерт» Рисунок 21. Структура таблицы «Пользователь-концерт» 17 Рисунок 22. Данные таблицы «Пользователь-концерт» Таблица «Жанры» Рисунок 23. Структура таблицы Таблица «Жанры» Рисунок 24. Данные таблицы Таблица «Жанры» Алгоритм создания базы знаний 1.Создадим файл Excel с новыми данными, которые мы хотим поместить в базу знаний. Изначально в данных допущены ошибки,которые в дальнейшем будут исправляться с помощью SQL Server Data Quality Server. Для наглядности ошибки выделены желтым цветом. 18 Рисунок 25. Новые данных для базы знаний 2.Создание базы знаний. Рисунок 26. Создание новой базы знаний Рисунок 27. Создание базы знаний Music_library02 19 Рисунок 28. Создание домена для названия альбомов Рисунок 29. Выбор значений названий альбом из базы данных в базу знаний Рисунок 30. Загрузка данных из базы данных в базу знаний 20 Рисунок 31. Результат загрузки данных Рисунок 32. Создание домена «Биография» Рисунок 33. Создание домена для названия артистов 21 Рисунок 34. Выбор значений названий артистов и их биографии из базы данных в базу знаний Рисунок 35. Загрузка данных из таблицы «Артисты» Рисунок 36. Результаты загрузки данных 22 Рисунок 37. Создание домена «Жанр» Рисунок 38. Выбор значений названия жанров из базы данных в базу знаний Рисунок 39. Загрузка значений жанров в базу знаний 23 Рисунок 40. Результаты загрузки значений в базу знаний Рисунок 41. Создание домена для названий треков Рисунок 42. Выбор значений таблицы «Треки» из базы данных в базу знаний 24 Рисунок 43. Загрузка данных в базу знаний Рисунок 44. Результаты загрузки данных о треках 3. Создание проекта качества данных Рисунок 45. Создание проекта качества данных Music_libraryDEMO02, используя базу знаний Music_library02 25 Рисунок 46. Выбор файла и соответствий для чистки данных Рисунок 47. Выполнение очистки данных на выбранном источнике данных Рисунок 48. Просмотр и экспорт результатов очистки данных 26 Рисунок 49. Фрагмент выходных данных 27 Рисунок 50. Фрагмент созданной базы знаний после добавления новой информации и исправления ошибок источника 28 Заключение В данной работе был предложен метод разработки БЗ в Microsoft SQL Quality Services на примере базы данных, разработанной для хранения данных фонотеки. Для большей эффективности необходимая информация была разделена на 11 таблиц. Также была создана база знаний и проект проверки качества данных, была произведена проверка данных из нового источника и исправлены обнаруженные ошибки, благодаря которым была отобрана информация по определенным критериям. Таким образом, разработанная информационная система выполняет поставленную задачу. 29 Библиографический список 1. Базы данных. Учебник для высших учебных заведений, под редакцией проф. А.Д. Хомоненко, Санкт-Петербург, корона, 2014г. 2. Джеймс Р. Грофф. Полное руководство SQL/ Пол Н. Вайнберг, Эндрю Дж. Оппель. М.:Вильямс, 2015.- 996 с. 3. Структурированный язык запросов (sql). Учебное пособие. В.В.Кириллов, Г.Ю. Громов, www. Citforum.ru 4. Федорук, В.Г. Основы языка SQL/ В.Г. Федорук. //Москва -2017. C.27 5. [Электронный ресурс] /Преимущества и недостатки SQL; ред. Крылов А.С. — Режим доступа: http://diplom35.ru/diplom/kak-oformit-spisokliteratury-po-gostu/ , свободный. (Дата обращения: 26.09.2018 г.). 30