Лекция № 5. Банки данных и знаний Вопросы лекции 4.1. Основные понятия банков данных и знаний 4.2. Компоненты банка данных 4.3. Классификация банков данных 4.1. Понятие банка данных Банк данных (БнД) является современной организации хранения и доступа к информации. формой «Банк данных – это система специальным образом организованных данных (баз данных), программных, технических, языковых, организационно–методических средств, предназначенных для обеспечения централизованного накопления и коллективного многоцелевого использования данных». Требования к Банку Данных • адекватность отображения предметной области (полнота, целостность и непротиворечивость данных, актуальность информации; • возможность взаимодействия пользователей разных категорий и в разных режимах, обеспечение высокой эффективности доступа для разных приложений; • дружественный интерфейсов и малое время на освоение системы, особенно, для конечных пользователей; • обеспечение секретности и конфиденциальности для некоторой части данных; определение групп пользователей и их полномочий; Требования к Банку Данных • обеспечение взаимной независимости программ и данных; • обеспечение надежности функционирования БнД, защита данных от случайного и преднамеренного разрушения; возможность быстрого и полного восстановления данных в случае их разрушения; • технологичность обработки данных, приемлемые характеристики функционирова-ния БнД (стоимость обработки, время реакции системы на запросы, требуемые машинные ресурсы и др.). 4.2. Компоненты банка данных Банк Данных является сложной человеко-машинной системой, включающей в свой состав различные взаимосвязанные и взаимозависимые компоненты, а именно: •информационная компонента; •программные средства; •языковые средства; •технические средства; •организационно–методические средства; •администраторы БнД. Ядром БнД является База данных База данных (БД) – именованная совокупность данных, отражающая состояние объектов и их отношений в рассматриваемой предметной области (ПО). Предметная область (ПО) – часть реального мира, подлежащая автоматизации с целью организации управления. Она представлена множеством фрагментов, каждый из которых характеризуется объектами, процессами и множеством пользователей. Системой управления базой данных (СУБД) называется совокупность языковых и программных средств, облегчающих для пользователей выполнение всех операций, связанных с организацией хранения данных, их корректировки и доступа к ним. В качестве технических используется ЭВМ. средств для БнД СУБД должна обеспечивать: физическую и логическую независимость данных; минимальную избыточность данных; возможность быстрого поиска; эффективные языки запросов к данным; требования безопасности, надежности, конфиденциальности, целостности; СУБД должна обеспечивать: данные должны быть защищены от искажения, хищения, разрушения; данные должны быть восстанавливаемыми; данные должны быть контролируемыми; должна быть установлена процедура идентификации пользователей; должна быть организована система санкционированного доступа; должен быть установлен контроль за действиями пользователя с целью обнаружения ошибочных операций Проект базы данных надо начинать с анализа предметной области и выявления требований к ней отдельных пользователей (сотрудников организации, дл которых создается база данных). Проектирование обычно поручается– администратору базы данных (АБД). Объединяя частные представления о содержимом БД, полученные в результате опроса пользователей, и свои представления о данных, которые могут потребоваться в будущих приложениях, АБД сначала создает обобщенное неформальное описание создаваемой базы данных. Это описание, выполненное с использованием естественного языка, математических формул, таблиц, графиков и других средств, понятных всем людям, работающих над проектированием базы данных, называют инфологической моделью данных. Организационно – методические средства представляют собой различные инструкции, методические и регламентирующие материалы, предназначенные для пользователей разных категорий, взаимодействующих с БнД. 4.3. Классификация банков данных Классификация банков данных может быть произведена по разным признакам (одни признаки относят к БнД в целом, другие – к отдельным его компонентам, третьи могут быть отнесены как к отдельному компоненту, так и к нескольким компонентам или банку в целом). Классификация Банков Данных по типу используемой модели Хранимые в базе данные имеют определенную логическую структуру – иными словами, описываются некоторой моделью представления данных (моделью данных), поддерживаемой СУБД. К числу классических относят следующие модели данных: •сетевую; •иерархическую; •реляционную. В последние годы появились и стали активно внедряться на практике следующие модели данных: •постреляционная; •многомерная; •объектно-ориентированная. Разрабатываются также всевозможные системы, основанные на других моделях данных, расширяющих известные модели. Классификация по типу модели распространяется не только на БД, но и на СУБД и БнД в целом. Классификация СУБД по числу уровней в архитектуре Под архитектурным уровнем СУБД понимают функциональный компонент, механизмы которого служат для поддержки некоторого уровня абстракции данных (логический, физический, внешний уровень). По числу уровней в архитектуре различают одноуровневые, двухуровневые и трехуровневые системы. Рис. 4.1. Классификация СУБД по числу уровней в архитектуре Нумерация уровней на рисунке условна, но, тем не менее, отражает их значимость (физическая модель может быть построена только на основе даталогической; эти два уровня могут быть совмещены, но поддерживаются СУБД всегда; внешний уровень в архитектуре СУБД может отсутствовать). Проектирование базы данных состоит из двух этапов: логическое проектирование; даталогическое проектирование. На этапе логического проектирования необходимо: • определить основные функции приложения, работающего с базой данных; • определить информация, каких сущностей (объектов) должна храниться в базе данных и идентифицировать их; • определить какие атрибуты данных для каждой сущности должны храниться в базе данных и идентифицировать их; • определить какие отношения (связи) должны существовать между сущностями. Даталогическое проектирование базы данных представляет собой этап разработки базы данных с использованием конкретной СУБД в соответствии с созданной на этапе логического проектирования моделью.