Перспективы развития СУБД интеллектуальный анализ данных • интеллектуальный анализ данных (ИАД), пли data mining — это процесс выявления значимых корреляций, образцов и тенденций в больших объемах данных. • При работе с большими объемами накапливаемой информации необходимо постоянно оперативно отслеживать динамику рынка, а это практически невозможно без автоматизации аналитической деятельности. OLAP • В бизнес-приложениях наибольший интерес представляет интеграция методов интеллектуального анализа данных с технологией оперативной аналитической обработки данных (On-Line Analytical Processing, OLAP). • В основе концепции оперативной аналитической обработки (OLAP) лежит многомерное представление данных. • Термин OLAP ввел Кодд (Е. F. Codd) в 1993 году. В своей статье он рассмотрел недостатки реляционной модели, в первую очередь невозможность «объединять, просматривать и анализировать данные с точки зрения множественности измерений», то есть самым понятным для корпоративных аналитиков способом Пример • Так, измерение Исполнитель может определяться направлением консолидации, состоящим из уровней обобщения «предприятие—подразделение-отдел-• служащий». • Измерение Время может даже включать два направления консолидации - «год-квартал-месяцдень» и «неделя-день», • В этом случае становится возможным произвольный выбор желаемого уровня детализации информации по каждому из измерений. • Операция спуска (drilling down) соответствует движению от высших ступеней консолидации к низшим; • напротив, операция подъема (rolling up)означает движение от низших уровней к высшим. Ненормализованные данные • Следующем новым направлением в развитии систем управления базами данных является направление, связанное с отказом от нормализации отношений. • Во многом нормализация отношений нарушает естественные иерархические связи Между объектами, которые достаточно распространены в нашем мире. • Возможность сохранять их на концептуальном (но не на физическом) уровне позволяет пользователям более естественно отражать семантику предметной • области. • В настоящий момент уже существует теоретическое обоснование работы с ненормализованными отношениями и практические реализации подобных систем. объектноориентированные базы данных. • В объектно-ориентированной парадигме предметная область моделируется как множество классов взаимодействующих объектов. • Каждый объект характеризуется набором свойств, которые являются как бы его пассивными характеристиками и набором методов работы с этим объектом. • Работать с объектом можно только с использованием его методов. • Атрибуты объекта могут принимать определенное множество допустимых значений, набор конкретных значений атрибутов объекта определяет его состояние. Продолжение • Множество объектов с одним и тем же набором атрибутов и методов образует класс объектов. • Объект должен принадлежать только одному классу (если не учитывать возможности наследования). • Допускается наличие примитивных предопределенных классов, объекты-экземпляры которых не имеют атрибутов: целые, строки и т, д. • Класс, объекты которого могут служить значениями атрибута объектов другого класса,называется доменом этого атрибута. Наследование • Одной из наиболее перспективных черт объектноориентированной парадигмы является принцип наследования. • Допускается порождение нового класса на основе уже существующего класса, и этот процесс называется наследованием. • В этом случае новый класс, называемый подклассом существующего класса (суперкласса), наследует все атрибуты и методы суперкласса. • В подклассе, кроме того, могут быть определены дополнительные атрибуты и методы. простое и множественное наследование • В первом случае подкласс может определяться только на основе одного суперкласса, • во втором случае суперклассов может быть несколько. • Если в языке или системе поддерживается единичное наследование классов, набор классов образует древовидную иерархию. • При поддержании множественного наследования классы связаны в ориентированный граф с корнем, называемый решеткой классов. • Объект подкласса считается принадлежащим любому суперклассу этого класса. • Специфика применения объектноориентированного подхода для организации и управления БД потребовала уточненного толкования классических концепций и некоторого их расширения. • 1. Возникло направление, которое предполагает возможность хранения объектов внутри реляционной БД, • 2. Часть разработчиков придерживается мнения о необходимости полного отказа от реляционной парадигмы и перехода на объектно-ориентированную парадигму. темпоральные баз данных • Следующим направлением развития баз данных является появление так называемых темпоральных баз данных, то есть баз данных, чувствительных ко времени. • Фактически БД моделирует состояние объектов предметной области в некоторый текущий момент времени. • Однако в ряде прикладных областей необходимо исследовать именно изменение состояний объектов во времени, • Если использовать чисто реляционную модель, то требуется строить и хранить дополнительно множество отношений, имеющих одинаковые схемы, отличающиеся временем существования или снятия данных. • Основной тезис темпоральных систем состоит в том, что для любого объекта данных, созданного в момент времени t1 и уничтоженного в момент времени t2, в БД сохраняются (и доступны пользователям) все его состояния во временном интервале [t1, t2). Дедуктивные базы данных. • Еще одним из перспективных направлений развития баз данных является направление, связанное с объединением технологии экспертных систем и баз данных и развитие так называемых дедуктивных баз данных. • Эти базы основаны на выявлении новых знаний из баз данных не путем запросов пли аналитической обработки, а путем использования правил вывода и построения цепочек применения этих правил для вывода ответов на запросы, • Для этих баз данных существуют языки запросов, отличные от классического SQL. • В экспертных системах также знания экспертов хранятся и форме правил, чаще всего используются так • называемые продукционные правила типа «если описание ситуации то описание действия». Экспертные системы • Экспертная система — это программа для компьютера, которая оперирует со знаниями в определенной предметной области с целью выработки рекомендаций или решения проблем. Технология экспертных систем является одним из направлений новой области исследования, которая получила наименование искусственного интеллекта (Artificial Intelligence — AI). • Исследования в этой области сконцентрированы на разработке и внедрении компьютерных программ, способных эмулировать (имитировать, воспроизводить) те области деятельности человека, которые требуют мышления, определенного мастерства и накопленного опыта. • К ним относятся • задачи принятия решений, • распознавания образов и • понимания человеческого языка. типовые задачи решаемые экспертными системами • извлечение информации из первичных данных (таких как сигналы, поступающие от гидролокатора); • диагностика неисправностей (как в технических системах, так и в человеческом организме); • структурный анализ сложных объектов (например, химических соединений); • выбор конфигурации сложных многокомпонентных систем (например, распределенных компьютерных систем); • планирование последовательности выполнения операций, приводящих к заданной цели (например, выполняемых промышленными роботами). Характеристики экспертных систем • Моделирует не столько физическую (или иную) природу определенной проблемной области, сколько механизм мышления человека • Система, помимо выполнения вычислительных операций, формирует определенные соображения и выводы, основываясь на тех знаниях, которыми она располагает. • Знания в системе представлены, как правило, на некотором специальном языке и хранятся отдельно от собственно программного кода, который и формирует выводы и соображения. • Этот компонент программы принято называть базой знаний. • Экспертная система должна обладать способностью объяснить, почему предложено именно такое решение, и доказать его обоснованность. Базовые функции экспертных систем • • • • Приобретение знаний Представление знаний Управление процессом поиска решения Разъяснение принятого решения