Единицы информации Классификация и основные свойства единиц информации Понятие информации Информация – совокупность документированных данных, хранящихся на электронных или бумажных носителях, относящаяся к выбранной предметной области Данные – это знаковые совокупности на носители, используемые для передачи или хранения информации, расположенные в соответствии с некоторой структурой. Структура сообщения Синтаксис (формат) сообщения – совокупность правил, которым должны соответствовать структура информационных сообщений, передаваемых в виде совокупности знаков для того, чтобы приемник мог воспринять ее и обработать; Семантика сообщения – содержание, которое изменяет знания приемника данных. Форматы данных Принято различать следующие форматы: Фиксированный (жесткий) формат данных – выделяются единицы информации, причем для каждой из единиц устанавливается имя и область допустимых значений; Свободный формат данных – способ форматирования документов, при котором не выделяются специфические единицы данных. Основные единицы информации Атрибуты (реквизиты) Составные единицы информации (СЕИ) Атрибуты Атрибут (реквизит) – информационное отображение отдельного свойства некоторого объекта, процесса или явления Атрибуты Атрибут характеризуется именем и значением. Имя атрибута – условное обозначение в процессе обработки данных. Значение атрибута – величина, характеризующая свойство объекта в конкретных обстоятельствах. Все допустимые значения атрибута образуют множество, называемое доменом данного атрибута. Атрибуты Атрибут с именем X представляет собой пару (X, z), где z – элемент множества Z (домена значений). Определение атрибута в информационной системе предполагает указание его имени и списка значений. Атрибуты В языке C/C++ объявление переменных включает в себя описание типа и задание имени переменных: int a; float fahr; char name[ ]; присвоение значения может быть выполнено при объявлении переменной: float price=3.12; или в процессе работы программного модуля. Атрибуты Для некоторых доменов множество входящих в них значений задается с помощью перечисления допустимых значений. Если в домене есть необходимость перечислить обозначения объектов из некоторого класса, то разрабатывается классификатор, содержащий условные обозначения (коды) отдельных объектов и классов, к которым эти объекты отнесены. Атрибуты Если значения атрибутов определены на одном и том же домене, то такие атрибуты называются ролевыми. Пример: на домене FAMILY определены атрибуты: СТУДЕНТ, ПРЕПОДАВАТЕЛЬ Домен значений может не храниться как самостоятельный информационный объект, однако среди ролевых атрибутов в базе данных существует атрибут с наиболее полным значением. Данный атрибут можно использовать для контроля вводимой информации. Составные единицы информации Составной единицей информации (СЕИ) называется набор из атрибутов и других СЕИ. Определение СЕИ построено рекурсивно, из элементарных единиц строятся более сложные. База данных также может быть рассмотрена как составная единица информации Составные единицы информации Множество атрибутов объединяются в одну СЕИ по следующим принципам: соответствующие атрибуты описывают один и тот же процесс; значения атрибутов, входящих в СЕИ, возникают одновременно, связаны логическими или арифметическими соотношениями Составные единицы информации Характеристики СЕИ являются: Имя – условное обозначение в процессах обработки информации Структура – вхождение одних единиц информации в состав других единиц информации Значения – набор значений атрибутов и СЕИ, входящих в состав рассматриваемой единицы информации Составные единицы информации Одна из задач СЕИ в информационных системах – описание структуры экономических документов Документ – материальный носитель информации, содержащий оформленные в установленном порядке сообщения и имеющий юридическую силу. Составные единицы информации Описание структуры СЕИ Для описания структуры независимо от языка программирования используется обозначение: ИМЯ СЕИ(ИМЯ АТРИБУТА, …) Составные единицы информации Определение структуры в C/C++ struct Event { int hour, min; char theme[100], name[50]; int num; }; Данное определение – это определение типа. Можно описать переменные данного типа (данной структуры): Event e1, e2[5]; Элементы структуры называются полями. Поля могут быть любого основного типа, массивами, указателем, объединением или структурой. Для обращения к полю используется операция выбора («точка» для переменной и -> для указателя): e1.hour=12; e1.min=30; strncpy(e2[0].theme, “Подготовка к следующему семинару”, 99); Составные единицы информации Определение значения СЕИ можно дать на основе значений единиц, входящих в состав СЕИ. Значения СЕИ, входящих в другую СЕИ, определяется рекурсивно, однако необходимо учитывать размерность СЕИ. Одно значение СЕИ при хранении в памяти ЭВМ называется записью. Операции над единицами информации Переименование единицы информации – операция присвоения нового имени, объявление синонима – это установление второго, третьего и т.д. равноценного имени Операция над значением атрибута – это перекодирование, т.е. замена существующего кода значения на новый для всех значений Выборка – операция выделения подмножества значений СЕИ, удовлетворяющих заранее поставленным условиям Операции над единицами информации Корректировка – выполнение одной из операций: добавление нового значения СЕИ исключение существующего значения СЕИ замена некоторого значения СЕИ на новое значение Декомпозиция – операция преобразования исходной СЕИ в несколько СЕИ с различными структурами Композиция – операция преобразования нескольких СЕИ с различными структурами в одну Нормализация – операция перехода СЕИ с произвольной структурой к СЕИ с двухуровневой структурой Свертка – операция преобразования СЕИ с двухуровневой структурой в СЕИ с произвольной многоуровневой структурой Экономические показатели При анализе экономических документов ставится задача разделения документа на элементарные осмысленные фрагменты – показатели Показатель представляет собой полное описание количественного параметра, характеризующего некоторый объект или процесс Как единица информации показатель является разновидностью СЕИ. Схематично структура показателя представляется выражением: П(P1,P2,…,Pk,Q) P1,…,Pk – атрибуты-призанки, Q – атрибутоснование Показатели Реквизит-признак представляет собой информационное отображение качественного свойства некоторого объекта Реквизит-основание является отображением количественного свойство объекта или процесса. При хранении экономических показателей один файл (таблица) отводится под группу показателей с одинаковым составом реквизитов признаков. Минимальный набор атрибутов показателя Атрибуты, отражающие идентификаторы объекта Атрибуты, отражающие признак времени Атрибуты, отображающие некоторое количественное свойство объекта Причина выделения показателей заключается в том, что показатель является минимальной группой атрибутов, сохраняющей информативность и достаточной для образования самостоятельного документа. Пример Рассмотрим документ «Приходный ордер». В его состав входят следующие реквизиты: Реквизиты основания: Кол-во, Цена, Сумма, на основе этих реквизитов можно построить три показателя. Дата Склад Пост – код поставщика Кмат – код материала Кол-во – количество по документу Цена Сумма П1(Кмат, Склад, Пост, Дата, Кол-во) П2(Кмат, Цена) П3(Кмат, Склад, Пост, Дата, Сумма) Причем Сумма=Кол-во*Цена Роль показателей Показатели, описывающие экономические процессы, включают составные части: Формальная характеристика, указывающая на алгоритм получения атрибута-основания в показателе; Перечень объектов в процессе; Название процесса; Единица измерения атрибута-основания; Определение периода или момента времени; Название функции управления; Название экономической системы. Критерий качества создания базы данных Минимальная избыточность хранимой информации, выражаемая принципом: каждое сообщение хранится в БД один раз. Соблюдение данного принципа дает следующие преимущества: Сокращается объем памяти ЭВМ, для хранения БД; Сокращается трудоемкость ввода данных и упрощаются проблемы контроля достоверности информации; Упрощаются алгоритмы корректировки данных; Использование экономических показателей позволяет построить структуру БД с минимальной избыточностью, если сначала расчленить все сведения в ЭИС на показатели, а потом объединить атрибуты родственных показателей по принципу: в один файл включается группа показателей с одинаковым составом атрибутов-признаков. Модель арифметических вычислений Модель арифметических вычислений основывается на графе взаимосвязи показателей. В графе G(S,U) множество вершин S={s(i)} представляет собой все показатели, хранящиеся в базе данных. Дуга (ребро графа) u(i,j) задается в том случае, если есть расчетное соотношения для показателя s(j) и оно зависит от показателя s(i). Графы взаимосвязи показателей служит основой для решения задач: разделение промежуточных показателей на хранимые и динамически вычисляемые; распределения файлов по узлам вычислительной сети Описание экономического процесса Выделяют семь классов признаков описывающих экономический процесс: Признаки формальной характеристики – формальный способ вычисления соответствующего показателя; Признаки характеристики процесса – характеристики состояний в которых находится описываемый объект (наличие, выпуск, реализация и т.п.) Признаки объекта – указывают характеризуемый показателем объект (продукция, сырье, персонал и т.п.); Признаки единицы измерения; Признаки субъекта – организации, предприятия; Признаки времени; Признаки функции управления – принадлежность показателя к определенной функции управления