КЛАССИФИКАЦИЯ И КОДИРОВАНИЕ ИНФОРМАЦИИ Винокуров И.В. Аннотация. Обработка экономических задач заканчивается составлением на ЭВМ различных сводок, таблиц, ведомостей, в которых информация сгруппирована по какимлибо реквизитам-признакам. Группировка информации осуществляется на основе систем классификации и кодирования, позволяющих представить технико-экономическую информацию в форме, удобной для ввода и обработки данных с помощью вычислительной техники. Экономическая информация фиксируется в документах в виде цифр и букв. Ключевые слова. Информационная система, код, классификатор, объект. Чтобы сделать информацию удобной для восприятия человеком и машиной, потребовалось создание специальных средств формализованного описания экономической информации. Эти средства включают целый ряд разработанных классификаторов, входящих в Единую систему классификации и кодирования (ЕСКК) [4]. Систематизация экономической информации вызывает необходимость применения самых разнообразных классификаторов: общегосударственных; отраслевых; локальных. Общегосударственные классификаторы (ОК) начали создаваться в стране по постановлению Правительства в 1970-ых годах и в настоящее время их создано около четырёх десятков [2]. Классификаторы приобретают особое значение в компьютерных информационных системах, предусматривающих создание автоматизированных рабочих мест (АРМ). Кодированию в документах подлежат те признаки, по которым выполняется группировка информации в машине [4]. Составление классификаторов выполняется в два этапа: первый этап - классификация информации, второе - кодирование [4]. Классификация — это разделение множества объектов на подмножества по их сходству или различию [3]. Под объектом понимается любой предмет, процесс, явление материального или нематериального свойства. Система классификации позволяет сгруппировать объекты и выделить определенные классы, которые будут характеризоваться рядом общих свойств. 1 Классификация объектов - это процедура группировки на качественном уровне, направленная на выделение однородных свойств. Применительно к информации как к объекту классификации выделенные классы называют информационными объектами [3]. Свойства информационного объекта определяются информационными параметрами, называемыми реквизитами. Реквизиты представляются либо числовыми данными, например вес, стоимость, год, либо признаками, например цвет, марка машины, фамилия. Реквизит — логически неделимый информационный элемент, описывающий определённое свойство объекта, процесса, явления и т.п. [1]. Кроме выявления общих свойств информационного объекта классификация нужна для разработки правил (алгоритмов) и процедур обработки информации, представленной совокупностью реквизитов [1]. При любой классификации желательно, чтобы соблюдались следующие требования: полнота охвата объектов рассматриваемой области; однозначность реквизитов; возможность включения новых объектов. При классификации широко используются понятия классификационный признак и значение классификационного признака, которые позволяют установить сходство или различие объектов. Возможен подход к классификации с объединением этих двух понятий в одно, названное как признак классификации. Признак классификации имеет также синоним основание деления [1]. Разработаны три метода классификации объектов: иерархический, фасетный, дескрипторный. Эти методы различаются разной стратегией применения классификационных признаков. Рассмотрим основные идеи этих методов для создания систем классификации [1]. Иерархический метод классификации заключается в последовательном делении заданного множества на подчиненные множества, каждое из которых в свою очередь делится на подчиненные ему подмножества [1]. Фасетный метод классификации заключается в параллельном разделении заданного множества объектов на независимые группировки по различным признакам классификации [1]. Рассмотрим иерархический и фасетный методы классификации информации при помощи модели категориального маятника (рис. 1). 2 Простота и удобство использования Качественное усложнение 1 Надёжность и компактность 2 Потребность заказчика 3 Иерархическая Фасетная Массовость Система классификации Рис. 1 Модель категориального маятника На представленном категориальном ряде можно проследить пути развития динамической системы (Методы, используемые в системе классификации информации). В первом случае мы получаем простой и удобный метод классификации информации, во втором случае – надёжный и компактный. В качестве неопределенности выделены потребности заказчика, влияющие на пути и объект следующим образом: усложнение популяризация удешевление Дескриптор — это термин естественного языка (слово или словосочетание), используемый при описании документов или показателей, который имеет самостоятельный смысл и неделим без изменения своего значения [1]. Дескрипторная система классификации представляет собой совокупность терминов (дескрипторов) и набор отношений между ними [1]. Классификация осуществляется в следующей последовательности. Сначала выявляются номенклатуры, подлежащие кодированию. К ним относятся те реквизитыпризнаки, которые используются для составления группировок. Затем по каждой номенклатуре составляется полный перечень всех позиций, подлежащих кодированию. 3 При этом соблюдается логическая зависимость различных признаков в рассматриваемой номенклатуре - полный перечень однородных наименований, состоящий из отдельных строк - позиций. В каждой номенклатуре предусматривается некоторое количество резервных позиций на случай появления новых объектов. Таким образом, можно отметить, что классификация заключается в распределении элементов множества на подмножества на основании признаков и зависимости внутри признаков [4]. После составления классификации выполняется следующий этап - кодирование процесс присвоения условного обозначения различным позициям номенклатуры. Кодирование применяется для обеспечения удобной и более эффективной обработки информации [4]. Система кодирования — это совокупность правил обозначения объектов и группировок с использованием кодов [1]. Код - условное обозначение объекта знаком или группой знаков по определённым правилам, установленным системой кодирования [1]. Код строится на базе алфавита, состоящего из букв, цифр и других символов. Код характеризуется: длиной – число позиций в коде; структурой – порядок расположения в коде символов, используемых для обозначения классификационного признака. Процедура присвоения объекту кодового обозначения называется кодированием. Выделяется две группы методов, используемых в системе кодирования (рис. 2). Система кодирования Классификационная Последовательная (для иерархической классификации) Параллельная (для фасетной классификации) Регистрационная Порядковая Серийнопорядковая Рис. 2 Система кодирования, использующая разные методы 4 Классификационная система кодирования ориентирована на проведение предварительной классификации объектов, либо на основе иерархической системы, либо на основе фасетной системы. Регистрационная система кодирования не требует предварительной классификации объектов. После присвоения кодов создаётся классификатор – систематизированный свод однородных наименований и их кодовое обозначение [4]. Классификаторы имеют двоякое применение: Для ручного проставления кодов в документах. В этом случае классификаторы оформляются в виде справочников и используются экономистами для подготовки первичных и сводных документов к машинной обработке. Хранение всех классификаторов в памяти машины, на машинных носителях в базе данных, в качестве словарного фонда или условно-постоянной информации. Технология применения кодов в современных условиях использования персональных компьютеров (ПК) определяется прежде всего эксплуатационными возможностями машин, а также методами программирования, обеспечивающими создание в машине различных взаимосвязанных массивов информации – банка данных. Новая информационная технология, использующая ПК, строится на безбумажной технологии, где происходит автоматическое формирование первичного документа. Технологический процесс предусматривает при этом автоматическое занесение реквизитов-признаков в документ. С этой целью в машинной программе содержится перечень номенклатур, используемый в данной задаче [4]. Список литературы: 1. Автоматизированные информационные технологии в экономике: Учебник / Под ред. Г.А. Титоренко. - М.:ЮНИТИ, 2004.-399 с. 2. ГОСТ 6.01.1-87 Единая система классификации и кодирования техникоэкономической информации. Основные положения [электронный ресурс]: режим доступа из справочно-правовой системы «КонсультантПлюс». 3. Костомаров М.Н. Классификация и кодирование документов и документной информации (классификация документов) // Секретарское дело. – 2003. – № 10. – С. 35-40 4. Остринская Л.И. Автоматизированные информационные системы и технологии в экономике. Омск: Издательство СибАДИ, 2005. 270 с. 5