МИНИСТЕРСТВО ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ УЧРЕЖДЕНИЕ ОРАЗОВАНИЯ «МОЗЫРСКИЙ ГОСУДАРСТВЕННЫЙ ПЕДАГОГИЧЕСКИЙ УНИВЕРСИТЕТ имени И. П. ШАМЯКИНА» Реферат на тему «Классификация и кодирование информации; системы классификации; методы кодирования» Выполнил студент Таргоня Александр Григорьевич 2013 Система классификации информации Процесс классифицирования представляет собой процесс распределения объектов классификации в соответствии с выбранной системой классификации. Классификация – упорядочение некоторого множества объектов (материалов, изделий, балансовых счетов, видов операций и т.д.) в соответствии с установленными признаками их сходства и различия. Признак, позволяющий распределять множество объектов на подмножества, называют основанием классификации. Процесс классифицирования представляет собой процесс распределения объектов классификации в соответствии с выбранной системой классификации. Необходимость классификации связана: С выявлением общих свойств информационного объекта; Разработкой правил и процедур обработки информации: Сокращением объема и времени поиска необходимой информации: Упрощением обработки информации. Система классификации – совокупность правил распределения объектов множества на основании классификационных признаков и зависимости внутри признаков. При проектировании ОИ к системам классификации объектов предъявляется ряд требований: Полнота охвата объектов рассматриваемой области; Однозначность реквизитов; Возможность включения новых объектов. Каждая система классификации имеет такие основные характеристики, как гибкость, емкость, глубина и заполненность (таблица 1.1). В настоящее время известны и наиболее применяемы иерархическая и фасетная системы классификации объектов. Таблица 1.1 Основные характеристики систем классификации Характеристика 1. Гибкость Свойства Возможность включения в систему классификации 2 новых классификационных признаков и объектов без нарушения ее целостности 2. Емкость Количество (максимально возможное) классификационных группировок в системе классификации 3. Глубина Количество допускаемых уровней (ступеней), соответствующих числу признаков классификации 4. Заполненность Отношение фактического количества классификационных группировок к емкости системы Иерархическая система классификации информации При иерархической системе классификации множество объектов делится в зависимости от выбранного классификационного признака на классы (группировки), образующие уровень. Каждый класс уровня в соответствии со своим классификационным признаком делится на подклассы ( уровень). Каждый подкласс уровня делится на группы ( уровень) и т.д. (рис. 1.1). Достоинствами иерархической системы классификации являются простота и логичность построения, возможность использования неограниченного количества классификационных признаков в различных ветвях иерархической структуры. Недостатки иерархической системы классификации следующие: жесткая структура, осложняющая внесение изменений; невозможность группировки объектов по заранее не предусмотренным признакам. В качестве примера иерархической классификации рассмотрим план счетов бухгалтерского учета. План счетов разбивается на классы (разделы): внеоборотные активы, производственные запасы, затраты на производство, готовая продукция, денежные средства, расчеты, капитал, финансовые результаты. Каждый из этих классов разбивается на подклассы (счета). Например, внеоборотные активы включают в себя основные средства (ОС), амортизацию ОС, нематериальные активы, амортизацию нематериальных активов и др. Каждый подкласс разбивается на группы (субсчета). Так, в подклассе «Основные средства» выделяются собственные и арендованные ОС. 3 Иерархическая система классификации Множество объектов Классы Подклассы Группы Рис. 1.1 Фасетная система классификации информации Фасетная система классификации позволяет разделить множество объектов одновременно по нескольким независимым друг от друга признакам. Признак классификации, который используется для образования независимых классификационных группировок, называется фасетом. Фасет ( Ф𝑖 ) представляет собой совокупность однородных значений классификационного признака. Внутри фасета значения могут располагаться в произвольном порядке или быть упорядоченными. Классификация (К𝑠 ) заключается в присвоении значений из фасетов: К𝑠 = (Ф1 , Ф2 , … , Ф𝑛 ). При построении фасетной системы классификации необходимо не повторять значений в различных фасетах. Структурно фасетную классификацию можно представить в табл. 1.2. Таблица 1.2 Фасетная система классификации Фасеты Ф1 Ф2 Ф3 Ф4 Фi Фn Значения фасетов 4 В качестве примера фасетной классификации рассмотрим бухгалтерскую отчетность (табл. 1.3). Таблица 1.3 Пример фасетной системы классификации Название отчетности (Ф1) Общеэкономическая Тип (Ф2) (со- Квартальная Форма (Ф3) Ф1 – баланс ставляется в соответствии с Годовая Ф2 – отчет о финансо- инструкциями вых результатах Минфина России) Ф3 – отчет о движении Налоговая (составляется в капитала соответствии с инструкция- Ф4 – отчет о движении ми ФНС) денежных средств Налоговые декларации Расчеты налогов Справки Здесь фасетами являются название отчетности, тип, форма, ниже в столбцах приведены их значения. Тогда классификация отчетности имеет вид: К1 = (общеэкономическая, квартальная, Ф1); К2 = (налоговая, годовая, налоговые декларации). Классификация экономических объектов способствует их систематизации, более глубокому изучению и созданию единых классификаторов однородных объектов для разных предприятий. Классификация является основой кодирования информации. 5 Система кодирования информации Кодирование – это процесс присвоения условных обозначений объектам классификации (материалам, изделиям, видам операций, счетам и т.д.) и классификационным группировкам. Цель кодирования: представление информации в более компактной и удобной для использования в ИС форме; подготовка информации к обработке в системе и передаче ее по каналам связи; упрощение логической обработки информации с использованием специальных методов; установление единообразия представления всех признаков. Уникальное условное обозначение, присвоенное конкретному объекту (например, счету), называется кодом. Код может состоять из одного знака или системы знаков, образованной по определенным правилам. В качестве знаков могут выступать цифры, буквы или буквенно-цифровые символы. Однако чаще используются только цифры. Код характеризуется длиной (числом позиций в коде), структурой (порядком расположения символов в коде) и емкостью (максимально допустимым числом элементов кода). Совокупность правил, по которым строится кодовое обозначение объекта, называется системой кодирования. При кодировании элементов экономических объектов используются порядковая, серийная, позиционная (поразрядная), повторения и комбинированная системы кодирования, которые сгруппированы в два класса - классификационные и регистрационные (рис. 2.1). Схема классификации систем кодирования Системы кодирования Регистрационные Классификационные Порядковая Позиционная Серийная Повторения Рис. 2.1 Комбинированная 6 Классификационное кодирование Классификационное кодирование выполняется после предварительной классификации объектов и подразделяется на позиционное (поразрядное), повторения и комбинированное кодирование. Позиционная (поразрядная) система кодирования применяется для кодирования сложных объектов, элементы которых можно группировать по нескольким признакам. Данные кодируемого множества классифицируются по заданным признакам, каждому из которых отводится определенное число разрядов (позиций). В качестве примера рассмотрим лицевой счет клиента банка. Структурно номер лицевого счета имеет следующий вид: РППББВВВКООООЛЛЛЛЛЛЛ, Где Р (одна позиция) – номер балансового раздела; П (две позиции) – номер счета первого порядка; Б (две позиции) – номер счета второго порядка; В (три позиции) – код валюты; К (одна позиция) – контрольный ключ; О (четыре позиции) – номер филиала; Л (семь позиций) – лицевая часть счета. Другим примером является банковский идентификационный код (БИК), структура которого такова: Код России Код банка в пределах РКЦ Код РКЦ Достоинствами позиционной системы кодирования являются простота построения, логичность, большая информативность кода, дающая возможность кодирования неограниченного количества классификационных признаков, их четкое выделение. Недостаток данной системы заключается в жесткой структуре предварительной классификации, не позволяющей закодировать группировки, не предусмотренные заранее. Система повторения использует кодовые обозначения, непосредственно характеризующие объект кодирования, т.е. сохраняет уже имеющиеся условные обозначения тех или иных признаков. Например, если размер инструмента 712, то этому инструменту присваивается код 712. 7 Достоинством данного кодирования является легкость запоминания, а недостатком – узость применения. Чаще всего система повторения применяется комбинированно с другими системами кодирования. Регистрационная система кодирования Регистрационная система кодирования используется для однозначной идентификации объектов и не требует их предварительной классификации. Она подразделяется на порядковую и серийную системы. Порядковая система кодирования заключается в последовательном присвоении каждому объекту номенклатуры номера его порядка, т.е. в кодировании информации числами натурального ряда. Этот порядок может быть случайным или определяется после предварительной группировки названий объектов по алфавиту. При появлении новых объектов используются номера в конце списка. Порядковая система применяется для простых и стабильных номенклатур. Ее достоинство – простота построения; недостаток в том, что с появлением новых объектов номенклатуры нарушается ее логическая стройность. Примером данной системы является кодирование списка студентов учебной группы, где фамилии студентов, упорядоченные по алфавиту, нумеруются цифрами натурального ряда. Серийная система кодирования предполагает разбивку всех кодируемых объектов на группы по какому-либо признаку. Каждой группе отводится серия кодов. В пределах этой серии каждому объекту номенклатуры присваивается код по порядку. Каждая серия кодовых обозначений, присваиваемая группе, содержит резервные коды для вновь появившихся позиций номенклатуры в группе. Преимуществами этой системы кодирования являются сравнительно небольшая длина кода и возможность добавления новых объектов в группу без нарушения логичности системы. Недостатки серийной системы состоят в отсутствии четкой границы между сериями и трудностями запоминания серий. Серийная система применяется для кодирования двузначных номенклатур, например, структурные подразделения предприятий или организаций, виды оплат и учреждений и т.д. К регистрационной системе кодирования относится также и штриховое кодирование, которое представляет собой способ автоматической идентификации (распознавание и различение) разнородных предметов (товары, инвен8 тарь, багаж, документы и т.п.), основанный на оптическом считывании информации. Данный способ предполагает выполнение следующих шагов: присвоение каждому предмету определенного идентификатора (номера или кода), нанесение на предмет специализированной метки, содержащей идентификатор, считывание данных с метки цифровым устройством и перевод данных метки в электронный вид. В качестве идентификатора можно использовать графические, магнитные, радиочастотные и электронные метки, применяемые в различных сферах, но наибольшей популярностью пользуется графическая метка в виде штрихкода. Построение штрихового кода основано на системе маркировки в виде чередования широких и узких, темных и светлых полос, которыми закодирована, как правило, алфавитно-цифровая информация. При этом широким линиям и широким промежуткам присвоено логическое значение 1, узким – 0. Таким образом, образуется последовательность из 0 и 1, представляющая собой двоичный код, который в последствии прочитывается электронным устройством – считывателем штрихкода. В нем закодированы необходимые сведения о стране-производителе, предприятииизготовителе и самом предмете. Существует более 50 систем штрихового кодирования. В настоящее время наибольшее применение получили следующие системы: UPC (Universal Product Code) – универсальный товарный код, разработанный и применяемый в США; EAN (European Article Numbering) – товарный код (европейский артикул), созданный в ЕС на базе UPC. Данный код соответствует названию Европейской ассоциации товарной нумерации, получившей статус международной организации (EAN International). UCC/EAN – единый стандартизированный штриховой код, созданный организациями США и Канады (Uniform Code Council) и EAN International. Среди них в Российской Федерации широкое применение получили EAN- и UCC/EAN-коды. В каждой системе существуют свои виды кодов: UPC-12, EAN-8, EAN13, EAN-14, UCC/EAN-128 (современная версия Code 39). Остановимся подробнее на структуре стандартного кода EAN-13, применяемого в нашей стране. Тринадцатиразрядный код используется для кодирования продукции и имеет следующую структуру: 9 Первые три цифры кода обозначают страну-производителя. Следующие четыре цифры – код предприятия-изготовителя, которое реализует товар под своей торговой маркой или производит его. Последующие пять цифр – код продукта (товара), учитывающий его потребительские свойства, размеры, оформление, упаковку, цвет и т.д. Последняя цифра является контрольной и используется для проверки правильности считывания кодов специальным сканирующим устройством. Список кодов стран-производителей EAN13 приведен в табл. 2.1. Применение штриховых кодов регулируется международными и национальными организациями. В РФ такой организацией является Ассоциация автоматической идентификации, которая устанавливает коды предприятий и коды продуктов. Код страны присваивается организацией EAN International. Таблица 2.1 Список кодов EAN-13 Код Страна Код Страна 00-09 США, Канада 690 КНР 30-37 Франция 70 Норвегия 380 Болгария 729 Израиль 383 Словения 73 Швеция 385 Хорватия 750 Мексика 400-440 Германия 759 Венесуэла 45,49 Япония 76 Швейцария 460-469 Россия, СНГ 770 Колумбия 471 Тайвань 773 Уругвай 474 Эстония 775 Перу 475 Латвия 779 Аргентина 477 Литва 780 Чили 482 Украина 786 Эквадор 484 Молдова 789 Бразилия 489 Гонконг 80-83 Италия 50 Великобритания 84 Испания 520 Греция 850 Куба 10 529 Кипр 858 Словакия 535 Мальта 859 Чехия 539 Ирландия 860 Югославия 54 Бельгия, Люксембург 869 Турция 560 Португалия 87 Нидерланды 569 Исландия 880 Южная Корея 57 Дания 885 Таиланд 590 Польша 888 Сингапур 599 Венгрия 890 Индия 600,601 ЮАР 893 Вьетнам 611 Марокко 90,91 Австрия 613 Алжир 93 Австралия 619 Тунис 94 Новая Зеландия 64 Финляндия 955 Малайзия Штриховое кодирование информации широко применяется в коммерческой деятельности, транспортных и складских системах, сфере учета материальных запасов, технологическом процессе и т.д. Выбор системы кодирования зависит от объема кодируемой номенклатуры, ее стабильности и от задач, стоящих перед ЭИС. При этом для конкретных объектов кодирования необходимо учитывать следующие требования: использование действующих классификаторов и учет особенностей разработанного варианта ЭИС; обеспечение системного подхода по отношению к каждому множеству объектов; обеспечение возможности включения в классификатор всех видов объектов каждого множества (всех возможных значений реквизитов) в размере системы в целом, а не ее отдельных частей и подсистем; присвоению каждому элементу множества только одного кодового обозначения; 11 не допускается включение в систему кодирования признаков, не относящихся ко всем экземплярам каждого элемента классифицируемого множества; признаки объектов, по которым образуется классификационная группировка, для множества должны быть постоянными; алфавит кода для всех кодируемых множеств данной ЭИС должен быть одинаковым; необходимо учитывать возможности появления новых элементов множества, следует иметь резерв свободных кодов; необходимо учитывать эксплуатационные возможности технических средств, предназначенных для обработки и информации; необходимо обеспечить возможность автоматического контроля ошибок при обработке данных в системе. Реализация этих требований обеспечивает правильный выбор системы кодирования при разработке информационного обеспечения ЭИС. На основании систем классификации и кодирования экономических объектов разрабатываются разные виды классификаторов. Под классификатором понимается систематизированный свод единиц информатизации и их кодовых значений. Основными назначениями классификаторов являются: однозначное обозначение объектов; группировка информации по ряду признаков; минимизация объемов хранимых данных в информационной базе системы; ускорение процедур поиска и обмена данными в компьютерной среде. В зависимости от сферы применения классификаторы подразделяются на международные, общегосударственные (общероссийские), отраслевые, региональные и локальные. Международные классификаторы входят в состав Системы международных экономических стандартов (СМЭС) и используются для обмена информацией между предприятиями и организациями разных стран мирового сообщества. В состав СМЭС входят классификации Организации Объединенных Наций (ООН) и ее специализированных образований, в том числе: международная стандартная отраслевая классификация всех видов экономической деятельности (МСОК); 12 международная стандартная торговая классификация (МСТК); классификация основных продуктов (КОП); классификация продовольственных и сельскохозяйственных организаций; классификация международной организации труда (МОТ); классификация ООН по вопросам образования, науки, и культуры (ЮНЕСКО) и др 13