ГЛОССАРИЙ - liveinternet.ru

реклама
ГЛОССАРИЙ
терминов по теории информации
Алгоритм- заранее заданная последовательность четко определенных правил или команд для получения
решения задачи (например,путем выполнения некоторой вычислительной процедуры) за конечное число шагов.
Алфавит - упорядоченный набор знаков.
Ансамбль сообщений - множество возможных сообщений с их вероятностностными характеристиками .
Байт - часть машинного слова, состоящая обычно из восьми битов.
Бит - фундаментальная единица информации,используемая в теории информации .Обозначает количество
информации, необходимое для различения двух равновероятных событий.
Блочный код - код с обнаружением или исправлением ошибок, в котором за одну операцию на вход кодера
поступает фиксированное число (например,k) знаков,а на выходе генерируется кодовое cлово,состоящее из
большего числа знаков (например, n). Соответственно декодер принимает n знаков и выдает k знаков. Этот код
иногда называют (n,k)-кодом, т.е. с длиной блока k и длиной кодового слова - n.Поскольку кодовые слова
длиннее входных слов,число одновременно принимаемых слов не так велико. Кодовые слова формируются
путем выбора из множества слов соответствующей длины, а именно:
способ выбора придает коду те или иные конкретные свойства.
Бод - единица измерения скорости передачи информации; представляет собой
число изменений состояния системы, в частности канала передачи данных,
в секунду. В случае двоичного канала скорость передачи в бодах равна
скорости передачи битов, т.е. 1 бод = 1 бит/с. В более общем случае 1 бод = 1 знак/с или1 бод = 1
символ/с.В зависимости от способа представления состояний системы боды могут измеряться и по-другому.
Единица измерения 1 бод 0 названа в честь французского изобретателя телеграфного аппарата Ж.М.Э.Бодо.
Верность передачи" - мера соответствия принятого сигнала (сообщения) переданному сигналу (сообщению).
Вероятность - число между 0 и 1, ассоциируемое с событием, которое является одним из множества
возможных; событие, которое обязательно происходит, имеет вероятность 1. Вероятность события имеет
ограниченную величину, определяемую относительной частотой события при неограниченном увеличении числа
наблюдений. Кроме того, это число характеризует степень уверенности в том, что событие
обязательно произойдет.
Выборка - выбор элементов для изучения таким образом, чтобы измерения, проведенные на элементах
выборки, дали информацию об аналогичных элементах, не вошедших в выборку. Этими элементами
могут быть люди, машины, периоды времени, поля пшеницы, азартные игры или любые другие объекты
изучения. Размером выборки является число включенных в нее элементов. Если дисперсия измеряемой величины
примерно известна, то дисперсия ее среднего значения по выборке равна дисперсии по всей генеральной
совокупности, поделенной на размер выборки. Эта формула может быть использована для определения
соответствующего размера выборки. Генеральной совокупностью является все множество элементов, о которых
мы хотим получить информацию. Она должна быть определена перед произведением выборки, иначе результаты
могут оказаться неверно определенными. Выборка является основой гипотез о распределениях вероятностей
значений в генеральной совокупности. К числу проблем определения выборки относится исключение смещения в
ней и отбор достаточного количества элементов для обеспечения адекватности. При случайной выборке
вероятность включения в нее каждого элемента одинакова. Элементы могут отбираться с помощью таблиц
случайных чисел или же с помощью механических манипуляций, например, с картами или монетами. При
систематической выборке элементы отбираются некоторым упорядоченным способом. Эта выборка правильна в
том случае, когда порядок попадания элементов в выборку не имеет отношения к изучаемому вопросу, но может
явиться непредусмотренным источником возникновения смещения.
Границы кодирования - пределы производительности кода, выраженные такими параметрами,как число
кодовых слов, минимальное расстояние Хемминга, длина кодового слова и эффективность. Применяются в
общем и частных случаях к кодам с обнаружением и исправлением ошибок и задаются в виде разнообразных
неравенств. Среди многих известных границ кодирования наиболее важными являются граница Хемминга и
граница Варшамова - Гильберта.
Групповой (или линейный) код- в теории кодирования линейными кодами называются коды, кодирования и
декодирования которых может быть сведено к линейным операциям. Обычно этот термин относится к
определенным кодам с определением ошибок, для которых кодирование осуществляется с помощью
порождающей матрицы, а декодирование -с помощью матрицы проверки на четность. Поэтому линейные коды
также называют кодами с проверкой на четность. Слова линейного кода образуют коммутативную группу, в
которой роль единицы играет нулевое кодовое слово.
Датчик- любое устройство, которое преобразует энергию в форме звука, света, давления и т.д. в эквивалентный
электрический сигнал, или наоборот. Например, фотоэлемент преобразует световое или ультрафиолетовое
излучение в электрическую энергию, пьезоэлемент преобразует механическое усилие в электрическую энергию
(и наоборот).
Декодирование - процесс преобразования кодированного сообщения в исходное.
Демодулятор- устройство, преобразующее входные аналоговые сигналы в выходные цифровые. Принцип
действия демодулятора обратен принципу действия модулятора, в котором цифровые сигналы преобразуются
в аналоговые.
Дискретная структура- множество дискретных элементов, на котором определен некоторый набор операций.
Термин "дискретный" означает отсутствие непрерывности, поэтому к дискретным множествам следует относить
конечные множества и счетные множества, в то же время несчетные множества, такие как множество
действительных чисел, не являются дискретными.
Длина кода - в кодере это число генерируемых в процессе операции кодирования символов. Обычно число
вводимых в кодер символов фиксировано; число выводимых символов может быть либо фиксированным, либо
переменным, в зависимости от типа используемого коде, который может формировать код фиксированной или
переменной длины.
Доступ - считывание или запись данных с указанием того, меняется ли при этом содержимое файла. Наиболее
часто термин используется применительно к полям данных, причем чаще всего под этим словом
подразумевается разрешенный тип доступа для той или иной системы. Например, доступ к файлу только для
чтения означает, что в процессе считывания содержимое файла не изменяется и не стирается.
Идентификация - процесс определения способа влияния управляемого параметра на систему.
Избыточность - введение в систему дополнительных компонентов сверх минимально необходимого их числа с
целью повышения надежности и робастности системы. Например, при тройной модульной избыточности
параллельно разворачиваются три составляющие, причем все выполняют одну и ту же функцию. Их выводы
сравниваются, и если одна составляющая дает результат, отличный от двух других, то этот элемент считается
неисправным и игнорируется. Избыточность – это не только двух- или трехкратное резервирование технических
средств на случай отказа, но и включение лишних символов в сообщения, посылаемые через системы связи с
целью подавления шумов.
Интерпретатор - языковый процессор, который построчно анализирует исходную программу и одновременно
выполняет предписанные действия, а не формирует на машинном языке скомпилированную программу, которая
выполняется впоследствии.
Информационная система - автоматизированная система, определяющей особенностью которой является то,
что она обеспечивает информацией пользователей из нескольких организаций. Именно этимона отличается,
например, от управляющей системы реального времени, системы коммутации сообщений, среды
программирования или персональной вычислительной системы. Рассматривая диапазон возможных значений
слов "информация" и "система", можно предложить ряд более широких толкований термина "информационная
система". Можно считать, например, что он относится ко всем автоматизированным системам или, в еще более
широком смысле, ко многим системам, в состав которых не входят ЭВМ. Поэтому при рассмотрении только
автоматизированных систем иногда употребляют термин информационная система организационного типа .
Информационные системы предназначены для решения задач обработки данных, автоматизации конторских
работ, а также задач, характерных для экспертных систем. Системы, основной функцией которых является
информационное обеспечение процесса управления, обычно называют управленческими информационными
системами.
Информационная технология, технология обработки информации - совокупность технологических
элементов (например, устройств или методов), используемых людьми для обработки информации.
Информационный объект, структура данных- аспект типа данных, выражающий природу величин, которые
являются составными, то есть отличными от атомарных. Такие величины состоят из элементов (которые сами не
обязательно являются атомами), и структура данных выражает, как из этих элементов может быть составлена
некоторая величина или как составную величину разделить на элементы. Таким образом, например, структура
данных "дата" – это набор, содержащий член для каждого возможного календарного дня совместно с операциями
для составления даты из ее элементов - года, месяца и числа - и выбора желаемых элементов.
Реализация структуры данных включает как выбор определенной структуры хранения, так и обеспечение
набора процедур/функций, которые реализуют соответствующие операции с использованием выбранной
структуры хранения. Формально структура хранения данных определяется как некоторая хорошо обозначенная
область в абстрактном типе данных, которым задается эта структура. Решение на ЭВМ задач реального мира
включает определение некоторой идеальной структуры данных и ее последующее отображение на имеющиеся
структуры данных (например, массивы, записи, списки, очереди и деревья), в результате чего достигается ее
реализация. Термин "структура данных" используется как для обозначения самой структуры, так и данных,
имеющих эту структуру.
Информация- совокупность символов. В свою очередь, символы можно определить как образы, несущие
смысловую нагрузку, что является еще одним определением информации. Информацию можно создавать,
передавать, запоминать, искать, принимать, копировать (в той жеили иной форме), обрабатывать, разрушать.
Искажение - нежелательные изменения формы сигнала, возникающие между двумя точками в системах
передачи. Существует пять следующих основных типов искажения : искажения, вносимое характеристика
ми; искажение задержки; искажение от стартстопных сигналов стохастическое искажение; нелинейное
искажение.
Источник сообщений - система, порождающая сообщения. Принято рассматривать cледующие типы источников
: комбинаторные и вероятностные. Комбинаторный источник способен породить некоторое подмножество
множества всех возможных сообщений, причем все порождаемые сообщения равновероятны. Вероятностный
источник порождает любое сообщение, но различные сообщения имеют различные вероятности. Источники
сообщений могут быть, кроме того, конечными и бесконечными. Конечный комбинаторный источник можно
идентифицировать с подмножеством некоторого конечного множества. Конечный вероятностный источник
можно отождествить с распределением вероятностей на конечном алфавите. Бесконечный источник порождает
бесконечые слова некоторого алфавита или функции действительного переменного. Вероятностные источники с
конечной памятью называются марковскими, а источники без памяти, у которых вероятность порождения
очередной буквы не зависит от предыдущих букв, называются бернуллиевскими.
Кадр - полное или содержащее всю необходимую для его идентификации информацию сообщение,
используемое в системе передачи данных.
Канал передачи данных - путь передачи информации со всеми необходимыми схемами, который используется
для пересылки данных между системами или частями системы. В случае интерфейса, состоящего из нескольких
параллельных каналов, каждый канал выделяется для передачи информации одного типа, например, данных или
сигналов управления.
Квантование - процесс формирования дискретного представления количественной характеристики, которая
обычно имеет непрерывный вид.Различают квантование по уровню и времени. Уровень квантования - одно из
значений непрерывнонго сигнала, полученное в результате его квантования, шаг квантования - разность между
соседнимиуровнями квантования. Квантованием во времени называется измерение в дискретные промежутки
времени амплитуды непрерывного сигнала (термин квантование синонимичен термину ДИСКРЕТИЗАЦИЯ). В
результате замены мгновенного значения сигнала U cоответствующим уровнем квантования V возникает
погрешность р = U - V, которую называют ошибкой квантования. Эта погрешность является случайной
величиной. При квантовании сигнала U(t) по уровню случайный процессс заменяется ступенчатой зависимостью
- U1(t). Изменяющуюся во времени ошибку квантования d(t), также представляющую собой случайный процесс,
называют шумом квантования d(t) = U(t) - U1(t).
Книга шифров - один из методов преобразования исходного сообщения, называемого незашифрованным
текстом, в зашифрованный вид, называемый шифром, шифртекстом или кодом. У отправителя и получателя
имеются копии секретной таблицы подстановок. В ней перечислены коды, передаваемые в составе шифртекста в
зависимости от значения каждого байта в исходном тексте. Однако на практике обычно используются
подстановочные коды, соответствующие более длинным блокам исходного текста, например, блокам длиной 64
бит. В таких шифровальных системах подстановочные коды должны генерироваться алгоритмически
отправителем и получателем, поскольку в таблице просто не хватило бы места для записи всех подстановочных
кодов.
Код - правило преобразования сообщения из одной символической формы редставления (исходного алфавита) в
другую (объектный алфавит), обычно без каких-либо потерь информации.
Код Бодо - код для передачи данных, в которых каждый символ представляется пятью элементарными
посылками одинаковой длительности. Для разделения символов используются стартстопные посылки.
Код Грея - двоичный код, построенный таким образом, что при изменении любого числа на единицу младшего
разряда изменяется состояние только одного разряда кодовой комбинации, соответствующей исходному
числу.
Код с исправлением ошибок - код, предназначенный для кодирования в канале. Кодирование
информации позволяет с большей вероятностью успеха исправить любые ошибки, возникающие в канале при
искажении сигнала помехой. Коды с исправлением ошибок могут быть как блочными, так и сверточными,
причем в обоих случаях они применяются в системах с прямым исправлением ошибок. Наиболее часто
используемыми кодами с исправлениеми являются коды Хемминга, коды Боуза-Чоудхури-Хокенге-ма,
коды Рида-Соломона, симплексные коды и код Голея.
Код с контролем по четности - код, в котором осуществляется вычисление или проверочный расчет в целях
верификации, для выяснения, соблюдается ли предписанное условие четности. Линейные коды также относятся к
кодам с проверкой на четность. В этих кодах кодирование осуществляется с помощью порождающей матрицы, а
декодирование - с помощью матрицы проверки на четность.
Код с обнаружением ошибок - предназначен для кодирования в канале. Эти коды обычно бывают блочными и,
как правило, применяются в системах с переспросом. Для обнаружения ошибок наиболее часто используются
избыточные коды. Простая разновидность таких кодов - код с контролем по четности - играет важную роль в
технике.
Код Хемминга - семейство двоичных линейных совершенных блочных кодов с исправлением ошибок,
открытых Р.У.Хеммингом в 1950 г. Они позволяют исправить любую одиночную ошибку в блоке. Для (n,k)блочного Хемминга
m
n = 2 - 1, k = n - m,
где параметр m определяет код. При необходимости исправления кратных ошибок коды Хемминга обобщаются,
что приводит к кодам Боуза Чоудхури-Хокенгема.
Кодер-декодер - устройство, преобразующее непрерывный аналоговый сигнал в цифровой вид и декодирующее
входящие цифровые сигналы обратно в аналоговый вид. При передаче цифровых сигналов можно
осуществлять их уплотнение, что позволяет более эффективно использовать среду передачи.
Кодирование - представление сообщения в виде множества дискретных данных. Кодирование есть отображение
Ф произвольного множества М в множество слов С некоторого алфавита. Математически код
рассматривается как отображение Ф так и множество кодовых комбинаций, т.е. образ Ф(М)<=С. Обратное
относительно кодирования действие (отображение Ф(Е-1) из С в М, если такое существует) называется
декодированием.
Кодирование источника - использование в рамках заданного алфавита кодов переменной длины с целью
уменьшения числа символов в сообщении до минимума необходимого, для представления всей информации
сообщения или, по крайней мере, для обеспечения условий такого сокращения. При кодировании источника
конкретный код выбирается на основе характеристик источника сообщения (т.е. относительных вероятностей
появления различных знаков алфавита в исходной программе), а не на основе характеристик канала, по которому,
в конечном счете будет передано сообщение. Основная идея сжатого кодирования заключается в представлении
наиболее вероятных символов сообщения кодами наименьшей длины, а менее вероятных - кодами большей
длины с тем, чтобы средневзвешенная по вероятности длина кода была минимальной в пределах, задаваемых
неравенством Крафта . Наиболее широко используется кодирование по методу Шеннона-Фано и кодирование по
методу Хаффмена. Первый метод проще в вычислительном отношении, второй - эффективен при заданном
расширении источника.
Кодирование по алгоритму Хаффмена - как правило, двоичное кодирование элемента конечного множества A
= {a1, a2,..., aN}, для каждого элемента ai которого предполагается известной вероятность pi появления в
сообщении. Для этого метода двоичного кодирования выполняется префиксное условие, а кроме того, средняя
длина получаемых сообщений оказывается минимальной. Таким образом, элемент ai с высокой вероятностью
появления в сообщении будет кодироваться короткой двоичной строкой, а элемент с малой вероятностью
появления – более длинной строкой.
Кодирование по методу Шеннона-Фано - относится к методам эффективного кодирования некорреляционной
последовательности знаков. Код строят следующим образом: знаки алфавита сообщений выписывают в таблицу
в порядке убывания вероятностей. Затем их разделяют на две группы так, чтобы суммы вероятностей в каждой
из групп были по возможности одинаковы. Всем знакам верхней половины в качестве первого символа
приписывают 0, а всем нижним -1. Каждую из полученных групп, в свою очередь, разбивают на две подгруппы с
одинаковыми суммарными вероятностями и т.д. Процесс повторяется до тех пор, пока в каждой подгруппе
останется по одному знаку. Кодирование по этому методу не всегда приводит к однозначному по строению кода.
От указанного недостатка свободно кодирование по алгоритму Хаффмена.
Кодовое слово - см. блочный код.
Коды Адамара - коды, построенные на основе матриц Адамара. Это семейство квадратных матриц H,
удовлетворяющих соотношению
т
H * H = c * I,
т
здесь H -транспонированная матрица H, I - единичная матрица, элементы которых могут принимать два
значения: +1 или -1,c -скалярная константа. Базой для построения кода являются строки матрицы Адамара,
которые образуют ортонормальный базис.
Кодово-импульсная модуляция - используемый в кодере-декодере метод преобразования аналогового сигнала
в поток цифровых двоичных сигналов. Амплитуда аналогового сигнала преобразуется в дискретную форму. Для
представления преобразованной величины выбирается соответствующий цифровой код. Цифровой код
передается в пункт приема, где он используется для формирования аналогового выходного сигнала. В целях
сокращения объемов данных, которые передаются между отправителем и получателем сообщений, используется
техника кодирования, основанная на известных характеристиках аналогового сигнала.
Количество информации - мера уменьшения неопределенности ситуации вследствие того, что становится
известным исход другой ситуации.
Коммутатор - комбинационная схема, которая коммутирует один из m входов с n выходами при условии, что
Компрессия данных - любой из многих методов в теории информации, спомощью которого производится
кодирование данных с целью сокращения их избыточности. Аналогичные методы используются и при
регистрации информации. Методы сжатия позволяют, например, уменьшать объем буквенного текста в 2-5 раз.
По существу, сжатие данных - это кодирование источника. Методы сжатия широко используются при передаче и
хранении изображений.
Конечная последовательность, список - некоторая ограниченная последовательность пунктов (x , x , ..., x ), где
n > 0. Если n = 0, список не имеет позиций и называется неопределенным (или пустым) списком. При
отсутствии каких-либо оговоренных условий позиции списка могут иметь произвольную структуру. В
частности, любая позиция может также представлять собой список, называемый в этом случае подсписком. Если
список имеет один и более подсписков, его называют списковой структурой .Список без подсписков называют
последовательным списком.
Контроль по избыточности - контроль, выполняемый с помощью резервированных технических средств или
избыточной информации и обеспечивающий выдачу сведений о наличии определенных ошибок.
Контрольная сумма, метод контрольной суммы - простой метод обнаружения ошибок, основанный на анализе
некоторого набора данных или участка программы. Если этот набор представляет собой совокупность блоков
длиной m бит, то берется сумма по модулю n, где n = 2 , и ставится в конец набора. Позднее (например, после
пересылки набора данных в другое место) можно осуществить повторное вычисление контрольной суммы; при
этом будут выявлены наиболее простые (одиночные) ошибки на уровне битов. Простейшим вариантом метода (m
=1, n =2) является контроль по четности.
Контрольный двоичный разряд, контрольное число - функция, которая вычисляется с целью обеспечения
контроля группы двоичных величин (например, слов, байтов или символов) путем получения сумм битов в этой
группе по модулю 2. Получаемая сумма представляет собой избыточную величину и называется контрольным
разрядом. Этот разряд равен нулю, если число единиц в группе четное, и равен единице, если число единиц в
группе было нечетным. Такой подсчет четности приводит к расширению группы двоичных величин (исходная
группа плюс контрольный разряд) для получения четного числа единиц. Это свойство называется четностью. В
некоторых случаях, исходя из особенностей аппаратного обеспечения, желательно иметь нечетное число единиц
в расширенной группе, и контрольный разряд выбирается так, чтобы общее число единиц было нечетным. Это
свойство группы двоичных величин называется нечетностью.
Коэффициент сжатия - отношение длин сообщения до и после его сжатого кодирования (в общем случае такое
кодирование выполняется для укорачивания сообщений).
Критерий сложности - средство измерения объема ресурсов, используемых в процессе вычисления. В процессе
вычисления с помощью любой машины Тьюринга могут использоваться различные ресурсы, например,
пространство и время. Эти ресурсы формально могут быть определены следующим образом. Пусть заданы
программа M машины Тьюринга и входная цепочка x, тогда временной ресурс Time (M, x) определяется как
число шагов в вычислении M на x до останова M. Время будет неопределенным (то есть равным бесконечности),
если M не останавливается на x. Временная сложность определяется как целочисленная функция, где
T (n) = max (Time (M, x) : |x| = n)
для неотрицательного целого числа n. Аналогичным образом пространственный ресурс Space (M, x)
определяется как число квадратов ленты, используемых M на x, а пространственная сложность S - как
S (n) = max (Space (M, x) : |x| = n).
Однако, для того чтобы не путать пространство, необходимое для работы, с пространством, выделяемым для
входной цепочки x, иногда предполагается, что машина имеет ленту ввода, работающую только на считывание, а
Space (M, x) определяется как число квадратов (куда можно записывать данные), используемых M на x.
Можно также определить более общие критерии сложности, в которых сочетаются многие свойства, присущие
как времени, так и пространству.
Лексикографический порядок (поиск) - порядок слов в словаре, определяемый последовательностью букв
алфавита. В более общем случае рассматривается множество S, строго упорядоченное отношением 0 имеется
множество T n-кортежей:
(x , x , ..., x )
с элементами x S. Тогда отношение упорядочения этих кортежей можно определить так, что
(x , ..., x ) < (y , ..., y )
тогда и только тогда, когда x < y или существует некоторое k, 1 < k < n, для которого
x = y при 1 < i < k,
x<y.
Множество T лексикографически упорядочено, если кортежи расположены в соответствии с указанным
отношением. Рассмотренное понятие можно обобщить для строк неодинаковой длины. При этом порядок строк
будет совпадать с порядком слов в словаре.
Линейный канал - канал связи, в котором информационный сигнал аддитивно смешивается с помехой и в
результате образует выходной сигнал. В q-ном линейном канале с конечным числом q значений амплитуд
сигналы складываются по модулю q; в двоичном случае q =2 - это приводит к тому же результату, что и
выполнение операции исключающее ИЛИ над этими сигналами.
Логическое кодирование - представление символов алфавита последовательностями логических значений. Это
кодирование эквивалентно двоичному кодированию.
Марковская цепь - последовательность дискретных значений случайных переменных, в которой каждый член
последовательности с определенной степенью вероятности зависит только от предшествующих. В случае
эргодической марковской цепи ее элементы в любой момент обладают одними и теми же статистическими
свойствами.
Мера информации - количественная или качественная оценка информации в сообщении.
Mера Хартли - аддитивная двоичная логарифмическая мера, позволяющая вычислять количество информации в
двоичных единицах (бит)по формуле
I = n log h,
2
где n - например, длина числа (количество разрядов), а h - основание системы счисления, в которой представлено
число. В качестве n может выступать число ячеек памяти, а в качестве h – емкость ячейки памяти. Аддитивная
мера удобна тем, что она обеспечивает возможность сложения и пропорциональность количества информации
к длине числа n (предложена Р.Хартли в 1928 г.).
Mодель Шеннона - общепринятая модель, предложенная К.Э.Шенноном в 1948 г., в которой имеется источник
информации, посылающий сообщение приемнику информации с использованием средства связи или механизма
связи, называемого каналом. Согласно Шеннону, "основной проблемой связи является точное или
приблизительное воспроизведение в одной точке сообщения, переданного из другой точки". В общем случае
канал искажает сообщение и добавляет к нему помехи. Для устранения искажений и уменьшения воздействия
помех до приемлемого уровня между источником информации и каналом помещается кодер, а между каналом и
пунктом приема информации помещается декодер. Источник посылает передаваемое сообщение, которое
кодируется в передаваемый сигнал; этот сигнал посылается по каналу. В результате в месте приема появляется
принимаемый сигнал, который декодируется и дает принимаемое сообщение; это сообщение прибывает в пункт
приема информации. Считается, что в канале действует источник помех, который в дополнение к передаваемому
сигналу вводит свою "информацию". Назначением кодирующего и декодирующего устройств является
формирование принимаемого сообщения, достаточно точно совпадающего с передаваемым сообщением,
несмотря на влияние "информации", поступающей от источника помех.
Mодем - модулятор + демодулятор - устройство, способное осуществлять модуляцию и демодуляцию
информационных сигналов. Модемы используются для подключения цифровых устройств к линиям передачи
аналоговых сигналов.
Mодуляция - процесс изменения одного сигнала, называемого несущим, в соответствии с формой некоторого
другого сигнала. Несущий - это обычно аналоговый сигнал, выбираемый так, чтобы он наилучшим образом
согласовывался с характеристиками конкретной системы передачи. Сигналы и способы модуляции могут
сочетаться друг с другом с целью получения комбинированных сигналов, переносимых по нескольким
независимым информационным каналам. К основным типам модуляции относятся:
а) амплитудная модуляция (АМ), при которой сигнал несущей из меняется по мощности или амплитуде. Эта
форма модуляции в системах передачи данных в чистом виде используется сравнительно редко;
б) частотная модуляция (ЧМ), при которой изменяется частота несущей. Такой способ часто применяется в
модемах;
в)фазовая модуляция (ФМ), при которой изменяется фаза волны несущей. Этот способ модуляции часто
используется в сочетании с амплитудной модуляцией в высокоскоростных модемах;
г) импульсно-кодовая модуляция (ИКМ), при которой аналоговый сигнал кодируется сериями импульсов в
дискретном потоке данных. Такая техника модуляции используется в устройствах кодирования-декодирования;
д)спектральная модуляция (СМ), при которой волна несущей модулируется по частоте (ЧМ) аналоговым или
цифровым сигналом в сочетании с третьим, кодовым, сигналом. Такой способ применяется в военной технике в
радиосетях с пакетной коммутацией.
"Мусор" - содержащаяся в ЗУ информация которая уже недостоверна, или не нужна. Обычно она появляется в
результате уплотнения информации в памяти. Удаление из памяти этой излишней информации известно как
"сборка мусора" и, как правило, осуществляется одновременно с уплотнением.
Необнаруживаемая ошибка - ошибка, не регистрируемая подсистемой записи/считывания данных. Считается,
что причиной этого может быть неадекватность средств контроля ошибок практической реализации этих средств
или же несоответствие возникающей ошибки их возможностям.
Неопределенность - термин, используемый для обозначения меры информации.
Неравенство Крафта . Пусть необходимо сформировать из q-го алфавита однозначно декодируемый код,
причем длина i-го кодового слова должна равняться Li . Тогда неравенство Крафта Является необходимым и
достаточным условием возможности построеният акого кода, содержащего n кодовых слов. Если в коде
отсутствуют свободные кодовые слова, то неравенство переходит в равенство.
Носитель - среда для записи данных.
Память - устройство или среда, которая может сохранять информацию для последующего ее извлечения.
Параметр-1) информация, предоставляемая подпрограмме, процедуре или функции;
2) количественная величина в функции или математической модели, выбираемая или оцениваемая в
конкретных обстоятельствах.
Поиск информации - извлечение хранимой информации, одна из основных операций, осуществляемых над
информацией.
Полоса пропускания - диапазон частот с нижним и верхним пределами. Все частоты между этими пределами
(но, может быть, и какие-то другие) пропускаются фильтром или каналом с небольшим затуханием.
Помеха - любой сигнал, который возникает в электронной или коммуникационной системе и не является
передаваемым полезным сигналом (случайное колебание, значение некоторых параметров которого предсказать
невозможно) Помехи могут появляться, например, от внешних неблагоприятных воздействий и расстраивать
систему, поскольку они могут формировать ложные сигналы, то есть ошибки.
Помехоустойчивость - величина интенсивности внешнего воздействия, при которой цифровая схема может
работать безошибочно. Логические величины на выходе схемы представляются двумя различными уровнями
электрического потенциала. Любая помеха, наведенная в логической схеме внешним воздействием,
прибавляется (или вычитается) к передаваемому цифровому логическому сигналу. Запасом по
помехоустойчивости является максимальное шумовое напряжение, которое может быть добавлено или вычтено
из логического сигнала, и которое не повлияет на пороговое напряжение, необходимое для достижения
устойчивого логического состояния.
Представление с избытком - смещение (или показатель избытка), которое необходимо прибавить к порядку
числа в представлении его с плавающей точкой для получения характеристики числа. Например, порядок,
принимающий значения в диапазоне от -128 до +127, представляется 8-разрядной характеристикой с
избытком 128, при этом ее значения меняются от0 до 255.
Продольный контроль по избыточности - контроль с использованием циклического избыточного кода, как
правило, нетривиального,хотя речь может идти и о простом вертикальном контроле, то есть о простом коде с
контролем по четности, применяемом, например, вдоль каждой дорожки записи на магнитной ленте. Суть метода
контроля с использованием циклического избыточного кода состоит в следующем. С целью обеспечения
контроля данных на наличие ошибок, которые могли возникнуть в процессе передачи или при записи
(считывании), к каждому блоку добавляются дополнительные цифры. Эти цифры вычисляются на основе
содержимого блока на входе, а затем повторно вычисляются приемником или в процессе считывания.
Циклический избыточный код - это разновидность полиномиального кода. В принципе, каждый блок можно
считать полиномом. Этот полином A умножается в кодере на порождающий полином G, в результате чего
формируется полином AG. В процессе передачи или записи этого полинома к нему прибавляется полином
ошибки E:
AG + E.
В декодере эта последовательность делится на тот же самый порождающий полином G. Остаток деления
проверяется. Если он отличен от нуля, то регистрируется ошибка и предпринимаются необходимые действия. На
практике используются систематические коды, то есть полином A кодируется как
Ax + R,
где r - степень G, а R - остаток от деления Ax на G. В любом случае не регистрируются только те ошибки, для
которых G является делителем E: системотехник выбирает G таким, чтобы свести вероятность этого к
минимуму.
Пропускная способность канала - скорость передачи информации любым, сколь угодно зашумленным
каналом, которая никогда не может быть превышена без ошибки, но, в принципе, достижима с некоторой
произвольно малой вероятностью ошибки. Эта теорема была впервые сформулирована и доказана К.Э.
Шенноном в 1948 г. Он показал, что всегда существует некоторый код с исправлением ошибок, с помощью
которого можно снизить вероятность ошибки до любого заранее установленного уровня. Среди результатов,
полученных Шенноном для конкретных каналов, наиболее известным является результат, полученный для
ограниченного по мощности непрерывного канала, в котором присутствует белый гауссов шум. Если мощность
канала ограничена величиной Ps , а мощность шума - величиной Pn , то пропускная способность (бит/с) такого
канала выражается формулой C = 1/2v log (1 + Ps / Pn ). Если это дискретный во времени канал, то v - число
периодов дискретизации в секунду, а если это непрерывный во времени канал, то v - минимальное число
отсчетов в секунду, необходимое для извлечения из канала всей информации.
Протокол передачи данных - набор правил и соглашений, определяющих форматы данных и процедуры
передачи для обмена информацией между взаимодействующими процессами, функциональными или
логическими модулями, абонентскими станциями и т.д.
Распаковка - процесс преобразования информации из упакованного формата в форму, при которой можно
получить непосредственный доступ к отдельным элементам данных.
Расстояние Хемминга - d( 2u, v 0) между двумя словами u и v одинаковой длины равно числу несовпадающих
разрядов этих слов. Оно используется в теории блочных кодов, предназначенных для обнаружения и справления
ошибок. Если длина слов u и v конечна, то расстояние Хемминга между этими словами также конечно,
поскольку d(u, v) <= n. Эту меру можно называть расстоянием, так как она неотрицательна, нульрефлексивна,
симметрична и удовлетворяет неравенству треугольника
0 <= d(u, v); d(u,v) = 0, если и только если u = v ;
d(u,v) = d(v,u);
d(u,w) <= d(u,v) + d(v,w).
Расстояние Хемминга играет важную роль в теории кодов с обнаружением ошибок и кодов с исправлением
ошибок.
Расширение источника - процесс одновременного кодирования группы символов или результаты этого
процесса. Если символы q-ичного источника информации группируются в блоки длиной r и эти блоки
обрабатываются (например, кодируются) подобно символам из алфавита объемом q , то подобный составной
источник называется r-расширением исходного источника.
Свертка - в математике операция объединения двух функций w и f, в результате которой получается третья
функция g, такая, что или соответствующая непрерывная операция). Эту операцию можно рассматривать как
преобразование входной функции f в выходную функцию g путем наблюдения первой через окно w
фиксированного размера. В теории кодирования f - это сигнал, а g -отклики на него линейного канала; тогда g это результат действия на данный сигнал (рассматриваемый как последовательность элементов) временной
характеристики линейного канала. Временная характеристика канала представляет собой последовательность
элементов формируемую на выходе канала при подаче на его вход сигнала, один элемент которого имеет
амплитуду, равную единице, а все остальные элементы - нули. В этом случае говорят, что производится свертка
входной сигнальной последовательности и временной характеристики канала. Обратный процесс называется
деконволюцией: для восстановления входной сигнальной последовательности над выходной, которая была
подвергнута свертке, и последовательностью, которая представляет временную характеристику канала,
выполняется операция деконволюции. Важно (как с математической, так и с практической точки зрения), чтобы
свертка дискретных сигналов соответствовала обычному умножению многочленов.
Сверточный код - линейный код с исправлением ошибок, характеризующийся порождающей матрицей размера
kxn
G = (g [x]),
ij
элементы которой g [x] являются многочленами; наивысшая ij степень многочлена m называется памятью
кода. Величина
c = m +1
называется предельной длиной кода. Линейные блочные коды можно рассматривать как специальный случай
сверточных кодов с m = 0 и c = 1. Сверточные коды часто задаются параметрами (n, k) или (n,k,c), хотя, когда
говорят "n,k-код", обычно подразумевают блочный код, а не сверточный.
Сеть - структура с многочисленными связями, состоящая из набора ячеек различных размеров, связанных между
собой стрелками и соединенных по заданному условию в ориентированный граф, который может содержать
циклы.
Сеть связи - система, включающая несколько источников информации и (или) несколько пунктов назначения,
посредством которой источник информации может достаточно эффективно и надежно передавать эту
информацию в пункт назначения.
Сжатие данных - любой из многих методов в теории информации, с помощью которого производится
кодирование данных с целью сокращения их избыточности. Аналогичные методы используются при
регистрации информации. Методы сжатия могут уменьшать объем буквенного текста. По существу,
сжатие данных - это кодирование источника.
Сигнал - форма представления данных, при которой данные рассматриваются в виде последовательности
значений скалярной величины- амплитуды, записанной (т.е. измеренной, напечатанной или нарисованной) во
времени. Чаще всего, но не всегда, амплитудой является электрический потенциал. В информационных системах
под сигналом понимают физический процесс, отображающий (несущий) сообщение.
Символ - наименьшая единица информации в записи.
Скорость создания сообщения - так в американской литературе при заданной точности сообщения называют
эпсилон-энтропию (см. энтропия сообщения).
Скорость передачи информации - скорость, с которой от устройства или через схему может передаваться
информация. Единица измерения этой скорости обычно указывает количество информации, передаваемое за один
цикл, например, число знаков в секунду и бит в секунду. В схемах передачи данных иногда используется такая
единица скорости передачи, как бод.
Словарь - любая структура данных, представляющая собой множество элементов, для которого определены
такие операции, как вставка и удаление, а также проверка на принадлежность.
Сложность - "трудность" решения вычислительных проблем, измеренная в терминах некоторого ресурса,
потребляемого в процессе вычисления. Ресурс может быть абстрактным или конкретным, с пространственными
или временными характеристиками. Анализ сложности вычислительных проблем в настоящее время является
областью очень активных исследований и имеет важные практические применения. Существуют следующие
виды сложности: сложность систем, сложность вычислений, сложность кодирования,
Сложность систем - выделяются два общих принципа оценки сложности; они применимы к системам любого
типа. Согласно первому принципу сложность системы должна быть пропорциональна объему информации,
необходимой для описания этой системы. В данном случае слово " информация" понимается чисто
синтаксически, а не семантически и не прагматически. Одним из способов описания такой дескриптивной
сложности является оценка числа элементов, входящих в систему (переменных, состояний, компонентов), и
разнообразия взаимозависимостей между ними. В соответствии со вторым общим принципом сложность систем
должна быть пропорциональна объему информации, необходимому для разрешения любой нечеткости, связанной
с рассматриваемой нечеткостью. И в данном случае рассматривается синтаксическая информация, однако эта
информация основывается на соответствующей мере нечеткости.
Сложность колмогоровская - минимальное число двоичных знаков, содержащих всю необходимую
информацию для идентификации объекта.
Случайная выборка - выбор элементов для изучения таким образом, чтобы измерения, проведенные на
элементах выборки, дали информацию об аналогичных элементах, не вошедших в выборку, причем вероятность
включения в выборку каждого элемента одинакова. Элементы могут отбираться с помощью таблиц
случайных чисел или же с помощью механических манипуляций, например, с картами или монетами.
Случайная последовательность - последовательность символов с псевдослучайными свойствами,
предназначенная для моделирования помех.
Сокращение избыточности - уменьшение объема буквенного текста за счет использования одного из методов
кодирования (сжатие данных).
Сообщение - порция информации передаваемой в системе с коммутацией сообщений. Сообщение может быть
произвольной длины (от нескольких битов до целого файла), но никакая часть сообщения не может быть
передана конечному адресату, пока оно не будет принято целиком в узле сети, смежном с пунктом назначения.
Различаются дискретные и непрерывные сообщения. Дискретные сообщения формируются в результате
последовательной выдачи источником отдельных элементов - знаков. Разновидностью дискретных сообщений
являются данные. Непрерывные сообщения неразделимы на элементы.Они описываются функциями времени,
принимающими непрерывное множество значений. Примерами могут служить речь, телевизионное изображение.
Сортировка - процесс переупорядочивания информации по возрастанию или убыванию значений ключей
сортировки.
Спектральная модуляция - один из основных типов модуляции, при котором волна несущей модулируется по
частоте аналоговым или цифровым сигналом в сочетании с третьим, кодовым, сигналом. Такой способ
применяется в военной технике в радиосетях с пакетной коммутацией.
Стандарт на шифрование данных - алгоритм, используемый в США для шифрования сообщений.
Стартстопная передача - асинхронная передача, при которой каждой группе кодовых элементов,
соответствующих сигналу символа, предшествует сигнал начала, подготавливающий приемное устройство
к приему. Завершает передачу группы сигнал окончания, устанавивающий приемное устройство в состояние
покоя.
Стационарный источник - источник со стационарной мерой, т.е. вероятностной мерой (не зависящей от сдвига
по времени).
Теорема о кодировании источника - в теории связи: утверждение о том, что выходной поток информации из
любого источника, имеющий энтропию в H единиц на один символ, может быть закодирован с помощью
алфавита из N символов таким образом, что символы потока из источника информации будут представлены
кодовыми словами, средневзвешенная длина которых не меньше, чем
H/log N,
(где основание логарифма согласуется с единицами измерения энтропии). Кроме того, теорема утверждает, что
этому нижнему пределу можно подойти сколь угодно близко при работе с любым источником, для чего нужно
выбрать соответствующий неравномерный код и и пользовать достаточно длинное расширение источника.
Теорема была впервые сформулирована и доказана К.Э.Шенноном в 1948 г.
Упаковка - способ компактного хранения (данных) с целью сокращения объема памяти для размещения одного
и того же объема данных.Существует несколько путей достижения компактности, например, хранение
нескольких байтов в одном слове или замена повторяющегося символа или слова триплетом, включающим:
специальный код, определяющий начало триплета; один из элементов заменяемого символа или слова; число
повторений символа или слова.
Уплотнение байт - вид временного уплотнения, при котором полный байт одного подканала передается как
единое целое и байты из различных подканалов размещаются друг за другом во временных окнах.
Уплотнение памяти - один из способов перемещения блоков информации в оперативной памяти с целью
расширения свободных областей.
Фазовая модуляция - один из основных типов модуляции, при которой изменяется фаза волны несущей. Этот
способ модуляции часто используется в сочетании с амплитудной модуляцией в высокоскоростных модемах.
Файл - информация, хранимая во вспомогательном ЗУ (то есть обычно на магнитном диске или магнитной
ленте) с целью ее сохранения после завершения отдельного задания (а) или преодоления ограничений, связанных
с объемом основного ЗУ (б). В файле могут содержаться данные, программы, тексты и любая другая
информация.
Факсимиле - фототелеграф, устройство для передачи изображений. Изображение разворачивается в передатчике,
восстанавливается в приемнике и переносится на определенные сорта бумаги.
Фильтр - простая электрическая схема или несколько более сложное устройство, осуществляющее процесс
фильтрации.
Фильтрация - обработка сигнала (в простой электрической цепи или в несколько более сложном устройстве),
приводящая к изменению как формы сигнала во временной области так и образа сигнала в частотной области.
При фильтрации во временной области каждый элемент исходного сигнала заменяется последовательностью
элементов, пропорциональных ему по амплитуде, но сдвинутых по времени; сумма (в случае линейной
фильтрации) этих элементов образует новый сигнал. При фильтрации в преобразованной области элементами
исходного сигнала будут не его смещенные во времени копии, а компоненты его преобразования Фурье или
Уолша, соответствующие различным частотам или секвентам. Используется также ряд других
преобразований. Как во временной области, так и в различных преобразованных областях фильтрация играет
весьма важную роль при уплотнении. Простой, но весьма типичный пример фильтрации в частотной (Фурье-)
области связан с использованием резонансных цепей, реализующих фильтры нижних частот, полосовые
фильтры, фильтры верхних частот и режекторные фильтры. Такие фильтры широко используются в каналах
передачи данных и в модемах.
Формальный язык - конечное или бесконечное подмножество множества всех слов, образованных из
некоторого конечного набора символов. Множество называется алфавитом языка. Указанное подмножество
множества называют 1 языком над алфавитом 0 или -языком. Таким образом, в теории формальных языков под
языком понимается просто совокупность строк без всякой связи с их возможной семантикой. Несмотря на
существенную роль, которую играют бесконечные языки, их исследование ограничено классом
рекурсивно перечислимых языков.
Цифровая обработка сигналов - группа методов обработки сигналов, для которой характерно преобразование
сигналов цифровыми способами. Преимущества цифровых методов по сравнению с аналоговыми состоят в
упрощении работы с памятью (например, последовательности отсчетов можно воспроизводить при разных
скоростях и в разных направлениях), а также в расширении набора используемых арифметических операций и в
повышении допустимой сложности алгоритмов. Однако их основное достоинство состоит в возможности
беспредельного увеличения точности вычислений. Главный недостаток цифровых методов заключается в том,
что для некоторых специфических приложений они оказываются более медленными, чем аналоговые методы. К
настоящему времени разработан целый ряд специализированных цифровых устройств, имеющих при сохранении
всех названных преимуществ достаточно высокое быстродействие, что достигается, однако, ценой потери
гибкости.
Цифровая передача данных - для представления цифровых данных при их передаче используются дискретные
сигналы, принимающие конечное множество значений. В системах с гальванической связью для представления
дискретных величин (обычно 0 и 1) используются различающиеся значения напряжения (или тока).
Цифровой передаче данных свойственны весьма низкие значения коэффициента ошибок и довольно высокие
скорости. Слабые сигналы можно регенерировать, сохраняя при этом суммарную вероятность ошибки на
довольно низком уровне. Поскольку при цифровой передаче используются только логические нули и
единицы, сигналы от нескольких источников легко уплотнять цифровыми методами. Цифровые данные можно
передавать и по линиям переменного тока. Такие линии не пропускают постоянную составляющую сигнала,
поэтому здесь используется иной метод передачи. По линиям переменного тока данные передаются при
помощи аналоговых сигналов. Цифровые сигналы преобразуются в аналоговую форму при помощи устройства,
называемого модулятором.
Цифровая сортировка - алгоритм сортировки, при котором файл сначала сортируется по цифре в младшем
разряде ключа сортировки, затем по следующей значащей цифре и т.д. Завершается сортировка проходом по
цифре в старшем разряде ключа сортировки. Данный алгоритм лучше всего реализуется с использованием
связных списков.
Цифровая фильтрация - фильтрация сигналов на основе методов их цифровой обработки.
Цифровой сигнал - сигнал,значение напряжения которого в любой момент времени совпадает с одним из
нескольких (обычно двух) уровней. Двухуровневый сигнал иногда называют двоичным цифровым сигналом или
просто двоичным сигналом. В двоичных логических схемах, работающих с двумя дискретными уровнями
напряжения, один из уровней (обычно высокий) соответствует логической "1" (истина), а другой - логическому
"0" (ложь).
Частота - количество полных циклов периодически изменяющейся величины - например, импульсной
последовательности или волны - происходящих за единицу времени. Измеряется в герцах.
Частотное уплотнение - способ уплотнения, согласно которому отведенная каналу связи полоса частот делится
на логические каналы для одновременной передачи ряда сообщений. Частотное уплотнение широко используется
во всем мире для объединения речевых телефонных сигналов. При этом ширина каждого канала равна 4000 Гц,
из которых собственно сигнал занимает 3000 Гц, а остаток (он не используется) делится на две защитные полосы
по 500 Гц каждая, располагаемые по обе стороны от сигнальной полосы. Спектр каждого сигнала содержит все
частоты, начиная с нулевой, однако все сигналы накладываются на разные несущие частоты и поэтому в
частотной области не перекрываются. Несмотря на наличие защитных полос, спектральные компоненты
сигнала, выходящие за границы канала и имеющие достаточный уровень, могут попадать в соседний канал,
вызывая там шумовые помехи.
Ширина полосы - характеристика канала передачи. Обычно это диапазон частот, пропускаемых каналом. Часто
он образуется всего одной полосой пропускания, но может включать в себя несколько неперекрывающихся
полос. Ширина каждой полосы пропускания измеряется разностью между верхним и нижним частотными
пределами этой полосы; сумма всех таких разностей дает общую ширину полосы канала. Ширина полосы, как
правило, измеряется в единицах частоты, т.е. в герцах (Гц), или в числах периодов в секунду. Если же ширина
полосы рассматривается не в частотной области, то она измеряется в соответствующих подходящих единицах.
Существует несколько довольно нестрогих классификаций частотных диапазонов по ширине полосы, которые
приняты для удобства описания диапазонов в различных областях техники. Одна из них следующая: узкий
диапазон частот (до 300 Гц); диапазон тональных частот (300 ... 3000 Гц); широкий диапазон частот(более 3000
Гц).
Шифр - зашифрованный вид исходного сообщения, называемого незашифрованным текстом; применяется для
защиты сообщения и представляет собой бессмысленный набор знаков, расшифровать который может только
человек, знающий ключ. В простых шифровальных системах, например, у получателя и отправителя имеются
одинаковые копии секретного ключа, а также алгоритма, с помощью которого каждый из них формирует
идентичные псевдослучайные последовательности знаков. В процессе шифрования отправитель изменяет
цепочку знаков исходного текста путем ее объединения с псевдослучайной последовательностью с
использованием сложения по модулю 2; в результате получается шифртекст, который затем передается
получателю. Получатель выполняет обратную процедуру, вычитая псевдослучайную последовательность из
полученного шифртекста. Тем самым восстанавливается исходный текст.
Шифратор - 1) аппаратное или программное средство, при помощи которого осуществляется кодирование.
Процесс кодирования имеет алгоритмический характер;
2) логическая схема, реализуемая, как правило, в интегральном виде и вырабатывающая на выходе
определенное двоичное слово длиной n бит в зависимости от того, на каком из его 2 .:. входов присутствует
логическая "1". Например, шифратор клавиатуры используется для выработки определенного двоичного кода,
соответствующего нажатой клавише. Если логическая "1" может присутствовать одновременно на нескольких
входах, то применяется приоритетный шифратор, который обычно реагирует только на самый старший разряд
входного слова.
Шифрование - обработка сообщения отправителем с целью преобразования его к виду, не понятному
несанкционированному пользователю. Существует множество методов преобразования исходного сообщения в
зашифрованный вид. Например, при шифровании по методу РСА (предложенному Ривестом, Шамиром и
Адлеманом) ключ, используемый для шифрования, не совпадает с ключом, нужным для деширования; по этой
причине данный метод иногда называют шифрованием по открытому ключу. Сообщение зашифровывается
путем преобразования его в целое число, например, M, возведения этого числа в степень e (общеизвестную) и
образования остатка от деления его на делитель n (общеизвестный), в результате чего образуется шифрованное
сообщение S. Дешифрование производится посредством аналогичного возведения S в степень d (засекреченную)
и повторного формирования остатка от деления на n; результатом будет получение числа M. Метод основан на
выборе n как произведения двух строго засекреченных простых чисел p и q. Значения e и d выбираются таким
образом, что
e * d = 1 mod - ((p - 1) * (q - 1)).
Секретность обеспечивается в значительной степени за счет трудности отыскания простых множителей числа n.
Шум - любой сигнал, который возникает в электронной или коммуникационной системе, и не является
передаваемым и полезным. Шумы могут появляться, например, от внешних неблагоприятных воздействий и
расстраивать систему, поскольку они могут формировать ложные сигналы, т.е. ошибки.
Шум квантования - действующий непрерывный шум, наложение которого на непрерывный сигнал приводит к
тому же результату, что и квантование непрерывного сигнала по амплитуде. Эффект квантования во времени
тоже может быть описан как наложение шума, но такое описание будет очень сложным.
Элемент данных - наименьшая информационная посылка, влияющая на исход вычисления.
Энтропия - мера количества информации, вырабатываемой источником, пропускаемой каналом или попадающей
к получателю (в пересчете на символ или секунду). Понятие энтропии в теории информации было введено
К.Э.Шенноном в 1948 г. и позднее развито другими исследователями. Энтропия дискретного источника без
памяти с алфавитом A = {a } объема n и выходом X в момент времени t
H(X) = p(x ) log b (1/p(x )),
где p(x ) = Prob (X = a ). Основание логарифма b выбирают из соображения удобства пересчета. Обычно
b = 2;
b = e = 2,71828 ...
или
b = 10;
в этих случаях энтропияизмеряется соответственно в битах, натуральных единицах, или натах, 0 и в 1 Хартли.
Если рассматривается источник с памятью, то следует учитывать зависимость между последовательными
символами, вырабатываемыми источником. Термин " энтропия" взят по аналогии с энтропией в термодинамике,
где она определяется выражением, имеющим ту же форму с точностью до физического масштабного множителя
k(постоянная Больцмана) и знака. Поэтому иногда для обозначеия меры информации пользуются термином
негэнтропия, неопределенность или просто "информация".
Энтропия сообщения - при заданных условиях точности это числовая мера сложности передачи сообщения при
заданных условиях относительно качества его воспроизведения. Энтропией сообщения H (v) при заданных
условиях точности воспроизведения сообщения W называется число
H (v) = inf (v,V),
w
где v..::X: - сообщение, вырабатываемое источником сообщений, V X с волной - воспроизводимое сообщение,
I(v,V ) - количество информации, содержащееся в V относительно v. Нижняя грань в формуле для H (v) берется
по всевозможным парам случайных величин кси и кси с волной, удовлетворяющих заданным условиям W
воспроизведения сообщения.
Эпсилон-энтропия - мера неопределенности непрерывного распределения. Пусть, например, p(x) - плотность
вероятности случайной величины psi , принимающей значения на [0,1]. Разобьем [0,1] на отрезки del(i) длиной
eps и определим p(i) = интеграл с нижней границей del(i) от p(x)dx.
Тогда эпсилон-энтропия определяется как
H
= - ∑ p(i) log p(i)*del(i).
eps
Из приближенного представления интеграла видно, что Н
приблизительно = - неопред.интеграл от 0 до 1 eps
p(x) log p(x)d(x) - log eps.
Эргодический источник - дискретный источник информации, обладающий тем свойством, что его выходной
сигнал в определенный момент времени имеет те же статистические свойства, что и в любой другой момент
времени. Очевидно, что дискретные источники информации без памяти (т.е. такие, у которых выходной сигнал
в любой момент времени не зависит от своей предыстории) всегда являются эргодическими. Дискретный
источник с памятью (т.е. такой, у которого выходной сигнал в какой-либо момент времени может зависеть от
своих значений, имевших место в несколько предшествующих моментов времени) является эргодическим только
в том случае, если он моделируется эргодической цепью Маркова.
Язык описания данных (ЯОД) - часть (подъязык) языка базы данных. Известно, что данные требуется
описывать на нескольких уровнях абстрагирования, а на каждом уровне будет использоваться свой ЯОД.
Описание на любом уровне называется схемой . Обычно различают три уровня описания данных или схем
описания. Первый - это концептуальный уровень, на котором описываются взаимосвязи между элементами
данных, вытекающие из взаимосвязей в "реальном мире" проблемной области; описание на этом уровне является
частью описания системы и называется концептуальной схемой . Второй уровень- это логический уровень. На
этом уровне описывается, как выбранные заимосвязи будут представлены в структуре записей базы данных.
Третьим является физический уровень. На нем описывается, как структуры записи будут представлены в
первичной и вторичной памяти. Описания на втором и третьем уровнях используются в процессе проектирования
системы и называются внутренними схемами . Кроме описания базы данных как единого целого на этих уровнях
абстракции часто требуется ее описание под разными углами зрения; каждое из этих описаний можно грубо
считать частичным или переопределенным описанием базы данных. Такие описания часто называют внешними
схемами или подсхемами. Язык описания данных, позволяющий описывать базу данных под различными углами
зрения, должен обеспечивать определение соотношения между глобальным описанием базы данных и каждым из
этих описаний на любом уровне абстракции.
Языковая конструкция - одна или несколько синтаксических структур, используемых в языке для указания
узкого класса операций. Это словосочетание часто употребляется как синоним термина "управляющая труктура".
Скачать