Кодирование текстовой информации. Единицы измерения

advertisement
Единицы измерения
информации
Кодирование
текстовой информации
Единицы измерения информации
Наименьшая единица количества информации - 1бит
Наименьшая единица измерения информации – 1 байт
Наименьшая единица хранения информации - файл
1 бит = 0/1
1 байт = 8 бит = 28 бит = 256 значений
1 Кбайт = 210 байт = 1024 байт
1 Мбайт = 210 Кбайт = 1024 Кбайт = 1 048 576 байт;
1 Гбайт = 210 Мбайт = 1024 Мбайт = 1 073 741 824 байт;
1 Тбайт = 210 Гбайт = 1024 Гбайт = 1 099 511 627 776 байт.
байт
байт
20
килобайт
Кбайт
210
мегабайт
Мбайт
220
гигабайт
Гбайт
230
терабайт
Тбайт
240
петабайт
Пбайт
250
эксабайт
Эбайт
260
зеттабайт
Збайт
270
йоттабайт
Йбайт
280
ASCII
(American Stsndart Cod for Information Interchange)
Институт стандартизации США ввел в
действие систему кодирования ASCII.
В системе ASCII закреплены таблицы
кодирования некоторых специальных
символов, строчных и прописных русских
и латинских букв, цифр, знаков
препинания и арифметических действий
и других.
ASCII
Каждому символу ASCII соответствует
8-битовый двоичный код:
А - 01000001; В – 010000010;
С – 010000011; D – 01000100 и т.д.
При записи текстового файла на диск,
каждый символ текста хранится в памяти
компьютера в виде набора из восьми
нулей и единиц.
Windows - 1251
Кодировка символов русского языка
введена компанией Microsoft.
Эта кодировка используется на некоторых
локальных компьютерах, работающих на
платформе Windows.
Каждому символу в этой кодировке
соответствует 8-битовый двоичный код.
КОИ - 8
Встречается в компьютерных сетях на
территории России и в российском секторе
Интернета.
Код обмена информацией - восьмизначный
UNICODE
Система, основанная на 16-разрядном
кодировании символов.
Шестнадцать разрядов позволяют
обеспечить уникальные коды для 65536
различных символов.
Каждому символу в этой кодировке
соответствует 16-битовый (2-байтовый)
двоичный код.
Пример 1. Определить количество
информационного объема выражения:
«Жесткий диск», записанного в кодировке
UNICODE.
Решение. В системе UNICODE каждый
символ кодируется 2 байтами. В
выражении 12 символов. Следовательно,
информационный объем этого
выражения равен
12 * 2 = 24 байта
Пример 2. Каждая станица текста состоит из 32 строк, в
каждой строке по 64 символа. Определить максимальное
количество станиц такого текста (без учета символов
форматирования), записанного в кодировке КОИ-8 на USB
Flash drive (UFD) емкостью 512 Мб.
Решение. В кодировке КОИ-8 каждый символ кодируется
одним байтом. Информационный объем страницы данного
текста составляет
32 * 64 = 2048 байт.
Емкость UFD
512 Мб = 512 * 1024 * 1024 = 536870912 байт.
Следовательно, максимальное количество страниц
указанного текста, записанного в кодировке КОИ-8 на UFD
емкостью 512 Мб, равно
536870912 : 2048 = 362144 страницы.
Download