Двоичное кодирование текстовой информации • Компьютеры не с самого рождения могли обрабатывать символьную информацию. Лишь с конца 60-х годов они стали использоваться для обработки текстов и в настоящее время большинство пользователей ПК занимаются вводом, редактированием и форматированием текстовой информации. • Традиционно для кодирования одного символа используется 1 байт информации. • При вводе в компьютер текстовой информации происходит ее двоичное кодирование, изображение символа преобразуется в его двоичный код. Пользователь нажимает на клавиатуре клавишу с символом, и в компьютер поступает определенная последовательность из восьми электрических импульсов (двоичный код символа). Код символа хранится в оперативной памяти компьютера, где занимает один байт. • В процессе вывода символа на экран компьютера производится обратный процесс - декодирование, то есть преобразование кода символа в его изображение. • Важно, что присвоение символу конкретного кода это вопрос соглашения, которое фиксируется в кодовой таблице. Стандартная часть таблицы кодов ASCII • Первые 32 кода отданы производителям аппаратных средств и называются они управляющие, т.к. эти коды управляют выводом данных. Им не соответствуют никакие символы. • Коды с 32 по 127 соответствуют символам английского алфавита, знакам препинания, цифрам, арифметическим действиям и некоторым вспомогательным символам. Коды национального (русского) алфавита • Коды расширенной части таблицы ASCII отданы под символы национальных алфавитов, символы псевдографики и научные символы. Альтернативные системы кодирования кириллицы 1. Система кодирования КОИ-7 (код обмена информацией, семизначный), действовавшая в СССР. Была вскоре вытеснена американским: кодом ASCII во вторую, расширенную часть системы кодирования с кодами от 128 по 255. 2. Кодировка Windows-1251. Была введена извне компанией Мiсrosоft. Так как программный продукт этой компании - операционная система Windows глубоко закрепилась и широко распространилась, то кодировка Windows-1251 получила широкое применение на компьютерах, работающих под управлением именно этой операционной системы. 3. Кодировка КОИ-8 широко распространена на территории России и в российском секторе Интернета. 4. Кодировка ISO (lntemational Standard Organization – Международный институт стандартизации) содержит символы русского алфавита, но на практике используется редко. 5. Кодировка ГОСТ - альтернативная. Действует на компьютерах в операционных системах MS-DOS. 6. Система UNICODE. Для представления каждого символа в этом стандарте используются два байта: один байт для кодирования символа, другой для кодирования признака. Двухбайтовое описание кодов символов позволяет закодировать очень большое число символов из различных письменностей. Так, в документах Unicode могут соседствовать русские, латинские, греческие буквы, китайские иероглифы и математические символы. Закрепление изученного • • • • • • • • • • • • №1. Закодируйте с помощью таблицы ASCII слова: А) Excel; Б) Access; В) Windows; Г) ИНФОРМАЦИЯ. №2. Буква «i» в таблице кодов имеет код 105. Не пользуясь таблицей, расшифруйте следующую последовательность кодов: 102, 105, 108, 101. №3. Десятичный код буквы «е» в таблице ASCII равен 101. Не пользуясь таблицей, составьте последовательность кодов, соответствующих слову help. №4. Десятичный код буквы «i» в таблице ASCII равен 105. Не пользуясь таблицей, составьте последовательность кодов, соответствующих слову link. №5. Декодируйте следующие тексты, заданные десятичным кодом: А) 192 235 227 238 240 232 242 236; Б) 193 235 238 234 45 241 245 229 236 224; В) 115 l1l 102 116 119 97 114 101. №6. Во сколько раз увеличится информационный объем страницы текста при его преобразовании из кодировки Windows 1251 (таблица кодировки содержит 256 символов) в кодировку Unicode (таблица кодировки содержит 65536 символов)? №7. Каков информационный объем текста, содержащего слово ПРОГРАММИРОВАНИЕ: А) в 16битной кодировке; Б) в 8-битной кодировке. №8. Текст занимает ¼ Кбайта. Какое количество символов он содержит? №9. Текст занимает полных 6 страниц. На каждой странице размещается 30 строк по 80 символов. Определить объем оперативной памяти, который займет этот текст. №10. Свободный объем оперативной памяти компьютера 320 Кбайт. Сколько страниц книги поместится в ней, если на странице: А) 32 строки по 32 символа; ) 64 строки по 64 символа; В) 16 строк по 32 символа. №11. Текст занимает 20 секторов на двусторонней дискете объемом 360 Кбайт. Дискета разбита на 40 дорожек по 9 секторов. Сколько символов содержит текст? Домашнее задание • §2.10. Двоичное кодирование текстовой информации • Стр.111 практические задания • №2.29, 2.30, 2.31