Символы Знак, который мы видим на экране или напечатанный на бумаге, называется символ (character). Пробел между словами – тоже символ. Числа и символы Мы знаем, что привычные для нас десятеричные числа представлены в компьютере как двоичные. Но удобно ли будет нам смотреть на длинные ряды нулей и единиц на экране? 0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 В компьютерной технике принято рассматривать цифру как число и как символ. Помимо цифр, на мониторы ЭВМ необходимо выводить еще и множество символов: математические знаки, буквы, знаки препинания и т. п. Ясно, что для вывода каждого символа необходим некий машинный код, однозначно соответствующий каждому символу. Согласно этому коду можно организовать корректный вывод каждого символа на дисплей. Таблица символов Давайте подсчитаем, сколько необходимо символов для вывода информации на дисплей. Исторически сложилось так, что первые разработчики компьютеров были носителями английского языка. Что им было необходимо обеспечить для вывода на монитор? Во-первых, 26 букв английского алфавита (строчных), вовторых, 26 прописных, 9 знаков препинания (. , : ! " ; ? ( ) ), пробел, 10 цифр, 5 знаков арифметических действий (+ - * / ^) и специальные символы (№ % _ # $, и так далее & > < | \). Получается чуть больше сотни символов. Такой набор символов можно закодировать при помощи семиразрядного двоичного числа, то есть 7 байтами. Получилось 128 позиций. Таблица символов получила название ASCII (American Standard Code for Information Interchange - Стандартный американский код обмена информацией). Система кодировки ASCII Первые 32 символа таблицы ASCII (от 00 до 31) используются для непечатаемых символов. Они предназначены для управления печатающим устройством и т.п. Остальная часть – от 32 до 127 – обычные (печатаемые) символы. Структурные свойства таблицы На первый взгляд кажется, что цифры в таблице имеют странные номера – от 48 до 57. Но это только в десятеричном выражении. Если мы посмотрим на их номера в двоичном счислении, мы можем заметить строгую закономерность. Цифры 0 — 9 представляются своими двоичными значениями (например, 5 = 0101), перед которыми стоит 0011. Таким образом, числа превращаются в символы с помощью простого добавления слева 0011, а символы в числа, если слева убрать 0011. Структура алфавита Если мы посмотрим на двоичные коды букв, мы увидим следующую закономерность: Перед заглавными буквами A-Z (верхнего регистра) стоит 010. Перед строчными буквами a-z (нижнего регистра) стоит 011. Буквы представляются своими порядковыми номерами в алфавите, записанными в двоичной системе счисления (00001 – 11010), что соответствует 1 - 26. Это упрощает преобразование регистра и сортировку по алфавиту. Управляющие символы Поскольку ASCII изначально предназначался для обмена информацией (по телетайпу), в нём, кроме информационных символов, используются символы-команды для управления связью. Управляющие символы имеют коды от 0 до 31, не выводятся на дисплей и не печатаются. Вот некоторые из них: 03, ETX — End of Text, конец текста. Сочетание клавиш Ctrl-C, имеющее код 03, часто используется для прекращения работы программ. 07, BEL — Bell, звонок, звуковой сигнал. 08, BS — Backspace, стирает предыдущий символ. 10, LF — Line Feed, перевод строки. 12, FF — Form Feed, прогон страницы, новая страница. 13, CR — Carriage Return, возврат каретки