Двоичное кодирование текстовой информации

advertisement
Двоичное кодирование
текстовой информации
copyright © МОУ "СОШ №58" г. Магнитогорска, 2008г., Понкратова М.В.
Введение
Лекция, объяснение учителя,
сочинение, контрольные и т.д.
Домашнее задание
Литературное творчество
Записи
проблемы
замазывание
зачёркивание
стирание
заклеивание
РЕЗУЛЬТАТ
Испорченный вид текста
Лишний расход бумаги
► Имея
компьютер, можно создавать тексты,
не тратя на это бумаги.
► Носителем текста становится память ЭВМ.
► Для длительного сохранения текста
должна быть использована внешняя
память – магнитные диски (винчестер,
floppy), Flash-память, лазерные диски.
Преимущества
Компактное размещение (500 стр. текста=1 дискета);
Ненужный текст можно стереть;
Нужные файлы можно скопировать в любом количестве на другие
носители;
Файл с текстом можно быстро переслать по электронной почте.
Неудобство
Решение
Прочтение текста только
с помощью компьютера
ЭКОНОМЯ БУМАГУ,
МЫ СОХРАНЯЕМ ЛЕСА
НА НАШЕЙ ПЛАНЕТЕ
Кодирование текстов
Текстовая информация состоит из
символов: букв, цифр, знаков препинания,
скобок и др. символов
Алфавит – это множество всех символов,
с помощью которых записывается текст.
Мощность алфавита – это число
символов в нём.
Компьютерный алфавит
N = 256
Информационный вес символа
8 бит (1 байт )
Двоичный код каждого символа в
компьютерном тексте
1 байт
Какой именно восьмиразрядный
двоичный код поставить в
соответствие каждому символу
Все символы компьютерного
алфавита пронумерованы от 0 до 255.
Каждому номеру соответствует
восьмиразрядный двоичный код от
00000000 до 11111111.
Этот код просто порядковый номер
символа в двоичной системе
счисления.
Таблица кодировки – это таблица, в
которой всем символам
компьютерного алфавита
поставлены в соответствие
порядковые номера.
• Для разных типов компьютеров
используются различные таблицы
кодировки.
• С распространением ПК типа IBM PC
международным стандартом стала
таблица кодировки под названием
ASCII (American Standart Code for
Information Interchange) –
Американский стандартный код для
информационного обмена.
Стандартная часть таблицы:
0(00000000)…31(00011111) –
служебные символы
32(00111111)…127(01111111) – латинский
алфавит, цифры, знаки препинания
Вариативная часть таблицы:
128(10000000) - 255(11111111) –
русский алфавит
Обратите внимание!!!
В таблице латинские буквы (прописные
и строчные) располагаются в
алфавитном порядке.
 Расположение цифр также
упорядочено по возрастанию значений.
 Это правило соблюдается и в других
таблицах кодировки и называется
принципом последовательного
кодирования алфавитов.
 Благодаря этому понятие «алфавитный
порядок» сохраняется ив машинном
представлении символьной информации.

ПРИМЕРЫ
Запишем внутреннее представление слова
«file».
Очевидно, в памяти компьютера оно
займёт 4 байта со следующим
содержанием:
01100110 01101001 01101100 01100101
Какое слово записано следующим
двоичным кодом?
01100100 01101001 01110011 01101011
«disk»
Самостоятельная работа


Закодируйте в двоичной форме
свою фамилию, записанную
латинскими буквами, используя
таблицу 3.1.
Закодируйте короткую фразу на
русском языке. Обменяйтесь
полученными кодами с соседом по
парте и раскодируйте тексты друг
друга.
Download