Важной операцией в информатике является сложение по модулю. Это операция арифметического сложения, при котором единица переноса в старший разряд, если таковая образуется при поразрядном сложении, отбрасывается. Обычно при выполнении этой операции конкретизируют, о каком модуле идет речь, например, по модулю 10, или по модулю 2, или по модулю 16. Обозначается эта операция .
Таблица сложения двоичных чисел по модулю 2 приведена ниже (обозначения строк и столбцов соответствуют слагаемым):
Обратите внимание, при сложении по модулю 1+1=0!
УМНОЖЕНИЕ
Операцию умножения можно производить привычным способом в столбик:
1 1 1 0 1
*
1 0 0 1 0
___________
0 0 0 0 0
1 1 1 0 1
0 0 0 0 0
0 0 0 0 0
1 1 1 0 1
____________________
1 0 0 0 0 0 1 0 1 0
КОДИРОВАНИЕ СИМВОЛОВ. ВИДЫ КОДИРОВОК. ТАБЛИЦЫ ASCII. UNICODE
Помимо цифр, на мониторы ЭВМ необходимо выводить еще и множество символов. Ясно, что для вывода каждого символа необходим некий машинный код, однозначно соответствующий этому символу, или некое правило, по которому можно организовать корректный вывод каждого символа на дисплей. Разумеется, разрабатывать такую систему ввода-вывода следует оптимальным образом с точки зрения потребления ресурсов компьютера. Особенно важно в этом случае помнить о том, что производительность компьютеров в отдаленные времена зарождения вычислительной техники была ничтожной, с современных позиций, а системные программисты и разработчики аппаратной части боролись за каждый бит, адрес, инструкцию, регистр, освобождая оперативную память и адресное пространство компьютерных "малышей".
Давайте подсчитаем, сколько необходимо символов для вывода информации на дисплей. Исторически сложилось так, что первые разработчики компьютеров были носителями английского языка. Что им было необходимо обеспечить для вывода на монитор? Во-первых, 26 букв английского алфавита (строчных), во-вторых, 26 прописных, 9 знаков препинания (.,:! ";? ()), пробел, 10 цифр, 5 знаков арифметических действий (+,-,*, /, ^) и специальные символы (№ % _ # $, и так далее ^, &, >, <, |, \). Получается чуть больше сотни символов. Такой сравнительно небольшой базовый набор символов можно закодировать при помощи таблиц соответствия этого набора машинным кодам (фактически, двоичным числам). Можно вполне ограничиться набором двоичных чисел от 0 до 27 (всего 128 позиций), что и было сделано. Таблица соответствия получила название ASCII (A merican S tandard C ode for I nformation I nterchange). В рамках таблицы ASCII создание многоязычных документов являлось очень проблематичной, а в большинстве случаев и совершенно невыполнимой задачей.
Рассмотрим структуру таблицы ASCII. Для удобства символы в ней пронумерованы в шестнадцатеричной системе счисления от 0 - 7F. Первые знакоместа в таблице занимают непечатаемые символы (0 до 7F), затем следуют печатаемые символы (20 - 7F).
ТАБЛИЦА ASCII
Непечатаемые символы
Число | Команда | Значение |
NUL | NULL | |
SOH | Start of Heading | |
STX | Start of Text | |
ETX | End of TeXt | |
EOT | End Of Transmission | |
ENQ | ENQurity | |
ACK | ACKnolidgement | |
BEL | BELl | |
BS | Back Space | |
HT | Horizontal Tab | |
A | LF | Line Feed |
B | VT | Vertical Tab |
C | FF | From Feed |
D | CR | Carriage Return |
E | SO | Shift Out |
F | Si | Shift In |
DLE | Data Link Escape | |
DC1 | Device Control 1 | |
DC2 | Device Control 2 | |
DC3 | Device Control 3 | |
DC4 | Device Control 4 | |
NAK | Negative ACKnolidgement | |
SYN | SYNcronous idle | |
ETB | End of Transmission Block | |
CAN | CANcel | |
EM | End of Medium | |
1A | SUB | SUBstitude |
1B | ESC | ESCape |
1C | FS | File Separator |
1D | GS | Groupe Separator |
1E | RS | Record Separator |
1F | DC1 | Unit Separator |
Печатаемые символы
Число | Символ | Число | Символ | Число | Символ | Число | Символ | Число | Символ | Число | Символ |
пробел | . | @ | P | ' | p | ||||||
! | A | Q | a | q | |||||||
" | B | R | b | r | |||||||
# | C | S | c | s | |||||||
$ | D | T | d | t | |||||||
% | E | U | e | u | |||||||
& | F | V | f | v | |||||||
' | G | W | g | w | |||||||
( | H | X | h | x | |||||||
) | I | Y | i | y | |||||||
2A | * | 3A | 4A | J | 5A | Z | 6A | j | 7A | z | |
2B | + | 3B | : | 4B | K | 5B | [ | 6B | k | 7B | { |
2C | , | 3C | ; | 4C | L | 5C | \ | 6C | l | 7C | | |
2D | - | 3D | < | 4D | M | 5D | ] | 6D | m | 7D | } |
2E | . | 3E | > | 4E | N | 5E | ^ | 6E | n | 7E | ~ |
2F | / | 3F | ? | 4F | O | 5F | _ | 6F | o | 7F | DEL |
Однако базового набора кодов стало быстро не хватать. Возросший дефицит знакомест в стандартной таблице ASCII потребовал ее немедленного расширения. В результате возникла новая таблица кодировок, получившая название " расширенная таблица ASCII ", число знакомест в которой возросло до 28 (256 знакомест). Эта таблица получила название международного стандарта IS 646, а восьмибитный код - Latin-1. В него были добавлены в основном латинские буквы со штрихами и диакритические символы. Вскоре появился новый стандарт IS 8859, в котором вводилось понятие "кодовая страница", т.е. набор из 256 символов для определения языка или группы языков, т.е. IS 8859-1 это Latin-1, IS 8859-2 включал славянские языки с латинским алфавитом (чешский, польский, вергерский), IS 8859-3 включал турецкий, мальтийский, эсперанто, галисийский языки, и т.д. Недостатком такого подхода является то, что программное обеспечение должно следить за кодовыми страницами, смешивать языки при этом невозможно, кроме того не были созданы кодовые страницы японского и китайского языков.
UNICODE
В январе 1991 года возник консорциум UNICODE (Unicode Consortium), целью которого является продвижение, развитие и реализация стандарта Unicode как международной системы кодирования для обмена информацией, а также поддержание качества этого стандарта в будущих версиях.
Стандарт UNICODE 4.0 представляет собой новую систему кодирования символов, выводимых на экран монитора или на принтер, позволяющую закодировать 1 114 112 символов (в стандарте из принято называть code points). Большинство символов, используемых в основных языках мира занимают 65 536 code points, образуя Basic Multilingual Plane (BMP) (Основной Многоязычный Уровень - мой перевод). Оставшиеся (более миллиона) code points вполне достаточно для кодирования всех известных символов, включая малораспространенные языки и исторические знаки. Стандарт UNICODE поддерживается тремя формами, 32-битной (UTF-32), 16-битной (UTF-16) и 8-битной (UTF-8). Восьмибитная форма UTF-8 была разработана для удобной совместимости с ASCII-ориентироваными системами кодирования. Стандарт UNICODE совместим с Международным стандартом International Standard ISO/IEC 10646.
Наиболее просто устроена форма UTF-32. В ней каждый символ закодирован при помощи 32-битного блока. Благодаря этому каждый символ UTF-32 обладает однозначным соответствием между декодированным символом и блоком кода. Это форма имеет фиксированную длину знакоместа. Она покрывает все кодовое пространство UNICODE - 0...10FFFF16. Это гарантирует полную совместимость с UTF-16 и UTF-8. Форма UTF-32 является наиболее предпочитаемой для большинства UNIX платформ.
Стандарт UNICODE содержит 96 382 символа, взятых их мировых шрифтов. Этих символов более чем достатонно для общения на всех известных языках мира, а также для написания классических (исторических) шрифтов многих языков. UNICODE всключает в себя шрифты европейских алфавитов, средне-азиатское письмо, направленное справа на лево, шрифты Азии, и многие другие. Подмножество символов (code points) HUN включает 70 207 идеографических символов определяемых по национальным и промышленным стандартам Китая, Японии, Кореи, Тайвани, Вьетнама и Сингапура. Более того, UNICODE содержит знаки пунктуации, математические символы, технические символы, герметрические фотмы и графические метки (dingbats), фонетические знаки.
Ниже приведена сравнительная таблица кодов ASCII и UNICODE, взятая из Фрагмента спецификации UNICODE 4.0 (Unicode Standard, Version 4.0), размещенного на сайте Unicode Consortium.
Кодовая таблица для кириллицы приведена на следующем рисунке (взято из Фрагмента спецификации UNICODE 4.0 (Unicode Standard, Version 4.0), размещенного на сайте Unicode Consortium.
УПРАЖНЕНИЯ
1. Представить десятичные числа в двоичной, восьмеричной, шестнадцатеричной системах счисления:
2. Представить двоичные числа в десятичной системе счисления:
3. Представить восьмеричные числа в десятичной системе счисления:
4. Представить шестнадцатеричные числа в десятичной системе счисления:
A5FFB | B2FCD | 3AE5C | 1FBCA | F2EBD |
5. Вычислить:
(F5BCD-10011011)+(BABA+DEDA)-(10011011*1101)+327Q-65Q
6. Представить десятичные дробные числа в десятичной системе счисления:
0,3157 | 0,6725 | 3,14159 | 5,9876 | 10,3647 |
7. Представить десятичные отрицательные числа в десятичной системе счисления:
-378 | -567 | -789 | -198 | -689 |
8. Вычислить и представить в двоичной системе:
0,7*(-19+(-17)); 0,3*(8-(-7)); 0,9*(12+(-4))
9. Вычислить, используя дополнительный код:
7-3; -7-3; -5+(-13); 9-(-7); -10-10; 9-(-5)
10. Используя буквенно-цифровой код, записать:
I like Arithmetical basics of computers. We need study hard. Long live our University!
Приложение
Таблица степеней оснований основных систем счисления
Таблица соответствия первых 17 положительных чисел основных систем счисления
KOI-8R
Кодировка KOI-8R (KOИ-8, Код Обмена Информацией, 8-ми битный) позволяет кодировать 28 = 256 символов, в число которых входят 31 прописная и 32 строчных букв русского алфавита, 26 прописных и 26 строчных букв латинского алфавита, 10 цифр, 32 служебных знака и специальные символы, предназначенные для управления устройствами и передачи данных. Коды в диапазоне 21-5F соответствуют одинаковым символам как для KOI-7, так и для KOI-8R.
Код | Символ | Код | Символ | Код | Символ | Код | Символ | Код | Символ | Код | Символ | Код | Символ | Код | Символ | Код | Символ | Код | Символ |
пробел | @ | P | \ | p | С0 | ю | D0 | п | E0 | Ю | F0 | П | |||||||
! | A | Q | а | q | С1 | а | D1 | я | E1 | А | F1 | Я | |||||||
" | B | R | b | r | С2 | б | D2 | р | E2 | Б | F2 | Р | |||||||
# | C | S | c | s | С3 | ц | D3 | с | E3 | Ц | F3 | С | |||||||
$ | D | T | d | t | С4 | д | D4 | т | E4 | Д | F4 | Т | |||||||
% | E | U | e | u | С5 | е | D5 | у | E5 | Е | F5 | У | |||||||
& | F | V | f | v | С6 | ф | D6 | ж | E6 | Ф | F6 | Ж | |||||||
' | G | W | g | w | С7 | г | D7 | в | E7 | Г | F7 | В | |||||||
( | H | X | h | x | С8 | х | D8 | ь | E8 | Х | F8 | Ь | |||||||
) | I | Y | i | y | С9 | и | D9 | ы | E9 | И | F9 | Ы | |||||||
2A | * | 3A | : | 4A | J | 5A | Z | 6A | j | 7A | z | СA | й | DA | з | EA | Й | FA | З |
2B | + | 3B | ; | 4B | K | 5B | [ | 6B | k | 7B | ( | СB | к | DB | ш | EB | Х | FB | Ш |
2C | , | 3C | < | 4C | L | 5C | \ | 6C | l | 7C | | | СС | л | DC | э | EC | Л | FC | Э |
2D | - | 3D | = | 4D | M | 5D | ] | 6D | m | 7D | ) | СD | м | DD | щ | ED | М | FD | Щ |
2E | . | 3E | > | 4E | N | 5E | ^ | 6E | n | 7E | - | СE | н | DE | ч | EE | Н | FE | Ч |
2F | / | 3F | ? | 4F | O | 5F | Ъ | 6F | o | 7F | "забой" | CF | о | DF | ъ | EF | О | FF | "забой" |