История развития вычислительных средств и ЭВМ привела к возможности отражения информационных процессов в двух формах: непрерывной и дискретной. Первая форма реализована в так называемых аналоговых вычислительных машинах и ряде приборов (осциллографах и т.п.). Данная форма представления информации сегодня остается востребованной для наблюдения непрерывных процессов, таких как кардиограмма, напряжение и сила тока в сети и др.
Дискретный способ отражения сегодня стал стандартом де-факто. Это обусловлено физическими принцами построения и функционирования всех современных ЭВМ и персональных компьютеров (ПК).
Все ЭВМ и ПК независимо от года выпуска (или поколения), назначения и сферы применения имеют некоторые общие принципы функционирования.
С точки зрения пользователя компьютер оперирует с двумя типами информации:
· данными,
· командами, которые выполняют помимо арифметических и логических операций над данными целый ряд управляющих операций и функций управления машиной.
Данные и команды в ЭВМ отображаются в кодированном виде, так как выработанный человеческим сообществом в ходе развития цивилизации понятийный аппарат неприменим для использования на компьютере.
Это связано с тем, основные устройства ЭВМ и ПК выполнены на двухпозиционных элементах, которые в каждый момент времени могут находиться в одном из двух устойчивых состояний. Им условно присваивают значения «0» и «1».
Так, например процессор состоит из десятков и сотен миллионов микросхем, которые работают как переключатели: есть сигнал – нет сигнала; современная оперативная память представляет собой набор микроконденсаторов: есть заряд – нет заряда; накопители на магнитных носителях: намагниченный сектор – размагниченный сектор и тому подобные элементы в других компонентах компьютера. Такой минимальный элемент, который может принимать одно из двух устойчивых состояний, получил название "бит", от сокращенного с английского "binary digit" – "bit". Бит – это минимальная составная единица информации, не несущая смысловой нагрузки. Что означает в конкретном случае "1" или "0" без взаимосвязи с другими такими элементами, отразить невозможно. Требуется некоторая совокупность таких элементов, чтобы отобразить информацию. С развитием технологий и уменьшением размеров электронных компонентов были предложены следующие совокупности этих компонентов: три, четыре, восемь. Совокупность из трех компонентов (23) предоставила возможность закодировать 8 вариантов – это привело к появлению 8-ричной системы счисления; из четырех компонентов (24) – 16 вариантов, 16-ричная система счисления. Все это привело к использованию на внутримашинном уровне двоичной системы счисления, а не привычной нам десятичную. Теоретический фундамент работы с двоичной системой счисления был разработан в 19 веке французским математиком Булем (Булева алгебра). И с появлением ЭВМ, а затем и ПК его работы получили практическое воплощение.
Таким образом, физическая природа электронных компонентов компьютера предоставляет возможность использовать только двоичную систему счисления и ее производные. Для того чтобы отобразить (представить) данные или дать команду на выполнение операции необходимо задать ЭВМ алгоритм, преобразующий эти функции на внутримашинный язык, понятный процессору.
Представление числовой информации в различных системах счисления приведена в таблице.
Преобразование числовой информации в памяти ПК и ее обработка микропроцессором не представляет сложностей, в виду реализации простых алгоритмов, в отличие от отображения символьной, графической, мультимедийной информации, которые реализуется сложными алгоритмами, реализованными в программных продуктах.
Таблица 1
Таблица соотношений различных систем счисления.
Число в 10-й системе счисления | Число в 8-й системе счисления | Число в 16-й системе счисления | ||
В виде двоичного кода | В символах данной системы | В виде двоичного кода | В символах данной системы | |
001 000 | ||||
001 001 | ||||
001 010 | А | |||
001 011 | В | |||
001 100 | С | |||
001 101 | D | |||
001 110 | E | |||
001 111 | F | |||
010 000 | 0001 0000 |
Для того чтобы отобразить все многообразие окружающего нас мира в качестве единицы информации в ЭВМ был предложен байт – совокупность из 8 бит, что позволяет с помощью байта отобразить один из 256 символов (28). В современных программных средствах используют более крупные совокупности – 2, 4, 6, 8 байт, которые получили название машинное слово (например, длина машинного слова – 4 байта). Такой подход привел к появлению различных систем кодировок, принятых международным сообществом, наиболее известной из которых является ANSII (American Standard Code for Information Interchange) – американский стандартный код обмена информацией. Так, используя ANSII, стало возможным создавать программное обеспечение, передавать информацию по компьютерным сетям и многое другое, воспринимаемое однозначно пользователями любой национальности. В системе ANSII таблица кодировки делится на две части: базовую (закрепляет значения кодов от 0 до 127) и расширенную (от 128 кода до 255). В базовой части первые 32 кода отданы производителям аппаратной части ПК, в ней размещаются так называемые управляющие коды, которые ни соответствуют никаким символам и не отражаются ни при выводе на экран, ни при печати. Вторая большая часть базовой кодировки закрепляет символы латинского алфавита, цифры (0-9) и наиболее распространенные символы. (см.Приложение 1,табл.1.1) Что касается расширенной части кодировки, то она отводится для кодировки символов национальных алфавитов (например, русского) и для кодирования различных графических символов типа "╗". Так, корпорация Microsoft, учитывая широкое распространение своих программных продуктов в России, предложила кодировку Windows 1251, которая нашла распространение для ПК работающих в российском секторе Интернета. (см.Приложение 1, табл.1.2)