Информация, данные методы.

До настоящего времени не существует единого мнения, что такое информация. Так, С.А.Христочевский (2001) считает, что для человека существенно прежде всего содержание, смысл сообщения, сигнала, а для ПК смысловой аспект безразличен. В связи с этим смысловой аспект сообщения – это и есть информация. Все технические системы имеют дело с данными, представленными в том виде, который реализован аппаратными и программными средствами этих систем. Следовательно, при взаимодействии человека с техническими системами необходимо обеспечить преобразование (трансформацию) информация – данные, данные – информация.

Иными словами, можно сказать, что в ПК информация всегда представляется с помощью данных, кодирующих ее по какому-то правилу. В процессе решения задачи нужно обязательно иметь в виду следующие этапы преобразований:

· исходная информация – данные;

· данные – данные (то есть обработка данных по какому-то алгоритму);

· данные – выходная информация.

Совершенно иной взгляд на информацию предлагает С.В.Симонович (2000). По его мнению информация – продукт взаимодействия данных и адекватных методов. Из этого следует:

1. Информация – динамический объект. Она существует только в момент взаимодействия данных и методов. Все прочее время она пребывает в состоянии данных. Следовательно, информация существует только в момент протекания информационного процесса. Все остальное время она содержится в виде данных.

2. Одни и те же данные в момент потребления могут поставлять разную информацию в зависимости от степени адекватности взаимодействующих с ними методов.

Пример. Для человека, не владеющего китайским языком, письмо из Пекина дает минимум информации. Использование адекватных методов – максимум информации.

3. Данные являются объективными, поскольку это результат регистрации объективно существующих сигналов. В то же время методы являются субъективными.

В основе искусственных методов лежат алгоритмы. В основе естественных методов лежат биологические свойства субъектов информационного процесса. Следовательно, информация возникает и существует в момент диалектического взаимодействия объективных данных и субъективных методов.

По мнению А.Н.Макаровой (1998) наряду с информацией в информатике используется термин «данные».

Данные – признаки или записанные наблюдения, которые какой-то причине не используются, а только хранятся. Как только данные начинают использоваться для уменьшения неопределенности появляется информация.

Пример: продаются диски с базами данных: номера телефонов, фамилии их владельцев пр. – это данные. Если нужно найти конкретный номер телефона конкретного человека – обращаемся в базу и находим нужное. Это – информация.

Меры информации и данных

При оценке информации различают три аспекта: синтаксический, семантический и прагматический.

Синтаксический аспект связан со способом представления информации вне зависимости от ее смысловых и потребительских качеств и рассматривает формы представления информации для ее передачи и хранения (в виде знаков и символов). Данный аспект необходим для измерения информации. Информацию, рассмотренную только в синтаксическом аспекте, называют данными.

Семантический аспект передает смысловое содержание информации и соотносит ее с ранее имевшейся информацией.

S_п - тезаурусная мера получателя; I_c - семантическое количество информации.

Прагматический аспект передает возможность достижения цели с учетом полученной информации.

где P₀ - вероятность достижения цели до получения информации; P₁ - вероятность достижения цели после получения информации; I_п - прагматическое количество информации; а > 1.

Виды информации:

1. Научная информация (наиболее полно отражает объективные закономерности природы, общества и мышления);

2. Информация управления:

а) производственная, связанная с управлением людьми;

б) техническая, связанная с управлением техническими объектами.

Также классификация информации может производиться по областям применения:

а) политическая;

б) техническая;

в) педагогическая;

г) физическая;

д) экономическая и др.;

2. По назначению:

а) массовая;

б) специальная.

Для измерения информации используются два параметра

· объем данных;

· количество информации.

В чем различие этих мер? Объем данных оперирует с обезличенной информацией, не выражающей смыслового отношения к объекту.

Количество информации отражает меру смыслового содержания информации.

Объем данных в сообщении измеряется количеством символов (разрядов). В двоичной системе счисления единица измерения – bit (бит).

Для измерения объема данных эту единицу предложил Клод Шэннон.

Бит – наименьшая единица объема данных в двоичном коде.

Термин bit – это аббревиатура, состоящая из двух английских слов (binary digit) – двоичная цифра.

Идея использования лишь двух символов для кодирования информации стара, как мир. Барабаны африканских бушменов передают сообщения в виде комбинации звонких и глухих ударов. Азбука Морзе также представляет собой пример двухсимвольного кодирования информации (точки и тире).

Двоичное представление чисел – не единственная альтернатива десятичной системе счисления. Древняя вавилонская арифметика основана на числе 60, а в привычках и языке англосаксов мы обнаруживаем следы двенадцатеричной системы счисления, которая когда-то господствовала на Британских островах: 12 месяцев, два 12 часовых периода в сутках. Но победила десятичная система.

Процедура отображения - преобразование информации в вид, удобный для восприятия человеком.

Практически всегда основой кодирования чисел в современной ЭВМ является двоичная система счисления.

Системой счисления называется способ записи чисел при помощи ограниченного числа символов (цифр).

Позиционной системой счисления называется система счисления, при которой число, связанное с цифрой, зависит от места, которое она занимает.

В двоичной системе счисления используется только две цифры: 0 и 1. Бит – очень маленькая единица. Чтобы закодировать один символ, например, английскую букву "а", нужно 8 символов:

01000001 – а	01000010 – в
01000011 – с	01000100 – d
01000101 – e	01000110 – f

1 байт = 8 бит

1 Кбайт = 2¹⁰= 1024 байт

1 Мбайт = 2¹⁰ = 1024 Кбайт

1 Гбайт = 2¹⁰ = 1024 Мбайт

Пример. Перевести в десятичную запись число (10000111)₂. Перевести в двоичную запись число 89. Сложить в двоичной записи эти два числа, результат перевести в десятичную запись.

Решение:(10000111)₂ =1·2⁷ + 1·2² + 1·2¹ + 1·2⁰ = 128 + 4 + 2 + 1 = (135)10,(89)₁₀ = 1·2⁶ + 1·2⁴ + 1·2³ + 1·2⁰ = (1011001)₂,

+ 1011001

11100000,

(11100000)₂ =128+64+32=(224)₁₀

Таблицы для пересчёта систем счисления:

Степень двойки

значение разряда

байт

десятичное значения если разряд = 1

байт

Десятичные значения для разрадов байта

десятичное значение байта = 128+32+16+2+1= 179

значение разряда

байт

десятичное значения если разряд = 1

шестнадцатиричное число

№ по порядку

значения разрядов в шестнадцатиричной системе

Для измерения смыслового содержания информации (количества информации) наибольшее распространение получила тезаурусная мера.

Тезаурус – совокупность сведений, которыми располагает пользователь или система.

В зависимости от соотношений между смысловым содержанием информации и тезаурусом пользователя изменяется количество семантической информации, воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус.

Максимальное количество семантической информации потребитель приобретает при согласовании ее смыслового содержания со своим тезаурусом, когда поступающая информация понятна пользователю и несет ему ранее неизвестные сведения. По этому вопросу очень четко писал академик И.П.Павлов "… однако во всякий момент требуется известное общее представление о предмете для того, чтобы было, на что цеплять факты, чтобы было с чем двигаться вперед, для того, чтобы было, что предполагать для будущих изысканий".