Информация и данные
Задача 1.
Количество информации по Хартли рассчитывается по формуле
[бит],
где N-число возможных состояний объекта; m-основание системы счисления (количество символов, применяемых в алфавите); n-число разрядов в сообщении.
Рассчитать количество информации, содержащееся в изображении черной точки.
Решение:
Для решения этой задачи надо определить число возможных состояний объекта, т.е., например, экрана монитора. Поскольку в задаче это не детализируется, сделаем следующие предположения:
1) нас интересует состояние только одного пикселя, который изображает черную точку; состояние остальных пикселей может быть любым, и для данной задачи несущественно;
2) качество цветопередачи 32 бита (максимальное качество типичного ЖК-монитора).
Тогда:
N=mn =232
Информация о цвете каждой точки передается 32 битами. Количество информации по Хартли будет равно
I= log2N = log2mn = nlog2m = 32log22=32бит.
Задача 2.
Подсчитать объем данных, количество информации в сообщении «Я изучаю информатику» и коэффициент информативности сообщения
Решение:
Не будем учитывать пробелы и различие между большими и малыми буквами, примем размер алфавита 32 символа. Длина сообщения равна 18 символам.
1) Объем данных равен количеству символов в сообщении:
Vd = n = 18 символов
Или, при двоичном (5-битном) представлении:
V = n log2m = 18*log2 (32) = 18*5 = 90 бит.
2) количество информации рассчитаем по Шеннону. Составим таблицу частот повторения символов в сообщении:
Буква | я | и | З | у | ч | а | ю | Н | ф | о | р | м | т | к |
Число повтор. |
Количество информации:
, или 3,68*18 = 66,3 бит на сообщение.
3) коэффициент информативности сообщения С=1/Vd = 66,3/90 = 0,737.
Задача 3.
Количество информации как разность энтропий рассчитывается по формуле
I = Н(α) - Н(β) ≤ 1,
где Н(α) априорная энтропия, а Н(β)-апостериорная энтропия.
Энтропия системы (объекта), имеющая N возможных состояний, согласно формуле Шеннона, равна
,
У монеты утяжелили одну сторону и вероятности выпадения сторон стали Р1 = 1/3, Р2 = 2/3. Подсчитать количество информации, которое получаем при выпадении одной из сторон.
Решение:
Под априорной энтропией в данном случае следует понимать энтропию двух возможных исходов (орел - решка), считая, что априори эти исходы равновероятны. После проведения опытов мы получаем апостериорную энтропию: возможны два исхода, но один из них в два раза более вероятен, чем другой. Количество информации в этом случае равно:
I = H(α) – H (β)= - (½log2½ + ½log2½) + (⅔log2⅔ + ⅓log2⅓) = 1 – 0,9183 = = 0,0817 бит/символ (т.е. на один исход)
Задача 4.
При представлении информации в компьютере или передачи ее по каналам связи информация кодируется числовыми кодами. Одно и то же количество разрядов кода в различных системах счисления может передавать различное количество информации. Эту зависимость можно представить в виде соотношения
,
где N число возможных состояний объекта; m – основание системы счисления (количество символов, применяемых в алфавите); n – число разрядов в сообщении.
Рассчитать количество разрядов двоичного кода, необходимого для кодирования 32 букв алфавита.
Решение:
N = 32, т.к. требуется закодировать 32 буквы алфавита.
m = 2, т.к. код двоичный. Тогда:
n = log2 32 = 5 – требуется 5 разрядов.
Задача 5.
В двоичной системе счисления единица измерения бит (двоичный разряд). В современных ЭВМ применяется единица байт, равная 8 битам.
Рассчитать объем данных в сообщении 10111011, который представлен в виде восьмиразрядного двоичного кода.
Объем данных в сообщении Vд = 8 бит =1байт.
В десятичной системе счисления единица измерения – дит.
Рассчитать объем данных в сообщении 9213452, который представлен в десятичной системе в виде семиразрядного числа.
Объем данных в сообщении Vд = 7 дит.
Задача 6.
Разработать фасетную систему классификации студентов РГТЭУ
Университет | Факультет | Специальность | Группа | Студент |
Рассчитать количество двоичных разрядов для фасетной классификации студентов РГТЭУ.
Расчет кол-ва информации, системы классификации, алфавит системы, система управления и коды управления
Решение:
Фасетная классификация – это совокупность нескольких независимых классификаций, осуществляемых одновременно по нескольким различным основаниям. В нашем случае это: факультет, специальность, группа. Университет не является классификационным признаком, т.к. рассматриваются только студенты РГТЭУ. Каждой ячейке фасетной структуры соответствует несколько объектов, идентификатор которого – фамилия студента. Если мы примем, что в университете 4 факультета, на каждом по три специальности, и каждой специальности обучаются студенты 3 групп, получим: требуется 6 двоичных разрядов (по 2 бита на номер факультета, группы, специальности); количество информации может быть определено как (всего 4*3*3=36 ячеек):
I = - (36∙(1/36)∙log2(1/36)) = 5,17 бит на ячейку.
Системы счисления и перевод чисел из одной системы представления в другую