Основными типами данных являются байты, слова и двойные слова (смотри Рисунок 2-2). Байт образуют восемь соседних битов, которые нумеруются с 0 до 7, причем бит 0 является самым младшим значащим битом.
Слово состоит из двух байтов, имеющих последовательные адреса. Т.о. слово содержит 16 бит, которые нумеруются от 0 до 15. Байт, содержащий нулевой бит, называется младшим байтом, а байт, содержащий 15-й бит - старшим байтом. В процессоре i486 младший байт хранится по меньшему адресу. Адресом слова считается адрес его младшего байта. Адрес старшего байта может быть использован для доступа к старшей половине слова.
Рис. 2-1 Сегментная адресация
Двойное слово состоит из четырех байт, имеющих последовательные адреса. Т.о. двойное слово содержит 32 бита, которые нумеруются от 0 до 31. Слово, содержащее нулевой бит, называется младшим словом, а слово, содержащее 31-й бит - старшим словом. Младшее слово хранится по меньшему адресу. Адресом двойного слова считается адрес его младшего слова. Адрес старшего слова может быть использован для доступа к старшей половине двойного слова.
Для достижения максимальной гибкости в структурах данных и эффективного использования памяти, слова необязательно выравнивать по четным адресам. Двойные слова также необязательно выравнивать по адресам, кратным четырем. Однако, из-за того, что процессор i486 имеет 32-разрядную шину, обмен данными между процессором и памятью производится двойными словами, начинающимися с адресов, кратных четырем. Процессор преобразует запросы невыровненных слов или двойных слов в последовательность запросов, допустимых для интерфейса с памятью. Таким образом, отсутствие выравнивания данных снижает производительность из-за увеличения количества обращений к памяти. Для повышения производительности структуры данных (особенно стеки) следует выравнивать по четным адресам и по адресам, кратным четырем.
Рисунок 2-2. Основные типы данных
Рисунок 2-3. Байты, слова и двойные слова в памяти
Т.к. байты, слова и двойные слова являются основными типами операндов, процессор также поддерживает дополнительную интерпретацию этих операндов. Специализированные команды распознают следующие типы данных (смотри Рисунок 2-4):
- Целый тип: знаковое двоичное значение, содержащееся в 32-разрядном двойном слове, 16-разрядном слове или 8-разрядном байте. Все операции предполагают представление чисел в дополнительном коде. Знаковый бит расположен в бите 7 в байте, в бите 15 в слове и в бите 31 в двойном слове. Он равен 0 для положительных чисел и 1 для отрицательных. 8-разрядное целое число может изменяться в диапазоне от -128 до |127, 16-разрядное целое число в диапазоне от -32768 до |32767, а 32-разрядное целое число в диапазоне от -2**31 до |2**31-1.
- Обычный тип: беззнаковое двоичное значение, содержащееся в 32-разрядном двойном слове, 16-разрядном слове или 8-разрядном байте. Значение числа для байта может изменяться от 0 до 255, для слова от 0 до 65535 и для двойного слова от 0 до 2**32-1.
- Ближний указатель: 32-разрядный логический адрес, который представляет собой относительный адрес внутри сегмента. Ближние указатели используются для всех указателей в сплошной модели и для ссылок внутри сегмента в сегментированной модели памяти.
- Дальний указатель: 48-разрядный логический адрес из двух компонентов: 16-разрядного селектора сегмента и 32-разрядного относительного адреса. Дальние указатели используются программами только в том случае, когда конструкторы системы выбирают сегментированную модель памяти. Строка: непрерывная последовательность байтов, слов или двойных слов.
- Строка может содержать от 0 до 2**32-1 байтов или 4 Гбайт. Битовое поле: непрерывная последовательность битов, в которой каждый бит рассматривается как независимая переменная.
- Битовое поле может начинаться с любого бита любого байта и может быть длиной до 32 бит. Битовая строка: непрерывная последовательность битов.
- Битовая строка может начинаться с любого бита любого байта и иметь длину до (2**32-1) бит.
- Неупакованный двоично-десятичный тип (НДД): распакованное байтовое представление десятичной цифры от 0 до 9. Распакованные десятичные числа хранятся как беззнаковые байтовые значения по одной цифре в каждом байте. Значение цифры определяется младшим полубайтом. Старший полубайт должен быть равным нулю при делении и умножении, но может иметь любое значение при вычитании или сложении.
- Упакованный двоично-десятичный тип (УДД): упакованное байтовое представление двух десятичных цифр от 0 до 9. Каждая цифра хранится в своем полубайте. Цифра в старшем полубайте является более значимой. Диапазон упакованного десятичного байта составляет от 0 до 99.
- Вещественные типы (типы данных с плавающей точкой).
Рисунок 2-4. Типы данных
История развития ВТ в связи с историей развития системного программного обеспечения.
Современные компьютерные системы наряду с прикладным ПО всегда содержат системное, которое обеспечивает организацию вычислительного процесса. История системного программного обеспечения связана с появлением первой развитой в современном понимании ОС UNIX.
1965 - Bell labs разрабатывает операционную систему Multix - прообраз UNIX, имеющий далеко не все части современной системы. До этого времени не существовало мобильных ОС (переносимых на разные типы машин) и Multix также не был мобильной ОС.
1971 - написан UNIX для работы на мощнейшей платформе того времени PDP - 11
1977 - Становится переносимой системой, т.к. переписан на языке C (AT&T system V)
1981 - платформа Intel начинает резко наращивать свои возможности. Колоссальным прорывом было создание 8088, затем 8086, 80286, etc. Появляется однопользовательская ОС MS-DOS, на 10 лет ставшая стандартом де-факто для пользователей персональных компьютеров. Но для машин с процессором Intel появляются и версии UNIX.
Конец 80 – начало 90 гг. – аппаратные средства резко увеличивают свою мощность. Microsoft создает новую ОС Windows NT и появляется стандарт Win32. Позже появляется Windows 95 – ОС для одного рабочего места, но имеющая многие возможности NT, призванная вытеснить MS-DOS. Аппаратные средства позволяют создавать 64-битные версии такой ОС, как UNIX, и в скором времени она появляется и используется на платформе Alpha фирмы DEC. С наращиванием мощности аппаратных средств системное программное обеспечение становится все более изощренным и имеющим большие возможности.
2. Общая классификация вычислительных машин. Современные архитектурные линии ЭВМ. Системное ПО и его место в современной информатике.
ЭВМ являются преобразователями информации. В них исходные данные задачи преобразуются в результат ее решения. В соответствии с используемой формой представления информации машины делятся на два класса: непрерывного действия - аналоговые и дискретного действия - цифровые. В силу универсальности цифровой формы представления информации цифровые электронные вычислительные машины представляют собой наиболее универсальный тип устройства обработки информации. Основные свойства ЭВМ - автоматизация вычислительного процесса на основе программного управления, огромная скорость выполнения арифметических и логических операций, возможность хранений большого количества различных данных, возможность решения широкого круга математических задач и задач обработки данных. Особое значение ЭВМ состоит в том, что впервые с их появлением человек получил орудие для автоматизации процессов обработки информации. Управляющие ЭВМ – предназначены для управления объектом или производственным процессом. Для связи с объектом их снабжают датчиками. Непрерывные значения сигналов с датчиков преобразуются с помощью аналогово-цифровых преобразователей в цифровые сигналы, кот. вводятся в ЭВМ в соотв с алгоритмом упр-я. После анализа сигналов формируются упр. воздействия, которые с пом. цифро-аналоговых преобразователей преобразуются в аналоговые сигналы. Через исполнительные механизмы изменяется состояние объекта.
Универсальные ЭВМ – предназначены для решения большого круга задач, состав которых при разаработке ЭВМ не конкретизируется.
Пример современных архитектурных линий ЭВМ: персональные ЭВМ (IBM PC и Apple Macintosh – совместимые машины), машины для обработки специфической информации (графические станции Targa, Silicon Graphics), большие ЭВМ (мэйнфреймы IBM, Cray, ЕС ЭВМ).
Общее назначение системного ПО - обеспечивать интерфейс между программистом или пользователем и аппаратной частью ЭВМ (операционная система, программы-оболочки) и выполнять вспомогательные функции (программы-утилиты) Современная операционная система обеспечивает следующее:
1) Управление процессором путем передачи управления программам.
2) Обработка прерываний, синхронизация доступа к ресурсам.
3) Управление памятью.
4) Управление устройствами ввода-вывода.
5) Управление инициализацией программ, межпрограммные связи.
1) Управление данными на долговременных носителях путем поддержки файловой системы.
См. также стандарты в (1).
1. Общее понятие архитектуры. Принципы построения ВС 4-го поколения.
Архитектура – совокупность технических средств и их конфигураций, с помощью которых реализована ЭВМ. ЭВМ 4 поколения, имеет, как правило, шинную архитектуру, что означает подключение всех устройств к одной электрической магистрали, наз. шиной. Если устройство выставило сигнал на шину, другие могут его считать. Это свойство используется для организации обмена данными. С этой целью шина разделена на 3 адреса – шина адреса, шина данных и шина управляющего сигнала. Все современные ЭВМ также включают устройство, наз. арбитром шины, которое определяет очередность занятия ресурсов шины разными устройствами. В PC распространены шины ISA, EISA, PCI, VLB.
Процессор (ЦП) – устройство, выполняющее вычислительные операции и управляющее работой машины. Содержит устройство управления, выбирающее машинные команды из памяти и выполняющее их, и арифметико-логическое устройство, выполняющее арифметические и логические операции. Работа всех электронных устройств машины координируется сигналами, вырабатываемыми ЦП. В современных ПК процессор представлен одной СБИС, содержащей свыше миллиона транзисторов.
Оперативная память – предназначена для хранения программ и данных, которыми они манипулируют. Физически выполнена в виде некоторого числа микросхем. Логически ОП можно представить как линейную совокупность ячеек, каждая из которых имеет свой номер, называемый адресом. Время записи и чтения из ОП в современных машинах занимает доли микросекунды, а для других устройств это время в 10-1000 раз больше.
Внешние устройства – устройства ввода и вывода информации. Поскольку, как правило, они работают значительно меделенне остальных, управляющее устройство должно приостанавливать программу для завершения операции ввода-вывода с соответствующим устройством.
1. Программная модель ЭВМ. Основной командный цикл процессора. Понятие системы команд.
2. Адресация. Данные в ЭВМ: структура и форматы представления.
Адресация на примере процессора 8086.
Числа, устанавливаемые процессором на адресной шине, являются адресами, т.е. номерами ячеек оперативной памяти, из которых необходимо считывать очередную команду или данные. Размер ячейки оперативной памяти составляет 8 разрядов, т.е. 1 байт. Поскольку процессор использует 16-разрядные адресные регистры, то это обеспечивает ему доступ к 65536 (FFFFh) байт или 64К (1K=1024 байт) основной памяти. Такой блок непосредственно адресуемой памяти называется сегментом. Любой адрес формируется из адреса сегмента (всегда кратен 16) и адреса ячейки внутри сегмента (этот адрес называют смещением). На компьютерах, оснащенных процессором 8086, оперативная память обычно имеет размер, равный 640К. Для того чтобы работать с памятью такого размера, процессор осуществляет пересчет адресов с помощью процедуры, называемой вычислением эффективного адреса (рис.2.3).
Физический 20-разрядный адрес вычисляется сложением сдвинутого влево на 4 разряда 16-разрядного адреса сегмента оперативной памяти со значением 16-разрядного смещения относительно начала этого сегмента. Используя 20-разрядные адреса, можно адресовать 1М оперативной памяти (1M=1024K=1048576 байт). В программе на ассемблере полный адрес записывается в виде SSSS:0000, гдe SSSS значение сегмента; 0000 – значение смещения. Участок оперативной памяти размером 16 байт называется параграфом.
Данные в ЭВМ – подразделяются на числовые и нечисловые.
Числовые данные:
1) Целые типы – для представления целых чисел.
2) Вещественные типы – для представления рациональных чисел. Бывают:
а) с фиксированной точкой;
б) с плавающей точкой.
Нечисловые данные:
1) Логические данные – принимающие значение истина или ложь.
2) Строковые данные.
3) Множества.
4) Произвольные данные (текст, звук, графика).
1. Организация ввода-вывода, классификация внешних устройств.
Организация ввода-вывода в современных ЭВМ осуществлена с использованием прерываний. Это связано с тем, что УВВ работают намного медленнее, чем процессор и оперативная память. Поэтому управляющее устройство должно приостанавливать выполнение программы и ждать завершения операции ввода-вывода с внешним устройством. При выводе все результаты выполненной программы должны быть выведены на ВУ, после чего процессор переходит к ожиданию сигналов от ВУ. При вводе, например, с клавиатуры получение значений нажатых клавиш осуществляется при поступлении прерывания от клавиатуры.
2. Системные особенности архитектур ЭВМ. Примеры эволюции современных ВК – IBM 370, PDP11/VAX, Intel 80X86, RISC.
Системные особенности архитектур ЭВМ заключаются в отличиях аппаратных средств, на которых реализована машина.
Единая система электронных вычислительных машин (ЕС ЭВМ, аналог IBM 370) представляет собой семейство программно-совместимых машин третьего поколения. Каждая и машин семейства состоит из:
- процессора;
- оперативной памяти;
- каналов устройств, обеспечивающих операции обмена данными между памятью и внешними устройствами независимо от процессора;
- набора внешних устройств ввода-вывода, выполняющих обмен информацией между внешними носителями и каналами.
Для ЕС ЭВМ характерно наличие каналов - специализированных процессоров, позволяющих освободить процессор от выполнения операций ввода-вывода и тем самым повысить скорость обмена с внешними устройствами. В машинах семейства ЕС с помощью каналов обеспечивается параллельная работа процессора и внешних устройств, а также параллельное выполнение операций ввода-вывода с несколькими внешними устройствами.
В основу построения ЕС ЭВМ положен принцип модульности, позволяющий по желаланию пользователя наращивать вычислительную мощность (заменять процессоры), расширять емкость оперативной памяти, добавлять внешние устройства.
Машины имеют большие наборы команд, развитое системное программное обеспечение, включающее трансляторы языков программирования Ассемблер, ФОРТРАН, ПЛ/1, КОБОЛ, АЛГОЛ, ПАСКАЛЬ, операционные системы с различными функциональными возможностями.
Основная особенность управляющих вычислительных машин типа PDP-11 заключается в том, что взаимодействие между всеми устройствами, входящими в состав комплексов, включая процессор, и оперативным запоминающим устройством (ОЗУ) осуществляется при помощи единого унифицированного интерфейса, получившего название "Oбщая шина" (ОШ). Oбщая шина является каналом, через который передаются адреса, данные, управляющие сигналы на все устройства комплекса, включая процессор и память. Физически ОШ представляет собой высокочастотную магистраль передачи данных, состоящую из 56 линий.
Процессор использует установленный набор сигналов для связи с памятью и для связи с внешними устройствами, благодаря чему в системе отсутствуют специальные команды ввода-вывода.
Все устройства комплекса подключаются в ОШ по единому принципу. Некоторым регистрам процессора, регистрам внешних устройств, которые являются источниками или приемниками при передачи информации, на ОШ отводятся адреса. В программах адреса регистров устройств рассматриваются как адреса ячеек памяти, что позволяет обращаться к ним с помощью адресных инструкций. Так, программирование операций вывода данных на внешнее устройство практически сводится к пересылке этих данных по определенному адресу.
VAX – 11 – более развитая машина, чем PDP-11. Это 32-битовая машина с адресным пространством свыше 4Г. Она по архитектуре похожа на PDP-11, но имеет 2 шинных адаптера – адаптер общей шины и адаптер массовой шины. Все совместимые с общей шиной периферийные устройства могут быть подключены к ней, тогда как высокоскоростные устройства могут быть подключены к массовой шине через собственные контроллеры. VAX – сокр. от английских слов “виртуальное адресное расширение”, т.е. машина имеет виртуальную память и многозадачность.
Обычно персональные компьютеры IBM PC состоят из трех частей: - системного блока;
- клавиатуры;
- дисплея.
Системный блок содержит все основные узлы компьютера:
- электронные схемы, управляющие работой компьютера (микропроцессор, оперативная память, контроллеры устройств и т.д.);
- блок питания;
- накопители для гибких магнитных дисков;
- накопитель на жестком магнитном диске.
К системному блоку можно подключить ряд дополнительных устройств ввода - вывода. Кроме клавиатуры и монитора такими устройствами являются:
- принтер - для вывода на печать текстовой и графической информации;
- мышь - устройство, облегчающее ввод информации в компьютер;
- стример - для хранения данных на магнитной ленте;
- модем - для обмена информацией с другими компьютерами через телефонную сеть;
- сканер - прибор для ввода рисунков и текстов в компьютер.
3. Двоичное кодирование информации. Представление элементарных типов данных: натуральные числа, целые числа со знаком, числа с плавающей точкой.
Состояния “установлен” и “сброшен” соотв. 2 цифрам двоичной системы счисления, фундаментальной для ЭВМ. Эти цифры называются битами. Двоичное кодирование – представление данных последовательностью битов. При двоичном кодировании числовой информации степень двойки при каждой двоичной цифре на единицу больше, чем у предшествующей цифры. Пример конструкции двоичного кода: 1012=(1*22)+(0*21)+(1*20)=510.
Таким образом осуществляется представление целых чисел без знака. Отрицательные числа со знаком представляются в дополнительном коде – в форме дополнения до двух. Чтобы найти двоичное представление отрицательного числа, надо взять его полжительную форму, проинвертировать ее и добавить к полученному результату 1.
Числами с плавающей точкой называются числа вида x=M*Pq, где М – мантисса, P – порядок, q – основание системы счисления. Нормализованная форма таких чисел:
M – дробное, |M| < 1.
Q – фиксировано.
P – целое число со знаком.
В машине в двоичных кодах хранится M и P. Порядок, как правило, выравнивается, т.е. приводится к большему по модулю порядку, путем сдвига мантиссы вправо с меньшим порядком на кол-во разрядов, равное (Pmax-Pmin)log2Q.
4. Правила арифметических и логических операций с элементарными типами данных.
5. Свойства точности вычислений при работе с плавающей точкой. Приемы программирования, обеспеч. необходимую точность вычислений.
При работе с плавающими числами следует иметь в виду, что результат не полностью соответствует арифметике действительных чисел. Диапазон представления чисел: -1*Qp<x<1*Qp. Для этих чисел понятие абсолютной точности заменяется на понятие относительная точность – это минимальное число x, при котором R*(1+x) будет иметь другой код, чем число R. Потеря точности связана с ситуацией поглощения меньших операндов большими, которая в свою очередь связана с фиксированным размером мантиссы. Способ увеличения точности – увеличение размера мантиссы (числа одинарной, двойной, повышенной точности в языках высокого уровня). При программировании операций с плавающей точкой многих проблем можно избежать, если правильно подобрать необходимые программисту типы данных в зависимости от размерности и точности предполагаемо обрабатываемых вещественных чисел. Некоторые ситуации приводят к ошибкам обработки таких чисел:
а) Поглощение меньших операндов большими.
б) Ситуация потери точности (lost precision). Данный эффект проявляется, когда вычитаются 2 почти одинаковых числа.
в) Ситуация переполнения. В результате операции порядок превышает максимально допустимое значение.
г) Ситуация обратная переполнению (underflow) – если порядок становится меньше минимального значения.
д) Потеря значимости – если мантисса стала равна нулю при ненулевом порядке.
6. Представление нечисловой информации. Текстовые данные, символьные коды ASCII, EBSDIC, UNICODE. Особенности кодирования русского алфавита.
Любой текст представляет собой послдовательность литер 0..9 A..Z a..z А..Я а..я. Набор литер весьма широк за счет наличия национальных языков. Первые машины имели алфавит только из цифр и латинских букв. Эти литеры образовали набор символов ASCII, EBSDIC. В этих кодировках общее количество символов не превышает 128 (7 бит).
При представлении в памяти текст имеет вид последовательности байтов.
Способы представления текста
1. Фиксированная длина - |_|_|_|_|_|_|_|.
2. ASCIIZ - |_|_|_|_|_|_|0|. Конец такой строки обозначает зарезервированный символ (не печатаемый). Получила широкое распространение благодаря языку C.
3. Variable Lenght - |x|_|_|_|_|_|. Строка содержит длину и последовательность байтов этой длины. Распространено в языке PASCAL.
Для представления национальных языков, в частности русского, 128 символов в общем случае недостаточно. Здесь используется:
1) Расширение ASCII – испольование 8 бита, теперь можно кодировать 256 символов;
2) UNICODE – использование 7 битов, но более чем 1 символа кодировки для представления большего количества литер (например для совместимости с сетями, отсекающими 8-й бит при передаче).
В настоящее время почти повсеместно используется 8-битовое кодирование символов. Кодовая таблица – графическое представление символов, по которым можно определить код. Проблемы при представлении русского алфавита - а) необходимость сортировки по кодам; б) при этом надо оставить на старых местах символы рисования рамок и заполнения (псевдографики) для совместимости с иностранными программами. Русская кодировка – основная ГОСТ – имела расположение символов по алфавиту, но в ней были смещены символы псевдографики. В настоящее время исп. альтернативная кодировка ГОСТ – в ней псевдографика оставлена на старом месте, но малые буквы русского алфавита разорваны (160-175, 224-239, 240-241). Это немного затрудняет сортировку – единственный недостаток. Кроме того, есть и другие кириллические кодировки – MIC, КОИ-8, ISO-8859, т.п.
1. Представление графической информации – растровое и векторное представления, разрешающая способность, полутоновые и цветные изображения, палитры.
Использование ЭВМ в автоматизированных системах управления, различных информационно-вычислительных системах, системах коллективного пользования (см. гл. 13) требует их укомплектования удобными средствами связи человека с машиной. Одним из таких средств является устройство ввода-вывода с электронно-лучевой трубкой (ЭЛТ), называемое монитором. В зависимости от типа монитора на экран может выводиться как алфавитно-цифровая, так и графическая информация. Устройство вывода графической информации состоит из видеопамяти (буфера образа), монитора и устройства сопряжения, передающего на монитор содержимое видеопамяти. В современных машинах первое и третье объединено в видеоадаптере.
При векторном представлении графической информации электронный луч на мониторе непрерывно пробегает между заданными точками, порождая отрезок – вектор. Такое представление наиболее удобно для изображений, состоящих из линий и простых геометрических фигур. В этом случае векторное изображение легко масштабируется и требует малый объем памяти для хранения.
Если изображение состорит из многих точек разных оттенков (полутоновое изображение), то векторный способ будет слишком сложен в реализации, и используется растровый способ представления – разбиение изображения на мельчайшие “клетки” и вывод на экран сетки точек – растра (bitmap). Разрешающая способность растра – величина, показывающая, сколько точек может быть выведено на квадратную единицу изображения (ед. измерения – dpi (точек на дюйм)). Для видеосистемы единицей измерения может быть размер выводимой точки и общее количество пикселов, выводимое на экран монитора (например, 1024х768).
В случае монохромного изображения для кодирования 1 точки в буфере образа достаточно одного бита – светится или нет. В случае полутонового или цветного изображения количество бит на точку буфера должно быть таково, чтобы представить все возможные цвета или оттенки. Например, 8 битами можно представить 256 цветов или оттенков. В таких системах программист имеет доступ к палитре – ресурсу видеоадаптера, позволяющему устанавливать цвета или оттенки для каждого кода цвета.
2. Представление звуковой информации – общее понятие о дискретизации и квантовании звуковых сигналов, точность представления звуковых колебаний.
Представление звуковой информации в ЭВМ:
а) Преобразование в цифровую форму с помощью аналого-цифрового преобразователя. При этом звук превращается в цепочку импульсов, сост. из 8 или 16 бит (фактически в вектор 8-битовых ил 16-битовых чисел)
б) Дискретизация этого сигнала с постоянной частотой. Если например голос человека дискретизируется с частотой 8КГц, используя 8 бит, на протяжении 10с, это займет 80К. По дискретизированным значениям можно восстановить сигнал с заданной точностью и направить его в цифро-аналоговый преобразователь. Усилив сигнал с выхода ЦАП, получим звук.
При малой частоте дискретизации часть данных теряется вследствие т.н. шума квантования, и мы не можем достаточно точно воспроизвести данные. Закон Шеннона для дискретизации: для достижения полного соответствия восстановленного сигнала исходному следует дискретизировать последний с частотой, в 2 раза превышающей его максимальную частоту. CD-проигрыватели работают с частотой 44KГц, и на такой частоте звук не теряет в качестве.
Равномерная дискретизация – замена сигнала последовательностью его мнгновенных значений, взятых через равные промежутки времени.
Квантование – разбиение функции сигнала через определенный шаг на интервалы - уровни квантования и замена сигнала значениями, взятыми с этих интервалов.
Форматы хранения оцифрованного звука в файлах:
VOC – стандарт де-факто от Creative.
WAV – формат оцифрованного звука от Microsoft.
Layer 1, 2, 3 audio MPEG – эффективно закодированный (сжатый примерно в 10 раз) формат хранения оцифрованного звука - сейчас приобретает наибольшее распространение.
3. Общее описание языка ASM. Типы данных. Оформление программ. Формат записи команд.
Ассемблер – машинно-ориентированный язык, имеющий 2 основных достоинства. 1)позволяет писать программы на уровне команд процессора 2)не требует знания этих команд, каждая из них заменяется удобной для запоминания мнемоникой – сокращением английских слов. Транслятор переводит мнемоники в их числовые эквиваленты.
Элементы языка: операторы (команды ассемблера + псевдооператоры макроассемблера), операнды, выражения, константы, метки, комментарии.
Собственно команды ассемблера процессора – м.б. без операндов, с одним или двумя операндами, использовать различные типы адресации (см. 19)
Псевдооператоры – 5 групп: определение идентификаторов (EQU), данных (DB), внешние ссылки (PUBLIC, EXTRN), определение сегментов и подпрограмм (SEGMENT, PROC), управление трансляцией (END).
Константы – м.б. числовые и литералы (последовательность букв, закл. в апострофы).
Комментарии – начинаются с символа; и предназначены для улучшения читаемости программы.
Метки – предназначены для организации переходов в программе. М.б. локальные и глобальные. Представляют собой символьные имена, заканчивающиеся на:.
Типы данных языка.
Целые типы.
BYTE – байт (однобайтовое целое число, код символа, элемент строки)
WORD – слово (целое число со знаком или без знака)
DWORD – двойное слово, длинное целое
Указатели
Полный 32-битовый указатель или 16-битовое смещение.
Вещественные типы (типы мат.сопроцессора) – действительные числа длиной 32, 64, 80 бит.
Массивы
В ассемблере возможно объявление массивов чисел.
Перичислимые и составные типы
ENUM – набор значений, заним. определенное кол-во бит.
RECORD – запись с битовыми полями, каждое из которых имеет длину опр. количество бит и инициализируется некоторыми значениями.
STRUC – структура, элемент содержащий 1 или более типов данных, называемых членами структуры.
UNION (объединение) – то же самое, что и структура, за исключением того, что все члены объединения занимают 1 и тот же участок памяти.
Формат команды языка:
[Метка:] мнемокод [операнд] [;комментарий]
По умолчанию заглавные и строчные буквы в языке не различаются.
Оформление программ:
[Общие для всех сегментов директивы]
...
Директива открытия сегмента
Текст программы или описание данных
Директива закрытия сегмента
... (может повторяться несколько раз в зависимости от числа сегментов)
Директива окончания программного файла
4. Константы, метки, условная компиляция.
Константы – м.б. числовые (десятичные, двоичные, шестадцатеричные)
ten EQU 10
antiten EQU –10
bitmask EQU 10001001b
video EQU 0A000h
и литералы – символьные
s EQU ‘string data'
Метки – служат для присваивания имени команде языка ассемблера. Предназначены для организации переходов в программе. Представляют собой символьные имена, заканчивающиеся на:. Глобальные метки действуют во всей программе. Локальные – только внутри подпрограммы.
Директивы условной трансляции предназначены для обозначения блока программного кода, который включается в объектный файл только тогда, когда выполняется заданное условие. Cинтаксис:
Ifxxx
;операторы, помещаемые в файл при выполнении условия
ELSE
;операторы, помещаемые в файл, если условие не выполнено
ENDIF
Существуют также дрективы ELSEIF, которые позволяют создавать множественные конструкции IF.
5. Компилятор ассемблер-программ, редактор связей (загрузчик).
Компилятор с ассемблера обрабатывает исходный код, преобразуя его в код команд на машинном языке. Результат его работы называется объектным кодом. В объектном коде необязательно находится весь код программы – в нем могут быть т.н. внешние ссылки на библиотечные процедуры или процедуры в других модулях, а также на данные.
Следующий шаг – создание исполняемой программы. Сборкой всех частей программы занимается редактор связей. Он размещает все модули в памяти и настраивает адресные константы внутри них так, чтобы они соответствовали фактическому местоположению в памяти.
Редакторы бывают 3 разновидностей.
1) Загрузчик – загружает объектный модуль и передает управление на точку входа программы.
2) Компоновщик – формирует исполняемый файл, точно соответствующий образу программы в памяти, привязывая его к абсолютным адресам.
3) Компоновщик, генерирующий псевдоперемещаемый код – записывает в исполняемый файл таблицу перемещений (relocation table), где содержатся данные о ячейке внутри кода, которая зависит от местоположения в памяти. Такой исполняемый файл перед запуском программы требует настройки. Этим занимается операционная система, в формате которой создается исполняемый модуль.
1. Основная память ЭВМ. Адресация, адресное пространство.
Число микросхем памяти, физически присутствующих в компьютере, определяет объем памяти, которую можно использовать для программ и данных. Это число может меняться от машины к машине. Объем памяти обычно можно наращивать с помощью плат расширения, вставляемых в специальные разъемы. Для процессора память - это не более чем несколько тысяч 8-разрядных ячеек, каждая из которых имеет уникальный адрес.
Говорят обычно не о физическом объеме памяти, а об адресуемой памяти. 8086 может адресоваться к 1024 К, то есть к 1048576 байтам памяти. Другими словами, это - максимальное количество различных адресов и, следовательно, максимальное количество байт данных, к которым может обратиться процессор.
Обращение к байту памяти производится с помощью 20-разрядного адреса. В схеме использования памяти процессором 8086 адреса имеют "ширину" 20 бит, поскольку они передаются по 20- разрядной шине адреса. Обычно адреса представляются в шестнадцатеричной системе исчисления. Таким образом, допустимый диапазон адресов памяти - от ООООО до FFFFF в шестнадцатеричной системе исчисления. При рассмотрении 1024 Кбайтного адресного пространства PC его делят на 16 блоков по 64 Кбайт и обозначают каждый из этих блоков шестнадцатеричной цифрой, совпадающей со старшей цифрой адреса. Например, первые 64 Кбайт памяти - блок О, адреса байтов этого блока от ООООО до OFFFF, последние 64 Кбайт - блок F, адреса байтов этого блока от FOOOO до FFFFF.
Структура основной памяти, адресуемой 8086
Теоретически, любая область памяти может представлять собой либо неизменяемое ПЗУ, либо ОЗУ. Однако принято первые десять блоков (блоки с нулевого по девятый общим объемом 640 Кбайт) заполнять оперативной памятью. Оперативная память в PC устанавливается начиная с блока О и последовательно, без пропусков, наращивается до блока 9 включительно. Если не все десять блоков заполнены, то программы не должны использовать адреса несуществующей памяти. Обращение по этим адресам может вызывать различные последствия в зависимости от модели машины, однако обычно эта ошибка никак не обнаруживается и программа продолжает работу.
1. Общая структура машинных команд, адресность. Способы адресации операндов. Расслоение памяти, выравнивание, кэш-память.
Общая структура машинных команд.
Операнды, которые используются в операторах ассемблера, могут быть регистром (г), адресом памяти (mem), непосредственным значением, задаваемым прямо в операторе (imm), сегментным регистром (sr). В связи с этим существуют различные форматы одних и тех же команд:
· первый и второй операнды - регистры. Результат помещается по адресу первого операнда. Могут использоваться все регистры общего назначения.
· первый операнд - регистр, второй - адрес памяти. Результат помещается в регистр, указанный в операторе, например:
mov ах, DATA; в регистр АХ помещается содержимое поля DATA
· первый операнд - адрес памяти, второй - регистр. Результат помещается по тому адресу, который используется в качество первого операнда.
· первый операнд - регистр, второй - непосредственные данные. Результат помещается в регистр.
· первый операнд - адрес памяти, второй - непосредственные данные. Результат помещается по указанному адресу.
· первый операнд - сегментный регистр, второй - регистр общего назначения. Результат помещается в сегментный регистр, причем задание регистра CS в таком формате команды не применяется.
· первый операнд - регистр общего назначения, второй - сегментный регистр. Результат помещается в регистр общего назначения.
Команды, работающие с одним операндом, могут работать с регистрами общего назначения, адресами памяти или с сегментными регистрами.
Способы адресации операндов. В программах на Assembler применяются следующие типы адресации операндов:
· регистровая;
· прямая;
· непосредственная;
· косвенная;
· базовая;
· индексная;
· базово-индексная.
Регистровая адресация подразумевает использование в качестве операнда регистра процессора, например: push DS mov BP,SP
При прямой адресации один операнд представляет собой адрес памяти, второй - регистр: mov DATA, АХ
Непосредственная адресация применяется, когда операнд длиной в байт или слово находится в ассемблерной команде: mov AX,4Ch
При использовании косвенной адресации исполнительный адрес формируется исходя из сегментного адреса в одном из сегментных регистров и смещения в регистрах ВХ, ВР,SI или DI, например: mov АL, [ВХ], mov АН, [SI].
В случае применения базовой адресации исполнительный адрес являетсй суммой значения смещения и содержимого регистра ВР или ВХ, например:
mov АХ, [ВР + 6]
mov [ВХ + Delta], АХ
При индексной адресации исполнительный адрес определяется как сумма значений указанного смещения и содержимого регистра SI или DI так же, как и при базовой адресации, например:
mov DX, [SI+5]
mov ES: [DI]+6, AL
Базово-индексная адресация подразумевает использование для вычисления исполнительного адреса суммы содержимого базового и индексного регистров, а также смещения, находящегося в операторе, например:
mov ВХ, [BP][SI]
mov ES:[BX+DI],AX
Кэш-память – сверхоперативная память, обращение к которой намного быстрее, чем к оперативной и в которой хранятся наиболее часто используемые участки последней. При обращении к памяти сначала нужные данные ищутся в кэш-памяти. При отсутствии производится обращение к оперативной памяти, в результате общее время доступа к памяти сокращается.
20. Состав типичных систем команд. Комплексный набор команд и RISC – процессоры.
21.Программно доступные ресурсы процессора. Управление последовательностью операций. Условные и безусловные переходы. Понятие о механизме прерываний.
В процессоре, как правило, программно доступными являются большинство регистров – ячеек памяти, расположенных непосредственно на процессоре. В 8086 недоступным для непосредственного чтения и изменения является только счетчик команд IP. Остальные регистры 8088, а также 8 регистров сопроцессора доступны программисту. Изменение последовательности выполняемых операций осуществляется при выполнениии команд условного и безусловного перехода. Команды условного перехода передают управление по адресу, заданному операндом, в зависимости от состояния отдельных битов флагового регистра, кроме команды JCXZ, которая проверяет состояние регистра СХ. Модификацию флагов можно произвести как непосредственно, так и выполнив команду сравнения CMP, которая установит флаги по результату операции. Примеры команд условного перехода: JA, JE, JNE, JB, JZ, JL. Команда безусловного перехода JMP передает управление по указанному адресу.
Прерывания – специфические сигналы, посылаемые процессору устройством или программой, когда требуется его немедленное вмешательство. В этом случае он останавливает всякую другую деятельность и вызывает программу-обработчик прерывания. По окончании ее работы он продолжает прерванную работу с того места, где она остановилась.
Прерывания бывают 2 типов –
а)аппаратные (генерируются схемами ПК в ответ на какое-либо действие, например, при нажатии клавиши на клавиатуре генерируется прерывание 9). Иногда аппаратные прерывания генерируются устройством в случае некорректной работы программы, например деление на 0.
б)программные – генерируются программой для вызова различных подпрограмм из ОЗУ и ПЗУ.
Аппаратные прерывания процессор обрабатывает в порядке приоритета (важности). Прерывания, требующие немедленной реакции процессора – немаскируемые (NMI). Такие прерывания процессор обрабатывает перед всеми остальными, часто они сигнализируют об аварийных ситуациях.
22.Классификация объектных данных в программах на языках высокого уровня. Агрегатные
данные: векторы, массивы, структуры, множества и их отображение на реальную ОП.
Большинство современных ЯВУ определяет понятие типа данных. Оно применяется ко всем объектам данных и определяет набор физический набор свойств и операций присущих данным этого типа. Различают языки со строгой типизацией (PASCAL) и со свободной (ASSEMBLER). Тип данных определяется как рекурсивное использование базовых предопределенных типов + агрегатирование. Агрегатирование – включает в себя описание массивов, структур, множеств, объединений.
Базовые типы
Перичислимый тип – объект данного типа может принимать одно из перечисленных заранее значений. Целые числа, действительные числа, символьные данные, битовые данные, указатель (типизированный и нетипизированный).
Агрегатирование
Массив – каждому элементу ставится в соответствие его индекс. Необходимо иметь возможность переводить индекс в адрес памяти. Для одномерных массивов проекция элементов на ОП выглядит как @A[i]=@A[0]+i*l, где l-длина элемента массива. Для многомерного есть 2 случая – размещение по строкам и по столбцам. Для двумерного массива прекция элемента @A[i,j]=@A[0]+i*lстр+j*lэл-та, где lстр – длина строки, а lэл-та – размер элемента. Если ЯВУ позволяет массивы переменной длины, то к массиву должен быть приписан скрытый элемент данных, наз. дополнительным вектором. Он должен содержать информацию о последних измененных размерностях для правильной индексации.
Структура – совокупность элементов различных типов. Длина структуры равна сумме длин всех ее членов. Чтобы обратиться к структуре по памяти, надо знать, где расположена структура, и смещение элемента внутри структуры.
Объединение – похоже на структуру, но все члены объединения расположены на одном участке памяти.Описывает одни и те же данные “с разных точек зрения”. Размер объединения совпадает с размером самого большого члена объединения.
Множество – представление набора элементов. Могут быть ограниченные и динамические. Представлены в виде битовых полей – 1 означает наличие элемента, 0 – отсутсвие. Длина равна числу элементов разделить на 8 и дополнена до кратности 8 в большую сторону. Доступ – через логические операции.
23.Указатели и динамические структуры данных: стеки, списки, очереди, деревья.
Указатель – тип данных, хранящих адрес в памяти других данных. В зависимости от типизации указатель может быть нетипизированным (содержать просто адрес в памяти) и типизированным (указывать только на элемент определенного типа).
Стек – хранилише данных однородного типа с дисциплиной “последним пришел-первым вышел” (LIFO).
Над стеком определены операции PUSH, POP (затолкнуть, извлечь).
При операции PUSH указатель стека SP увеличится на 1, при извлечении уменьшится на 1.
Природа стека делает необходимым соответствие операций PUSH и POP. Если его нет, то возможно 2 ситуации:
а) переполнение – SP вышел за пределы верхнего значения
б) антипереполнение –“- нижнего.
Очередь – структура данных с дисциплиной FIFO – “первым вошел, первым вышел”.
Здесь HP – указатель на последнее значение, tp – номер последнего выбранного элемента. Если HP=TP – очередь пуста.
ENQ x - добавляем в очередь
HP=HP+1
A[HP]=x
DEQ x - извлекаем из очереди
TP=TP+1
x = A[TP]
Особые ситуации - так же как и со стеком.
Для реализации динамических структур данных используют т.н. кучу (heap). Это объем памяти, в котором можно выделить участок для произвольного элемента данных. Для кучи есть 2 операции: выделения памяти ALLOCATE и освобождения FREE. Эти функции не делают никаких действий с собственно памятью. При выделении программист получает адрес, а при освобождении доступный объем кучи становится больше. Одного адреса для этих операций недостаточно, требуется еще и размер элемента данных.
Списки – сложные динамические структуры данных, представляющие собой структуры, содержащие указатели на другие подобные структуры. Если такой указатель в структуре 1 – односвязный список, если 2 – двусвязный, если много – многосвязный. Стек и очередь можно легко представить в виде одно- и двусвязного списка. Списки характеризуются тем, что для них легко реализуется любая дисциплина ввода-вывода за счет простого добавления и удаления элемента.
Для добавления элемента достаточно выделить под него память и присвоить адрес памяти нового элемента соответствующему предыдущему элементу. Для удаления элемента память из-под него освобождается, а указателям на него присваивается некоторое зарезервированное значение NULL – “указатель на ничто”.
Двусвязный список
Дерево – структура данных, в которой каждому элементу может соответствовать несколько подчиненных элементов, например, для бинарного дерева – два подчиненных элемента. Структура для представления такого дерева – данные и указатели на левого и правого потомков. На таком списке реализуются все операции по обходу деревьев.
Структура двоичного дерева. Каждый элемент содержит поле данных и два указателя - на левого и правого потомков.
24. Способы выделения памяти в программах: абсолютное, статическое, динамическое и автоматическое распределения. Механизм стека и кучи при реализации процессоров языка программирования.
Статическое выделение памяти – выделение памяти под данные внутри сегмента данных программы. Такие данные существуют на протяжении всей жизни программы до ее завершения.
Автоматическое распределение – выделение памяти под данные в стеке. Такие данные существуют на протяжении работы текущей подпрограммы (функции или процедуры), затем уничтожаются.
Динамическое выделение – выделение памяти под данные самой программой, когда это необходимо. Время жизни таких данных зависит от программы.
В стеке размещаются данные для возврата из подпрограмм, а также их аргументы и автоматические данные. Все это может потребовать достаточно большого размера стека. Как правило, программист может определять размер стека в программе.
Куча. Для реализации динамических структур данных используют т.н. кучу (heap). Это объем памяти, в котором можно выделить участок для произвольного элемента данных. Для кучи есть 2 операции: выделения памяти ALLOCATE и освобождения FREE. Эти функции не делают никаких действий с собственно памятью. При выделении программист получает адрес, а при освобождении доступный объем кучи становится больше. Одного адреса для этих операций недостаточно, требуется еще и размер элемента данных. Если указатель типизированный, размер будет получен автматически. В случае нетипизированного указателя размер должен быть передан в функцию.
Для реализации кучи ЯВУ снабжаются диспетчерами памяти, которые выделяют и освобождают память, имеют сведения о ее фрагментации, знают наибольший кусок свободной памяти и ее общее количество и т.п. При ненадобности память должна своевременно освобождаться. При использовании динамической памяти возможноа ситуация образования «мусора» – кусков памяти, на которые утеряны ссылки, но которые не были своевремменно освобождены, поэтому менеджер считает их занятыми. Для оптимизации известна процедура “уборка мусора” – перестройка динамических структур с освобождением памяти из-под тех данных, на которые отсутствуют ссылки.
25. Среды ссылок: глобальная, локальная и нелокальная их реализация в исполняющих системах ЯВУ.
26. Понятие программного модуля: подпрограммы, функции, сопрограммы.
Модульное программирование подразумевает разбиение программы на подпрограммы по специфике обрабатываемых данных. Для этой цели в ЯВУ используются функции и процедуры. При вызове подпрограммы в стеке сохраняется текущее значение счетчика команд (ближняя модель вызова) и значение сегмента кода (дальняя модель вызова). При использовании дальней модели вызова подпрограмма необязательно должна находиться в том же сегменте, что и вызывающая программа. По окончании выполнения кода подпрограммы эти данные восстанавливаются, управление передается на следующий оператор после оператора вызова процедуры.
До вызова подпрограммы в стек помещаются параметры – аргументы подпрограммы. Если передан не сам аргумент, а его адрес, то подпрограмма может изменить аргумент, в противном случае нет, т.к. по завершению работы подпрограммы стек очищается от аргументов. Отличие функций от процедур в том, что функции могут возвращать значения в вызывающую программу и их можно присваивать, например, какой-либо переменной. В действительности функция при возврате значений просто модифицирует регистры процессора, а ЯВУ по соглашению использует данные из этих регистров.
27. Способы передачи управления между модулями. Применение стека для организации связи в подпрограммах и функциях.
Переписать 26 без первых 2 предложений.
28. Параметры подпрограмм и функций. Способы передачи параметров – по значению, по ссылке, по имени.
До вызова подпрограммы в стек помещаются фактические параметры – аргументы подпрограммы. Если требуется изменит аргумент в процедуре, то передается не сам аргумент, а его адрес. Существует два способа передачи параметров в подпрограмму для 8086 – соглашения о передаче параметров в С и Паскале. При передаче параметров первым способом запись аргументов в стек идет с последнего до первого, в Паскале наоборот.
Передача самого аргумента – передача параметра по значению. Передача адреса аргумента – передача по ссылке.
В С можно писать подпрограммы с переменным числом параметров, однако это не рекомендуется, т.к. стек имеет ограниченный размер и не желательно передавать по значению элементы данных большого размера.
После выполнения пролога все параметры подпрограммы имеют отрицательное смещение от регистра BP. После выполнения пролога, как правило, в стеке выделяется место под локальные переменные.
По окончании работы процедуры стек очищается от локальных переменнных и параметров.
29. Общая структура программного модуля для микропроцессора 80х86 – регистр BP, локальные переменные, глобальные переменные, параметры.
Обобщение 26, 28 (см. их для того, чтобы написать более подробно)
Регистр BP – относительно него с отрицательным смещением происходит адресация параметров после выполнения кода пролога в подпрограмме.
push bp
mov bp, sp
mov ax, word ptr [bp-2]; загрузка в ах аргумента
Локальные переменные – размещаются в стеке после вызова процедуры и выполнения кода пролога и удаляются перед завершением.
Глобальные переменные – размещаются в сегменте данных программы и существуют в течение всей жизни программы.
Параметры – могут передаваться по значению и по ссылке, размещаются в стеке перед вызовом процедуры, после выполнения кода пролога к ним возможно адресоваться через регистр BP, при завершении подпрограммы удаляются из стека.
30. Сегментация памяти. Типы программных сегментов, их использование в программах.
Любая программа состоит из многих частей. Как правило некоторые функции пишутся самостоятельно, другие используются готовыми. Чтобы обеспечить взаимодействие между частями программы, применяют ряд механизмов.
а) унитарная структура объектного модуля.
б) механизм внешних ссылок позволяет устанавливать связи между отдельными частями.
в) Способ объединения отдельных частей в общий исполняемый модуль. В современных системах основой 3-го способа и является сегментация.
Сегменты – бывают 4 видов.
а) кодовые – содержат коды исполняемой программы. Вряде случаев там можно располагать и данные. Модификация сегмента кода в процессе работы программы считается плохим стилем программирования, но иногда это приходится делать, напр. при сохранении регистров перед запуском программы функцией EXEC.
Сегменты данных бывают 3 типов:
а) сегмент инициализированных данных – содержит данные статического типа с уже присвоенными значениями
б) сегмент стека – как правило, ничем не инициализирован
в) сегмент неинициализированных данных. В него попадают данные, не имеющие начального значения (BSS).
Исполняемый модуль содержит образ начального состояния всех сегментов, и не обязан содержать только образ BSS.
При использовании указателей в программах с не более чем одним сегментом данных и не более чем одним – кода достаточно 16-битового короткого указателя, т.к. значения сегментов фиксиованы и хранятся в регистрах DS и CS соответственно. Для большего количества сегментов требуются длинные указатели.
Существует несколько моделей памяти – способов распределения программ по сегментам. Поддержка переключения моделей памяти есть в компиляторах C и ASSEMBLER, в остальных, например Trubo Pascal, чаще всего используется модель памяти LARGE.
TINY (крошечная) – и данные и код в одном сегменте (64К). Короткие указатели. Полученный исполняемый модуль может быть пригоден для конверсии в формат типа COM.
SMALL (малая) – 2 сегмента – код и данные (128K).Короткие указатели.
COMPACT (компактная) – 1 сегмент кода и много сегментов данных. Первая модель, где нужны дальние указатели.
MEDIUM (средняя) – наоборот, много сегментов кода, 1 данных.
LARGE (большая) – много сегментов кода и данных. Наиболее распространена.
HUGE (огромная) – то же, что и LARGE + все указатели программно приводятся к виду длинных. Используется для построения очень больших программ.
В 32-битовом режиме модели памяти не нужны, т.к. размер сегмента достигает 4ГБ.
31. Особенности указателей в 80х86. Модели памяти.
См. 30.
32. Понятие среды ОС. Взаимодействие прикладной программы с ОС. Системные соглашения о связях.
Структура взаимодействия аппаратуры, системы и прикладного ПО.
Среда ОС – совокупность условий, в которых работают прикладные програмы в данной ОС. Современная ОС обеспечивает, как минимум, 4 условия:
а) запуск и остановка прикладных программ.
б) распределение ресурсов.
в) обеспечение таких системных услуг, которых нет в аппаратуре.
г) защиту, т.е минимальную вероятность повреждения программ и данных при сбое одной из выполняющихся программ.
Чтобы писать приложения под ОС, существует ряд правил, которым должен следовать программист, в частности, он должен знать API – интерфейс прикладного программирования. Определяет состав, параметры и смысл функций, предоставляемых ОС программисту.
Например: стандарт POSIX на API ОС UNIX включает функции:
1) Набор файловых операций
2) Операции со строками
3) Ф-ии многозадачности, управления процессами
4) Управление терминалом.
Помимо POSIX есть API Win32 и т.п. АPI ОС может включать самые разнообразные услуги, вплоть до поддержки функций телефонного аппарата на базе модема (TAPI Win32)
33. Принципы междумодульного взаимодействия: внешние ссылки и общие имена (public names)
Внешние ссылки из сегмента позволяют получать доступ к данным, которые объявлены в другом модуле. Для объявления внешних ссылок в компиляторах с ассемблера используется директива EXTRN. Пример использования:
EXTRN maybe:far
Идентификаторы в программе можно сделать доступными из других модулей. Для этого применяется директива PUBLIC. Пример использования:
maybe PROC far
PUBLIC maybe
Такие действия необходимы для того, чтобы после раздельной компиляции модулей компоновщик, используя имена и смещения, записанные в объектных модулях, разрешил все внешние ссылки директив EXTRN, использовав соответствующие директивы PUBLIC. Если для какой-то ссылки EXTRN не будет обнаружен соответствующий идентификатор PUBLIC, то компоновщик выдаст ошибку unresolved external <имя_идентификатора>, и сборка прекратится.
Использование многомодульной структуры необходимо:
а) для разбиения большого текста на модули по функциональному назначению;
б) для создания библиотек процедур;
в) для написания подпрограмм в языки высокого уровня.
34. Технология разработки программ – трансляция и редактирование связей. Понятие об исходном, объектном, выполняемом модулях.
Исходный код программы – код, написанный на языке программирования. Может включать модули на ЯВУ и модули с подпрограммами на языке ассемблера.
Объектный модуль – код программы после трансляции (компиляции), преобразованный в машинные коды. Помимо них содержит внешние ссылки и информацию для редактора связей и может также содержать отладочную информацию (debug info).
Исполняемый модуль –модуль, содержащий готовую к выполнению программу – м.б. 2 видов:
а) точный образ памяти программы с привязкой к абсолютным адресам (в MS-DOS – формат файла *.COM)
б) перемещаемый исполняемый формат, см. 17.
Трансляция – получение объектного кода из исходного.
Редактирование связей – разрешение внешних ссылок и создание исполняемого модуля из объектных.
35. Основные функции редактора связей – распределение памяти, разрешение внешних ссылок – см. 17, 33.
36. Программные сегменты и их атрибуты, способы распределения памяти под сегменты.
Собственно сегменты и распределение памяти см. 30.
Атрибуты сегментов
Атрибут комбинации сегмента предназначен дляуказания компоновщику, каким образом объединять сегменты, находящиеся в разных модулях и имеющие одинаковые имена. М.б. PRIVATE (сегмент не будет объединяться с одноименными из др. модулей), PUBLIC (будет) и некоторые другие.
Атрибут класса сегмента представляет собой строку, заключенную в кавычки, которая позволяет определить компоновщику нужный порядок размещения сегментов при помещении их в программу из разных модулей. Он группирует вместе сегменты с одинаковым классом.
Атрибут выравнивания сегмента – сообщает компонаовщику, чтобы он позаботился о том, чтобы сегмент начинался с указанной границы. Возможное выравнивание: BYTE – выравнивание не делается, сегмент начинается со следующего байта, WORD (DWORD) – выравнивание погарнице слова (двойного слова), PARA – выравнивание по границе 16-байтового параграфа, и т.п.
Атрибут размера сегмента – показывает размер, 16 или 32-битные сегменты.
Атрибут доступа – показывает возможность доступа к сегменту в защищенном режиме – доступен как кодовый, для чтения, записи, чтения и записи.
37. Разрешение внешних ссылок, функция автовызова, библиотеки объектных модулей и их использование.
Разрешение внешних ссылок – см. 33, 17.
Библиотеки объектных модулей – пакет объектных модулей, собранных в один файл и подключаемый к программе на этапе разрешения внешних ссылок (все идентификаторы, которые должны быть доступны из библиотек, объявляются в модулях как PUBLIC). Компоновщик может просматривать библиотеку и самостоятельно находить нужные модули, избавляя от этого программиста. Библиотеки делаются с помощью программы-библиотекаря. Библиотекарь может добавлять и извлекать модули, а также получать список доступных идентификаторов.
Любой компилятор ЯВУ имеет в комплекте несколько стандартных библиотек, например, библиотеки ввода-вывода, работы с плавающей точкой, графическую и т.п.
38. Типы внешних ссылок и общих имен. Статическое и динамическое разрешение ссылок.
Внешние ссылки см. 17, 33, 34.
Статическое и динамическое разрешение внешних ссылок.
Процесс разрешения внешних ссылок на этапе создания исполняемого модуля – статическое разрешение ссылок. Возможно и динамическое подсоедиение нужных модулей на этапе работы программы.
а) Динамически вызываемый загрузчик, т.е. программа вызывает загрузчик и подсоединяет недостающие части. Такой подход невыгоден (сложен и требует много времени)
б) DLL – принцип разделяемых библиотек. DLL – это пакет функций, отредактированный для исполнения в позиционно-независимом стиле. Имеет таблицу всех содержащихся функций. Для работы с ним программа выполняет 1) функцию загрузки DLL, 2)переход по смещению в таблице функций.
При работе с DLL несколько программ могут использовать одну ее копию в памяти.
39. Динамическое распределение памяти, оверлейные программы. Общая структура объектного модуля.
Стандартный исполняемый псевдоперемещаемый модуль (например, типа EXE для DOS) содержит сегменты в том виде, в котором они будут размещены в памяти. Такое распределение памяти называется статическим. В ситуации нехватки памяти, отдельный код или данные, которые могут быть нужны не все вместе, а по очереди, разумнее было бы подгружать в память в процессе выполнения. Выделение памяти под выполняемый код в процессе работы программы и удаление их после использования называется динамическим распределением памяти. Программы, содержащие динамически подгружаемые модули, называются оверлейными, а сами такие модули – оверлеями. Загрузка данных из модуля в общем случае не представляет проблем, в случае загрузки кода перед выполнением он должен быть особым образом подготовлен (например, с учетом местоположения вызывающей программы в памяти для подпрограмм должны быть образованы правильные ссылки). Такую подготовку выполняет специальная программа – менеджер оверлеев. Он может поставляться, а) как библиотека компилятора [в Borland Pascal 7.0]. В этом случае оверлейный модуль, как правило, имеет какой-то свой специфический формат, работа с ним ведется с помощью стандартных подпрограмм. Код оверлейных подпрограмм и данных размещается в памяти [в BP буфер оверлеев имеет плавающую границу с кучей] и по окончании работы с ним может быть удален. б) Может быть внедрен в структуру оверлейного модуля. В этом случае модуль имеет формат исполняемого файла, и для инициализации он должен быть запущен стандартным для ОС способом из-под вызывающей программы.
Оверлеи имеют широкое распространение в системе MS-DOS, при подгрузке используется не только основная память, но и DOS-спецификации расширенной: XMS, EMS. В развитых многозадачных системах используется, в основном, очень похожая технология DLL. Ее отличие в том, что она функционирует в защищенном режиме и позволяет использовать одну свою копию в памяти разным программам. DLL можно рассматривать как следущее поколение оверлейной технологии.
40. Основные функции ОС. Принципы мультипрограммирования. Системные ресурсы.
Основные функции ОС:
1) Управление процессором путем передачи управления программам.
2) Обработка прерываний, синхронизация доступа к ресурсам.
3) Управление памятью.
4) Управление устройствами ввода-вывода.
5) Управление инициализацией программ, межпрограммные связи.
6) Управление данными на долговременных носителях путем поддержки файловой системы.
Ресурс – какой-либо объект или показатель надежности какого-либо объекта. Системные ресурсы – совокупность аппаратных ресурсов и системных сервисов. Основными потребителями системных ресурсов являются процессы, выполняемые в системе.
41. Защита программ и данных в мультипрограммных средах. Режимы управления. Защита и распределение памяти.
Защита программ и данных в многозадачных ОС означает малую вероятность того, что сбой одной из выполняющихся программ не вызовет повреждения данных или кода других программ, и по возможности изолировать процессы друг от друга. Во всех ОС сущ. хотя бы 2 режима процессора – системный и пользовательский. Программа исп. в пользовательском режиме и не может использовать ряд команд. В системном режиме доступно все. Переключение режимов работы осуществляется системными вызовами. Системный вызов – специальная команда, приводящая к прерыванию, и в ядре ОС существует несколько точек, куда перейдет управление по этому прерыванию. 386 имеет встроенный механизм для этих переключений – шлюз.
Защита памяти – осуществляется путем блокировки доступа к памяти других процессов, а также блокировки доступа к памяти ядра. Один из способов – вся память делится на страницы, и у каждой есть замок – 4-битовый признак, который можно установить только привелигированной командой. В процессоре есть 4-битовый регистр – ключ, который также можно установить только привелигированной командой. При обращении происходит сравнение замка и ключа.
С появлением многозадачности появилась проблема распределения памяти. При работе реальной программы обращения к ОП имеют тенденцию к локализации. Память можно разделить на используемую и неиспо