Центральный процессор суперЭВМ-это мультипроцессорная система или система с несколькими операционными устройствами.
Базовые подходы построения машин высокой производительности:
1. Специализированное функциональное устройство для каждой операции.
2. Чем меньше обращений к памяти, тем лучше:
a. Сложные многофункциональные команды
б. Более простые системы адресации
в. Меньше обращений в память за операндами
3. Перенесение действий с программного уровня на микропрограммный уровень (согласование форматов данных и т.д.)
4. Типовая организация данных. Будем помечать данные признаком типа –тегом (все данные со своими типами).Машина при выполнении какой-либо операции смотрит на тег и выбирает операцию нужного типа.
5. Векторизация операций (операции с массивами)
Команды: сложение массивов, умножение матриц
6. Образование сцеплений команд внутри процессора («короткое замыкание»). Первая команда формирует данные, которые являются исходными данными для второй команды.
7. Отказ от системы команд в классическом виде, фактически входными данными является микрокоманда.
8. Большое РЗУ из регистров большой длины (для операций с плавающей запятой – 80 бит).
Из этих пунктов следует, что в таких системах идет параллельная работа множества функциональных устройств. Но это означает лишь высокую производительность, а не быстродействие.
RISC-архитектура – машина с упрощенным набором команд (одна команда в 1,2 такта) команда становится похожа на микрокоманду.
RISC-архитектура
Если машина не предназначена для математических расчетов, то система команд простая. Нет сложной системы адресации, многоадресных команд.
Регистр аккумулятор используется по умолчанию (операции регистр-регистр).
Прообразом RISC-архитектуры была машина: БЭСМ-6.
Вызов процедуры и возврат с передачей значений производится за один такт. Нужно убрать множество обращений к стеку, необходимость сохранять состояние машины.
Не перегонять данные из ЦП в память, а только переключать блок регистров. РЗУ объемом 128 регистров, которые разбиты на блоки по 8 регистров.
8 регистров универсального типа, внутренний регистр-указатель блока. Смена блока происходит по прерыванию. Величина вложенности ограниченна, предусмотрен доступ к нижним регистрам.
2/3-3/4 площади кристалла занято под РЗУ.
Технологический обзор
1950 г. – первая машина на больших лампах.
Используется последовательная арифметика, 100 арифметических операций в секунду.
UNIVAC, ADVAC.
Постепенно переходят на пальчиковые лампы, размеры машин уменьшаются.
1952 г. Машины с параллельной арифметикой, 10 тыс. операций в секунду.
БЭСМ, Стрела, IBM-701,704.
1976 г.100-130 млн. операций с плавающей точкой в секунду.CRAY-1.
Быстродействие элементов 65-75 г.:
Лампа- 1 мкс./вентиль.
Транзистор- 0,3 мкс./вентиль.
Интегральные микросхемы:
ТТЛ 5-10 мкс./вентиль.
ЭСЛ 1 мкс./вентиль.
По сути в массовом производстве повышение быстродействия шло за счет технологии.
Технологические ограничения:
Скорость света – 30 см./нсек.
Скорость распространение электро- магнитного сигнала в металле- 10 см./нсек.
Кремний 0,1 мм./нсек.
Поликремний 0,05 мм./нсек.
Вскоре размеры логических элементов стали сопоставимы с размерами кристаллической решетки. Дальнейшее повышение быстродействия за счет технологии не возможно.
1961 г. На стадии разработки находиться способ повышения быстродействия за счет параллелизма.
1964 г. Машина Атлас - четырехступенчатый конвейер команд, трехуровневая память со страничной организацией и расслоенным обращением.