Ћекции.ќрг


ѕоиск:




 атегории:

јстрономи€
Ѕиологи€
√еографи€
ƒругие €зыки
»нтернет
»нформатика
»стори€
 ультура
Ћитература
Ћогика
ћатематика
ћедицина
ћеханика
ќхрана труда
ѕедагогика
ѕолитика
ѕраво
ѕсихологи€
–елиги€
–иторика
—оциологи€
—порт
—троительство
“ехнологи€
“ранспорт
‘изика
‘илософи€
‘инансы
’ими€
Ёкологи€
Ёкономика
Ёлектроника

 

 

 

 


ќсобенности €дра со структурой Haswell




 

ѕроцессоры со структурой Haswell производились по22-нанометровому техпроцессу.

—ерьезных изменений в структуре €дра Haswell не произошло. √лавный упор был сделан на управление энергопотреблением и масштабируемость.

¬веден новый набор состо€ний €дра в зависимости от его текущей загрузки -S0ix. ќсновна€ иде€ Ц минимизировать энергопотребление в момент низкой активности или полного бездействи€ системы, например, когда пользователь просто что-то разгл€дывает на экране, а в фоновом режиме не выполн€етс€ никаких ресурсоемких задач. ¬ этот момент отключаютс€ (обесточиваютс€) все незадействованные модули внутри €дер. ћодули включаютс€ только по необходимости, что дает аж двадцатикратную экономию в режиме просто€, при этом сама система находитс€ в полностью активном состо€нии C0. ¬ итоге иде€ с полным отключением блоков оказалась в разы эффективнее снижени€ напр€жени€ и понижени€ частот. јналогичным образом оптимизированы и другие состо€ни€ C0-C7.

 роме этого, €дра еще больше "разв€заны" друг от друга по частоте, что позвол€ет эффективнее использовать режимы Turbo, при этом остава€сь в рамках заданного теплового пакета.

ѕо€вилс€ расширенный набор команд AVX2, возросло количество исполнительных портов. »х стало восемь, поэтому в теории пропускна€ способность конвейера €дра со структурой Haswell стала на треть больше. Ѕыл предприн€т р€д шагов к тому, чтобы обеспечить все эти порты работой, то есть улучшить возможности €дра по параллельному выполнению команд. — этой целью были оптимизированы алгоритмы предсказани€ ветвлений и увеличен объЄм внутренних буферов: в первую очередь Ч окна внеочередного выполнени€ команд.

–асширена система команд подмножеством команд AVX2, а также существенно увеличилась скорость их выполнени€. √лавное досто€ние этого набора Ч FMA-команды, объедин€ющие сразу пару операций над числами с плавающей точкой. Ѕлагодар€ этим командам теоретическа€ производительность €дра со структурой Haswell при операци€х над числами с плавающей точкой с одинарной и двойной точностью выросла вдвое.

“акже в структуре Haswell по€вилс€ набор команд-расширений TSX (Transactional Synchronization Extensions), которые помогают программистам лучше управл€ть потоками команд и данных дл€ более плотной загрузки много€дерных процессоров.

ќптимизирована межъ€дерна€ шина.  роме того, вдвое увеличена пропускна€ способность кэш-пам€тей L1 и L2.¬ каждом такте они оперируют с вдвое большим количеством данных, хот€ сами объемы кэш-пам€тей, а также задержки в выборке или в случае кэш-промахов остались аналогичными с предыдущим поколением.
ѕоказатели задержек и пропускных способностей трех структур €дер приведены в таблице 31.2.

“аблица 31.2.

  —труктура Sandy Bridge —труктура Ivy Bridge —труктура Haswell
  «адержка, такты
L1D кеш-пам€ть      
L2 кеш-пам€ть      
L3 кеш-пам€ть      
ѕропускна€ способность, √байт/с
L1D кеш-пам€ть 510,68 507,64 980,79
L2 кеш-пам€ть 377,37 381,63 596,7
L3 кеш-пам€ть 188,5 193,38 206,12

 

 еш-пам€ть третьего уровн€ L3 в структуре Haswell работает с б о льшими задержками, чем в процессорах предыдущих поколений, так как обща€ часть этого процессора получила асинхронное тактирование относительно €дер. ќднако увеличение задержек с лихвой компенсируетс€ двукратным ростом полосы пропускани€, произошедшим не только в теории, но и на практике.

ќрганизаци€, размеры, задержки, пропускные способности кэш-пам€тей первого и второго уровней приведены в таблице 31.3.

“аблица 31.3.

’арактеристики —труктура Nehalem —труктура Sandy Bridge —труктура Haswell
ќрганизаци€ кэш-пам€ти команд первого уровн€ L1K 32  байт, 4-канала 32  байт, 8-каналов 32  байт, 8-каналов
ќрганизаци€ кэш-пам€ти данных первого уровн€ L1D 32  байт, 8-каналов 32  байт, 8-каналов 32  байт, 8-каналов
«адержка при обращении в кэш-пам€ть L1 4 такта 4 такта 4 такта
–азмер блока данных, читаемых из кэш-пам€ти L1 16 байт 32 байта 64 байта
–азмер блока данных, записываемых в кэш-пам€ть L1 16 байт 16 байт 32 байта
ќрганизаци€ кэш-пам€ти второго уровн€ L2 256  байт, 8-каналов 256  байт, 8-каналов 256  байт, 8-каналов
«адержка при чтении из кэш-пам€ти L2 10 тактов 12 тактов 12 тактов
–азмер блока данных, читаемых из кэш-пам€ти L2 в кэш-пам€ть L1 32 байта 32 байта 64 байта
TLB L1K 4  байт, 128, 4 канала, 2ћ/4ћ: 7 потоков 4  байт, 128, 4 канала, 2ћ байт/4ћ байт: 8 потоков 4 байт, 128, 4 канала, 2ћ байт/4ћ байт: 8 потоков
TLB L1D 4  байт, 64, 4 канала, 2ћ байт/4ћ байт: 32, 4 канала, 1G: расщепленный 4  байт, 64, 4 канала, 2ћ байт/4ћ байт: 32, 4 канала, 1G, 4, 4 канала 4 , 64, 4 канала, 2ћ/4ћ: 32, 4 канала, 1G, 4, 4 канала
TLB L2 4 ћ, 512, 4 канала,   4 ћ, 512, 4 канала 4  байт+2ћ байт, общий, 1024, 8 каналов
–азмер блока при обращении в оперативную пам€ть 64 байта 64 байта 64 байта

 

¬ целом структура Haswell на фоне структуры Sandy Bridge не выгл€дит заметным продвижением вперЄд. ѕринципиальное преимущество наблюдаетс€ лишь при использовании набора команд AVX2. ≈сли же эти новые команды в рассмотрение не брать, то средний уровень превосходства структуры Haswell над структурой Sandy Bridge составл€ет пор€дка 10 процентов.

ќбща€ блок-схема €дра со структурой Haswell приведена на рис. 31.3.

 

 

–ис. 31.3. Ѕлок схема €дра со структурой Haswell

 

 онтрольные вопросы

 

1. Ќазовите основные стадии конвейера команд современных универсальных процессоров.

2. —колько уровней кэш-пам€ти в современных процессорах?

3. ‘ункции кэш-пам€ти первого уровн€?

4. ‘ункции кэш-пам€ти второго уровн€?

5. ‘ункции кэш-пам€ти третьего уровн€?

6. ѕочему кэш-пам€ть первого уровн€ раздел€ют на кэш-пам€ть команд и кэш-пам€ть данных?

7. „то такое предвыборка?

8.  акие различи€ между организацией кэш-пам€ти в процессорах фирм Intel и AMD?

9.  акие функции дешифратора?

10. «ачем нужно переименование регистров?

11. ѕочему необходим буфер дл€ хранени€ выполненых команд?

12. ‘ункции предсказател€ переходов?

13. ‘ункции планировщика выдачи команд на выполнение?

 





ѕоделитьс€ с друзь€ми:


ƒата добавлени€: 2015-10-01; ћы поможем в написании ваших работ!; просмотров: 370 | Ќарушение авторских прав


ѕоиск на сайте:

Ћучшие изречени€:

—тудент всегда отча€нный романтик! ’оть может сдать на двойку романтизм. © Ёдуард ј. јсадов
==> читать все изречени€...

1441 - | 1245 -


© 2015-2024 lektsii.org -  онтакты - ѕоследнее добавление

√ен: 0.012 с.