ОГЛАВЛЕНИЕ:
- Предисловие
- Микроархитектура Sandy Bridge
- Общие характеристики платформы
- Обзор MSI P67A-GD55
- Тестирование
Принцип увеличения интеграции и качественного, а не количественного, улучшения находит свое продолжение и в этот раз. Это тот же 64-битный 4-ядерный процессор, но выполненный уже полностью в рамках 32-нм технологического процесса на монолитном кристалле с поддержкой симуляции многопоточности, знакомой как Hyper-threading (HT). Реалии прогресса оказались таковы, что коммутация компонентов шинами с перекрёстной топологией стала "узким горлышком". На смену QPI пришла до 4х раз более быстрая 256-битная кольцевая шина Ring Interconnect. Она соединяет четыре ядра, кэш последнего уровня, графическое ядро и блок системного агента, через четыре 32-байтных кольца: шины данных, запросов, подтверждения и мониторинга. Обработка запросов прямо зависит от тактовой частоты ядер. Процессоры обладают кэш-памятью первого уровня объёмом 64 Кбайт (32 Кбайт для инструкций и 32 Кбайт для данных) и кэшем L2 объёмом 256 Кбайт. До 8 Мбайт кэша третьего уровня распределяются не только на графическую систему, но и на блок Uncore, название которого теперь системный агент. Помимо реализации мульти-медиа обработки с поддержкой одновременного аппаратного кодирования, декодирования видео высокой четкости в форматах MPEG2, VC1, AVC и вывода изображения через Display Port разрешением до 2560 x 1600 точек, двухканального контроллера памяти DDR3 с поддержкой 1600 МГц модулей(в настольном варианте 1333 МГц) с максимальным объемом в 32 ГБ и контроллера питания, шин PCI-E x16 2.0 и DMI, в нем размещен специальный трассировочный механизм для предотвращения конфликта доступа. Это обосновано особенностью работы L3 кэша разделением на 4 сегмента с независимыми контроллерами. Они отдают половину своей шины для доступа кольцевой шины данных, а другую на взаимодействие с системным агентом, например, на предмет неудачных обращений, контроля межкомпонентного обмена данными и некэшируемых обращений. Такая схема позволяет значительно снизить латентность работы практически всех модулей, включая графическую систему, путем снижения частоты обращения к оперативной памяти.
Одной из наиболее значимых нововведений является появление кэша микроопераций L0, при сверке с которым инструкции могут загружаться в обход декодеров. А список всех этих инструкций теперь хранится в отдельном регистровом файле. Благодаря этому буферу переупорядочивания не нужно их физически перемещать, а достаточно просто ссылаться на них
Помимо наличия привычных инструкций для увеличения скорости кодирования и декодирования алгоритмом блочного шифрования Advanced Encryption Standard (AES), шифрования RSA и SHA, набора виртуализации Virtualization Machine Extensions (VMX) под фирменным названием VT-d, появилось расширение системы команд Advanced Vector Extensions. Набор призван увеличить производительность операций поддержкой векторных регистров SIMD размером до 256 бит, ослаблением требования выравнивая данных для операндов SIMD и увеличением эффективности обработки двухоперандных инструкций XMM, которые теперь могут обрабатываться в трёхоперандном виде без модификации регистров-источников, но с отдельным регистром для результата. Увеличение производительности в микрооперациях SIMD, целочисленных, с плавающей запятой обязано и повышению точности работы блоков предсказаний ветвлений, благодаря буферам удвоенной ёмкости с историей команд и результатами ветвления.
Концепция динамического изменения частоты и напряжений технологиями Turbo-boost и EIST максимально доработаны. Режим экономии энергии предполагает даже кольцевая шина, а для незадействованных компонентов предусмотрены агрессивные режимы отключения. Теперь на срок увеличения производительности должны влиять температурные показатели, которые обрабатываются не с помощью программного драйвера, а аппаратно. Поддаваться такому заводскому разгону сможет и интегрированная видеосистема уровня Intel HD Graphics 200/100 с 12 и 6 исполнительными шейдерными модулями (EU) соответственно. В топовых моделях мобильных процессоров ее рабочие частоты могут увеличиваться вдвое, с 650 МГц до 1300 МГц. Основной упор при усовершенствовании видеоподсистемы был сделан на самый массовый рынок которому необходима поддержка Blu-ray 3D-графики и улучшение показателей энергоэффективности. Производительность, по сравнению с предыдущими 45 нм ядрами Clarkdale/Arrandale, увеличена вдвое, а прирост в сложных вычислениях (синус, косинус, извлечение квадратного корня и т.п.) достигает двадцати раз. Перечень технологий 3D приложений, за исключением введения поддержки DirectX 10.1 и 4xMSAA рендера, остался тот же. Для лучшего воспроизведения видео добавлена поддержка детектирования деинтерлейсинга, фильтрации шумов, возможность повышения детализации и улучшенная передача телесных тонов.