PersCom — Компьютерная Энциклопедия Компьютерная Энциклопедия

Процессоры

Процессоры

Особенности микроархитектуры Athlon XP

В октябре 2001 г. на рынок поступили первые процессоры Athlon на ядре Palomino. Этой модификации был присвоен индекс XP (eXtreme Perfomance), подчеркивающий новшества архитектуры в сравнении с «обычным» Athlon. Так, в частности, существенной переделке подвергся механизм трансляции адресов команд и данных в физические адреса памяти. Для ускорения доступа к командам и данным все современные процессоры имеют Translation Look-aside Buffer (TLB). Этот буфер осуществляет кэширование, но не данных или команд, а их физических адресов. В предыдущих процессорах Athlon этот буфер был двухуровневым. Первый уровень (L1) емкостью 24 значения для адресов инструкций и 32 значения для адресов данных. Второй уровень (L2) мог хранить до 256 адресов данных и 256 адресов инструкций.

В ядре Palomino увеличен размер буфера первого уровня, теперь он может хранить до 40 значений адресов данных. Кроме того, теперь TLB, также как и основной кэш, стал «исключающим» — exclusive. Это означает, что содержимое буфера первого уровня не дублирует содержимого буфера второго уровня. И наконец, в новом ядре реализован механизм опережающей загрузки новых значений адресов (до того, как они могут потребоваться) — speculatively reload.

Существенно улучшен механизм опережающей загрузки данных из памяти в кэш. Этот механизм опережающей загрузки данных был реализован и в ранних процессорах, но только для инструкций, включенных в 3DNow! и SSE. В ядре процессоров Athlon XP осуществляется непрерывный анализ адресов затребованных процессором данных и последовательности, в которой они были затребованы. На основании анализа делается попытка предсказания адресов данных, которые будут затребованы, и опережающая загрузка этих данных в кэш процессора. Во многих случаях, например, при циклической обработке больших массивов данных, предсказание будет успешным. Это позволяет повысить производительность даже для неоптимизированных приложений.

В ядре Palomino полностью реализованы как система команд 3DNow!, так и система команд SSE. Этот комплексный набор получил название 3DNow! Professional Technology.

Перечисленные изменения потребовали очередного увеличения количества транзисторов — до 37,5 миллионов. Однако это не привело к повышению потребляемой мощности. Более того, процессор Athlon ХР стал примерно на 20% «холоднее» своего предшественника.

Упаковка и тестирование

По окончании цикла формирования пластины все процессоры тщательно тестируют. По результатам теста определяется частотный класс партии чипов (здесь скрыты резервы, иногда позволяющие «разогнать» процессор). Затем из пластины-подложки с помощью специального устройства вырезают конкретные, уже прошедшие проверку кристаллы. Каждый микропроцессор встраивают в защитный корпус, который также обеспечивает электрическое соединение кристалла микропроцессора с внешними устройствами. Тип корпуса зависит от типа и предполагаемого применения микропроцессора. После установки в корпус каждый микропроцессор повторно тестируют.

Подсистема кэш-памяти

Задача подсистемы памяти сравнительно проста: как можно быстрее доставить затребованные данные и как можно быстрее снять полученный результат. Поскольку скорость работы памяти SDRAM не идет ни в какое сравнение со скоростью работы процессоров (разрыв более чем на порядок в пользу процессоров), то активно используется кэширование данных в высокоскоростной памяти сравнительно небольшого объема. Процессор Pentium 4 имеет два, а модификация Extreme Edition даже три уровня кэш-памяти. Основная роль в ускорении работы отведена кэшу второго уровня. Фактически, именно кэш второго уровня становится основным хранилищем данных в микроархитектуре Pentium 4.

В процессе работы самые необходимые данные размещаются в кэше первого уровня. В отличие от кэша процессоров Pentium II размер кэша данных невелик: всего 8 Кбайт в ядре Willamette/Northwood и 16 Кбайт в ядре Prescott. Зато скорость кэша Ы заметно выросла: задержка доступа составляет всего 2 такта, в отличие от 3 тактов в Pentium III. На частотах 2 ГГц и выше это различие становится решающим.

Поскольку объем данных в кэше первого уровня невелик, есть высокая вероятность, что необходимых процессору данных там не окажется. В случае отсутствия необходимых данных инициируется обращение в кэш второго уровня. Если нужные данные там есть, они копируются в кэш первого уровня по шине шириной 256 бит. Эта технология получила название Advanced Transfer Cache. Очевидно, что механизм кэширования является инклюзивным. То есть данные, содержащиеся в кэш-памяти первого уровня, отображаются в кэш-памяти второго уровня. Процессоры AMD имеют эксклюзивный кэш: данные не повторяются.

Если необходимых данных в кэше второго уровня не найдено, направляется запрос в оперативную память. Время реакции оперативной памяти намного больше, нежели время реакции кэша второго уровня. С позиции эффективности конвейера процессора, запрос в оперативную память — это катастрофа, поскольку характерное время поступления данных из оперативной памяти исчисляется сотнями процессорных тактов. Именно поэтому крайне необходим механизм предзагрузки, который должен заблаговременно начать доставку нужных данных.

Размер кэша второго уровня для ядра Willamette составляет 256 Кбайт, для ядра Northwood — 512 Кбайт, для ядра Prescott — 1024 Кбайт. Модификация процессора Pentium 4 ЕЕ содержит кэш третьего уровня объемом 2048 Кбайт. Этот кэш подключен к ядру 64-битной шиной, задержки обращения к нему выше, нежели к кэш-памяти второго уровня. Тем не менее, во многих случаях его наличие заметно повышает производительность, поскольку кэш третьего уровня все равно превосходит по скорости оперативную память.



Интерфейс Socket 939

Athlon 64 3000+ и выше (с июня 2004)
Athlon FX-53 и выше (с июня 2004)

В июне 2004 г. компания AMD вернулась к стратегии использования единого интерфейса для процессоров одной линейки. Так процессоры Athlon 64 и Athlon FX перешли на Socket 939. С внедрением технологических норм 90 нм процессор Athlon 64 получил ядро Winchester (кэш L2 512 Кбайт). Применение технологии Cool-and-Quiet позволило снизить энергопотребление Athlon 64 в состоянии покоя до рекордно низких 3 Вт. Использование в производстве кристаллов технологий SOI (silicon on insulator — кремний на изоляторе) и SS (strained silicon — растянутая кристаллическая решетка) позволило к исходу 2004 г. поднять частоту ядра, выпускаемого по 130 нм технормам, до 2,6 ГГц. Среди чипсетов, поддерживающих Socket 939, отметим: ATI Xpress 200, nVIDIA nForce3 150/ 250, nVIDIA nForce4, SiS 755, SiS 756, SiS 760, VIA K8T800, VIA K8T890.

Изменения в маркировке

В обозначении процессоров Athlon ХР указывается не тактовая частота процессора, а так называемый model number — номер конкретной модели в общем семействе процессоров Athlon. Например, Athlon ХР 1500+, Athlon ХР 1800+. К этому шагу AMD вынудило то обстоятельство, что процессор Athlon ХР, несомненно, производительнее предыдущих моделей Athlon. Но как правильно сравнить процессор с ядром Thunderbird, работающий на частоте 1,4 ГГц, и процессор с более прогрессивным ядром Palomino, но работающий на частоте 1,33 ГГц, знает только компания AMD.

Несомненно, значение model number косвенно привязано к определенному значению тактовой частоты процессоров Pentium 4. Видимо, значение model number, к примеру, 1500+ означает, что в подавляющем большинстве приложений этот процессор не уступит Pentium 4 с тактовой частотой 1,5 ГГц. Но компания AMD не скрывает, что процессоры Pentium 4 и Athlon ХР настолько разные, что без труда можно найти приложение, в котором Pentium 4 окажется быстрее.

Подкатегории