link280 link281 link282 link283 link284 link285 link286 link287 link288 link289 link290 link291 link292 link293 link294 link295 link296 link297 link298 link299 link300 link301 link302 link303 link304 link305 link306 link307 link308 link309 link310 link311 link312 link313 link314 link315 link316 link317 link318 link319 link320 link321 link322 link323 link324 link325 link326 link327 link328 link329 link330 link331 link332 link333 link334 link335 link336 link337 link338 link339 link340 link341 link342 link343 link344 link345 link346 link347 link348 link349 link350 link351 link352 link353 link354 link355 link356 link357 link358 link359 link360 link361 link362 link363 link364 link365 link366 link367 link368 link369 link370 link371 link372 link373 link374 link375 link376 link377 link378 link379 link380 link381 link382 link383 link384 link385 link386 link387 link388 link389 link390 link391 link392 link393 link394 link395 link396 link397 link398 link399 link400 link401 link402 link403 link404 link405 link406 link407 link408 link409 link410 link411 link412 link413 link414 link415 link416 link417 link418 link419

PersCom — Компьютерная Энциклопедия Компьютерная Энциклопедия

Процессоры

Процессоры

Особенности микроархитектуры Athlon XP

В октябре 2001 г. на рынок поступили первые процессоры Athlon на ядре Palomino. Этой модификации был присвоен индекс XP (eXtreme Perfomance), подчеркивающий новшества архитектуры в сравнении с «обычным» Athlon. Так, в частности, существенной переделке подвергся механизм трансляции адресов команд и данных в физические адреса памяти. Для ускорения доступа к командам и данным все современные процессоры имеют Translation Look-aside Buffer (TLB). Этот буфер осуществляет кэширование, но не данных или команд, а их физических адресов. В предыдущих процессорах Athlon этот буфер был двухуровневым. Первый уровень (L1) емкостью 24 значения для адресов инструкций и 32 значения для адресов данных. Второй уровень (L2) мог хранить до 256 адресов данных и 256 адресов инструкций.

В ядре Palomino увеличен размер буфера первого уровня, теперь он может хранить до 40 значений адресов данных. Кроме того, теперь TLB, также как и основной кэш, стал «исключающим» — exclusive. Это означает, что содержимое буфера первого уровня не дублирует содержимого буфера второго уровня. И наконец, в новом ядре реализован механизм опережающей загрузки новых значений адресов (до того, как они могут потребоваться) — speculatively reload.

Существенно улучшен механизм опережающей загрузки данных из памяти в кэш. Этот механизм опережающей загрузки данных был реализован и в ранних процессорах, но только для инструкций, включенных в 3DNow! и SSE. В ядре процессоров Athlon XP осуществляется непрерывный анализ адресов затребованных процессором данных и последовательности, в которой они были затребованы. На основании анализа делается попытка предсказания адресов данных, которые будут затребованы, и опережающая загрузка этих данных в кэш процессора. Во многих случаях, например, при циклической обработке больших массивов данных, предсказание будет успешным. Это позволяет повысить производительность даже для неоптимизированных приложений.

В ядре Palomino полностью реализованы как система команд 3DNow!, так и система команд SSE. Этот комплексный набор получил название 3DNow! Professional Technology.

Перечисленные изменения потребовали очередного увеличения количества транзисторов — до 37,5 миллионов. Однако это не привело к повышению потребляемой мощности. Более того, процессор Athlon ХР стал примерно на 20% «холоднее» своего предшественника.

Упаковка и тестирование

По окончании цикла формирования пластины все процессоры тщательно тестируют. По результатам теста определяется частотный класс партии чипов (здесь скрыты резервы, иногда позволяющие «разогнать» процессор). Затем из пластины-подложки с помощью специального устройства вырезают конкретные, уже прошедшие проверку кристаллы. Каждый микропроцессор встраивают в защитный корпус, который также обеспечивает электрическое соединение кристалла микропроцессора с внешними устройствами. Тип корпуса зависит от типа и предполагаемого применения микропроцессора. После установки в корпус каждый микропроцессор повторно тестируют.

Подсистема кэш-памяти

Задача подсистемы памяти сравнительно проста: как можно быстрее доставить затребованные данные и как можно быстрее снять полученный результат. Поскольку скорость работы памяти SDRAM не идет ни в какое сравнение со скоростью работы процессоров (разрыв более чем на порядок в пользу процессоров), то активно используется кэширование данных в высокоскоростной памяти сравнительно небольшого объема. Процессор Pentium 4 имеет два, а модификация Extreme Edition даже три уровня кэш-памяти. Основная роль в ускорении работы отведена кэшу второго уровня. Фактически, именно кэш второго уровня становится основным хранилищем данных в микроархитектуре Pentium 4.

В процессе работы самые необходимые данные размещаются в кэше первого уровня. В отличие от кэша процессоров Pentium II размер кэша данных невелик: всего 8 Кбайт в ядре Willamette/Northwood и 16 Кбайт в ядре Prescott. Зато скорость кэша Ы заметно выросла: задержка доступа составляет всего 2 такта, в отличие от 3 тактов в Pentium III. На частотах 2 ГГц и выше это различие становится решающим.

Поскольку объем данных в кэше первого уровня невелик, есть высокая вероятность, что необходимых процессору данных там не окажется. В случае отсутствия необходимых данных инициируется обращение в кэш второго уровня. Если нужные данные там есть, они копируются в кэш первого уровня по шине шириной 256 бит. Эта технология получила название Advanced Transfer Cache. Очевидно, что механизм кэширования является инклюзивным. То есть данные, содержащиеся в кэш-памяти первого уровня, отображаются в кэш-памяти второго уровня. Процессоры AMD имеют эксклюзивный кэш: данные не повторяются.

Если необходимых данных в кэше второго уровня не найдено, направляется запрос в оперативную память. Время реакции оперативной памяти намного больше, нежели время реакции кэша второго уровня. С позиции эффективности конвейера процессора, запрос в оперативную память — это катастрофа, поскольку характерное время поступления данных из оперативной памяти исчисляется сотнями процессорных тактов. Именно поэтому крайне необходим механизм предзагрузки, который должен заблаговременно начать доставку нужных данных.

Размер кэша второго уровня для ядра Willamette составляет 256 Кбайт, для ядра Northwood — 512 Кбайт, для ядра Prescott — 1024 Кбайт. Модификация процессора Pentium 4 ЕЕ содержит кэш третьего уровня объемом 2048 Кбайт. Этот кэш подключен к ядру 64-битной шиной, задержки обращения к нему выше, нежели к кэш-памяти второго уровня. Тем не менее, во многих случаях его наличие заметно повышает производительность, поскольку кэш третьего уровня все равно превосходит по скорости оперативную память.



Интерфейс Socket 939

Athlon 64 3000+ и выше (с июня 2004)
Athlon FX-53 и выше (с июня 2004)

В июне 2004 г. компания AMD вернулась к стратегии использования единого интерфейса для процессоров одной линейки. Так процессоры Athlon 64 и Athlon FX перешли на Socket 939. С внедрением технологических норм 90 нм процессор Athlon 64 получил ядро Winchester (кэш L2 512 Кбайт). Применение технологии Cool-and-Quiet позволило снизить энергопотребление Athlon 64 в состоянии покоя до рекордно низких 3 Вт. Использование в производстве кристаллов технологий SOI (silicon on insulator — кремний на изоляторе) и SS (strained silicon — растянутая кристаллическая решетка) позволило к исходу 2004 г. поднять частоту ядра, выпускаемого по 130 нм технормам, до 2,6 ГГц. Среди чипсетов, поддерживающих Socket 939, отметим: ATI Xpress 200, nVIDIA nForce3 150/ 250, nVIDIA nForce4, SiS 755, SiS 756, SiS 760, VIA K8T800, VIA K8T890.

Изменения в маркировке

В обозначении процессоров Athlon ХР указывается не тактовая частота процессора, а так называемый model number — номер конкретной модели в общем семействе процессоров Athlon. Например, Athlon ХР 1500+, Athlon ХР 1800+. К этому шагу AMD вынудило то обстоятельство, что процессор Athlon ХР, несомненно, производительнее предыдущих моделей Athlon. Но как правильно сравнить процессор с ядром Thunderbird, работающий на частоте 1,4 ГГц, и процессор с более прогрессивным ядром Palomino, но работающий на частоте 1,33 ГГц, знает только компания AMD.

Несомненно, значение model number косвенно привязано к определенному значению тактовой частоты процессоров Pentium 4. Видимо, значение model number, к примеру, 1500+ означает, что в подавляющем большинстве приложений этот процессор не уступит Pentium 4 с тактовой частотой 1,5 ГГц. Но компания AMD не скрывает, что процессоры Pentium 4 и Athlon ХР настолько разные, что без труда можно найти приложение, в котором Pentium 4 окажется быстрее.

Подкатегории