PersCom — Компьютерная Энциклопедия Компьютерная Энциклопедия

Процессоры

Процессоры

Системная шина

У шины AMD K7 есть два замечательных свойства. Во-первых, это не обычная общая шина, а коммутатор. Такое решение обеспечивает гарантированную пропускную способность для соединений «точка-точка», в то время как на общей шине возможны конфликты. Во-вторых, системная шина К7 имеет частоту до 400 МГц. При ширине шины 64 разряда плюс 8 разрядов ЕСС она имеет пропускную способность до 3,2 Гбайт/с. Скоростная шина нужна не только для поддержки быстрой оперативной памяти DDR, но и для обеспечения потоков ввода-вывода от шин PCI и AGP.

Интерфейс системной шины К7 электрически совместим с протоколом шины Alpha EV6. Микропроцессор К7 подсоединяется к шине через интерфейс Socket A (Socket 462). Важной особенностью, влияющей на пропускную способность шины К7, является объем передаваемых по шине пакетов. Такая пакетная передача данных способствует конвейеризации обработки транзакций на шине. Для К7 размер пакета составляет 64 байта (длина строки кэша), что вдвое больше, чем у процессоров поколения Р6. Эффективному использованию системной шины способствует раздельная обработка транзакций. Она позволяет перекрывать выполнение различных транзакций во времени, разрешая начинать обработку новых транзакций, не дожидаясь завершения предыдущих. Теоретически максимальная емкость адресуемой шиной оперативной памяти в К7 составляет 8 Тбайт, но реально наборы системной логики поддерживают до 4 Гбайт.



Многослойные структуры

Наложение новых слоев осуществляют несколько раз, при этом для межслойных соединений в слоях оставляют окна, которые заполняют атомами металла. В результате на кристалле создаются металлические полоски — проводящие области. Процесс выращивания и обработки всех слоев длится несколько недель, а сам производственный цикл состоит из более чем 300 стадий. В итоге на кремниевой пластине формируются сотни идентичных процессоров.

Интерфейс Socket 775

Pentium 4 2666-3800 МГц (с июня 2004)
Celeron D 2533-3200 МГц (с июня 2004)
Pentium 4 ЕЕ 3460-3730 МГц (с июня 2004)

Следующим крупным шагом компании Intel по совершенствованию тех-
нологии стал перевод всех процессоров для настольных систем на интер-
фейс Socket 775 LGA (Land Grid Array). Несколько ранее была внедрена
усовершенствованная архитектура ядра Prescott (технормы 90 нм). Ядро
отличается удлиненным исполнительным
конвейером, увеличенным до 1024 Кбайт
объемом кэша L2, поддержкой набора ин-
струкций SSE3. При этом тепловая мощ-
ность процессора Pentium 4 на ядре Prescott
с частотой 3,8 ГГц достигла 125 Вт.
Процессоры семейства Celeron D обяза-
ны своим появлением внедрению технорм
90 нм. Соответственно политике компании
Intel, бюджетная модификация получила вдвое урезанный кэш (то есть 256 Кбайт) и ограниченную до 533 МГц частоту системной шины.

Переход на новый интерфейс ознаменовался знаменательным событием: компания Intel отказалась от маркировки процессоров по рабочей частоте и по примеру компании AMD ввела маркировку по рейтингу (процессорному номеру).

Особое место в семействе Pentium 4 занимают процессоры с маркировкой Extreme Edition {ЕЕ). Они построены на совершенно ином ядре Gallatin (технормы 130 нм). Основное отличие Pentium 4 ЕЕ заключается в наличии кэш-памяти третьего уровня объемом 2 Мбайт и увеличенной до 1066 МГц частоте системной шины.

Предсказание переходов

Кроме представления команд CISC в удобной для процессора форме микроархитектура ядра должна решать проблему предсказания ветвлений программы. Суть проблемы в том, что, встретив инструкцию перехода, процессор останавливает конвейер. Задержка будет тем дольше, чем больше длина конвейера.

Поэтому инструкции перехода надо выявлять заранее и реагировать соответствующим образом. Для этого предназначен специальный блок предсказания переходов (Branch Prediction Unit). Его задача — предвидеть направление перехода и, в случае удачного предсказания, сэкономить время. Соответственно, если результат предсказания будет неудачным, происходит полная остановка конвейера и очистка буферов.

Если в программе есть условные переходы (то есть такие, которые зависят от результата выполнения какой-либо операции), надо постараться «угадать», произойдет этот переход, или нет. Метод гадания на кофейной гуще здесь не подходит. Поэтому блок предсказаний хранит специальную таблицу истории переходов (Branch History Table), в которой записана результативность предыдущих примерно 4000 предсказаний. Кроме того, отслеживается точность последнего предсказания, чтобы при необходимости откорректировать алгоритм работы. Благодаря этому декодер выполняет по подсказке блока предсказания условный переход, а затем блок предсказаний проверяет, правильно ли было предсказано это условие. Микроархитектура Prefetch (предзагрузки или предвыборки) позволяет заранее знать, какие данные понадобятся процессору в будущем.

Специальные механизмы анализируют последовательности адресов, по которым происходила загрузка данных, и пытаются предугадать следующий адрес. Работает механизм предвыборки в тесном содружестве с Branch Prediction Unit и с подсистемой памяти.

Интерфейс Socket 940

Athlon 64 FX-51 — FX-53 (сентябрь 2003 — март 2004)

Процессор Athlon 64 FX с интерфейсом Socket 940 предназначен для серверных систем и оснащен двухканальным контроллером памяти DDR400 (поддерживается только регистровая память ЕСС). Процессор соединяется с северным мостом чипсета шиной HyperTransport с пиковой пропускной способностью 3200 Мбайт/с. Интерфейс Socket 940 поддерживается чипсетами: nVIDIA nForce3 150 и VIA K8T800.



Подкатегории