Материалы

Особенности микроархитектуры Athlon

Рейтинг:   / 0
ПлохоОтлично 

Создание в 1999 г. процессорного ядра К7 седьмого поколения стало значительным достижением компании AMD. В процессоре Athlon были реализованы выдающиеся технические решения: три параллельных исполнительных конвейера, системная шина с удвоенной частотой за счет передачи данных по фронту и спаду сигнала, асинхронная шина памяти, блоки декодера и предварительной выборки данных высокой интеллектуальности.

Кэш-память первого уровня включает двухканальные частично-ассоциативные (наборно-ассоциативные) кэш команд и кэш данных емкостью по 64 Кбайт каждый. Кэш данных К7 обеспечивает одновременный доступ к двум 64-разрядным величинам при выполнении команд загрузки регистров и записи в память. Другой важной особенностью К7 является наличие в блоке кэша команд специальной кэш-памяти предварительного декодирования, которая используется декодерами команд. Напомним, что в современных х86-совместимых процессорах прямого выполнения х86-команд не происходит, поскольку они неудобны для достижения максимума производительности. х86-инструкции декодируются в более простые и эффективные внутренние RISC -подобные команды фиксированной длины, которые, собственно, и исполняются микропроцессором.

В ядре К7 таких декодера три, и они работают параллельно, поэтому кэш предварительного декодирования в существенной степени способствует увеличению пропускной способности.

Кроме того, кэш команд первого уровня содержит двухуровневый блок быстрой переадресации страниц TLB, используемый для преобразования виртуальных адресов в физические: TLB первого уровня имеет емкость 24 строки, a TLB второго уровня — 256 строк. Аналогичный блок TLB в кэше данных первого уровня включает TLB первого уровня емкостью 32 строки и TLB второго уровня емкостью 256 строк. Наконец, кэш команд первого уровня содержит большую таблицу предсказания переходов емкостью 2048 строк, что позволяет достигнуть высокой вероятности правильного динамического предсказания ветвлений.

Из декодеров команды попадают в устройство управления командами емкостью 72 строки. AMD K7 является суперскалярным микропроцессором с внеочередным спекулятивным выполнением команд. Большая емкость устройства управления командами позволяет эффективно использовать ресурсы девяти функциональных исполнительных устройств, которые являются конвейерными и способны к внеочередному выполнению команд. В числе этих устройств: три адресных конвейера, три целочисленных конвейера и три конвейера с плавающей запятой. Соответственно К7 может выполнять до 9 команд за такт. Общая длина целочисленного конвейера в К7 составляет 10 стадий, а конвейера обработки чисел с плавающей запятой — 15 стадий.

Емкость целочисленного планировщика команд составляет 18 строк; через него команды поступают как в целочисленные, так и в адресные функциональные устройства. Аналогичный планировщик команд для чисел с плавающей запятой имеет емкость 36 строк. На работе блока команд с плавающей запятой стоит остановиться подробнее.

Прежде всего отметим, что этот блок обеспечивает работу с одинарной (32 разряда), двойной (64 разряда) и расширенной (80 разрядов) точностью. Кроме того, эти функциональные исполнительные устройства работают с данными в форматах команд ММХ и 3DNow!, Исполнительное устройство FSTORE выполняет команды загрузки регистров и записи в память. Блок FADD, кроме сложения операндов с плавающей запятой, выполняет команды сложения из набора 3DNow! и ММХ-команды сдвига. Блок FMUL, кроме умножения чисел с плавающей запятой, выполняет ММХ-команды, команды 3DNow! и специальные операции деления. Таким образом, К7 может одновременно выполнять сложение и умножение чисел с плавающей запятой в блоках FADD и FMUL. Это дает пиковую производительность в две операции с действительными за такт.

 

Функциональная схема микроархитектуры К7
Яндекс.Метрика