link700 link701 link702 link703 link704 link705 link706 link707 link708 link709 link710 link711 link712 link713 link714 link715 link716 link717 link718 link719 link720 link721 link722 link723 link724 link725 link726 link727 link728 link729 link730 link731 link732 link733 link734 link735 link736 link737 link738 link739 link740 link741 link742 link743 link744 link745 link746 link747 link748 link749 link750 link751 link752 link753 link754 link755 link756 link757 link758 link759 link760 link761 link762 link763 link764 link765 link766 link767 link768 link769 link770 link771 link772 link773 link774 link775 link776 link777 link778 link779 link780 link781 link782 link783 link784 link785 link786 link787 link788 link789 link790 link791 link792 link793 link794 link795 link796 link797 link798 link799 link800 link801 link802 link803 link804 link805 link806 link807 link808 link809 link810 link811 link812 link813 link814 link815 link816 link817 link818 link819 link820 link821 link822 link823 link824 link825 link826 link827 link828 link829 link830 link831 link832 link833 link834 link835 link836 link837 link838 link839

PersCom — Компьютерная Энциклопедия Компьютерная Энциклопедия

Процессоры

Процессоры

Процессоры

В конце 1970 г. компания Intel приступила к выпуску первого в мире микропроцессо- ра модели 4004. Он был четырехразрядным, то есть за одну операцию (такт) обрабаты- вал одно 4-разрядное число. В 1972 г. Intel разработала 8-разрядный микропроцессор модели 8008, а в 1978 г. — первый 16-раз- рядный процессор 8086. Он стал базой для персональных компьютеров IBM PC XT, ставших стандартом де-факто для всей компьютерной индустрии. Затем появились процессоры 80286, 80386 (первый 32-раз- рядный процессор), 80486. С появлением в 1995 г. процессоров Pentium начался новый этап развития персональных компьютеров, когда они стали не только рабочим инстру- ментом, но и домашним, бытовым устрой- ством повседневного использования.

В 1995 г. персональный компьютер, оснащенный процессором Pentium 100 и 16 Мбайт оперативной памяти, стал продаваться по цене ниже 3000$. Видимо, этот рубеж стал психологическим барьером, по- скольку продажи росли с космической скоростью вплоть до насыщения рынка, когда в развитых странах 80-85% семей стали владельцами ПК. Поначалу главными покупателями выступали студенты и аспиранты, за- тем к ним подключились школьники и их родители. В последнее время в мире продается около 200 миллионов ПК в год, а средняя цена настольной персоналки не превышает 1000$.

С 1995 г. и по настоящее время различные фирмы выпустили свыше 120 моделей процессоров для персональных компьютеров. Некоторые из них стали знаковыми явлениями в компьютерной индустрии. Основными производителями процессоров для ПК в рассматриваемый период стали компании Intel и AMD. Корпорация Intel с 1995 г. и по настоящее время использовала семь моделей платформ с различными интерфейсами про- цессоров: от Socket 5 до Socket 775. Компания AMD использовала немного меньше — пять платформ (от Socket 7 до Socket 939). Таким образом, в среднем актуальность платформы сохранялась в течение полутора-двух лет.

Интерфейс Socket 370

Celeron 233-533 МГц (апрель 1998 — январь 2000)
Pentium III 500-1133 МГц (октябрь 1999 — июль 2001)
Celeron II 533-1100 МГц (январь 2000 — июль 2001)
Celeron/Pentium III 1000-1400 МГц (январь 2000 — июль 2001)

В 1998 г. для процессоров Pentium III был разработан интерфейс Socket 370, кристалл устанавливался в пластиковый корпуса PPGA. Важным преимуществом Pentium III стала возможность исполнения расширенного набора инструкций SIMD, оперирующих со специальными 128-битными регистрами. Каждый из них хранит четыре действительных числа одинарной точности. Таким образом, выполняя операцию над двумя регистрами, SSE фактически оперирует четырьмя парами чисел. То есть, благодаря этому процессор может выполнять до четырех операций одновременно. Однако разработчик программы должен использовать специальные команды, а также позаботиться о помещении и извлечении данных из четырех местных регистров, поэтому для использования всех вычислительных мощностей Pentium III необходима целенаправленная оптимизация кода. Таким образом, в Pentium III появился блок, подобный ММХ, но оперирующий действительными числами. Это решение способствовало улучшению производительности процессора в следующих областях:

• трехмерная графика и моделирование, расчет освещенности с использованием вычислений с плавающей точкой;

• обработка сигналов и моделирование процессов с широким диапазоном изменения параметров;

• генерация трехмерных изображений в программах реального времени, не использующих целочисленный код;

• алгоритмы кодирования и декодирования видеосигнала, обрабатывающие данные блоками;

• численные алгоритмы фильтрации, работающие с потоками данных.

С 2000 г. начался выпуск процессоров в корпусах FC-PGA. Последней модификацией Pentium III и Celeron стали процессоры на ядре Tualatin, изготавливаемом по технормам 130 нм. Модель Pentium III-S Tualatin имеет рабочую частоту до 1400 МГц, кэш-память второго уровня объемом 512 Кбайт. Ядро получило блок Data Prefetch, который стал одним из ключевых элементов будущей архитектуры Pentium 4. К сожалению, Pentium III-S потребовал новой модификации интерфейса Socket 370, что исключило возможность апгрейда действующих систем.

Архитектура процессоров Pentium 4

В ноябре 2000 г. компания Intel приступила к производству 32-разрядного процессора Pentium 4 на ядре Willamette, работающего на частоте 1,5 ГГц. Знаменательность этого события в том, что с момента выхода Pentium Pro в области архитектуры процессоров Intel не происходило ничего более значительного. С выходом Pentium 4 на свет появился процессор седьмого поколения (Pentium Pro, Pentium II/III относятся к шестому поколению — Р6).

Необходимо перечислить новшества архитектуры Willamette, позволяющие отнести процессор Pentium 4 к новому поколению:

• асимметричное ядро с блоками, работающими на различных скоростях;
• значительно улучшенная версия суперскалярного механизма исполнения инструкций;
• новый кэш второго уровня, отслеживающий порядок выполнения инструкций;
• переработанные блоки операций с мультимедийными данными и числами с плавающей запятой;
• огромный набор новых инструкций;
• новая системная шина, передающая по 4 пакета данных за такт (ар-хитектура Quad Pumped);
• конвейер выполнения инструкций из 20 стадий.

Наибольшее впечатление на экспертов произвела стартовая рабочая частота процессора в 1,5 ГГц. Такого результата удалось добиться за счет новой архитектуры конвейера выполнения инструкций. Pentium III имеет конвейер длиной 12 стадий (17 стадий FPU), Athlon — 10 стадий (15 стадий FPU). Pentium 4 при длине конвейера 20 стадий позволяет достичь максимальной тактовой частоты, но и получает самые большие задержки для связанных друг с другом операций (второй операции придется ожидать 20 тактов, пока не завершится первая операция).

Модель архитектуры процессора Pentium 4

Интерфейс Slot A

Athlon 500 — 1000 МГц (август 1999 — май 2000)

Архитектура К7 процессора Athlon опи-
ралась на многие технологические новше-
ства, в том числе на передовую системную
шину EV6, заимствованную у процессоров
Alpha. Первые образцы Athlon выпуска-
лись по технологическим нормам 250 нм.
Кэш-память второго уровня объемом
256 Кбайт располагалась на процессорной
плате и работала на частоте 1/2, 2/3 или 3/4 от частоты ядра процессора.
С вводом в строй предприятия «Fab 30» по выпуску микропроцессоров в
немецком городе Дрездене производство Athlon постепенно перевели на
технологические нормы 180 нм. В последних модификациях кэш-память
второго уровня переехала с платы в ядро процессора.

Процессор Athlon имеет на кристалле три параллельных декодера для обработки инструкций х86, по три конвейера для работы с целочисленными командами и данными с плавающей точкой. Конечно, предусмотрена поддержка инструкций 3DNow! Кроме того, реализовано параллельное выполнение до девяти операций за один цикл синхронизации.



Особенности микроархитектуры Athlon

Создание в 1999 г. процессорного ядра К7 седьмого поколения стало значительным достижением компании AMD. В процессоре Athlon были реализованы выдающиеся технические решения: три параллельных исполнительных конвейера, системная шина с удвоенной частотой за счет передачи данных по фронту и спаду сигнала, асинхронная шина памяти, блоки декодера и предварительной выборки данных высокой интеллектуальности.

Кэш-память первого уровня включает двухканальные частично-ассоциативные (наборно-ассоциативные) кэш команд и кэш данных емкостью по 64 Кбайт каждый. Кэш данных К7 обеспечивает одновременный доступ к двум 64-разрядным величинам при выполнении команд загрузки регистров и записи в память. Другой важной особенностью К7 является наличие в блоке кэша команд специальной кэш-памяти предварительного декодирования, которая используется декодерами команд. Напомним, что в современных х86-совместимых процессорах прямого выполнения х86-команд не происходит, поскольку они неудобны для достижения максимума производительности. х86-инструкции декодируются в более простые и эффективные внутренние RISC -подобные команды фиксированной длины, которые, собственно, и исполняются микропроцессором.

В ядре К7 таких декодера три, и они работают параллельно, поэтому кэш предварительного декодирования в существенной степени способствует увеличению пропускной способности.

Кроме того, кэш команд первого уровня содержит двухуровневый блок быстрой переадресации страниц TLB, используемый для преобразования виртуальных адресов в физические: TLB первого уровня имеет емкость 24 строки, a TLB второго уровня — 256 строк. Аналогичный блок TLB в кэше данных первого уровня включает TLB первого уровня емкостью 32 строки и TLB второго уровня емкостью 256 строк. Наконец, кэш команд первого уровня содержит большую таблицу предсказания переходов емкостью 2048 строк, что позволяет достигнуть высокой вероятности правильного динамического предсказания ветвлений.

Из декодеров команды попадают в устройство управления командами емкостью 72 строки. AMD K7 является суперскалярным микропроцессором с внеочередным спекулятивным выполнением команд. Большая емкость устройства управления командами позволяет эффективно использовать ресурсы девяти функциональных исполнительных устройств, которые являются конвейерными и способны к внеочередному выполнению команд. В числе этих устройств: три адресных конвейера, три целочисленных конвейера и три конвейера с плавающей запятой. Соответственно К7 может выполнять до 9 команд за такт. Общая длина целочисленного конвейера в К7 составляет 10 стадий, а конвейера обработки чисел с плавающей запятой — 15 стадий.

Емкость целочисленного планировщика команд составляет 18 строк; через него команды поступают как в целочисленные, так и в адресные функциональные устройства. Аналогичный планировщик команд для чисел с плавающей запятой имеет емкость 36 строк. На работе блока команд с плавающей запятой стоит остановиться подробнее.

Прежде всего отметим, что этот блок обеспечивает работу с одинарной (32 разряда), двойной (64 разряда) и расширенной (80 разрядов) точностью. Кроме того, эти функциональные исполнительные устройства работают с данными в форматах команд ММХ и 3DNow!, Исполнительное устройство FSTORE выполняет команды загрузки регистров и записи в память. Блок FADD, кроме сложения операндов с плавающей запятой, выполняет команды сложения из набора 3DNow! и ММХ-команды сдвига. Блок FMUL, кроме умножения чисел с плавающей запятой, выполняет ММХ-команды, команды 3DNow! и специальные операции деления. Таким образом, К7 может одновременно выполнять сложение и умножение чисел с плавающей запятой в блоках FADD и FMUL. Это дает пиковую производительность в две операции с действительными за такт.

Функциональная схема микроархитектуры К7

Подкатегории