link420 link421 link422 link423 link424 link425 link426 link427 link428 link429 link430 link431 link432 link433 link434 link435 link436 link437 link438 link439 link440 link441 link442 link443 link444 link445 link446 link447 link448 link449 link450 link451 link452 link453 link454 link455 link456 link457 link458 link459 link460 link461 link462 link463 link464 link465 link466 link467 link468 link469 link470 link471 link472 link473 link474 link475 link476 link477 link478 link479 link480 link481 link482 link483 link484 link485 link486 link487 link488 link489 link490 link491 link492 link493 link494 link495 link496 link497 link498 link499 link500 link501 link502 link503 link504 link505 link506 link507 link508 link509 link510 link511 link512 link513 link514 link515 link516 link517 link518 link519 link520 link521 link522 link523 link524 link525 link526 link527 link528 link529 link530 link531 link532 link533 link534 link535 link536 link537 link538 link539 link540 link541 link542 link543 link544 link545 link546 link547 link548 link549 link550 link551 link552 link553 link554 link555 link556 link557 link558 link559

PersCom — Компьютерная Энциклопедия Компьютерная Энциклопедия

Процессоры

Процессоры

Технология Hyper-Threading

В модификации Pentium 4 на ядре Nortwood В впервые реализована технология виртуальной двухпроцессорности Hyper-Threading. Строго говоря, все необходимые аппаратные блоки присутствовали еще в процессоре Pentium 4 с ядром Willamette, однако они были отключены (видимо, по маркетинговым соображениям). И только с появлением Pentium 4 с частотой 3,06 ГГц мультипроцессорные технологии стали доступны обычному пользователю. Не секрет, что стоимость двухпроцессорных машин, позиционируемых как рабочие станции или серверы, ограничивала их применение в домашних условиях. Теперь пользователь получает два логических (виртуальных) процессора на одном физическом ядре и может использовать их на обычной системной плате.

Следует подчеркнуть, что основная часть ресурсов ядра (в частности процессорный конвейер и кэш-память) используются логическими процессорами совместно, поэтому о революционном повышении производительности речи не идет. Однако немалая часть ресурсов ядра простаивает во время работы других элементов, а технология Hyper-Threading позволяет загрузить временно простаивающие блоки другими задачами. Учитывая, что многозадачность является одним из краеугольных камней современных операционных систем и приложений, технология Hyper-Threading дает заметный рост производительности системы.

Эффективность блоков Hyper-Threading при выполнении конкретных приложений сильно зависит от степени оптимизации кода программы.

Принцип работы технологии Hyper-Threading

Чем лучше оптимизирован код для архитектуры Pentium 4, тем меньше будет выигрыш от применения Hyper-Threading, поскольку «правильный» код нагружает элементы процессора по максимуму. Если же оптимизация кода далека от идеала, происходят промахи размещения данных в кэш-памяти, ошибки предсказания ветвлений, нарушение параллелизма выполнения инструкций. В результате часть аппаратных блоков ядра простаивает, ожидая результатов критичных операций. В этот момент свободные блоки могут быть представлены операционной системе как элементы второго, логического процессора и получить собственные задачи, выполнение которых будет происходить независимо от работы других элементов.

На физическом уровне технология Hyper-Threading реализована в следующих элементах: буфер очереди инструкций, буфер трансляции команд, указатель следующей инструкции, механизм возврата в стек инструкций, буфер с таблицами псевдонимов регистров, кэш отслеживания исполнения следующей инструкции и кэш отслеживания заполнения буфера инструкций.

Особенности ядра Prescott

Микроархитектура ядра Prescott в сравнении с предшественниками (Willamette и Northwood) содержит неоднозначные технические решения. С одной стороны, улучшены алгоритмы предвыборки (Prefetch), что позволило достичь больших значений реальной пропускной способности памяти. Заметны и другие положительные моменты, в первую очередь введение нового набора SIMD-инструкций SSE3.

С другой стороны, микроархитектура Prescott имеет ряд негативных черт: увеличение задержек доступа в кэш-память, снижение почти в два раза эффективной пропускной способности шины между уровнями кэша, увеличение задержек исполнения ряда инструкций. Невольно возникает подозрение, что в ядре Prescott потенциальные возможности архитектуры NetBurst реализованы далеко не полностью.

Подкатегории