pentium-4-prescott-sampion-nebo-pouhy-predskokan

Hardware Článek Pentium 4 Prescott: šampión nebo pouhý předskokan?

Pentium 4 Prescott: šampión nebo pouhý předskokan? | Kapitola 3

2. 2. 2004 00:00 108

Seznam kapitol

1. Jak to všechno začalo: Pentium 4 nejen pro pamětníky 2. Pokračování: P4 Prescot 3. Interní architektura jádra 4. Žhavá záležitost: teplo a spotřeba 5. Testy: CPU

6. Testy: propustnost paměti 7. Testy: Kombinované testy 8. Závěr 9. Dodatek 1: předchůdci architektury NetBurst 10. Dodatek 2: Architektura NetBurst

Dnešní den se nese ve znamení uvedení nového procesoru Pentium 4. Právě dnes nastupuje nové jádro které bylo ohlášeno už na IDF (Intel Developer Forum) začátkem roku 2002. Prescott, neboť tak se procesorový nováček jmenuje, vychází z architektury NetBurst a to, že Intel zůstal u označení Pentium 4 svědčí o tom, že spíše než o revoluci se jedná o evoluci. Nekoná se tedy schéma: "přišel, viděl, zvítězil" ale "přišel, viděl, připravil". Pojďme se podívat, na co se budeme muset připravit v budoucnu i my. A věřte mi, že nás nejspíše čeká doslova žhavá budoucnost...

AI model LTX2 směle konkuruje placeným generátorům videí

Reklama

Intel slibuje zlepšenou předpověď větvení (branch prediction), zlepšený pre-fetch a zrychlení celočíselných výpočtů.

Pentium 4 Prescott: šampión nebo pouhý předskokan?

Prodloužení pipeline

Delší výpočetní pipeline je cestou, jak využít více výpočetních "slotů" v situaci, kdy rychlost paměti zdaleka nestačí sledovat rychlost moderních procesorů.

Nevýhodou dlouhé a úzké pipeline je, že výkon procesoru je velmi závislý na technologiích snižujících latence (zpoždění) v systému jako je np. efektivní předpovídání větvení kódu (branch prediction), "předzásobení daty" (prefetching) a také na efektivní práci vyrovnávací paměti cache. Také Intelem tolik oblíbené vícevláknové paralelní zpracování dat (HyperThreading) je metodou jak snižovat ztráty způsobené zpožděním - v případě stavu "cache miss" může procesor, v ideálním případě, naplnit jednotky instrukcemi z dalšího výpočetního vlákna.

Je tedy pravděpodobné, že v klasickém "jedno-threadovém" scénaři a na nízkých počátečních frekvencích nebude Prescott nijak excelovat. Je také zřejmé, že nový vítr do plachet Prescot nabere s dalším zvýšením frekvence FSB (to už ale bude s novými čipsety a na platformě Socket T).

Instrukce SSE3

Prescott obsahuje 13 nových instrukcí (PNI, Prescott New Instructions) které jsou nazvané SSE3.

Kuriózní je, že většinu nových instrukcí stanoví instrukce, na které se v sadách SSE nebo SSE2 "zapomnělo". Výjimkou jsou nové instrukce pro synchronizaci výpočetních vláken a instrukce LDDQU, která by mohla urychlit kompresi videa až o 10%.

Cache a paměťový subsystém

Většinu tranzistorů v jádře zaměstnává 1MB velká paměť cache druhé úrovně (i když cache L1 pro data také narostla, z 8KB na 16KB). Zdá se však, že další honba za vyššími takty způsobila, že rychlost cache Prescottu je ve srovnání s Nortwoodem nižší.

graf je převzatý ze serveru XBirLabs.com

Změny jádra si vyžádaly změny v časování paměti cache - u 16KB bloku dat jsou to 4 a 28 cyklů (L1 a L2) proti 2 a 19 cyklům Northwoodu. Lze tedy konstatovat, že v současné situaci je paměť cache nejenom větší, ale zároveň i pomalejší - latence cache L1 je prakticky dvojnásobná!

Pozn. redakce: evidentně se počítá s vyššími takty jádra, kdy by byl nízký počet čekacích cyklů Northwoodu (2 cykly přístupu k L1) neudržitelný. V případě některých menších testovacích smyček dojde ve srovnání s Northwoodem téměř jistě ke zpomalení výpočtu.

Pojďme se podívat co na Prescottu inženýry nejvíce pálí...

Předchozí