Architektura procesorů Nehalem (2/2)

Seznam kapitol

1. Front-end 2. Dekódování 3. Out-of-order engine 4. Cache subsystém

5. Paměťový subsystém 6. Správa energie 7. Co od Nehalemu čekat?

Nehalem bude první masově nasazovaný procesor Intelu, který bude integrovat řadič pamětí blízko procesoru. Tím ale výčet novinek nekončí. Inženýři se při návrhu zaměřili také na návrh samotné výpočetní části a kompletně předělali také návrh cache subsystému. Pojďme se podívat, v čem budou největší změny samotné architektury procesoru.

Reklama

Oblast, v níž se Intel v poslední době velmi angažuje (zejména po fiasku s Pentiem 4) je úspora energie. Přestože jeho procesory obsahují více transistorů než konkurence od AMD, mívají nižší spotřebu. Ta je dána agresivním power managementem. Ten Intel poprvé použil u Pentia M a současné generace z tohoto přístupu čerpají. Údajně je nyní filosofie taková, že za každé 1 % spotřeby energie navíc se musí výkon zvýšit o 2 %.

Uvedená filosofie je pochopitelně značně diskutabilní, protože dnešním trendem je zvyšování výkonu jen za určitých okolností. U procesoru prakticky existuje jediná veličina, která zvedne výkon za všech okolností – frekvence.

Nehalem je první procesor Intelu, který zavádí nezávislé napájení některých částí. Celý čip je nyní rozdělen do třech oblastí: výpočetní jádro, paměťový řadič, zbytek. Každá z těchto částí má přitom svoje vlastní napětí, a tedy její spotřeba může být optimalizována na základě požadavků.

Zároveň je zavedena další specialita, kterou Intel nazývá Power Gate. Jedná se o speciální transistor s velmi velkým odporem, který je schopen fungovat jako „uzávěr“ pro protékající proud. Využití takového transistoru je zřejmé – umožňuje téměř plně odpojit jednotlivé části od napájení. Výhodu to má zejména při power managementu více částí sdílejících stejný zdroj napětí, tedy například u jader procesoru.

Současný stav a nový stav si vysvětlíme na příkladu. Představme si, že máme procesor s dvěma jádry. Pokud obě jádra budou využita, poběží obě na plné frekvenci. Pokud bude využito jen jedno, pak jádro 0 poběží na plné frekvenci a jádro 1 bude moct frekvenci snížit na minimum (aby uspořilo energii). Spotřeba sestává z části dynamické (způsobené frekvencí) a z části statické (způsobené úniky proudu – leakage). Primárním faktorem ovlivňujícím leakage jsou počet transistorů a napětí. Podíl leakage na celkové spotřebě se zmenšujícími se transistory neustále roste, protože menší atomární velikost nedokáže tak dobře bránit průsakům elektronů. Například u Pentia 4 Prescott činila statická spotřeba až 62 Ampér, tedy více než polovinu z maximálních 119 Ampér.

Aby v našem příkladu mohlo jádro 1 co nejvíce omezit svojí spotřebu, musí snížit jak spotřebu dynamickou (snížit svojí frekvenci na minimum), tak také snížit napětí. Snížení frekvence je věc velmi jednoduchá – stačí odpojit PLL generátor frekvence nebo alespoň v určitém poměru odstranit jím generované hodinové cykly. Tuto techniku všechny dnešní procesory zvládají velmi dobře a výsledné frekvence jsou v řádu maximálně pár desítek MHz. Horší je to s poklesem napětí. To je totiž mezi jádry sdíleno. Pokud tedy jádro 0 potřebuje vysoké napětí pro práci na maximální frekvenci, může jádro 1 omezit jen dynamickou spotřebu. Statická spotřeba zůstává a dochází ke zbytečné spotřebě elektřiny a zahřívání čipu. A právě pro vyřešení této situace Intel implementoval Power Gate. Při požadavku na snížení spotřeby jádra 1 stačí jednoduše napájení tohoto jádra zaizolovat – spotřeba v ten okamžik poklesne na téměř nulu. Toto řešení je oproti plně individuálnímu napájení jednotlivých jader elegantní v tom, že náklady na jeho zavedení jsou mnohem nižší a přitom účinnost je podobná.

S odpojováním jader souvisí i nová funkce „Turbo Mode“. Jejím úkolem je prakticky to samé, co má u mobilních procesorů Core 2 Duo na starosti funkce Intel Dynamic Acceleration – zvyšování frekvence individuálních jader v případě nevytížení jader ostatních. Po třech letech od uvedení dvoujádrových procesorů se tedy skutečně dočkáme první vlaštovky toho, co zde mělo být už při jejich uvedení a čehož absenci jsem také kdysi kritizoval – skloubení výhod vícjádrových procesorů s výhodami procesorů jednojádrových - možnosti dosahovat podstatně vyšších frekvencí (protože nejsou limitované spotřebou). Nehalem bude podporovat dvoustupňový Turbo Mode, kde v každém stupni bude frekvence navýšena o 133 MHz. Navýšení frekvence se může týkat více než jednoho jádra, přičemž záleží na odběru proudu a spotřebě. Pokud budou tři jádra velmi málo vytížená, může být čtvrté urychleno o dva stupně. Pokud budou dvě jádra vytížena hodně (a zbylá vůbec), tak patrně bude možné zvýšení frekvence jen o jeden stupeň, ale to u obou jader. Pro celkové řízení spotřeby, frekvencí a monitorování teplot slouží samostatná logika nazvaná Power Control Unit, která sestává z asi 1 milionu transistorů (což je zhruba tolik, kolik má procesor 80486). Tato jednotka je částečně programovatelná, neboť akceptuje firmware nahrávaný při startu počítače BIOSem.

Lepší řízení spotřeby a frekvencí se projevilo i na změně u technologie Thermal Monitor. Ta byla zavedena již v Pentiu 4 a později v Pentiu M se dočkala verze 2. Jejím cílem je v případě přehřátí snížit spotřebu procesoru. To se provádí prostřednictvím eliminace hodinových cyklů (Thermal Monitor 1) nebo snížením frekvence a napětí (Thermal Monitor 2). Preferovanou variantou je přitom ta druhá, neboť při stejném snížení spotřeby nabízí vyšší výkon. V současnosti je u procesorů architektury Core použita politika, kdy při přehřátí se procesor automaticky přepíná na definovanou nízkou frekvenci, typicky s nejnižším možným násobičem 6x. Nehalem jde v tomto ohledu trochu dál, neboť stupňů pro přepínání bude mít víc. Při současném real-time monitoringu spotřeby toto řešení umožní realizovat míře přehřátí přiměřenou odezvu, a tedy dosáhnout vyššího průměrného výkonu v případě přehřátí.

S novým procesorem souvisí i nová patice – LGA1366. Ta je výrazně větší než u současná LGA775 použitá u procesorů architektury Core. Intel přitom stále volí variantu s dutou střední částí, neboť zde již dlouhou dobu dává na procesor kondenzátory (AMD je dává u svých procesorů na vrchní stranu, proto má patici bez volného středu).

Maximální povolená hmotnost chladiče CPU činí u nového socketu 550 gramů, stejně jako v současnosti. Přesto je zde rozdíl – chladiče mohou nyní být širší a i samotný BOX chladič od Intelu by měl být o 10 mm v průměru širší. Jeho účinnost tak bude vyšší. Proč? Nehalem zřejmě i přes všemožné úsporné techniky nebude právě úsporný. Zlepšení v jádře si vyžádala jeho značné zvětšení (zhruba o 30 %) a to samozřejmě znamená více transistorů. Společně s integrací paměťového řadiče je výsledkem velký čip obsahující velké množství logiky. Přestože celkový počet transistorů je menší než u čtyřjader Core 2 Quad, je to právě logika, které je výrazně více a která má velkou spotřebu (cache má spotřebu minimální). Thermal Design Power (cílová „průměrná“ spotřeba v plné zátěži) prvních modelů se má vyšplhat na 130 W.

Mimochodem, Intel přešel s Nehalemem na transistory, které mají nižší spotřebu, ale také nižší rychlost přepínání . Co je cílem? Přirozeně bojovat proti příliš vysoké spotřebě velkého komplexního čipu a to i za cenu nižšího výkonu. Zda je taková cesta dobrá nebo zda je lepší mít transistorů méně a spoléhat se primárně na frekvenci anebo více oddělených čipů, nechám již na vás.

Předchozí