AMD Bulldozer – Nová architektura CPU od AMD
i Zdroj: PCTuning.cz
Hardware Článek AMD Bulldozer – Nová architektura CPU od AMD

AMD Bulldozer – Nová architektura CPU od AMD | Kapitola 4

Z. Obermaier

Z. Obermaier

6. 9. 2010 01:00 28

Seznam kapitol

1. Bulldozer, Bobcat – starý známý .. 2. AMD Bulldozer – Představení 3. Hlavní novinky architektury 4. AMD Bulldozer – Architektura podrobně 5. AMD Bulldozer – Architektura podrobně II.
6. AMD Bulldozer – Front-end (Prediction, Fetch a Dekodér) 7. AMD Bulldozer – Výpočetní jednotky 8. AMD Bulldozer – Paměťový subsystém 9. AMD Bulldozer – Úsporné funkce a Turbo 10. Závěr

Většina světových médií přinesla zevrubný pohled na novou architekturu procesorů AMD už minulý týden. My máme sice krapet zpoždění, nabídneme vám ale také více informací. Kromě obecně známých skutečností si podrobně popíšeme architekturu jádra, a pohovoříme více o výkonu budoucí generace procesorů AMD.

Reklama
AMD Bulldozer – Nová architektura CPU od AMD
i Zdroj: PCTuning.cz

AMD Bulldozer – Nová architektura CPU od AMD
i Zdroj: PCTuning.cz

Úvod do architektury začněme pohledem na jádra, bloky a strukturu celého procesoru. AMD začíná prezentaci o nových čipech horním obrázkem, který ukazuje nalevo SMT systém (Hyper-Threading od Intel) a napravo řešení ze dvou plnohodnotných jader.

Pro úplnost jen krátce vysvětlím princip SMT. Jde o to, že výpočetní jádro (FPU a další) jednotky bývají většinu svého času vytížené méně než než 50 procent. Toto číslo berte jako fakt, je podloženo mnoha výzkumy výrobců procesorů. Dá se tedy říci, že se více než polovinu procesorového času "flákají". Intel tedy vymyslel způsob jak je více vytížit a tím navýšit efektivitu celého procesoru. Některé obvody na front-endu zdvojil, a pustil do jednoho jádra dvě fronty instrukcí (ty se mezi sebou střídají). Tím vytížil jádro v některých případech téměř na sto procent. Pro operační systém se takové jádro s SMT hlásí jako jádra dvě, výkon ale nestoupá dvakrát, ale většinou mezi 50-60 procenty plnohodnotného jádra (dle aplikace).

Jak tedy říká první obrázek, u SMT sice jdou dva thready do jednoho jádra, tomu se ale většinou nedostává dostatek prostředků na vykonání obou threadů a jedno vlákno je zpracováno rychleji na úkor druhého, nebo obě pomaleji. Výkon sice naroste, efektivita ale není nijak vysoká. Druhý obrázek nalevo ukazuje klasické řešení dvou plnohodnotných jader na dvě vlákna instrukcí. Zde jsou oba thready vykonány stejně rychle, výkon naroste dvojnásobně. Toto řešení zabere v čipu více místa (větší počet tranzistorů) a jednotky jsou většinu času nevyužité. AMD obě tyto technologie skloubilo. V jednom stavebním bloku (modulu) jsou dvě plnohodnotná výpočetní jádra, jež sdílejí složitější výpočetní jednotky, front-end a L2 cache. Oba dva thready tedy budou vykonány téměř stejně rychle jako u dvou plnohodnotných jader, malá ztráta výkonu zde ale je právě díky sdílení zdrojů na front-endu a dále. Více to znázorní následující obrázek:

AMD Bulldozer – Nová architektura CPU od AMD
i Zdroj: PCTuning.cz

Zcela nahoře jsou dvě plnohodnotná jádra, propustnost obou vláken (threadů) je stoprocentní. Náklady takového řešení je ale také maximální, dvě jádra zabírají spoustu místa v jádře CPU a mají dvojnásobnou spotřebu. Uprostřed je řešení architektury Bulldozer. Propustnost o pár procent klesla (80 procent), náklady se ale snížily o čtvrtinu, stejně jako spotřeba. Nejméně nákladným řešením je SMT zcela dole. Náklady na čip jsou kousek nad polovinou dvou plných jader, propustnost je ale také jen kousek nad šedesáti procenty. Nejlepším kompromisem mezi výkonem, cenou a spotřebou tedy může být řešení AMD. Nabízí nejvíce výkonu za nižší náklady než dvě plnohodnotná jádra. Jak se toto řešení osvědčí v praxi si ale musíme ještě počkat.

Struktura procesoru

AMD Bulldozer – Nová architektura CPU od AMD
i Zdroj: PCTuning.cz

U nadcházejících procesorů architektury Bulldozer už nebudeme hovořit o jádrech, ale o modulech. Každý modul se skládá ze dvou samostatných jader, které společně sdílí front-end, výpočetní jednotky a L2 cache. Paměť L1 cache je dedikovaná pro každé jádro a není sdílená. Toto řešení je velice modulární a umožní výrobci celkem snadno vytvářet různé kombinace počtu modulů a tím navyšovat výkon procesorů. Jak bude první procesor vypadat ukáže následující obrázek:

AMD Bulldozer – Nová architektura CPU od AMD
i Zdroj: PCTuning.cz

První procesory se objeví v kombinaci z našeho obrázku. Půjde o osmijádra tvořena čtyřmi Bulldozer moduly. Později se u serverových čipů setkáme s obdobou dnešních "slepenců" Magny Cours, kde budou pod chladičem procesoru spojeny dva bloky ze tří nebo čtyř modulů (interlagos). Spojením vznikne dvanáctijádrový nebo šestnáctijádrový procesor, zdali se ho časem dočkáme i v desktopu je otázka, která nebude ještě dlouho zodpovězena. Kromě čtyř Bulldozer modulů s osmi jádry, bude v čipu umístěna L3 cache, jejíž maximální hodnota nebyla zatím prozrazena. Některé zdroje uvádí 2MB jiné 3MB pro jeden modul, tedy v případě osmijádra bude kapacita sdílené L3 Cache 12MB nebo 8MB. V procesoru dále najdeme integrován paměťový řadič, rozhraní severního můstku s PCI-E linkami (zřejmě až 42 linek) a rozhraní Hyper-Transport pro komunikaci s dalšími komponenty systému nebo dalšími procesory.

AMD Bulldozer – Nová architektura CPU od AMD
i Zdroj: PCTuning.cz

Další obrázek ukazuje, jak bude zřejmě procesor architektury Bulldozer vypadat, na obrázku je prý obecné Bulldozer jádro s názvem Orochi. Má osm jader ve čtyřech modulech a 8MB L3 cache. Nesrovnalosti s rozměry jednotlivých modulů AMD označilo za kamufláž, aby konkurence neodhalila pravou podobu jádra. Zde se ale AMD nemá čeho bát, Nehalem je z části okopírovaným Phenomem, u Orochi je zase velká část okoukána od Nehalemu (více u popisu architektury). Zde ještě jednu poznámku ke jménu jádra Orochi. Pokud zalistujete do dávné minulosti roku 2008, skutečně se jádro prvního procesoru architektury Bulldozer mělo jmenovat Orochi (jádra architektury 10h se jmenují Agena, Deneb, Thuban). Tento název byl ale v roce 2009 nahrazen novým – Zambezi. Což je označení pro desktopovou verzi. Tedy malá rekapitulace: Serverový procesor do patice C32 s osmi jádry se bude jmenovat Valencia, další šestnáctijádrový Opteron do patice G34 ponese jádro Interlagos. Desktopový procesor do patice AM3+ se pak pochlubí jménem jádra Zambezi.

Předchozí
Další
Reklama
Reklama

Komentáře naleznete na konci poslední kapitoly.

Reklama
Reklama