AMD A10-7870K Godavari = refresh Kaveri | Kapitola 2
Seznam kapitol
AMD nedávno vydalo nový procesor, který byl uveden poměrně v tichosti a moc magazínů jej doposud netestovalo. Model A10-7870K totiž vypadá jako loňský Kaveri, jenže jde o její refresh s novým označením Godavari. Podíváme se, v čem se oproti starším čipům Kaveri liší a jak se změnily jeho vlastnosti.
V rychlosti se podíváme i na samotný (schématicky zjednodušený) návrh čipu. V horní části vidíme čtveřici procesorových jader. Pod procesorovými jádry jsou ve schématu výpočetní jednotky grafické části architektury GCN. Na pravé straně schématu se nachází IO část a řadič PCIe. Veškeré podporované standardy vidíme v popiscích. Kaveri je prvním procesorem AMD s integrovaným řadičem PCIe 3.0. Zcela vlevo je potom sdílený paměťový řadič nově nazvaný Huma (komunikace probíha s CPU i GPU).
Kaveri i jeho refresh má v případě procesorů A10, jako je A10-7870K anebo A10-7850 a 7850K až dvanáct výpočetních jednotek.
Celek tvoří čtyři procesorová jádra a osm grafických a programovatelných jednotek GCN. Pokud se zaměříme čistě na srovnání procesorového výkonu předchozí architektury Richland a Kaveri takt na takt, dle AMD narostl v některých případech až o 20 %, v průměru však okolo 10 %. Kaveri má o 200–300 MHz nižší takty (zhruba o 5–8 %), ve finále pak v průměru těsně překoná Richland. A to je ten negativní důsledek 28 SHP procesu. Grafická část je připravená pro paralerní výpočty ve specifikovaných úlohách. Výpočetní výkon dělá potom 856 GFLOPS. Nechybí mu podpora DX11.2, Mantle a True Audio. Jako celek (8 jednotek) obsahuje celkem 512 stream procesorů, 32 texturovacích jednotek a také 16 ROP. I na poli praktického grafického výkonu uvidíte příjemné nárůsty.
Základní stavební jednotkou procesorové části jsou moduly. Každý modul potom obsahuje dvojici jader, které sdílí FP jednotku a 2MB cache druhé úrovně. Cílem jádra Steamroller B bylo znovu navýšit samotný jednojádrový výkon, zvýšit efektivitu na Watt a vylepšit předvídání.
Vylepšení instrukční fetch jednotky má za následek zvýšení efektivity výkonu, přínos je v praxi velmi malý, přesto snížení chybovosti načítání a zlepšení předvídání nelze brát jako samozřejmost. Došlo ke zvýšení propustnosti výpočtů s celými čísly. V FP jsou tradičně jako u Piledriveru dvě pipeline určeny pro AVX a propojeny, takže dokážou zpracovávat 256bitové instrukce AVX. Došlo i ke změnám v cache první úrovně. Ta je nyní zvětšená na 96 KB a třícestná. L2 cache zůstala stejná, o velikosti 2 MB. Procesor Kaveri umí pracovat s moderními istrukčními sety jako, jsou například FMA4/3, AVX, AES, XOP.
Grafická část tvoří téměř polovinu velikosti celého APU. Znovu mohu zopakovat, že grafická část je tvořena z osmi výpočetních jednotek. Celý koncept uspořádání vychází například z řady radeonu Hawai. Architektura GCN byla potřebná i pro vyšší výkon s použitím klasických DDR3 pamětí (vylepšení front-end apod.). AMD zde říká, že grafický výkon A10-7850K je vyšší, než využívá třetina uživatelů Steamu. To není už zanedbatelné. Shrnutí opakuje architekturu GCN, podporu AMD TrueAudio a pochopitelně, i jako předchozí generace, možnost zapojení více monitorů do Eyefinity. Nakonec pokročilá akcelerace UVD a a převod formátů videa VCE. Grafická jednotka potom komunikuje skrze řadič s 2133 MHZ pamětmi DDR3. Procesor dokáže provozovat paměti i na frekvencích okolo 2600 MHz.
Procesorová jádra i grafické jednotky se vzájemně neomezeným přístupem do paměti skrze paměťový řadič nazvaný nově HUMA. Ještě zajímavější je vzájemný přístup k paměti v CPU skrze iGPU a naopak. Jako celek tvoří silnější výpočetní část pochopitelně ta grafická.
Zjednodušené schéma sdíleného řadiče pro všechna výpočetní jádra (grafické i procesorové).