512 kByte pod kapotou - Athlon XP Barton | Kapitola 3
Seznam kapitol
Po více jak dvou a půl letech se Athlonu XP konečně dostává 512 kByte cache druhé úrovně. Nabouchaný motor výpočetního jádra tak má konečně k dispozici pořádnou nádrž. Společně s novým podvozkem typu nForce 2 nám chce předvést dosud nevídané. Jenom zařadit rychlost a jedeme. You have the power...
Jak Athlony rozlišit?
Dle reakcí v diskusních fórech dělá stále velkému množství lidí problém, jak rozlišit jednotlivé čipy procesoru Athlon. Do tohoto bychom chtěli vnést trochu světla. Nejdříve proto charakteristika jednotlivých čipů:
Thunderbird | Palomino | Thoroughbred | Barton | |
prodejní název | Athlon | Athlon XP | Athlon XP | Athlon XP |
výrobní technologie | 0,18 mikron | 0,18 mikron | 0,13 mikron | 0,13 mikron |
tranzistory | 37 milionů | 37,5 milionů | 37,8 milionů | 54,3 milionů |
velikost čipu | 120 mm2 | 128 mm2 | 80 mm2 nebo 85 mm2 |
101 mm2 |
tvar čipu | obdélníkový | čtvercový | obdélníkový | výrazně obdélníkový |
delší strana | 13 mm | 11 mm | 11 mm | 13,5 mm |
frekvence (MHz) | 700 až 1400 | 1000 až 1733 | 1466 až 2250 | 1833 až 2166 |
napětí (V) | 1,7 a 1,75 | 1,75 | 1,5 až 1,65 | 1,65 |
max. spotřeba | 72,1W | 72W | 74,3W | 74,3W |
Kromě těchto čipů byste se mohli setkat i s čipy K7 a K75 - první generací Athlonů umísťovaných do slotu A. Těch se ale moc neprodalo a pokud už nějaký ten kus ano, bylo to většinou do serverů. Poznat je můžete snadno - jsou na dnešní poměry obrovské, umístěné ve velkém umělohmotném pouzdru.
Co jsme čekali
Od nového Athlonu XP s jádrem Barton jsme čekali, jak jinak, vyšší výkon než u předchozích generací. Větší cache by měla přinést znatelné zlepšení v aplikacích operujících s velkým množstvím dat. Měla by celkově zefektivnit práci s daty a pomoci Athlonu na frekvencích nad 2 GHz ve škálovatelnosti (schopnosti zvyšovat výkon s růstem frekvence).
Toto je Linpack, průmyslově uznávaný test schopnosti čipu pracovat s různě velkými datovými bloky. Test spočívá v počítání s desetinnými čísly na různě velkých maticích. Osa X v grafu reprezentuje velikost proměnné pro velikost matice, která zhruba odpovídá rovnici X * X * 8 (počet buněk čtvercové matice krát 8 byte jakožto velikost jedné buňky). Osa Y udává výkon v MegaFLOPS.
Z průběhu grafu si můžete všimnout, že nejvyššího výkonu čip dosahuje při zpracování matice o straně cca. 85. Výpočtem velikosti snadno zjistíte, že je to asi 64 kByte, velikost datové level 1 cache Athlonu. Výsledný výkon se pro Barton i Thoroughbred se stejnou frekvencí neliší.
Hlavní rozdíl přichází až při zpracování větších objemů. Zatímco Thoroughbred po velikosti 180 rapidně propadá, Barton se drží až do velikosti strany asi 250. Tento rozdíl je způsoben dvojnásobnou cache druhé úrovně. Barton má lepší předpoklady pro práci s většími datovými bloky, jeho výkon může být v extrémním případě až dvojnásobný oproti současným Athlonům XP.
Všimněte si, že velikost cache hraje roli i v aplikacích, které se celé nevejdou do cache. I při zpracování matice o velikosti cca 1,5 MB si Barton vede o několik procent lépe než Thoroughbred. Při ještě větších datových tocích ale Barton prakticky nemá žádnou výhodu proti Thoroughbredu.
Insider: Příliš malá cache může být problém
Pokud si pamatujete na můj dřívější článek Na velikosti záleží - cache, jistě si vzpomenete, jaký vliv měla malinká cache u Celeronu založeného na jádře Pentia 4. Zatímco oba plnohodnotné čipy Pentium 4 (Willamette s 256 kByte a Northwood s 512 kByte) si vedly v testech relativně obstojně, Celeron propadal. Při tehdejším srovnání jsem samozřejmě nezapomněl ani na Linpack:
Z tohoto grafu se dá vyčíst hodně. Velikost cache byla u Pentia 4 rozhodující. Northwood dokázal s větší L2 cache nadále zvyšovat výkon při rostoucí velikosti matice. Toto byl klíč k průměrnému růstu výkonu u Northwoodu oproti Willamette o 10 procent. Druhý efekt se týkal Celeronu. Z grafu je jasně vidět, že s velmi velkými datovými bloky se výkon Pentií 4 Willamette a Northwood vyrovnává, zatímco u Celeronu je výrazně nižší. Malá cache zde způsobuje rapidní snížení efektivity Data prefetch mechanismu, který procesoru při takto velké cache patrně spíše škodí než prospívá. Nebyla to samotná malá cache, ale toto, co způsobilo rapidní pokles výkonu Celeronu v datově náročných aplikacích. |
Pokračujme ale dále...