Intel to s grafickými čipy myslí vážně
Potvrzuje to prezentace, kterou zveřejnil server Beyond3D. Intel už má poměrně zajímavý nástin toho, jak budou jeho vlastní samostatné grafické čipy vypadat.
Prezentace je to docela rozsáhlá, takže zde zmíním jen ty nejdůležitější body. Celá je k nahlédnutí na serveru Beyond3D.
Intel hodlá znovu vstoupit na trh se samostatnými grafickými čipy a už je to na 95% jisté. Má k tomu dobrý důvod. Uvědomuje si totiž, že grafické čipy mají v některých typech výpočtů nepoměrně vyšší výkon, než klasické procesory, pokud se ten výkon umí využít. Zkrátka cítí, že procesor přestává být nejdůležitější součástí počítače, a než by tento trend měnil, jednoduše se mu přizpůsobí.
Klikněte na obrázek pro zvětšení
Na těchto snímcích Intel porovnává tradiční jádro x86 procesoru, které spoléhá na out-of-order vykonávání příkazů a 128bitovou vec4 jednotku, a takzvané "throughput core". "Throughput core" je in-order výpočetní jádro, které je pětkrát menší a má velmi nízkou spotřebu. V klasických jednovláknových aplikacích je sice pomalé (30% obyčejného CPU), ale obsahuje také 512bitovou vektorovou výpočetní jednotku, která dokáže pracovat s 16 hodnotami najednou - tedy vec16 (možná si vzpomenete, že v souvislosti s čipem R600 od ATi se mluvilo o vec4 jednotkách). Staré programy sice z vektorové jednotky užitek mít nebudou, ale v aplikacích, které budou patřičně napsány a zkompilovány, by takovéto čipy dovedly zázraky. Ale zatím jsme srovnávali pouze samotná výpočetní jádra, pojďme raději porovnat celé procesory, z nichž každý by se opíral o jiný z výše zmíněných přístupů.
Klikněte na obrázek pro zvětšení
Jak vidíte zde, výkon v jednojádrových aplikacích by s novým přístupem byl poloviční, avšak celkový teoretický výkon ve výpočtech s plovoucí desetinnou čárkou je nesrovnatelně vyšší a přesahuje 1TFLOPS. Možná se mýlím a výše popisovaný čip bude vydán pouze jako grafický akcelerátor, ale prostě si nemohu nevzpomenout na projekt Tera-scale a na mnohojádrové procesory, které jako náhodou měly také běžet na 4GHz a celkem podávat výkon přes 1TFLOPS.
Zůstaňme však na zemi a předpokládejme, že toto opravdu skončí jen jako grafický čip, protože přeci jen, od procesoru je vyžadována zejména univerzálnost, kterou toto řešení poněkud postrádá. Podobnost s procesorem vyvolává zejména přítomnost 4MB cache, která bude dynamicky dělitelná mezi všechny výpočetní jednotky. Je také možné, že projekt Larrabee skončí jen jako specializovaný akcelerátor pro složité floating-point výpočty, jelikož se prezentace vyhýbá jakýmkoliv zmínkám o antialiasingu, adresování textur a podobným grafickým záležitostem. Takže je otázka, co nám to Intel nakonec naservíruje...
Zdroj: Beyond3D