Prezentace ATi: Možnosti DirectX 10
ATi vypustila do světa prezentaci, kde poukazuje na omezení DirectX 9, možnosti DirectX 10 a výhody unifikované architektury. Současně je také vysvětlena ona fáma o DirectX 10 SDK, která přeci jen nakonec nebyla tak úplně fámou.
Tentokrát nejde o marketingovou prezentaci navážející se do nVidie, nýbrž ukazuje, co přinese DirectX 10 zejména vývojářům. Vybral jsem pouze ty nejdůležitější informace, celou prezentaci si můžete prohlédnout zde (ve formátu PDF).
Jak se zdá, DirectX 10 nepřinese žádné úžasné efekty navíc - místo toho se bude soustředit na optimalizaci výkonu. Jedním významným krokem tímto směrem je unifikovaná architektura.
Problémem dnešního způsobu renderingu je, že během různých fází renderování jednoho snímku je chvilku plně vytížen pixel shader a chvilku vertex shader, přičemž druhá polovina čipu nemá co na práci. Jde o podobný problém, který podnítil vznik technologie HyperThreading, nicméně řešení je daleko elegantnější.
Unifikovaná architektura spočívá ve sloučení pixel, vertex a geometry shaderu v jednu sjednocenou pipeline. Pár slov ke geometry shaderu - jde o zbrusu novou část čipu vyžadovanou specifikacemi DX10. Jeho úkolem bude generovat a zpracovávat vrcholy, se kterými pak dále budou pracovat vertex a pixel shadery. Krom toho ale bude moci i vyhodnocovat kolize objektů, což je dnes práce výhradně pro procesor. Samozřejmě to ale neznamená, že by CPU nemělo co na práci - to se bude moci soustředit například na umělou inteligenci.
Je vám zřejmě jasné, kterých grafických čipů se unifikace týká - je to řada R6xx. Původně se předpokládalo, že pixel a vertex shader budou sjednoceny a geometry shader zůstane samostatný. Z této prezentace vyplývá, že i geometry shader bude součástí unifikované pipeline.
Díky unifikaci bude všechny úkony provádět jedna víceúčelová výpočetní jednotka a tak žádná část čipu nebude zahálet.
Dalším omezení DirectX 9 spočívá ve zpomalení při velkém počtu objektů. DirectX 10 omezí "režijní náklady" (podíl času věnovaného rozhraní a ovladači) ze 40% na 20% výkonu, a tak zbyde více času pro samotnou hru.
Nyní k vysvětlení SDK a "DX10" ukázek. Pravda je taková, že na demech jsou předvedeny možnosti DirectX 10, ale unifikovanou pipeline nahrazuje emulace přes pixel shadery Radeonu X1900. R5xx má tedy možná blíže k unifikované architektuře, nežli ke klasickému designu R3xx/R4xx a NV40/G70.
A ještě jedna poznámka k DirectX 10. Unifikovaná architektura nebude jeho požadavkem, nicméně je napsáno tak, aby takovýto přístup preferovalo. Ačkoliv nejde o marketingovou prezentaci s cílem očernit nVidii, skrytý záměr je docela dobře poznat: a to přesvědčit vývojáře a odbornou veřejnost, že R6xx bude díky unifikaci lepší než G80.
Zdroj: GameDev.net