Architektura Fermi - Nvidia GF100 se představuje | Kapitola 7
Seznam kapitol
Nová generace grafických karet Nvidia byla už několikrát odložena a každá novinka vzbudí rozruch. Velká většina dosavadních informací byla spíše spekulativního rázu, ale ve dnešním článku vám konečně můžeme nabídnou konkrétní fakta o architektuře a vlastnostech čipu. Získali jsme je přímo na konferenci Deep Dive v Las Vegas.
Když přišla na trh G80 znamenala první krok k HPC computingu, ovšem jako první svého druhu trpěla vážnými problémy s efektivitou a nedořešenou architekturou. Jako herní GPU uspěla, ovšem v HPC se mnoho neprosadila. Druhá verze G200 vyřešila spoustu prvotních problémů, ovšem zůstala také na půli cesty s mnohými překážkami v masovém rozšíření do HPC sféry. GF100 by mělo být konečně plným řešením zbavených předchozích nedostatků starších čipů. Spousta algoritmů nedokáže pracovat se sdílenou pamětí cache, na což tvůrci u GF100 mysleli. Nové uspořádání pamětí cache udělali z GPU už téměř CPU, na kterém lze spouštět aplikace, které na starší generaci GPU spustit nešly nebo s brutálním dopadem na výkon.
Důležitou změnou je také přepracování sheduleru, který přepíná mezi výpočetní a grafickou úlohou. V tomto směru byly G80 a G200 neohrabané a jádro přepínalo ve snímkové frekvenci obrazu. U GF100 šel výrobce dál a mezi úlohami je přepínáno každých 20 mikrosekund a ještě jsou zpracovávány paralelně.
Jádro GF100 je plně kompatibilní a podporuje všechny hlavní výpočetní rozhraní dnešní doby. Aplikace může být vytvořena v C++ nebo napsáno pro PhysX nebo OpenCL, všechny budou na GPU fungovat. Pro GF100 není problém počítat v jeden okamžik kolize PhysX, renderovat scénu v DirectX 11 a zároveň počítat třeba AI v DirectCompute. Díky rychlému přepínání mezi úlohami je to zvládnutelné. Druhý obrázek pak popisuje možnosti budoucího využití výpočetního výkonu ve hrách. Následuje několik příkladů využití pro budoucí hry v nekomentovaných slajdech.
Zde se zastavme, demo kapaliny je možné stáhnout ze stránek výrobce a ozkoušet si můžete sami. Zajímavý je nárůst výkonu GF100 proti G200 o více než 100 procent. Je to způsobeno opět pamětí cache v jádru, s jejíž starší verzí v G200 byla simulace kapalin spustitelná jen s velkým dopadem na výkon. Ve hře Cryostasis dosáhla G200 výkonu 30 fps při simulaci 30 000 částic vody, jádro GF100 atakuje hodnotu 140 fps při simulaci 130 000 částic vody. Také nepřehlédněte poznámku, že v nové verzi PhysX 3.0 (nyní máme 2.8.6) lze počítat s navýšením výkonu o dalších 40-60 procent.
K výpočetním možnostem se ještě vrací poslední graf. Ukazuje nám, že GF100 je ve všech testovaných scénářích, minimálně dvakrát ale spíše třikrát výkonnější než G200. Testováno bylo ve hře Dark Void, Fluid demu, Raytracingu a AI testu. Podívejte se na dále na video a obrázky z real-time raytracingu:
Pro zvětšení klikněte na obrázky (mají minimálně 5MB)
Předposledním obrázkem této kapitoly si ještě jednou shrňme všechny hlavní znaky jádra GF100. V Geometry realismu je jádro až osmkrát výkonnější než jeho předchůdce. Nabízí také až 32xCSAA vyhlazování a třikrát vyšší výkon v shadow-mappingu. Také výpočetní výkon pro hry narostl čtyřikrát proti G200. Poslední řádek říká, že jde o nejvýkonnější GPU co kdy bylo vyrobeno a v nejvyšším nastavení (zde 1920x1200) s vyhlazováním 8xAA je až dvakrát výkonnější než GeForce GTX 285 (tady není konkrétní karta, na starších slajdech byla zmíněná).
Na úplný závěr této kapitoly, pro vás mám lahůdku. Zdali pak poznáte co to je? Oficiálně jde o PhysX plugin do Autodesk 3DS Max, ovšem podívejte se jak se soubor jmenuje. Ano tušíte správně, jde s největší pravděpodobností o model pro Mafia 2, která bude skutečně postavena na fyzice PhysX a byla na CES také tak prezentována, zde je důkaz.