Architektura Fermi - Nvidia GF100 se představuje | Kapitola 6
Seznam kapitol
Nová generace grafických karet Nvidia byla už několikrát odložena a každá novinka vzbudí rozruch. Velká většina dosavadních informací byla spíše spekulativního rázu, ale ve dnešním článku vám konečně můžeme nabídnou konkrétní fakta o architektuře a vlastnostech čipu. Získali jsme je přímo na konferenci Deep Dive v Las Vegas.
![Architektura Fermi - Nvidia GF100 se představuje](https://storage.googleapis.com/pctuning-cz/media/images/th3dnjr6659jj0h60d1fcb57149d572985259.jpg)
Na kvalitě obrazu a vyhlazování také NVIDIA hodně zapracovala, hlavně vylepšením ROP jednotek. Jeden ROP cluster má osm ROP jednotek, celkový počet je 64 proti 32 u jádra G200. Zdvojnásobení počtu jednotek se musí samozřejmě projevit i na možnostech karty, také tomu tak je. Jedna ROP jednotka v jádru GF100 zvládne 32-bit integer pixel za jeden takt, nebo FP16 pixel za dva takty. Zpracování FP32 pixelu jí bude trvat čtyři takty. Atomické operace jsou až dvacetinásobně rychlejší než u G200, operace v paměti pak téměř osmkrát rychlejší.
![Architektura Fermi - Nvidia GF100 se představuje](https://storage.googleapis.com/pctuning-cz/media/images/fvbefrjsjm4ne1l60d1fcb67cd10947037494.png)
U jádra G200 docházelo ve většině her k velkým propadům výkonu se zapnutým vyhlazováním 8xMSAA. To se díky vyššímu počtu ROP jednotek a novým kompresním algoritmům podařilo u GF100 vyřešit. V režimu 4xAA je GF100 o 60 procent výkonnější než G200, u vyhlazování 8xAA je to rozdíl 130 procent. Dopad na výkon 4xAA a 8xAA je u GF100 jen 9 procent.
![Architektura Fermi - Nvidia GF100 se představuje](https://storage.googleapis.com/pctuning-cz/media/images/tuvvvsgfdgecj3160d1fcb71b008317402058.png)
![Architektura Fermi - Nvidia GF100 se představuje](https://storage.googleapis.com/pctuning-cz/media/images/x0jraq1pq926uoy60d1fcb7c6ebc328233420.png)
![Architektura Fermi - Nvidia GF100 se představuje](https://storage.googleapis.com/pctuning-cz/media/images/nphp3lfj8bul38o60d1fcb878381318420126.png)
Nově v jádru GF100 podporují texturovací jednotky DirectX 11 Gather4 funkci. Výrobce tuto funkci implementoval přímo do hardware, což by mělo razantně vylepšit práci se stíny, ambient occlusion a dalšími post procesing algoritmy. S Jittered samlingem by měly být stíny hladší a filtrování efektivnější. Funkčnost je demonstrována na stínech lodi v testu 3D Mark 06.
Nové vyhlazování 32xCSAA
![Architektura Fermi - Nvidia GF100 se představuje](https://storage.googleapis.com/pctuning-cz/media/images/w96cmqbx1dm0k7f60d1fcb92e701686068031.png)
![Architektura Fermi - Nvidia GF100 se představuje](https://storage.googleapis.com/pctuning-cz/media/images/23509d72n9y9zmx60d1fcb9e569b583241837.png)
![Architektura Fermi - Nvidia GF100 se představuje](https://storage.googleapis.com/pctuning-cz/media/images/38tugnr2jboneky60d1fcba8e6c4334289730.png)
Další novinkou je režim vyhlazování 32xCSAA, který by měl poskytnou co nejvyšší možnou kvalitu zobrazení. Běžné dnes je, že na vegetaci se používá postup alpha-to-coverage a zvýraznění hran je závislé na počtu krycích samplů. Pokud jsou krycí samply jen čtyři nebo osm, dochází k rozmazání a rozdvojování zejména textur blíže k obrazovce. S novým režimem a třiceti dvěma krycími samply by se měl tento jev znatelně potlačit.
![Architektura Fermi - Nvidia GF100 se představuje](https://storage.googleapis.com/pctuning-cz/media/images/vh929iuac04raj560d1fcbb5d31b817452374.png)
![Architektura Fermi - Nvidia GF100 se představuje](https://storage.googleapis.com/pctuning-cz/media/images/902p90zb37i3evh60d1fcbc23589042428078.png)
Zde je porovnání kvality vyhlazování 16xCSAA (8+8 samplů) jádra G200 a 32xCSAA (8+24 samplů) u GF100.
![Architektura Fermi - Nvidia GF100 se představuje](https://storage.googleapis.com/pctuning-cz/media/images/yjpqj2vozpxoc9x60d1fcbccd062404694989.png)
![Architektura Fermi - Nvidia GF100 se představuje](https://storage.googleapis.com/pctuning-cz/media/images/hk6puxbfwfot7q360d1fcbd92e8b739106931.png)
![Architektura Fermi - Nvidia GF100 se představuje](https://storage.googleapis.com/pctuning-cz/media/images/rnhcgkx13k2xcz460d1fcbe4d684640200218.png)
Vylepšení se také dočkal TMAA (Transparency Multisampling), který také těží z CSAA. TMAA najde uplatnění hlavně v DirectX 9 hrách, kde API nepodporuje alpha-to-coverage techniku. TMAA zde konvertuje starší techniku alpha-test do alpha-to-coverage což zaručí spolu s CSAA mnohem lepší kvalitu obrazu. Ostatně to dokládají dva obrázky.
![Architektura Fermi - Nvidia GF100 se představuje](https://storage.googleapis.com/pctuning-cz/media/images/tuudj46fcs5xrcn60d1fcbef123b870603371.png)
Poslední obrázek ukazuje pokles výkonu vyhlazování 8xMSAA a 32xCSAA u karty s jádrem GF100. Takto vysoké vyhlazování má díky menší náročnosti 32xCSAA krycích samplů na paměť, vliv na výkon jen 7 procent proti druhého režimu.