GeForce Pascal dostanou podporu pro DirectX Raytracing | Kapitola 3
Seznam kapitol
Když Nvidia uváděla GeForce RTX, tvářila se, že jde o první grafiky, které mají přinést použítelný ray tracing ve hrách. V noci oznámila, že podporu pro ray tracing DXR, který je novou součástí DirectX, dostanou i starší karty. Co bychom od toho měli čekat? A proč Nvidia věnuje takové úsilí GeForce RTX, když to funguje i na starších kartách?
Na dalším obrázku je shrnutí zátěže grafického čipu při práci na jednom snímku v Metro Exodus a to, jak jednotlivé technologie a optimalizace fungují pohromadě.
Nahoře je Pascal GTX 1080 Ti, horizontální osa je čas, vertikální je využití grafického čipu.
V levé části grafu jsou výpočty na shading, největší souvislý blok uprostřed jsou výpočty potřebné pro ray tracing a napravo je návrat na normální shading. Na záznamu je vidět, jak obrovský čas zabírá právě ray tracing.
V prostředním grafu je vidět, jak výpočet celého snímku probíhá na RTX 2080 s architekturou Turing bez využití RT cores. Šedou barvou jsou výpočty na jádrech pro výpočty s plovoucí desetinnou čárkou FP32, fialovou na jádrech pro celočíselné výpočty INT32. Protože oboje výpočty běží paralelně, částečně to zkracuje výpočty shadingu na začátku a konci a o více než polovinu zkracuje dobu potřebnou pro ray tracing.
Právě ray tracing je hodně náročný na celočíselné výpočty INT32 a schopnost Turingu provádět je současně spolu s FP32 podle Nvidie výrazně zkracuje množství času, které je u každého snímku stráveno ray tracingem, i když se nevyužívají RT cores.
Na posledním průběhu je pak RTX 2080 využívající všechny nové technologie včetně RT cores a tensor cores a celý obrovský prostřední úsek, který u dvou předchozích průběhů zabíral většinu času, je zredukovaný na kousek se zelenou barvou – zelená znázorňuje RT Cores provádějící výpočty pro ray tracing výrazně rychleji než na tradičních shaderech.
V první části tak dostaneme hodnoty kolem 10 TFLOPS, v druhé ve špičkách ekvivalent 80 TFLOPS, v třetí až dvacet a ve čtvrté opět ekvivalent až 80 TFLOPS.