Nvidia GeForce RTX 4090 a RTX 4080: Ada Lovelace a jiný přístup k renderingu
i Zdroj: nvidia.com
Grafické karty Článek Nvidia GeForce RTX 4090 a RTX 4080: Ada Lovelace a jiný přístup k renderingu

Nvidia GeForce RTX 4090 a RTX 4080: Ada Lovelace a jiný přístup k renderingu

Adam Vágner

Adam Vágner

21. 9. 2022 17:30 68

Seznam kapitol

1. Architektura Ada Lovelace 2. RTX 4090 a RTX 4080: Parametry, ceny 3. DLSS 3 4. DLSS 3: otázky a odpovědi

Nvida představila první tři modely z nové generace GeForce. Uvedení RTX 4090 na trh je plánováno na říjen, RTX 4080 nás čeká v listopadu. Klíčová pro ně bude technologie DLSS 3 v kombinaci s Reflex, díky nimž nabízejí vyšší snímkové frekvence a kratší input lag, než jakého lze dosáhnout prostým navýšením hrubého výkonu. Už teď je kolem ní řada nejasností, zkusíme odpovědět na nejčasnější otázky.

Reklama

Karty také provází slogan „beyond fast“, v češtině „víc než rychlost“ s podtitulem „Předběhla svůj čas i hry“. Nvidia tím zjevně naráží právě na novou technologii DLSS 3.

Na úvod musím říci, že je pravděpodobné, že následující text bude určitě obsahovat řadu nepřesností a zjednodušení. Velká část z něj se věnuje asi nejstřeženějšímu tajemství spojenému s novou generací GeForce řady 40 – technologii DLSS 3. Kvůli tomu nedostal ani nikdo z novinářů, snad s výjimkou Digital Foundry, kteří dělají videoanalýzy, dopředu žádné informace. Je to otrava, ale je to asi jediná možnost, jak opravdu zajistit, že to nikdo nevyžvaní.

Dosud zveřejněné informace nejdou příliš do hloubky. Jak to doopravdy funguje, vědí jen vývojáři, a detailnější vysvětlení pro „širší veřejnost“ má teprve následovat. Přesto se už teď dá říct, že koluje řada zavádějících informací, snad se to časem vystříbří. A počítejte s tím, že i tento článek bude ještě doplňovaný za pochodu.

GeForce RTX 40 využívají novou architekturu Ada Lovelace. S ní přichází i výpočetní jednotky nových generací. S architekturou RTX přibyla v čipu dva základní typy – RT Cores pro akceleraci ray tracingu a tensor cores pro urychlení výpočtu tenzorů využívaná pro výpočty u neuronových sítí.

Nvidia GeForce RTX 4090 a RTX 4080: Ada Lovelace a jiný přístup k renderingu
i Zdroj: PCTuning.cz

RT Cores, tedy výpočetní jádra pro výpočty ray tracingu, mají taktéž zvládat výpočty průniku paprsku s trojúhelníkem dvojnásobnou rychlostí, celkový počet RT-TFLOP má být tedy víc než dvakrát rychlejší. Kromě toho dostala nový Opacity Micromap Engine (OMM) a Displaced Micro-Mesh Engine (DMM). 

Nová generace tensor cores má mít až pětkrát vyšší propustnost, s novým FP8 Transformer Engine má dosahovat až 1,4 Tensor-petaFLOPS. 

Nvidia GeForce RTX 4090 a RTX 4080: Ada Lovelace a jiný přístup k renderingu
i Zdroj: PCTuning.cz

Novým důležitým prvkem v jádře je optical flow accelerator pro akceleraci výpočtů potřebných pro generování nových snímků, o tom dále v kapitole věnované DLSS 3.

OMM (Opacity Micro Maps) má sloužit pro urychlení výpočtů objektů s texturami s alfa-kanálem (tedy částečně průhlednými), jako je listoví, pletivo anebo jako jsou částicové efekty (jiskry, kouř, oheň a podobně). 

DMM Engine má až 10× zrychlit stavbu Bounding Volume Hierarchy (BVH), tedy struktury obalových těles při dvacetinásobném snížení nároků na paměťový prostor. Pro nás je podstatné, že to usnadní ray tracing v graficky složitých scénách.

Další novinkou je Shader Execution Reordering s romantickou zkratkou SER zvyšuje výkon při operacích s ray tracingem až třikrát, což může ve hrách přinést až 25% navýšení výkonu.

Nvidia GeForce RTX 4090 a RTX 4080: Ada Lovelace a jiný přístup k renderingu
i Zdroj: PCTuning.cz

A očekávané je asi i vylepšení enkodéru videa o hardwarovou podporu enkódování do nového formátu AV1, který má nabídnout až o 40 % vyšší efektivitu a možnost streamerům navýšit rozlišení z 1080p na 1440p při zachování stejného bitrate a stejné kvality komprese.

V následujícím grafu se srovnáním výkonu je zajímavý dovětek „Rozlišení 3840 × 2160, nejvyšší herní nastavení, režim výkonu DLSS Super Resolution, generování DLSS snímků kartami RTX řady 40, i9-12900K, 32 GB RAM, Windows 11 x64. Všechna data o technologii DLSS Frame Generation a hra Cyberpunk 2077 s novým režimem Max Ray Tracing založeným na předběžných verzích.“

Nvidia GeForce RTX 4090 a RTX 4080: Ada Lovelace a jiný přístup k renderingu
i Zdroj: PCTuning.cz
Nvidia GeForce RTX 4090 a RTX 4080: Ada Lovelace a jiný přístup k renderingu
i Zdroj: PCTuning.cz

Z toho a z titulů uvedených v grafech se dá usuzovat, že jde o hodnoty s DLSS 3.0 ve srovnání s DLSS 2.0 u starších karet. U Cyberpunku je ještě poznámka, že jde o připravovaný update s dalšími, ještě náročnějšími efekty využívajícími ray tracing, který je náročnější než aktuální verze – i proto je u něj nárůst výkonu největší.

Tento konkrétní příklad demonstruje video níže s GeForce RTX 4090 v rozlišení 3840 × 2160, nový režim Max Ray Tracing, DLSS 3, beta verze.

Obecně lze říci, že změny v jádře a nové DLSS přinese ve starších hrách až dvojnásobný nárůst výkonu, v novějších hrách, které už budou s novými technologiemi počítat, budou na ně optimalizované a budou využívat náročnější efekty s ray tracingem může být nárůst výkonu oproti renderingu bez využití funkcí nové generace až čtyřnásobný.

Nvidia GeForce RTX 4090 a RTX 4080: Ada Lovelace a jiný přístup k renderingu
i Zdroj: PCTuning.cz

A také se z toho dá usuzovat, že hrubý nárůst výkonu bude nižší. Minimálně pro nejvyšší modely ale platí, že v převážné většině starších her, které DLSS a ray tracing nevyuživají, už nabízejí dostatečný výkon na to, abyste se obešli i bez DLSS a spíše než na výkonu grafiky u nich bude výkon váznout na výkonu procesoru.

Předchozí
Další
Reklama
Reklama

Komentáře naleznete na konci poslední kapitoly.

Reklama
Reklama