Test Nvidia GeForce RTX 4090 FE: Brutální výkon, na který procesory nestačí
Seznam kapitol
Nvidia dnes uvádí na trh GeForce RTX 4090 a s ní i novou generaci GeForce. Pro ty nejnáročnější nastupuje jako první špičkový model RTX 4090. Nárůst výkonu proti minulé generaci je extrémní, daní za to je spotřeba i cena. Ale provozní vlastnosti vysokou spotřebou kupodivu významně netrpí.
GeForce RTX 4090: představení a parametry
GeForce RTX 4090 už jsme se na PCTuningu trochu věnovali při jejím představení a při rozbalování. Dnes vám nabídnu první várku testů. Na to, co všechno by to chtělo otestovat, jsem neměl zrovna moc času, takže to pro začátek bude stručnější než obvykle a detailům a podrobnějším testům se budeme věnovat v dalších článcích.
Testoval jsem především v rozlišení 4K, ale často najdete výsledky i v nižších rozlišeních. Na nich je někdy vidět, že měření neukazuje často ani tak výkon karty ve srovnání s předchozí generací, jako spíš to, že ji aktuální generace procesorů často nestíhá krmit.
Grafy jsou krásně přehledné, protože toho v nich moc nebude. Kvůli nové generaci jsem vyměnil staré Core i9-10900K za novější a výše taktovanou Core i7-12700K s rychlejšími pamětmi DDR5. Změnila se i většina her za novější a spíše než definitivní metodika je ještě do jisté míry provizorní, protože moc graficky propracovaných, náročných a dobře hodnocených her v poslední době nevycházelo. Další problém je, že metodika na testování nových karet se bez nových karet špatně připravuje – alespoň v případě GTX 4090, u které až ve chvíli, kdy ji dostanete do rukou, zjistíte, že testy nejsou dostatečně náročné. Letos nás snad ještě čeká pár zajímavých věcí, snad půjdou do metodiky doplnit.
Zvenčí jsme si kartu představili už při rozbalování minulý týden, pokud vám uteklo, v další kapitole zopakuji aspoň to základní ke konstrukci karty. RTX 4090 Founders Edition je masivní kovová cihla, která v počítači zabere prostor tří slotů a čtvrtý pod ní je ještě dobré nechat volný, aby měl chladič kudy nasávat vzduch. Důvodem je hlavně vysoká spotřeba karty – limit příkonu má na šílených 450 W, ale tím už vás asi nepřekvapím. Tříslotovému chladiči to kupodivu nedělá zase tak velké problémy – pokud jde o provozní vlastnosti, je na tom lépe než řada modelů minulých generací s podstatně nižší spotřebou.
Parametry si dáme prostřednictvím tabulky, parametry dalších karet z předchozích generací jsou o tabulku níže.
Model | RTX Titan | RTX 3080 Ti | RTX 3090 | RTX 3090 Ti |
Grafický čip | TU201-400-A1 | GA 102-225-A1 | GA 102-300-A1 | GA 102-350 |
Výrobní proces | TSMC 12 nm | Samsung 8 nm 8N | Samsung 8 nm 8N | Samsung 8 nm 8N |
Plocha čipu | 754 mm² | 628 mm² | 628 mm² | 628 mm² |
Počet tranzistorů | 18,6 mld. | 28,3 mld. | 28,3 mld. | 28,3 mld. |
Graphic Processing Cluster (GPC) | 6 | 7 | 7 | 7 |
Streaming multiprocesory (SM) | 72 | 80 | 82 | 84 |
Streaming multiprocesory (SM) | 96 | 112 | 112 | 112 |
Stream procesory (CUDA cores) | 4 608 | 10 240 | 10 496 | 10 752 |
Texturovacích jednotek (TMU) | 288 | 320 | 328 | 336 |
Jádra RT (RT Cores) | 72 | 80 | 82 | 84 |
Jádra tensor (Tensor Cores) | 576 | 320 | 328 | 336 |
Základní takt | 1 350 MHz | 1 365 MHz | 1 395 MHz | 1 560 MHz |
Takt s boost | 1 770 MHz | 1 665 MHz | 1 695 MHz | 1 860 MHz |
Kapacita pamětí | 24 GB | 12 GB | 24 GB | 24 GB |
Typ pamětí | GDDR6 | GDDR6X | GDDR6X | GDDR6X |
Šířka sběrnice | 384 b | 384 b | 384 b | 384 b |
Rychlost pamětí | 14,0 Gb/s | 19,0 Gb/s | 19,5 Gb/s | 21,0 Gb/s |
Takt pamětí | 1 750 MHz | 1 188 MHz | 1 219 MHz | 1 313 MHz |
Celková propustnost pamětí | 672,0 GB/s | 912,4 GB/s | 936,2 GB/s | 1,0 GB/s |
Rozhraní | PCIe 3.0 x16 | PCIe 4.0 x16 | PCIe 4.0 x16 | PCIe 4.0 x16 |
Přídavné napájení | 2× 8pin | 1× 12pin (2× 8pin) | 1× 12pin (2× 8pin) | 1× 12pin (3× 8pin) |
Maximální příkon karty | 280 W | 350 W | 350 W | 450 W |
Zaváděcí cena | 2 499 USD | 1 199 USD | 1 499 USD | 1 999 USD |
zaváděcí cena s DPH (orientační 23,40 Kč/USD) | 74 700 Kč | 35 800 Kč | 44 800 Kč | 59 700 Kč |
Detaily k BIOSu a dalším limitům Founders Edition prozradí GPU-Z:
Klíčovou novinkou je technologie DLSS 3. Zopakuji to, co jsme si psali po představení:
DLSS 3
U DLSS 3 přidává kromě možnosti vytvořit nový snímek kombinací nekompletního aktuálního snímku a starších snímků s vyššími detaily ještě možnost dopočítat další snímek mezi ně.
K tomu Nvidia přidává do celého procesu technologii Optical Multi Frame Generation kombinovanou s technologií Nvidia Reflex pro dosažení nízkých latencí. Obchází tím standardní renderovací frontu a zpoždění, které dané tím, že je před poslední vyrenderovaný snímek zapotřebí vložit ten dopočítaný, do jisté míry kompenzuje. Jak moc, to se liší titul od titulu v závislosti na tom, do jaké míry Reflex v dané hře pomáhá. Latence ale bude pochopitelně větší než při aktivním Reflexu bez použití DLSS 3.
Zmiňovali jsme, že u DLSS dostává algoritmus mapu pohybových vektorů. Ta ale není dokonalá, zachycuje sice, které objekty se v obraze pohybují, ale nejsou v ní věci, které se na objekty nanášejí až během renderingu jako mapa (textura) – například to mohou být dopočítané odrazy nebo stíny.
Dochází k tomu například u stínů motorky jedoucí na silnici:
Textura silnice se sice pohybuje, ale motorka a s ní i stín se oproti kameře nehýbe, je vržený na pohybující se silnici. Neuronová síť dostane od hry informaci, že se silnice na obrazovce pohybuje, a na základě toho má tendenci posouvat spolu s texturou silnice i texturu stínu.
Optical flow má právě tyto problematické oblasti odhalit a korigovat. V (téměř) reálném čase generuje další mapu s vektory pohybu prvků obrazu na základě již vyrenderovaných snímků. Díky tomu zjistí, u kterých prvků se pohyb liší od první mapy s pohybovými vektory a může je předat dál neuronové síti. Výsledkem je kombinace mapy pohybových vektorů ze hry a mapy pohybových vektorů z vyrenderovaných snímků, na základě níž může DLSS obraz rekonstruovat přesněji. Může pak omezit artefakty, které vznikají tam, kde se rozchází pohyb těles a pohyb jiných prvků v obraze.