Test Nvidia GeForce RTX 4090 FE: Brutální výkon, na který procesory nestačí

Seznam kapitol

1. GeForce RTX 4090: představení a parametry 2. Konstrukce karty, konektory 3. Testovací sestava, 3D Mark 4. Crysis 3 Remastered, Cyberpunk 2077 5. F1 2022 + DLSS 3.0 6. Far Cry 6, GTA V

7. Metro Exodus Enhanced Edition, Red Dead Redemption 2 8. Witcher 3, World of Tanks 9. Blender Benchmark, Luxmark, Vray 5 benchmark 10. Spotřeba, teploty v F1 2022 11. Spotřeba, teploty v Metro Exodus 12. Závěr

Nvidia dnes uvádí na trh GeForce RTX 4090 a s ní i novou generaci GeForce. Pro ty nejnáročnější nastupuje jako první špičkový model RTX 4090. Nárůst výkonu proti minulé generaci je extrémní, daní za to je spotřeba i cena. Ale provozní vlastnosti vysokou spotřebou kupodivu významně netrpí.

Reklama

GeForce RTX 4090: představení a parametry

GeForce RTX 4090 už jsme se na PCTuningu trochu věnovali při jejím představení a při rozbalování. Dnes vám nabídnu první várku testů. Na to, co všechno by to chtělo otestovat, jsem neměl zrovna moc času, takže to pro začátek bude stručnější než obvykle a detailům a podrobnějším testům se budeme věnovat v dalších článcích.

Testoval jsem především v rozlišení 4K, ale často najdete výsledky i v nižších rozlišeních. Na nich je někdy vidět, že měření neukazuje často ani tak výkon karty ve srovnání s předchozí generací, jako spíš to, že ji aktuální generace procesorů často nestíhá krmit.

Grafy jsou krásně přehledné, protože toho v nich moc nebude. Kvůli nové generaci jsem vyměnil staré Core i9-10900K za novější a výše taktovanou Core i7-12700K s rychlejšími pamětmi DDR5. Změnila se i většina her za novější a spíše než definitivní metodika je ještě do jisté míry provizorní, protože moc graficky propracovaných, náročných a dobře hodnocených her v poslední době nevycházelo. Další problém je, že metodika na testování nových karet se bez nových karet špatně připravuje – alespoň v případě GTX 4090, u které až ve chvíli, kdy ji dostanete do rukou, zjistíte, že testy nejsou dostatečně náročné. Letos nás snad ještě čeká pár zajímavých věcí, snad půjdou do metodiky doplnit.

Zvenčí jsme si kartu představili už při rozbalování minulý týden, pokud vám uteklo, v další kapitole zopakuji aspoň to základní ke konstrukci karty. RTX 4090 Founders Edition je masivní kovová cihla, která v počítači zabere prostor tří slotů a čtvrtý pod ní je ještě dobré nechat volný, aby měl chladič kudy nasávat vzduch. Důvodem je hlavně vysoká spotřeba karty – limit příkonu má na šílených 450 W, ale tím už vás asi nepřekvapím. Tříslotovému chladiči to kupodivu nedělá zase tak velké problémy – pokud jde o provozní vlastnosti, je na tom lépe než řada modelů minulých generací s podstatně nižší spotřebou.

Test Nvidia GeForce RTX 4090 FE: Brutální výkon, na který procesory nestačí

Parametry si dáme prostřednictvím tabulky, parametry dalších karet z předchozích generací jsou o tabulku níže.

Model	RTX Titan	RTX 3080 Ti	RTX 3090	RTX 3090 Ti
Grafický čip	TU201-400-A1	GA 102-225-A1	GA 102-300-A1	GA 102-350
Výrobní proces	TSMC 12 nm	Samsung 8 nm 8N	Samsung 8 nm 8N	Samsung 8 nm 8N
Plocha čipu	754 mm²	628 mm²	628 mm²	628 mm²
Počet tranzistorů	18,6 mld.	28,3 mld.	28,3 mld.	28,3 mld.
Graphic Processing Cluster (GPC)	6	7	7	7
Streaming multiprocesory (SM)	72	80	82	84
Streaming multiprocesory (SM)	96	112	112	112
Stream procesory (CUDA cores)	4 608	10 240	10 496	10 752
Texturovacích jednotek (TMU)	288	320	328	336
Jádra RT (RT Cores)	72	80	82	84
Jádra tensor (Tensor Cores)	576	320	328	336
Základní takt	1 350 MHz	1 365 MHz	1 395 MHz	1 560 MHz
Takt s boost	1 770 MHz	1 665 MHz	1 695 MHz	1 860 MHz
Kapacita pamětí	24 GB	12 GB	24 GB	24 GB
Typ pamětí	GDDR6	GDDR6X	GDDR6X	GDDR6X
Šířka sběrnice	384 b	384 b	384 b	384 b
Rychlost pamětí	14,0 Gb/s	19,0 Gb/s	19,5 Gb/s	21,0 Gb/s
Takt pamětí	1 750 MHz	1 188 MHz	1 219 MHz	1 313 MHz
Celková propustnost pamětí	672,0 GB/s	912,4 GB/s	936,2 GB/s	1,0 GB/s
Rozhraní	PCIe 3.0 x16	PCIe 4.0 x16	PCIe 4.0 x16	PCIe 4.0 x16
Přídavné napájení	2× 8pin	1× 12pin (2× 8pin)	1× 12pin (2× 8pin)	1× 12pin (3× 8pin)
Maximální příkon karty	280 W	350 W	350 W	450 W
Zaváděcí cena	2 499 USD	1 199 USD	1 499 USD	1 999 USD
zaváděcí cena s DPH (orientační 23,40 Kč/USD)	74 700 Kč	35 800 Kč	44 800 Kč	59 700 Kč

Detaily k BIOSu a dalším limitům Founders Edition prozradí GPU-Z:

Klíčovou novinkou je technologie DLSS 3. Zopakuji to, co jsme si psali po představení:

DLSS 3

U DLSS 3 přidává kromě možnosti vytvořit nový snímek kombinací nekompletního aktuálního snímku a starších snímků s vyššími detaily ještě možnost dopočítat další snímek mezi ně.

K tomu Nvidia přidává do celého procesu technologii Optical Multi Frame Generation kombinovanou s technologií Nvidia Reflex pro dosažení nízkých latencí. Obchází tím standardní renderovací frontu a zpoždění, které dané tím, že je před poslední vyrenderovaný snímek zapotřebí vložit ten dopočítaný, do jisté míry kompenzuje. Jak moc, to se liší titul od titulu v závislosti na tom, do jaké míry Reflex v dané hře pomáhá. Latence ale bude pochopitelně větší než při aktivním Reflexu bez použití DLSS 3.

Zmiňovali jsme, že u DLSS dostává algoritmus mapu pohybových vektorů. Ta ale není dokonalá, zachycuje sice, které objekty se v obraze pohybují, ale nejsou v ní věci, které se na objekty nanášejí až během renderingu jako mapa (textura) – například to mohou být dopočítané odrazy nebo stíny.

Dochází k tomu například u stínů motorky jedoucí na silnici:

Textura silnice se sice pohybuje, ale motorka a s ní i stín se oproti kameře nehýbe, je vržený na pohybující se silnici. Neuronová síť dostane od hry informaci, že se silnice na obrazovce pohybuje, a na základě toho má tendenci posouvat spolu s texturou silnice i texturu stínu.

Optical flow má právě tyto problematické oblasti odhalit a korigovat. V (téměř) reálném čase generuje další mapu s vektory pohybu prvků obrazu na základě již vyrenderovaných snímků. Díky tomu zjistí, u kterých prvků se pohyb liší od první mapy s pohybovými vektory a může je předat dál neuronové síti. Výsledkem je kombinace mapy pohybových vektorů ze hry a mapy pohybových vektorů z vyrenderovaných snímků, na základě níž může DLSS obraz rekonstruovat přesněji. Může pak omezit artefakty, které vznikají tam, kde se rozchází pohyb těles a pohyb jiných prvků v obraze.