GeForce FX 5900 Ultra od ASUSu - nejvýkonnější grafika?
Seznam kapitol
Zajímá vás, jak si povede nejrychlejší čip firmy nVIDIA v luxusním balení od ASUSu? Půjde stejně dobře přetaktovat jako předchozí V9950 a jak si povede v testech proti ATi Radeonu 9800 Pro? Pomohou kartám s čipy FX 5900 nové Detonatory FX 45.23? To všechno a mnohem více se dočtete v nejrozsáhlejší recenzi grafické karty, která kdy na PCtuningu vyšla. Karty jsme otestovali v 9 hrách a v 10 teoretických testech (!), abyste si mohli udělat dokonalý obrázek o špičce dnešního pelotonu grafikých karet. K testování karet bylo k dispozici nadupané Pentium 4 3.2GHz (800MHz FSB, HT) a deska s dvojkanálovým čipsetem Springdale/i865PE.
Historie čipu NV35
Asi si pamatujete, jak loni firma ATi všem vyrazila dech se svým Radeonem 9700 Pro (založeným na jádru R300 a v té době běžné 0.15um technologii). nVidia na tento trumf tehdy neměla žádnou odpověď, její dlouho ohlašovaný čip NV30 byl ještě v nedohlednu - nemluvě o jeho masové produkci, která se stále oddalovala problémovým přechodem na 0.13um. Firma ATi vedla výkonem (nejvíce při zapnutém anisotropním filtrováním a hlavně při anti-aliasingu) a navíc byla o jednu verzi DirectX dále.
nVIDIA uvedla řadu NV30 v říjnu 2002, avšak první karty se na trh dostaly až v roce 2003. Projekt NV30 čili GeForce FX 5800 byl pro nVidii navíc skutečným debaklem: karty byly vybaveny velice drahými paměťmi DDR II taktovanými sice na 500MHz (1000MHz efektivně), ale zato byly sráženy dolů úzkou 128-bitovou paměťovou sběrnicí (standardem hi-endových karet byla už tehdy šíře 256-bitů). Velice drahá byla také výroba sofistikovaného plošného spoje (PCB) s dvanácti vrstvami. Prodejnímu úspěchu take nepomohlo sice zajímavé, ale hlučné chlazení zvané FlowFX, které se stalo terčem mnoha vtipů a přisoudilo FX 5800-vce legrační přízviska (jako "vysavač" atd.). To vše by ale ještě nebylo tak strašné, kdyby NV30 byla schopna skutečně rozdrtit svého tehdejšího konkurenta - R300. To se nVIDII ani zdaleka nepodařilo, pokud někde její čip vedl, tak nepříliš výrazně - a to vzhledem k rozdílu taktů obou karet bylo velkým zklamáním. nVIDIA tedy zastavila produkci NV30 (hovoří se asi o 100.000 vyrobených čipů).
Naštěstí se už v lednu 2003 objevil následník - NV35, označován jako GeForce FX 5900. Zdá se, že nVIDIA se při jeho návrhu již poučila z chyb NV30 a to vyústilo ke rozšíření paměťové sběrnice na 256-bitů, která využívá normální DDR SDRAM paměti, které sice jsou sice taktované na 425MHz (o 75MHz níže), ale i tak se propustnost téměř zdvojnásobila. Ale to zdaleka nebyl jediný přínos, podívejme se proto na všechny změny podrobněji.
Technologie, 256-bit sběrnice, Intellisample HCT
135 milionů transistorů...
...a (stále jen) 4 vylepšené pixel procesory
S nárůstem počtu transistorů přímo souvisí změna v pixel procesorech (rendering/ pixel pipelines). Mnoho lidí očekávalo konečně jejich zvýšení z dosavadních čtyř (které koneckonců měla už GeForce2) na osm, kterými se honosí největší konkurenti od ATi. Ale zůstalo jen u čtyř (každý z nich přesahuje specifikace pixel shader 2.0), ale stejně jako předtím je každý procesor vybaven dvěma texturovacími jednotkami, dvěma celočíselnými ALU a jedním ALU pro operace v plovoucí desetinné čárce. Sečteno, podtrženo, je umožněno až dvanáct operací s pixely v jediném cyklu. nVIDIA uvádí, že nový čip je při vykonávání kódu pixel shader 2.0 (DirectX 9) se 128-bitovou přesností až dvakrát rychlejší právě díky vylepšeným pixel procesorům.
256-bitová sběrnice
Tou asi nejdůležitější změnou je ale rozšíření paměťové sběrnice ze 128 na 256 bitů. Sběrnice NV30 byla vlastně velice velice podobná předchozí NV25 (GeForce 4 Ti), tedy 4 x 32-bit (crossbar, více o této sběrnici na tomshardware.com v prvním článku o čipu NV20, tedy GeForce3). NV30 byla navíc koncipována pro DDR-II paměti. Sběrnice NV35 používá čtyři 64 bitové sběrnice a má mít schopnost využívat jak DDR, tak DDR-II paměti. Co to ale znamená v praxi - samozřejmě prudké zvýšení paměťové propustnosti, což si snadno můžeme ověřit dle jednoduchého vzorce:
Celková paměťová propustnost = šířka paměťové sběrnice * frekvence pamětí (SDR) * 2 (jestliže jsou použity paměti DDR).
- U FX 5900 Ultra je to: 256-bit sběrnice * 425MHz takt pamětí (SDR) * 2 (DDR) = 217,6 Gbitů/s / 8 = 27,2 Gbytů/s
- U FX 5800 Ultra je propustnost: 128-bit sběrnice * 500Mhz paměti * 2 = 128 Gbitů/s / 8 = 16 Gbytů/s
- A nakonec ATi Radeon 9800 Pro: 256-bit sběrnice * 340MHz paměti * 2 = 174,08 Gbitů/s / 8 = 21,76 Gbytů/s
V dnešních aplikacích při běžných rozlišeních se zdá 256-bitová sběrnice vzhledem k použití algoritmů komprese, rychlého čištění paměti a ořezání zakrytých částí renderované scény jako málo užitečná, její vliv je poznat teprve ve velice vysokých rozlišeních. Ale hlavně je poznat při zapnutí vyhlazování hran pro celou scénu (FSAA), který není ani tak odrazem fill-rate čipu, ale právě paměťové propustnosti. Tudíž očekávejme výrazné zlepšení výkonu právě při použití full scene anti-aliasingu.
IntelliSample HCT
Do trošku tajemného názvu IntelliSample HCT (High Compression Technology) nVIDIA zahrnuje:
- Anisotropní filtrování textur (až 8x čili 128 samostatných vzorků na texturu)
- 2x, Quincunx, 4x, 4xS (super-sampling) a hybridní 6xS, 8x anti-aliasing
- Rychlé vyprázdnění Z a Color bufferu
- Dynamická gamma korekce
- 4:1 Z a barevná komprese
- Lokální paměťový řadič s přepínačem
- Vyrovnávací paměti textur
- Z-Cull (Early Z-Cull, vylepšena od NV30), Early HSR (brzké Hidden Surface Removal - odstranění skrytých povrchů)
Už u FX 5800 byl implementován algoritmus barevné komprese (Color Compression). Tato komprese je používána hlavně při zapnutém FSAA. Například s 4xFSAA jsou čtyři sub-pixely jediného pixelu zprůměrovány pro získání výsledné barvy. Jestliže všechny tyto sub-pixely leží uvnitř polygonu a ne na jeho hranách, je dosaženo ideálního kompresního poměru - tedy 4:1. V reálných scénách se počet pixelů, které mohou být komprimovány samozřejmě liší, hodně také závisí na použitých texturách. U FX 5900 by tento algoritmus měl být vylepšen tak, aby měl zhruba o 50 procent vyšší efektivitu. Maximální kompresní poměr 4:1 zůstal zachován, ale měl by být dosahován častěji.
CineFX 2.0
CineFX 2.0, UltraShadow
Engine CineFX (více o něm v recenzích a preview FX 5800) povýšil do verze 2.0. Zase je to tak trochu krycí název pro tyto technologie:
- UltraShadow
- Zdvojnásobený (teoreticky) výkon pixel shader v plovoucí desetinné čárce
- Pixel Shader 2.0+ (až 1024 instrukcí)
- Vertex Shader 2.0+ (až 65.536 instrukcí)
- Dynamické podmíněné spouštění instrukcí
Hlavním přínosem má být technologie "UltraShadow", která urychluje rendering stencil stínů (stencil buffer je používán k jejich generování) omezením hloubky objektů ve scéně, které mohou vrhat stíny. Stencil stíny jsou používány v moderních scénách a dlouho očekávaný DooM III používá právě hodně operací s nimi. Podívejme se na obrázek, kterým nVIDIA UltraShadow ilustruje:
Jestliže hodnota hloubky pixelu nespadá do hranice (na obrázku mezi zmin a zmax) specifikované v době renderingu stínů, není stencil buffer tohoto pixelu vůbec aktualizován, což ústí v ušetření fill-rate (na obrázku znázorněno jako Fill savings). Tato technologie má však hned několik nevýhod, tou hlavní je že UltraShadow je k dispozici pouze v OpenGL - extenze "NV_depth_bounds_test" a nVIDIA si ji nechá (nechala) patentovat. Technologie nemůže být zapnuta v mnoha typech programových kódů, protože programátor by musel vždy analyzovat scénu a ustanovit rozumné hranice pro shadow rendering. Zní vám toto vše povědomě? Ano N-patches známe také jako ATi Truform, technologie, jež se i přes svůj neoddiskutovatelný přínos dosud nedokázala prosadit.
Srovnávací tabulka čipů
Porovnejme si (snad) přehlednou tabulkou rozdíly mezi NV30 a 35 a jejich největších rivalů od ATi - R350 a dříve R300.
GeForce FX 5900 Ultra (NV35) | GeForce FX 5800 Ultra (NV30) | Radeon 9800 Pro (R350) |
Radeon 9700 Pro (R300) | |
Výrobní proces | 0.13 ľm | 0.13 ľm | 0.15 ľm | 0.15 ľm |
Technologie čipu | 256-bit | 256-bit | 256-bit | 256-bit |
Počet transistorů | 135 milionů | 125 milionů | 107 milionů | 107 milionů |
Paměťová sběrnice | 256-bit DDR/DDR-II | 128-bit DDR-II | 256-bit DDR/DDR-II | 256-bit DDR/DDR-II |
Takt čipu | 450 MHz | 500 MHz | 380 MHz | 325 MHz |
Takt pamětí | 425 MHz (850 DDR) | 500 MHz (1000 DDR-II) |
340 MHz (680 DDR) |
310 MHz (620 DDR) |
Paměťová propustnost | 27.2 GB/s | 16 GB/s | 21.76 GB/s | 19.84 GB/s |
Fill-rate (single-texturing) | 1800 Mpixel/s | 2000 Mpixel/s | 3040 Mpixel/s | 2600 Mpixel/s |
Fill-rate (multi-texturing) | 3600 Mtexel/s | 4000 Mtexel/s | 3040 Mtexel/s | 2600 Mtexel/s |
Vertex Shader | 3 (FP Array) | 3 (FP Array) | 4 | 4 |
Maximální počet transformací Troj./s | 315M | 350M | 380M | 325M |
Počet Pixel Pipelines | 4 (8) | 4 (8) | 8 | 8 |
Počet text. jednotek na pipeline | 2 (1) | 2 (1) | 1 | 1 |
Max. textur v 1 cyklu | 16 | 16 | 16 | 16 |
Vertex Shader verze | 2.0+ | 2.0+ | 2.0 | 2.0 |
Pixel Shader verze | 2.0+ | 2.0+ | 2.0 | 2.0 |
DirectX | 9.0+ | 9.0+ | 9.0 | 9.0 |
FSAA | MultiSampling SuperSampling |
MultiSampling SuperSampling |
MultiSampling | MultiSampling |
Optimalizace propustnosti paměti | vylepšené LMA II Color Compression |
vylepšené LMA II Color Compression |
Hyper Z III+ | Hyper Z III |
Optimalizační enginy | IntelliSample HCT | IntelliSample | SmartShader 2.1 SmoothVision 2.1 |
SmartShader 2.0 SmoothVision 2.0 |
Z komprese | 4:1 | 4:1 | 8:1 Max - 24:1 @ 6x FSAA |
4:1 Max - 24:1 @ 6x FSAA |
Barevná komprese | 4:1 | 4:1 | 8:1 | 6:1 |
Integrované RAMDACy | 2x 400MHz | 2x 400MHz | 2x 400MHz | 2x 400MHz |
Bitů na barevný kanál | 10 | 10 | 10 | 10 |
OpenGL | 1.4 | 1.4 | 1.3 | 1.3 |
Další technologie | TV encoder na čipu UltraShadow Programovatelnost Adaptivní filtrování |
TV encoder na čipu UltraShadow Programovatelnost Adaptivní filtrování |
TV encoder na čipu Adaptivní filtrování N-patches Fullstream F-buffer |
TV encoder na čipu Adaptivní filtrování N-patches Fullstream |
Z tabulky je vidět, že 5900 Ultra je vybavena čipem taktovaným "pouze" na 450MHz a pamětmi na 425MHz, což znamená snížení oproti FX 5800 Ultra o 50 resp. 75MHz. Ale jak víme, šířka paměťové sběrnice se zdvojnásobila na 256 bitů a tak se celková paměťová propustnost zvedla o 70%.
Rozdíl pak stále zůstává ve fill-rate, který se o 10% snížil, ale díky nižšímu taktování je umožněna vyšší výtěžnost čipů a také menší produkce tepla, což samozřejmě dovoluje použít i rozumnější chlazení než u FX 5800 Ultra.