kam-smeruje-dalsi-generace-3d-akceleratoru
Hardware Článek Kam směřuje další generace 3D akcelerátorů?

Kam směřuje další generace 3D akcelerátorů? | Kapitola 2

Souček Jiří

Souček Jiří

15. 11. 2004 00:00 45

Seznam kapitol

1. nVidia 2. nVidia SLI - výstřelek, nebo budoucnost 3D grafiky? 3. ATi 4. ATi a multiprocessing

V poslední době se objevuje stále více novinek ohledně bližších i vzdálenějších řešení, která nám nabídnou ATi a nVidia. Některé informace upadají v zapomnění, jiné se vyvracejí a tak určitě nebude na škodu si celou situaci pěkně shrnout. Specialitkou jsou dvě samostatné kapitoly s několika ukázkami grafického multiprocessingu v podání nVidie i ATi.

Reklama

V předchozích týdnech se objevily první testy "novinky", kterou před několika měsíci ohlásila společnost nVidia. Co nám SLI může nabídnout? Vracíme se do časů 3Dfx? Pamětníci dobře vědí, že spojení dvou identických grafických karet za účelem navýšení 3D výkonu není nic nového pod sluncem. Co se od dob Voodoo 2 změnilo a co naopak zůstalo při starém najdete v této části článku.

3Dfx - První krůčky multiprocessingu

Kam směřuje další generace 3D akcelerátorů?
i Zdroj: PCTuning.cz

Když byla v roce 1995 ohlášena Voodoo Graphics, byla považována za herní 3D akcelerátor. Rychlý a kvalitní, ale "jen" herní. Roku 1997 přišla novinka s názvem Voodoo 2, která měla oproti původní Voodoo zdvojnásobenou taktovací frekvencí, přidanou sekundární TexelFX procesor (dneska bychom řekli druhou texturovací jednotku) a přinášela režim SLI. Poté přestalo 3Dfx znamenat jen akceleraci počítačových her. Objevila se mladá společnost nazvaná Quantum 3D, která začala stavět na nové technologii SLI a budovat monstrózní profi-grafické stanice založené na 3Dfx čipsetech.

Kam směřuje další generace 3D akcelerátorů?
i Zdroj: PCTuning.cz

Krom hi-end akcelerátorů pro luxusní herní sestavy to byly profi multi-čipsetové systémy v čele s top produktem Mercury, který nabízel 8 spolupracujících Voodoo 2 čipsetů (24 čipů) vybavených tehdy nepředstavitelnými 96 MB grafické paměti.

Kam směřuje další generace 3D akcelerátorů?
i Zdroj: PCTuning.cz


Mercury system - 8x Voodoo 2 v SLI

Co ale SLI tehdy znamenalo? Byla to v podstatě zkratka vzniklá ze spojení Scan-Live Interleaving (někdy také používaná pro termín Scan-Line Interface) a označovala spolupráci několika grafických čipů. Ta byla realizována tím způsobem, že liché řádky obrazu počítal jeden čipset a sudé řádky pak druhý. Prakticky to znamenalo navýšení teoretického fillrate na dvojnásobek (v případě použití dvou čipsetů).

A co to přineslo běžnému uživateli? Možnost propojení dvou Voodoo 2 pomocí speciálního plochého SLI-kabelu a dvě velké výhody: zdvojnásobení teoretického fillrate (výkon) a zdvojnásobená kapacita frame-bufferu (paměť pro textury zůstávala stejná; obě karty v ní totiž měly uloženy tytéž informace). Zmíněný větší frame-buffer (ze 4 na 8 MB) umožňoval použití vyššího 3D rozlišení, z původních 800*600 až na 1024*768.

Kam směřuje další generace 3D akcelerátorů?
i Zdroj: PCTuning.cz


Voodoo 2 SLI - luxus roku 1998

Konektory včetně kabelu pak byly označovány jako Scan-Line Interface, zatímco celá technologie nesla název Scan-Line Interleaving. Na běžné trhy se SLI dostalo pouze v podobě Voodoo 2 PCI, zatímco výše zmíněná společnost - Quantum 3D - nabízela i SLI s Voodoo 1. Nemá smysl tajit, že krom Rush čipsetu a Banshee podporovaly multiprocesing všechny 3D čipy, které 3Dfx vydalo.

Výkon a vysoké rozlišení byly kompenzovány cenou. Přestože nebyl duel Voodoo 2 výkonnostně ještě velmi dlouhou dobu překonán, byla pro mnohé uživatele cena blížící se 20000 Kč nepřekonatelnou bariérou. Ti, co si tehdejší "luxus" mohli dovolit, byli odměněni plynulým obrazem o rozlišení, které ani konkurenční řešení nepodporovala. Případně při jeho použití byla schopna předvést jen trhanou slide-show.

SLI ale neznamenalo jen samé plusy. Byl sice násoben fillrate a frame buffer, ale triangle-rate (množství zpracovaných polygonů) zůstával na stejných hodnotách. Také analogové propojení s primárním VGA-adaptérem bylo velmi diskutovaným tématem. Pokud výrobce Voodoo 2 šetřil, odrazilo se to i na kvalitě obrazu 2D karty, jejíž analogový signál skrz Voodoo 2 procházel. Naopak ve výběru primárního adaptéru měl uživatel naprostou svobodu a záleželo pouze na jeho peněžence a preferencích.

Další hardware (Banshee a Voodoo 3) byl primárně určen pro sběrnici AGP. Ta je samozřejmě v systému přítomna pouze 1x, takže myšlenka přidání další karty byla eliminována již v zárodku. S následující implementací SLI jsme se setkali až na proslulé (a zpožděné) Voodoo 5. Na výstavě Comdex 99 byla ohlášena v několika verzích, z nichž klasická 5500 podporovala 2 čipy a šestitisícovka 4.

Kam směřuje další generace 3D akcelerátorů?
i Zdroj: PCTuning.cz


Voodoo 5 6000 - čtyřcestné SLI (model)

Došlo i k přepracování propojovacího systému a původní SLI (známé především z Voodoo 2) bylo nahrazeno plně digitálním. Na Voodoo 5 ale SLI neznamenalo jen navýšení fillrate (oproti jednočipovému řešení), ale bylo podstatou efektů T-Bufferu a zvlášť pak legendárního Anti-Aliasingu (HW Rotated Grid SuperSampling). Ten si se svojí kvalitou nezadá s režimy, které nabízejí ATi a nVidia na poslední generaci grafických karet. 

Množství spolupracujících čipů bylo přímo úměrné kvalitě obrazu. Každý čip znamenal přesně 2 AA vzorky. (U cinema-efektů T-Bufferu byla již situace jiná; množství čipů neznamenalo nárůst kvality (vždy byly používány čtyři vzorky), ale přinášelo nárůst výkonu. Při cinema-efektech totiž nebyla vícenásobně překreslována celá scéna (jako při AA), ale pouze ty části, kde byly požadované efekty použity.)

Jednoduchost řetězení VSA-100 (až 64 procesorů v SLI) a nárůst kvality FSAA přímo úměrný počtu čipů vedly k vývoji dalších grafických systémů. Většina jich vycházela z osmicestného SLI, později se objevily i verze používající čtyřcestné, které 3Dfx koncem roku 2000 exkluzivně licencovala pro Q3D.

Stojí za zmínku, že SLI čipu VSA bylo flexibilnější, než na starších akcelerátorech. Krom klasického střídání sude/liché řádky přibyla možnost rozdělovat výpočty po skupinách řádků (např. po dvou, čtyřech až 128 řádcích).

Kam směřuje další generace 3D akcelerátorů?
i Zdroj: PCTuning.cz


AAlchemy 8164 (8-cestné SLI)

3Dfx kvůli nakumulovaným problémům musela koncem roku 2000 ukončit činnost. A přestože se zdálo, že tato ztráta nejvíce poznamenala hráče, stala se zároveň i velkým problémem pro Quantum 3D, která vyráběla na 3Dfx čipsetech svoje hi-endové grafické stanice. Koncem roku 2000 neexistovala společnost, která by nabídla grafický čip s dostatečnou podporou pro multiprocesing propracovaný na takové úrovni, jako bylo 3Dfx SLI. To znamenalo jediné:  Procesory VSA-100 (nezbytné pro chod Q3D) nelze ničím jiným snadno a rychle nahradit.

nVidia, která po 3Dfx nepřevzala jen technologie a patenty, ale i závazky, souhlasila, že bude i nadále VSA-100 pro potřeby Q3D vyrábět... Nenechte se zmást tím, že zacházím takhle daleko od našich domácích a hráčských systémů až někam do profesionální grafické simulátory. Tam teprve vše začalo.

Kam směřuje další generace 3D akcelerátorů?
i Zdroj: PCTuning.cz

Po vypršení smlouvy mezi nVidií a Quantum 3D ohledně dodávek VSA čipů nezbylo, než přejít k nějaké alternativě. A protože nVidia s Q3D už měla navázané dobré kontakty (a mnoho zaměstnanců z 3Dfx přešlo jak k nVidii, tak do Quantum 3D), nebyl zástupce VSA hledán nijak dlouho. Došlo na GPU NV2x, nám známé například z GeForce 3 a GeForce 4 Ti. Oba procesory však byly primárně určené pro hráčské počítače (podpora multiprocesingu nebyla ideální). Také nepodporovaly AntiAliasing, který Quantum 3D svým zákazníkům až doposud nabízela - zmíněný Rotated Grid AA.

Samozřejmě nebyl podporován ani T-Buffer, což byla jedna z podstatných technologií pro realizaci RGAA. A tak Quantum 3D musela tyto funkce nahradit vlastním kompozitorem, který zajišťoval spojení mezi čipy a hlavně se podílel na realizaci AntiAliasingu. To samozřejmě fungovalo, ale určitě nemusím připomínat, že toto řešení bylo komplikovanější, než spojení VSA čipů, které SLI nativně uměly.

Netrvalo dlouho a nVidia vyšla kolegům vstříc formou vylepšené podpory pro multiprocesing. Znovuzrozené SLI (nyní nazvané Scaleable Link Interface) GeForce 6  nezůstalo dlouho pod pokličkou. A jak to bylo dál, už známe všichni.

Kam směřuje další generace 3D akcelerátorů?
i Zdroj: PCTuning.cz

SLI okem kritika

nVidia SLI uvedla na grafické kartě GeForce 6800 Ultra (PEG), ale jako první bylo reálně představeno na mainstreamové GF 6600 GT. Krom těchto dvou ještě můžeme čekat podporu na výkonnějších GF 6800 pro PEG (nyní např. 6800 GT).

Otázkou je, proč si pořizovat 6600 GT SLI, když jedna 6800 GT nabídne minimálně stejný výkon a nemusíme kvůli tomu kupovat novou základní desku... Mnoho čtenářů stále vzpomíná na doby 3Dfx a argumentuje peněženkou: Dnes mám na jednu šest tisíc šestistovku, až mi nebude výkonem stačit, dokoupím si za pár korun druhou - stejně jako s Voodoo 2. Jenže - ono to má jeden háček! 90% Voodoo 2 vycházelo jen ze dvou návrhů PCB, takž dát dohromady dvě stejné karty nebyl až takový problém. V2 byly pouze přídavné akcelerátory, čímž odpadly i možné komplikace s BIOSem.

Co, nebo kdo dnes zaručí, že se za půl roku bude prodávat GF 6600 GT od téže značky, která bude vycházet ze stejného PCB a její BIOS bude totožný? BIOS můžeme flashnout, ale odlišné revize PCB už jsou tvrdší oříšek. Pokud chce mít uživatel jistotu, tak je jediným 100% řešením koupit karty zároveň. A opět se vracíme zpět: Proč kupovat dvě GF 6600 GT, když jedna GF 6800 GT zabere méně místa a je rychlejší?

Celá situace s kompatibilitou však může dopadnout zcela jinak. Minulý týden zveřejnila společnost nVidia první podrobnosti ohledně SLI certifikátu, který by měl zajišťovat vzájemnou kompatibilitu mezi jednotlivými HW komponenty. 

Kam směřuje další generace 3D akcelerátorů?
i Zdroj: PCTuning.cz

V případě certifikací jednotlivých kusů HW se setkáme s logem "NVIDIA SLI Ready"; celé sestavy pak ponesou štítek s logem "NVIDIA SLI". Zájem o SLI certifikát projevilo již kolem 40 společností, které se zabývají výrobou / prodejem grafických karet, základních desek a PC sestav.

Kam směřuje další generace 3D akcelerátorů?
i Zdroj: PCTuning.cz


Referenční SLI propojka pro GeForce 6

Druhým bodem je vlastní systém propojení. Za dob Voodoo 2 se ke každé kartě přidával SLI kablík. Tzn. počet karet = počet kabelů. Pokud se ztratil, nebyl problém ho vyrobit z nepotřebného datového kabelu k FDD. Dnes je propojka starostí výrobce základní desky. Při troše nadsázky to znamená jednu propojku na každé dvě karty. A to není mnoho. SLI propojky také budou dvojího typu: lepší, kde propojení obstará malé PCB a obyčejné kabelové. O možném kvalitativním rozdílu zatím můžeme jen polemizovat, ale už nyní je jisté, že propojky typu "PCB" budou žádanější a bude jich nedostatek (nepůjdou jen tak "zbastlit").

Již jsem nakousl, že provedení nVidie se od provedení 3Dfx poměrně liší. Nejznámějším rozdílem je rozdělení výpočtů mezi oba čipy (čipsety). nVidia SLI rozděluje obraz na dvě horizontální části, přičemž predikční mechanismus zajišťuje polohu dělící linie tak, aby obě části scény byly výpočetně srovnatelně náročné. Např. obloha pokrývající 2/3 scény může být ke zpracování jednodušší, než tráva (polygony, vertex shadery) + vodní hladina (pixel shadery). Pokud by byl obraz rozdělen pouze na poloviny, byla by jedna z karet méně vytížená a "čekala" by na druhou.

Kam směřuje další generace 3D akcelerátorů?
i Zdroj: PCTuning.cz


Ukázka práce balančního softwaru

Mnoho uživatelů se ptá, proč nerozdělit obraz svisle. Jeden z problémů je v tom, že VPU vykresluje obraz po řádcích, nikoli po sloupcích, a proto je horizontální dělení jednodušší. Celkový výkon SLI bude hodně záviset na propracovanosti balančního softwaru; můžeme čekat, že účinnost ještě mírně poroste.

O co se pak zdá jednodušší původní řešení 3Dfx, kde byly liché řádky obrazu přiděleny jednomu čipsetu a sudé počítal čipset druhý. Znamenalo to ideální rozdělení výpočtů mezi obě karty, protože je prakticky nemožné, aby sudé řádky od lichých lišily svoji náročností na zpracování. Přichází otázka, proč nVidia nezvolila tuto jednodušší a osvědčenou cestu. Jedním z důvodů může být marketing (nV nechce, aby si uživatelé mysleli, že bez vlastní invence jen převzala bývalé konkurenční řešení) a druhým důvodem pak použitelnost. V případě, že nezapneme vertikální synchronizaci totiž může dojít k tomu, že sudé řádky jsou oproti lichým zobrazovány nepatrně dříve nebo později a výsledek pak připomíná prokládané video.

Kam směřuje další generace 3D akcelerátorů?
i Zdroj: PCTuning.cz


ilustrační obrázek

Žádná katastrofa to není, protože většina uživatelů vertikální synchronizaci používá. Ale stále existuje skupina lidí, která v-sync nezapíná kvůli navýšení snímkové frekvence. Pro tu by znamenal prokládaný obraz nehratelnost.

nVidia SLI je velice flexibilní a způsob rozdělení výpočtů určuje software. Tzn. že při troše dobré vůle (ze strany výrobce čipu) by bylo možné používat i původní systém se střídáním řádků nebo skupin řádků.

Další výhody... a nevýhody?

Zatím se neobjevila jediná zpráva, která by zmiňovala jiné výhody, než nárůst výkonu. Nemám teď na mysli vyšší rozlišení (tento problém je již dnes pasé), ale mluvím o FSAA. Při použití metody SuperSampling totiž stále GeForce 6 používá nepříliš efektivní Ordered-Grid pozice. V případě dvou nezávislých akcelerátorů by neměl být problém ve využití efektivnějšího Rotated-Grid. To zřejmě budou umět jen profi systémy - uvidíme.

Drobnou nepříjemností je samotné PCI Express rozhraní, jak je řešené na základních deskách. Systémy pro P4 nepodporují dva symetrické PEG sloty, tzn. že sekundární nabízí nižší přenosovou rychlost. "Brzda" se může projevit na procentuálním nárůstu výkonu oproti jedné kartě řádově v jednotkách procent. Lepší řešení je systém s čipsetem nForce4 - sloty jsou symetrické (v případě použití SLI je to PEG 8x pro každý).

SLI a nárůst výkonu

Kam směřuje další generace 3D akcelerátorů?
i Zdroj: PCTuning.cz


kliknutím zvětšíte

Velice zajímavá tabulka (od nVidie) ukazuje výkony karet podporujících SLI, ale zároveň naťukává téma "6900". Z čeho můžeme vyjít... 3DMark 2005 není závislý na výkonu procesoru, takže by měl z SLI ždímat maximum a Doom 3 je na tom v tomto testu velice podobně. Nárůst mezi 60-85% u her a aplikací s moderními enginy není vůbec špatná hodnota. Pro zajímavost jsem na naší testovací sestavě provedl benchmark na 3Dfx kartách, které SLI využívaly: Voodoo 2 a Voodoo 5 5500 ve hře Quake III:

Kam směřuje další generace 3D akcelerátorů?
i Zdroj: PCTuning.cz

Pro zajímavost přidávám i výsledky z www.voodoo.zarovka.com (Doom3 + Voodoo2 patch):

Kam směřuje další generace 3D akcelerátorů?
i Zdroj: PCTuning.cz

Nechtěl bych dělat předčasné závěry, ale vzhledem k tomu, že ani v testech nVidie, ani v testech našich nebyla sestava bržděna výkonem CPU, můžu říct, že původní systém se střídavými výpočty po řádku byl efektivnější. Tohle ale rozhodne jen čas a ladění balančního softwaru.

Předchozí
Další
Reklama
Reklama

Komentáře naleznete na konci poslední kapitoly.

Reklama
Reklama