nvidia-rekneme-vam-pravdu-o-ati-crossfire
PCTuning Článek

nVidia: Řekneme vám pravdu o ATi CrossFire

Souček Jiří
Souček Jiří
19. 9. 2005 23:00 99 Sdílej:

Koncem května letošního roku uvedla společnost ATi technologii nazvanou CrossFire, konkurenci pro nVidia SLI, která měla podle slov ATi nabídnout zákazníkům více než jen navýšení výkonu v osmdesáti hrách podporovaných konkurencí. Uvedení hardwaru pro CrossFire je naplánováno na druhou polovinu tohoto měsíce, a tak není až takovým překvapením, že krátce před tímto datem vyjádřila nVidia na CrossFire svůj názor.

Reklama
Reklama

CrossFire podle ATi

Pro začátek by se hodilo krátké shrnutí, abychom si připomněli, co to vlastně CrossFire (dále CF) je. Jedná se o marketingový název označující spojení více VPU za účelem zvýšení kvality obrazu nebo výkonu ve 3D aplikacích, na kterém ATi původně pracovala se společností Evans & Sutherland od roku 2002 (původně byl systém určen výhradně pro profesionální sféru).


ATi Radeon X850XT CrossFire

K vydání CF pro PC-trh se ATi odhodlala, aby odpověděla na konkurenční SLI. Zároveň upozornila, že je zbytečné nabízet SLI na slabších grafických kartách, když jedna hi-endová poskytne vyšší výkon a nižší cenu. Dále pak, že její řešení bude nabízet mnohé výhody, oproti konkurenci - např.:

  • kompatibilitu karet různých výrobců
  • možnost zvýšení kvality obrazu (vhodné např. pro starší hry nebo aplikace limitované výkonem CPU, kde druhé jádro nepřináší výrazný nárůst výkonu)
  • funkčnost ve všech hrách (není třeba specifická podpora pro každý titul)
  • možnost spojení nestejně výkonných karet (v případě potřeby)


ATi Radeon X850XT Master

Současné řešení pro generaci X8x0 zakládá na použití dvou grafických karet. Klasické, která je běžně dostupná a CrossFire Master karty, jejíž vydání se rychle blíží. Tyto karty budou komunikovat přes PEG i přes externí kabelovou propojku. Zda bude tento režim zachován i pro následující generaci (R520) zatím není známo, ale s největší pravděpodobností určité změny budou.

Pojďme se ve stručnosti podívat, jaké režimy multiprocesingu současné CrossFire nabízí:

SFR - Split-Frame Rendering / Scissors (nůžky)

Obraz je horizontálně rozdělen (v případě CF na přesné poloviny) a první vykresluje jeden čip, druhou druhý čip. Nevýhoda tohoto režimu spočívá v nemožnosti škálování geometrie. Další nedostatek se může projevit v okamžiku, kdy je horní polovina obrazu výrazně náročnější na zpracování, než spodní polovina.

SFR byl původním systémem nVidia SLI, ale jeho podoba byla mírně odlišná - obraz nebyl rozdělen fixně na poloviny, ale dělící hranice byla průběžně posouvána balančním softwarem, který podle náročnosti předchozích snímků odhadoval, která z částí obrazu je více náročná. Tento systém se neukázal jako neschůdnější (balanční software je další zátěží pro systém a v případě nižšího framerate - kdy jsou mezi jednotlivými snímky výraznější rozdíly - rozděloval výpočty ne vždy optimálně). Kvůli nižší efektivitě doplnila nVidia i režim AFR, který CF podporuje také:

AFR - Alternate Frame Rendering

AFR je režim, který má ATi patentovaný již od dob Rage Fury MAXX (ta jej z 3D akcelerátorů používala jako první). Tento systém je jednoduchý - jeden grafický čip vykresluje liché snímky, druhý sudé snímky. Výhodou je, že škáluje nejen fillrate, ale i geometrický výkon.

Super-Tiling

Specifický režim ATi CF, který byl používán na profesionálních systémech. Spočívá v rozdělení celého obrazu na šachovnici, přičemž "světlá" políčka šachovnice vykresluje jeden čip, "tmavá" druhý (samotná políčka jsou rozdělena mezi jednotlivé pipelines). Nevýhoda - neškáluje geometrii. Výhody: ideální rozdělení zátěže mezi oba čipy, snadno může podporovat více čipů.

Super AA

Tento režim byl také používán v profi systémech Evans & Sutherland. Díky programovatelné pozici vzorků FSAA architektury R3xx a vyšší umožňuje, aby každá karta vykreslovala tentýž obraz, ale pozice AA vzorků jsou pro každý čip rozloženy jinak a tudíž po prolnutí obou obrazů dojde k efektivnímu zdvojnásobení účinnosti FSAA. Na obrázku si můžete všimnout, že rozložení vzorků je oproti režimu jedné karty upraveno tak, aby bylo co možná nejlepší a vykrývalo plochu celého pixelu.

CrossFire okem nVidie

Tolik k technologické stránce, teď se pojďme podívat na samotné téma dnešního článku. Na serveru http://www.techpowerup.com/ byly zveřejněny slides od společnosti nVidia, která se rozhodla vyjádřit svůj názor na konkurenční řešení. Pojďme se na ně podívat (místy jsem doplnil překlady některých pasáží - pro lepší orientaci jsem je označil modře) :

 Pravda o CrossFire
 Pravda o CrossFire
- strana 1 -


- strana 2 -

Už samotný nadpis (ATi pokračuje s "papírovým" vydáváním hardwaru) působí dojmem, jako by ATi byla jedinou firmou, která každý produkt dodává se zpožděním oproti oficiálnímu vydání. Je všeobecně známo, že např. Radeon X800XT-PE nebyl po vydání o nic hůře dostupný, než GeForce 6800 Ultra (nebo dokonce Ultra-Extreme), nebo jak probíhalo vydání GeForce FX 5800 Ultra, po které nebylo měsíce od vydání ani památky a nakonec skončila stejně jako zmíněná Ultra-Extreme...

Je to již déle než čtvrt roku, co ATi vydala CF ("na papíře"). Bude trvat nejméně čtyři měsíce, než si zákazníci budou moci tento produkt koupit. (podle webových stránek ATi slíbila dostupnost CF-karet na polovinu srpna)

Nejdříve se vyjádřím k první části - ATi uvedla CF jako technologii multiprocesingu, ale hardware nikdy oficiálně uveden nebyl (sami se můžete přesvědčit, neexistuje oficiální recenze CF, která by nabízela testy samotného hardwaru). CF dosud bylo uvedena pouze jako technologie (= vysvětlení jakým způsobem funguje a co bude umožňovat). Oficiální uvedení hardwaru se teprve chystá. Tohle nVidia nerozlišila. Ve skutečnosti je mezi tím poměrně velký rozdíl (je běžnou praxí, že představení technologie předchází představení produktu, který ji využívá).

Ať už to nVidia myslela tak nebo onak, měla by si nejprve "zamést" na svém dvorku, protože uvedení GeForce 6800 Ultra SLI bylo obdobnou fraškou - použitých čipů (NV45) bylo vyrobeno 200ks kvůli uvedení SLI + recenzím a skutečná výroba ve velkém se taktéž posunula o několik měsíců.

Co se druhé části týká, má nVidia pravdu. Pokud ATi uvedla, že karty budou v polovině srpna a skutečnost tomu neodpovídá, je to chyba a v současné době to znamená zpoždění o měsíc.

GeForce 7800GTX SLI nabízí bez diskuze lepší výkon, než X850/X800 v CF
GeForce 7800GTX SLI nabízí bez diskuze lepší výkon, než X850/X800 v CF

- strana 3 -

Tvrzení nVidie se zdá být pravdivé, hned vysvětlím, proč jsem použil termín "zdá". Ať se tento fakt zdá být sebe jasnější, není (alespoň z etického hlediska) správné odsuzovat produkt, který ještě není na trhu, který ještě nebyl uveden a který proto  nemůže obhájit své postavení. Přestože by GF7-SLI měla být jednoznačně výkonnější než X850-CF, je teoreticky možné, aby režim CF některým hrám vyhovoval lépe a procentuální nárůst výkonu byl výraznější. Uvidíme.

Ještě mě upoutal jeden detail, který byl přítomný už ve slidech o Kyru II - nVidia u vlastních karet používá plné názvy, kdežto konkurenčním kartám názvy zestručňuje, případně komolí. V oficiálním dokumentu by se to stávat nemělo, ať je vztah ke konkurenci jakkoli vyostřený.


- strana 4 -

Čtvrtá stránka se věnuje kvalitě při FSAA. ATi uvádí, že CF nabízí "lepší kvalitu obrazu" (dalo by se přeložit i dokonalou kvalitu obrazu). Zde částečně záleží na výkladu.

Tato účinnost se dá vyjádřit číselně (tzv. Edge-Effective Resolution), kdy se uvádí počet horizontálních a vertikálních linií procházející vzorky. V případě režimu SLI-AA 16x je tedy EER 8x16 (=128), Super AA 12x a 14x umožňuje díky programovatelnosti "plné" EER: 12x12 (=144), což znamená celkově vyšší úroveň vyhlazení a stejnoměrnou účinnost jak horizontálních, tak vertikálních linií. Že je rozložení vzorků důležitější než jejich počet, jsem ilustroval ve článku o Quantum 3D - pokud jste ho nečetli, mohu připomenout typický příklad (rozdíl mezi pozicemi ordered-grid a rotated-grid při čtyřech vzorcích):

Ordered Grid FSAA 4x
(2x zvětšeno)

Rotated Grid FSAA 4x
(2x zvětšeno)

Za ne zrovna ideální považuje rozložení vzorků na GF6/7 při použití SLI i společnost Quantum 3D, která na zmíněných čipech staví svým zákazníkům profesionální simulátory - ze zmíněných důvodů používá raději vlastní AA-kompozitor.

Poslední poznámka říká, že pouze GeForce 7 nabízí TRAA. To je pravda, ale pokud netrváte na podpoře přímo od výrobce, můžete zkusit např. utilitku DirectX tweaker, která implementuje velmi podobnou funkci pro vyhlazování transparentních textur pro všechny DX9 kompatibilní grafické karty.

Radeon X850 a X800 CrossFire nepodporují Shader Model 3.0 a HDR
Radeon X850 a X800 CrossFire nepodporují Shader Model 3.0 a HDR

- strana 5 -

SM3.0 samozřejmě nepodporují, ale HDR ATi nabízí už od Radeonu 9700 (R300).


- strana 6 -

  • ATi: CrossFire umožňuje využít obě GPU ve všech aplikacích

  • nVidia: S použitím posledních ovladačů to umožňuje SLI taktéž

A já se ptám: Proč to muselo nVidii - stejně jako SLI AA - trvat tři čtvrtě roku? Je to proto, že nikoho nenapadlo tyto prvky implementovat? Nebo se původní SLI (s podporou oněch 80ti her a bez možnosti zvýšení kvality obrazu) zdálo pánům z nVidie pro obyčejného zákazníka dost dobré? Nebo nVidia celé měsíce řešila problematickou implementaci SLI-AA a shodou okolností se ji povedlo vyřešit zrovna 14 dní po uvedení CF?


- strana 7 -

Na této straně nVidia trochu zmatkuje ohledně herních profilů. Tvrzení, které uvádí, ATi přímo na stránkách nemá:

Mýtus: CF nepoužívá herní profily / dokonce sama ATi přiznává, že herní profily používá pro zapnutí AFR.

No, když se nad tím člověk zamyslí, je vlastně vše v pořádku. ATi tvrdí, že profily používá, pravda to taky je, takže není co řešit... skoro:

Původní rozdíl spočíval v tom, že SLI fungovalo pouze v těch hrách, pro které nVidia vytvořila profil v ovladačích (profil obsahoval hlavně informaci o tom, jaký režim multiprocesingu má být pro danou aplikaci použit). Když uživatel spustil hru, pro níž neexistoval profil, SLI akcelerace neběžela. CF má oproti tomu nastavené presety pro několik základních situací (D3D, OpenGL a D3D s kartou s 12pipelines...) a ty by měly fungovat rovnou, automaticky, na jakékoli aplikaci, bez konkrétní podpory (=bez herních profilů). V rámci zvýšení výkonnostního nárůstu CF přidává ještě navíc k tomu herní profily pro aplikace, které dokážou běžet rychleji v jiném CF režimu, než v přednastaveném (obvykle se přepíná na AFR).

nVidia v současné době AFR používá v naprosté většině situací a SFR nechává pouze pro aplikace, které s AFR nejsou schopny fungovat. Na konci stránky proto AFR chválí, ačkoli v době konkurenční Rage Fury MAXX, která ho používala jako první, bylo terčem kritiky a posměšků téže společnosti. Názory se někdy mění.


- strana 8 -

Tyto informace udávají, jaké režimy ATi v různých situacích používá, ale tabulka je jednak trošku zastaralá a hlavně není definitivní.

"And, no, the OpenGL SuperTiling thing is not correct - there is a specific issue I have noted, but I've tested another OpenGL title and it works fine" Dave Baumann, Beyond 3D

Podle slov D.Baumanna je vidět, že např. kombinace OpenGL + SuperTiling není úplně nemožná, z čehož lze usuzovat, že by s určitou porcí SW podpory mohly být pro OpenGL výhledově dostupné i jiné režimy, než jen Scissors (SFR) a AFR z profilů.

ATi tvrdí: CrossFire je flexibilnějšíPravda: Mnoho zákazníků ATi skončí s nestejnými kartami, což přinutí výkonnější z karet fungovat pomaleji a degradovat ji na úroveň levnější.
ATi tvrdí: CrossFire je flexibilnějšíPravda: Mnoho zákazníků ATi skončí s nestejnými kartami, což přinutí výkonnější z karet fungovat pomaleji a degradovat ji na úroveň levnější.

- strana 9 -

To je pravda. Když dojde k použití karet s nestejnými takty nebo nestejným počtem pipelines, přizpůsobí se výkonnější karta té slabší. Osobně nejsem toho názoru, že majitele X800PRO bude pálit, že nebudou moci využít CF s plným výkonem X800XT-Master, ale jestli je tu někdo takový, kdo si k X800PRO chystá koupit master-kartu a toto mu vadí, ať se prosím ozve v diskusi. Zatím si myslím, že kdo měl zájem o výkon či kvalitu bez ohledu na peníze (a toužil přitom po CrossFire), šel do X800XT nebo X850XT.

Na druhé straně je tu výhoda, která umožňuje použití karet od různých výrobců, s odlišným BIOSem, jiné revize, což ovšem nVidia nezmiňuje (ostatně není divu, sama to oficiálně nenabízí a zatím s touto možností experimentuje).

ATi tvrdí: Kompozitor přináší flexibilituPravda: Není pochyb, že se s CrossFire původně nepočítalo
ATi tvrdí: Kompozitor přináší flexibilituPravda: Není pochyb, že se s CrossFire původně nepočítalo

- strana 10 -

Zde záleží na pojetí celé technologie. Při návrhu PCB se s CF (případně jeho současnou podobou) skutečně nepočítalo. Ovšem grafický čip je pro multiprocesing navržený a nativně jej podporuje (včetně výše jmenovaných režimů spolupráce). Co nepodporuje, je komunikace přes externí rozhraní, se kterou se původně nepočítalo (měla probíhat po sběrnici) a která byla doplněna dodatečně kvůli snížení výkonnostního propadu.

Ale stejně tak bychom mohli hledat mouchy na SLI, které evidentně nepočítalo s SLI-AA.

Partneři ATi budou nuceni vyrábět malé série Master-karet a počítat s náklady na přídavný čip a externí propojku.

V případě nVidia platíte za kompozitor i když vás SLI nezajímá, je totiž součástí každého čipu. Co se propojky týká, u ATi se bude platit za externí propojku, u nVidie za interní propojku. V těchto dvou případech si ATi s nVidií nemají co vyčítat, jeden za 18, druhý bez dvou za 20.

Řešení ATi (kabel) má ještě jeden význam - CF podporuje karty od různých výrobců, kteří mohou mít jinak navržené PCB (=mírně odlišnou pozici konektoru), tudíž je třeba, aby propojka byla do jisté míry flexibilní.


- strana 11 -

Minulý týden se objevila zpráva, že CrossFire bude při rozlišení 1600x1200 limitováno nepříjemně nízkou obnovovací frekvencí 60Hz. Tato domněnka (na které určitá porce pravdy bude), vychází z faktu, že současné karty (ze kterých bude přenášen obraz na master-kartu) používají TMDS reciever (přijímač), jenž při 1600*1200 vyšší obnovovací frekvenci nezvládá. Tento reciever musel být použit kvůli kompatibilitě s TMDS převodníkem použitým na původních (slave) kartách.

Je jasné, že omezení budou, ale stále není jisté, v jakých případech, nebo zda nepůjde jen o záležitost iniciálních ovladačů. Hned vysvětlím proč.

Zde máme fotku CF master (převzato a upraveno z http://www.hardware.fr). Čtvercový čip s nožičkama je onen zmiňovaný TMDS reciever, vpravo od něj je kompozitor, který skládá obrazy z obou karet do finální podoby, nad ním je malý čtvercový RAMDAC, který převádí obraz do analogové podoby pro CRT monitor; pokud je použit LCD panel, převezme iniciativu TMDS transmitter (obdélníček). Nyní nastává otázka, zda by při použití CRT monitoru nemohl RAMDAC použít vyšší obnovovací frekvenci. Odpověď je ano, ale zatím zůstává nezodpovězená otázka, zda je "pevně" připojen ke kompozitoru a pouze převádí dodaný signál (čímž by musel s největší pravděpodobností kopírovat jeho obnovovací frekvenci = 60Hz), nebo je připojen na nějaký buffer (paměť, bylo by třeba cca 24MB), díky němuž by mohl být nezávislý na recieveru a kompozitoru.

Druhým bodem jsou samotné režimy CrossFire. Při SuperTiling a SuperAA není obraz přenášen externě, ale používá se PEG sběrnice* a jako kompozitor funguje samotné grafické jádro (jak jsem zmiňoval, pro tyto dva režimy bylo navrženo). To znamená, že obraz v tomto případě přes reciever nejde a není tudíž omezen 60Hz obnovovací frekvencí (SuperTiling, SuperAA).

*přenos přes sběrnici byl používaný už v první verzi ovladačů pro CF, není sice jisté, zda se tato situace nezměnila, ale zatím tomu nic nenasvědčuje

Jestli této možnosti ATi využije, zbývá nám AFR a SFR... SFR by jedno řešení mělo, otázkou je, jestli je po hardwarové stránce možné:

Na obrázku jsem se pokusil znázornit zmíněnou situaci - rozlišení 1600*1200 při SFR, kdy jedna z karet vykresluje horní polovinu obrazu (žlutá) a druhá spodní polovinu (modrá). Celkové rozlišení obrazu je sice 1600*1200, ale ze slave-karty se na master-kartu teoreticky přenáší jen obraz o polovičním rozlišení (1600*600), který by neměl být obnovovací frekvencí limitován (jde zhruba o stejnou plochu, jako při 1152*864). To by bylo fajn, ale záleží na dvou faktorech - zda ve skutečnosti není přenášen obraz v plném rozlišení (1600*1200) tak, že jedna polovina obraz obsahuje vykreslenou scénu a druhá je vyplněna jednolitou barvou. A zda je část obrazu pocházející z master karty předána rovnou kompozitoru, aniž by měla cokoli společného s recieverem. Na zodpovězení těchto otázek si budeme ještě muset počkat.

Poslední zůstává AFR. Je-li při tomto režimu obraz přenášen externě (přes reciever), je limitace při 1600*1200@60Hz prakticky jistá a nedá se s tím nic dělat.


- strana 12 -

Opět se můžeme vrátit k předchozí kapitole - pokud režimy SuperTiling a SuperAA zůstanou v původní podobě, nebude pro ně vyšší rozlišení znamenat problém. U SFR určitá jiskra naděje je a situace s AFR zatím vypadá nejhůř.

Doplnění: Podle posledních informací se problém s 60Hz limitací 1600*1200 bude týkat pouze generace X8x0. R520 podle nových informací serveru Beyond 3D obsahuje R520 dva duální (dual-link) integrované TMDS převodníky podporující až 2048x1536 @ 85Hz:

"X800 and X850 only integrated a single link TMDS transmitter, hence a display limitation of 1600x1200 @ 60Hz; with all of the next generation graphics chips guaranteed to support two dual link TMDS transmitters if the next generation Crossfire uses the same master/slave with compositor system then just using one of the TMDS transmitters should mean the maximum resolution of the slave image could go up to 2048x1536 @ 85Hz and ATI only need include a dual link DVI on the master card and these higher resolutions could be achieved with Crossfire." 

zdroj: Dave Baumann, ATI Avivo Technology Preview, 20.9.2005

- strana 14 -
- strana 14 -

- strana 13 -

Problém ohledně výkonu USB2.0 southbridge ATi byl aktuální v prosinci minulého roku. Všechny zmíněné linky nakonec vedou k jedné recenzi z The Tech Report:


- strana 15 -

Že původní revize south-bridge obsahovala chybu, díky níž USB2.0 fungovalo pomaleji, je dobře známá informace. ATi si byla tohoto nedostatku vědoma a v dalších revizích měl být odstraněn. Krom toho ATi nabídla alternativu - southbridge ULi.

Na zmíněnou recenzi se doporučuji podívat (zde), krom testů USB nedopadá SB450 vůbec katastroficky, určitě ne tak, jak je vykreslován v této prezentaci zakládající na (opět) tři čtvrtě roku starých informacích (začátek prosince 2004).

- strana 17 -
- strana 17 -

- strana 16 -

U těchto testů není uveden zdroj, zřejmě jde o výsledky interních testů nVidie. Nejde o nezávislé testy, nevím o jediné recenzi, která by poukazovala na něco podobného (samozřejmě se můžete vyjádřit diskuzi), nemohu se k tomu vyjádřit.


- strana 18 -

Zde se nabízí odpověď sama:


kliknutím zvětšíte
- zdroj: http://www.pcpop.com/ -

Žádné řešení není bezchybné a každý produkt má své výhody i nevýhody. Někdo preferuje gigabitový ethernet, někdo dává přednost bohatší multimediální výbavě.

V tabulce nF4 SLI je ještě zmíněna "two full bandwidth x16 PCI-E slots". Tuto vymoženost ovšem podporuje pouze nejnovější verze čipsetu NF4 SLI X16, která byla uvedena začátkem srpna, ale v době psaní tohoto článku není o nic dostupnější, než ATi CrossFire. Stručně řečeno: "naše nedostupné řešení je lepší než konkurenční nedostupné řešení"...

Závěr


- strana 19 -

Na konec se hodí otázka - proč má nVidia potřebu tyto prezentace vydávat? Kdyby CrossFire mělo být takový propadák, jak nVidia naznačuje, znemožnilo by se velice rychle samo i bez její asistence. A vzhledem k tomu, že i negativní reklama je reklamou, nemusí mít slides takový dopad, jaký jejich tvůrci očekávali.

Při vzpomínce na předchozí dokumenty tohoto typu (obzvlášť Kyro II a Radeon X800XT) nemám pocit, že šlo o propadáky - obě řešení byla na svoji dobu poměrně úspěšná a ani jedno nečekala budoucnost, kterou marketingové oddělení nVidie vidělo ve své křišťálové kouli.

 

V současné době je jisté jen jedno: ATi to nebude mít jednoduché. Během následujících týdnů bude uveden HW CrossFire a ani ne deset dnů nato se pravděpodobně setkáme s novou řadou produktů R5x0. ATi nezbyde nic jiného, než aby kvalitou vlastních produktů vyvrátila tuto hanlivou prezentaci CrossFire, stejně jako lživou "recenzi" R520 serveru Hardware analysis. Nyní nezbývá než čekat, zda se to ATi povede.

V článku byly použity obrázky z následujících zdrojů:

http://www.hothardware.com/
http://www.anandtech.com/
http://www.hardware.fr

Reklama
Reklama
Reklama
Reklama

Byl detekován AdBlock

PCTuning je komunitní web, jehož hlavním příjmem je reklama. Zvažte prosím vypnutí AdBlocku, ať můžeme všem čtenářům i nadále přinášet kvalitní herní zpravodajství, články a videa.

Děkujeme!

Váš tým PCTuning