kam-smeruje-dalsi-generace-3d-akceleratoru
Hardware Článek Kam směřuje další generace 3D akcelerátorů?

Kam směřuje další generace 3D akcelerátorů? | Kapitola 3

Souček Jiří

Souček Jiří

15. 11. 2004 00:00 45

Seznam kapitol

1. nVidia 2. nVidia SLI - výstřelek, nebo budoucnost 3D grafiky? 3. ATi 4. ATi a multiprocessing

V poslední době se objevuje stále více novinek ohledně bližších i vzdálenějších řešení, která nám nabídnou ATi a nVidia. Některé informace upadají v zapomnění, jiné se vyvracejí a tak určitě nebude na škodu si celou situaci pěkně shrnout. Specialitkou jsou dvě samostatné kapitoly s několika ukázkami grafického multiprocessingu v podání nVidie i ATi.

Reklama

Sázka na jistotu - R420 / X800

Kam směřuje další generace 3D akcelerátorů?
i Zdroj: PCTuning.cz

Není žádným tajemstvím, že R420 (Radeon X800) vychází z předchozí úspěšné řady R3x0. Obsahuje i mnohá vylepšení, ale plnou podporu SM 3.0 nenese (128bit datová preciznost, HW Displacement Mapping). ATi při návrhu R420 zvolila jednodušší cestu - vzít jako výchozí bod starší jádro - aby většina týmu mohla pracovat na další generaci (R520).

R420 díky povedenému rozvržení jádra a použití low-k dielektrika umožňuje běžet na nejvyšších taktovacích frekvencích, s jakými jsme se na poli herních akcelerátorů mohli setkat. Tím více-méně nVidii dohání, i když se zdá, že s novějšími ovladači má konkurenční 6800 určitý náskok.

Nastává otázka, jestli je oněch 525 MHz X800XTPE v kombinaci s relativně nízkým tepelným vyzařováním jen věcí low-k dielektrika, nebo zda již ATi zapojila nějaké prvky technologie Intrinsity Fast14. Tu získala začátkem roku právě od společnosti Intrinsity. Samotná technologie spočívá ve využití sofistikované metody nazývané "dynamic logic", umožňující vytvořit design procesoru až 5x rychleji, než bylo se současnými metodami možné. Přičemž tento procesor bude moci běhat na taktovací frekvenci až 4-5x vyšší, než současná výrobní technologie umožňuje. (Vezmeme-li v úvahu 180nm výrobní proces, jehož hranice je někde okolo 250MHz, pak Intrinsity pomocí technologie Fast14 dokázala vytvořit funkční čip na 2200MHz).

Radeon X300 (RV370): první low-end pro PEG

Kam směřuje další generace 3D akcelerátorů?
i Zdroj: PCTuning.cz

Architektura převzatá z RV350 řadí ve srovnání X800XT a GF 6800U tuto kartu do low-end segmentu. Nemá příliš cenu její vlastnosti rozebírat, je to vlastně Radeon 9600 (bez PRO) s nativní PEG podporou. 325 MHz jádro, 200 (400 efektivně) MHz paměti. Dodává se i SE verze (obrázek) s 64bit sběrnicí. Proslavila se tím, že ji někteří výrobci balí k základním deskám s PEG rozhraním a hlavně prvenstvím - její jádro (RV370) je totiž první vyráběné 110nm technologií.

Radeon X600 (RV380), neboli R9600XT pro PCI Express

Kam směřuje další generace 3D akcelerátorů?
i Zdroj: PCTuning.cz

Stejně jako RV370, tak i RV380 (X600) vychází z úspěšného Radeonu 9600. Tentokrát ale z PRO verze (odpovídají i takty: 400 MHz jádro, 300 (600 efektivně) MHz paměti) a rychlejšího XTéčka (500 MHz jádro, 370 (740 efektivně) MHz paměti - ty jsou tedy rychlejší). Ani tyto karty si nezískaly výraznou oblibu (i přes slušný poměr cena/výkon). A stejně jako X300 jsou bundlovány k luxusnějším základním deskám.

RV410 - nový mainstream

Kam směřuje další generace 3D akcelerátorů?
i Zdroj: PCTuning.cz

RV410 už obsahuje jádro postavené na návrhu R420. Nabízena bude (a z části již je) ve třech verzích. X700, X700PRO a X700XT, přičemž všechny jsou frekvenčně pomalejší, než konkurenční GF6600GT, ale zároveň jsou také rychlejší, než GF6600.

Současné problémy

Největším problémem stávajících Radeonů je závislost výkonu na frekvenci. Aby ATi dosáhla výkonu srovnatelného s konkurenčním řešením, potřebuje zhruba o 1/4 vyšší frekvenci jádra. To je nový problém, který se týká až poslední generace. Z historického hlediska byla situace spíš opačná. Jistou přítrž tomuto trendu má učinit jádro R520. Uvidíme. Na druhou stranu se nezdá, že by vysoké frekvence činily ATi potíže. Jisté zaškobrtnutí (ale finančně velmi citelné) se projevilo u RX700XT, ale ostatní karty příliš potíže nemají.

Větší potíží je pro Kanaďany kalifornské SLI. Pokud bude držet výkonnostní rekordy (3D Mark, Doom III, HalfLife2 atp.) nVidia, bude to mít neblahý dopad na velkou část potenciálních zákazníků. To se ale již řeší.

Také můžeme pozorovat určitý trend v ovladačích nVidie, který vede k jistému nárůstu výkonu při FSAA a v některých hrách, čímž odstrkuje ATi na druhé místo.

Výhledy

R480 - první Radeon s...

...dvouslotovým chladičem! Alespoň tuto informaci podává většina zdrojů. Je ale s podivem, proč by ATi měla používat chladič přes dva sloty, když i X800XTPE stačil menší, než jakým disponovala stará 9800XT. R480 bude zřejmě poslední hi-endový procesor vycházející z architektury R420 (respektive ze základů R300). Téměř jistá je i absence podpory 3.0 shaderů, ale připouští se, že nějaké to vylepšení oproti X800 přece jen bude.

Když už jsem nakousl téma ohledně chlazení, přichází na řadu frekvence jádra. O R480 zatím příliš mnoho nevíme. Původní předpoklad byl jádro taktované na 600 MHz - což je ale považováno za typickou hranici 130nm výrobního procesu (a zároveň jde o původní takt, na kterém měla X-osmistovka tikat). Koncem minulého týdne se objevily poměrně rozporuplné informace ohledně taktovacích frekvencí

 R480 PROR480 XTR480 XT PE
Paměťová sběrnice256-bit DDR265-bit DDR256-bit DDR
Kapacita paměti256 MB (<512)256 MB (<512)256 MB (<512)
Takt čipu520 MHz520 MHz540 MHz
Takt pamětí540 MHz (1080 DDR)540 MHz (1080 DDR)590 MHz (1180 DDR)
Paměťová propustnost34.56 GB/s34.56 GB/s37.78 GB/s
Počet Pixel Pipelines12 (z 16ti)1616
Text. jednotek na pipeline1 (?)1 (?)1 (?)
Fillrate6,24 GTxl/s (?)8,32 GTxl/s (?)8,64 GTxl/s (?)
Výrobní technologie110 nm TSMC 110 nm TSMC110 nm TSMC

Pro názornější srovnání jsem připravil tabulku udávající přibližný procentuální nárůst frekvencí oproti stávající generaci X800 (R420)

 Takt. frekvence jádraTakt. frekvence pamětíPrůměrný nárůst
R420 PRO /  R480 PRO+10%+20%+15%
R420 XT / R480 XT+4%+8%+6%
R420 XT PE / R480 XT PE+4%+5%+5%

Frekvenční rozdíly (obzvlášť u jádra) nejsou nikterak výrazné, možná až zanedbatelné. Proč ATi nezůstala u osvědčeného 130nm výrobního procesu (s nímž by těchto frekvencí také dosáhla), je zatím záhadou. Ze zveřejněných údajů však něco odhadnout vyčíst můžeme. Následuje několik možných vysvětlení:

  • ATi chce mít u XT verzí vyšší frekvenční rezervy pro Overdrive, který byl u X800XTPE "komicky" nízký (jen 5MHz)
  • Původním záměrem byly vyšší frekvence (kvůli kterým byl zvolen i 110nm proces), ale výrobní technologie ještě není zcela zvládnutá, takže nebylo možné tak vysokých hodnot dosáhnout
  • ATi si je vědoma možného blízkého nástupu R520 a nechce mu vytvářet konkurenci "z vlastní stáje"
  • Architektura R480 se liší od R420 více, než čekáme a bude schopna na obdobné taktovací frekvenci přinést vyšší výkon

Ať už přijde v úvahu jakákoli z možností, je prakticky jisté, že původně udávaný 15% nárůst výkonu oproti R420, nebude jednoduché (či možné?) dodržet. Také ve srovnání s očekávaným výkonem NV48 nevypadá R480 nijak oslnivě. Nakonec nám ale nezbude nic jiného, než trocha trpělivosti - počkat na čísla z prvních testů.

Název karty taktéž není jistý. Původně se váhalo mezi X880 a X900; dnes je častěji uváděno X850 nebo X900...

R430

Po vydání R480 bychom se měli dočkat i varianty nasměrované do oblasti mainstream / low-end. Půjde o další variaci na stávající R420, jen vyráběnou na 110nm technologii a frekvenčně nepřevyšující hranici 400 MHz. Množství pipeline bude obdobné, jako u řady X800 (8 na SE, 12 na PRO a 16 na XT). V souvislosti s XT modelem se zmiňuje spíše značení XL (Inquirer), ovšem může jít o chybu. Výsledné řešení bude konkurencí pro GeForce 6600 GT, 6800 LE a podobně.

Díky těmto parametrům by mohlo jít o poměrně úspěšné řešení (odemykání pipelines, rezerva pro přetaktování, nižší cena).

ATi HyperMemory... Turbo Cache v červeném

Kam směřuje další generace 3D akcelerátorů?
i Zdroj: PCTuning.cz

S technologií TurboCache má ATi zpoždění . Uvedla systém využívající operační paměti přes PCI Express jako první, ale v prvních specifikacích konečného řešení ji nVidia předběhla. S jistotou můžu říct pouze, že ATi HyperMemory... bude.

ATi měla v poslední době s vývojem HM určité obtíže, ale ty jsou již překonány. V nejbližších týdnech máme očekávat prezentaci funkčního řešení.

R520 - novoroční revoluce?

V dnešních dnech hotový R520 (alias Fudo) bude znamenat revoluci v současném hardwaru ATi. S řadou "X" už nebude mít příliš společného, půjde o zcela nový čip. Původně měl být R520 vydán už jako R400, jenže to by vyšel mnohem později než NV40. Proto ho ATi odložila a na jeho místo "plácla" R420, jak jí známe. Pět set dvacítka nabídne následující:

  • 16 pixel pipelines
  • 2 texturovací jednotky na pipeline
  • minimálně plná podpora DX9.0c (shadery 3.0)
  • takt jádra 700-800 MHz
  • podpora pamětí GDDR4 o taktu 1200 MHz / 2400 MHz efektivně
  • podpora GDDR3 v celém frekvenčním rozsahu
  • paměťová propustnost téměř 80GB/s
  • fillrate až 25,6 GTxl/s
  • očekávaný výkon 6x vyšší než u R9800XT a překonávající GF6800U SLI
  • výrobní technologie 90nm low-k u TSMC
  • 512 MB grafické paměti

nVidia zatím o projektu, který by mohl tomuto řešení konkurovat, nic neuvedla a je možné, že proti němu postaví GF6900Ultra SLI, popř. GF6950Ultra SLI, o které se také objevilo několik zmínek.

Důležitým bodem v architektuře R520 jsou dvě texturovací jednotky na pipelines. Ve většině případů je výhodnější kombinace dvojnásobku pipelines s jednou TMU na každé, ale to by velmi rostla plocha čipu a udržet podobné řešení (s dnešními prostředky) na frekvenci 700-800 MHz představuje velký problém. ATi také nevyvrací možné komplikace s výrobou čipu. Pokud by 90nm technologie nebyla schůdným řešením, bude použita vyzkoušená 130nm metoda. To by znamenalo výrazně nižší frekvenci i výkon.

Určitou nejistotu vnášejí starší zprávy. Ty hovořily o frame-bufferu integrovaném v jádře. Nové zprávy integrovaný frame-buffer nezmiňují. Je možné, že bude pouze ve verzi R500 určené pro XBox2. Např. jeden frame o rozlišení 1600*1200 zabere 7.3 MB a několik desítek MB EDRAM by citelně zvětšilo plochu jádra.

Předchozí
Další
Reklama
Reklama

Komentáře naleznete na konci poslední kapitoly.

Reklama
Reklama