Novinky v architektuře RDNA 3 a představení Radeonů RX 7900 XTX a RX 7900 XT
i Zdroj: AMD
Grafické karty Článek Novinky v architektuře RDNA 3 a představení Radeonů RX 7900 XTX a RX 7900 XT

Novinky v architektuře RDNA 3 a představení Radeonů RX 7900 XTX a RX 7900 XT

Adam Vágner

Adam Vágner

4. 11. 2022 10:30 53

Seznam kapitol

1. Architektura RDNA3 2. Vylepšený ray tracing a první nástřely výkonu 3. Display a Media enginy 4. Referenční RX 7900 XTX a RX 7900 XT

Včera večer AMD představilo novou generaci Radeonů modelové řady RX 7000 s novou architekturou RDNA 3. K dispozici máme více informací o změnách v architektuře, první nástřely výkonu bez ray tracingu i s ním, detailní parametry, ceny. Co chybí, je srovnání výkonu s konkurencí, ale i s tím se dá aspoň něco málo udělat.

Reklama

13. prosince mají být na trh uvedené první dva modely z nové generace Radeonů s architekturou RDNA 3, které AMD označuje jako „světově nejpokročilejší herní grafiky“. AMD je představilo včera po deváté hodině večerní formou prezentace. 

Výkonnější model RX 7900 XTX má přinést až 70% navýšení výkonu v rozlišení 4K oproti špičkovému modelu předchozí generace RX 6950 XT. 

Novinky v architektuře RDNA 3 a představení Radeonů RX 7900 XTX a RX 7900 XT
i Zdroj: AMD

Zatím asi nejobsáhlejší představení s kompletní prezentací zveřejnil Anandtech, najdete ji i na konci článku v galerii. V článku na Anadtechu jsou i nějaké detaily, které v prezentaci na Youtube nezazněly, takže jej využijeme jako primární zdroj. Informací bylo hodně, času málo, takže asi ještě něco málo průběžně doplním. Další informace najdete přímo na webu AMD, kde se chvíli po zveřejnění prezentace objevily i produktové stránky RX 7900 XTX, RX 7900 XT a také nějaké povídání k architektuře RDNA3.

Novinky v architektuře RDNA 3 a představení Radeonů RX 7900 XTX a RX 7900 XT
i Zdroj: AMD

Navi 31 je první herní grafický čip, který využívá čipletovou konstrukci. Čip je rozdělený na dva typy bloků – Graphics Compute Die (GCD) vyráběného 5nm procesem TSMC a několika Memory Cache Die (MCD) vyráběných 6nm procesem rovněž u TSMC. 

Novinky v architektuře RDNA 3 a představení Radeonů RX 7900 XTX a RX 7900 XT
i Zdroj: AMD

Celý grafický čip včetně čipletů má 58 miliard tranzistorů (u Navi 21 jich bylo 26,8 miliard). Počet tranzistorů u čipletu AMD neuvádí. Samotný grafický čip GCD má plochu 300 mm². 

Novinky v architektuře RDNA 3 a představení Radeonů RX 7900 XTX a RX 7900 XT
i Zdroj: AMD

Obsahuje výpočetní jednotky, pomocné jednotky, display engine a media engine, prakticky vše, co v minulé generaci. Ven se přesunula Infinity Cache a paměťové řadiče. 

Novinky v architektuře RDNA 3 a představení Radeonů RX 7900 XTX a RX 7900 XT
i Zdroj: AMD

Čipy s architekturou RDNA3 mohou být vybavené různým počtem čipletů MCD. Každý z šesti čipletů MCD obsahuje vyrovnávací paměť Infinity Cache druhé generace (L3 cache) a 64b (resp. 2× 32b) paměťový řadič GDDR6 a má plochu 37 mm², počet tranzistorů u čipletu AMD neuvádí. 

Novinky v architektuře RDNA 3 a představení Radeonů RX 7900 XTX a RX 7900 XT
i Zdroj: AMD

Marketing AMD se snaží čiplety prodat tak, jako by u RDNA3 znamenaly stejnou revoluci jako před pár lety u Ryzenů, ale neubráním se pocitu, že v této podobě to není totéž. U Ryzenů se na čiplety přesunula stěžejní část procesoru – výpočetní jádra, zatímco u Radeonů je na čipletech infinity cache, tedy vyrovnávací paměť, a paměťové řadiče. 

Ale čiplety s pamětí vedle GPU nejsou pro Radeony zase tak revoluční věc. AMD už si je vyzkoušelo u Radeonů Fury a Vega, u nichž byly vedle GPU posazené „čiplety“ s pamětmi HBM a HBM2. V principu je rozdíl spíš v tom, že zatímco u R9 Fury a RX Vega sloužily čiplety přímo jako videopaměť karty, u Radeonů RX 7900 mají výrazně menší kapacitu, jsou připojené mnohonásobně rychlejším rozhraním a fungují jako vyrovnávací pamět Infinity Cache. K výraznému posunu ale došlo z hlediska rychlosti komunikace s čiplety a celkové propustnosti. A ještě jsou tu v čipletech navíc ty řadiče, roli videopaměti pak sehrávají klasické GDDR6, se kterými komunikuje čip skrz řadiče v čipletech. 

Momentu „Zen“ u procesorů čiplety u RDNA3 podobají spíš v tom, že přesunutím infinity cache mimo GPU je možné monolit rozsekat do menších částí a s tím zlepšit výtěžnost a zlevnit výrobu. Umožňuje to rovněž vyrábět různé části čipu různými výrobními procesy. Ale ani tady se neubráním dojmu, že ty úspory nebudou v této generaci tak dramatické. Samotné GPU má mít plochu jen 300 mm² a u něj je šestice levnějších čipletů s plochou 37 mm². Oproti RTX 4090, jejíž čip AD102 má plochu 608,5 mm², to obrovský rozdíl je, jenže nové Radeony už všichni stavějí spíše proti GeForce RTX 4080, jejíž čip čip AD103 by měl mít plochu 379 mm² a i když bude na výrobu dražší, bude mít pro změnu jednodušší a levnější pouzdření.

V plné konfiguraci má RX 7900 XTX aktivních všech šest MCD, u RX 7900 XT je aktivních 5 MCD, jeden je nefunkční a slouží jako distanční prvek. Výhody výroby MCD lepším 5nm procesem by byly jen minimální, proto se u nich AMD rozhodlo pro levnější 6nm proces.

RX 7900 XTX se šesti aktivními MCD nabízí 384b paměťovou sběrnici GDDR6 spolu s 96 MB cache L3. 

Novinky v architektuře RDNA 3 a představení Radeonů RX 7900 XTX a RX 7900 XT
i Zdroj: AMD

Při pěti aktivních MCD u RX 7900 XT se dostaneme na 320b sběrnici pro GDDR6 a 80 MB cache L3. I u výkonnějšího modelu je tak Infinity cache o něco menší než u RX 6800 XT a vyšších modelů s Navi 21, které měly kapacitu cache 128 MB. Zmenšení kapacity prý umožnila vylepšení umožňující opětovné použití dat uložených v cache, víc detailů AMD neuvedlo.

Novinky v architektuře RDNA 3 a představení Radeonů RX 7900 XTX a RX 7900 XT
i Zdroj: AMD

Pro dosažení potřebné propustnosti AMD využilo technologii pouzdření Elevated Fanout Bridge (EFB) poprvé použitou u akcelerátorů řady MI200 (CDNA2). U nich propojovala mezi sebou GPU a paměti HBM2e, u RDNA 3 je využitá k propojení MCD s GCD. Celková propustnost mezi MCD a GCD je 5,3 TB/s. 

Novinky v architektuře RDNA 3 a představení Radeonů RX 7900 XTX a RX 7900 XT
i Zdroj: AMD

Řadu prvků RDNA3 dědí z RDNA2 a RDNA, ale došlo i dílčím, ale podstatným změnám. 

Novinky v architektuře RDNA 3 a představení Radeonů RX 7900 XTX a RX 7900 XT
i Zdroj: AMD

Nejvýraznější změnou v čipu je přepracování ALU. AMD zdvojilo počet ALU (stream procesorů) ve výpočetním bloku Compute Unit (CU), ze 64 ALU v jedné Dual Compute Unit na 128. AMD toho nedosáhlo jejich zdvojením, ale tím, že u nich umožnilo dual-issue zpracováním instrukcí. Každá SIMD lane tak může během jednoho cyklu provést až dvě instrukce. Nelze to ale udělat vždy, jenom u instrukcí, které lze provádět paralelně. Pokud ji paralelně provést nelze, funguje ALU jako klasická. 

Novinky v architektuře RDNA 3 a představení Radeonů RX 7900 XTX a RX 7900 XT
i Zdroj: AMD

V praxi to znamená, že se ne vždy podaří ALU vytížit stoprocentně a teoretickou hodnotu FLOPS uváděnou u RDNA3 nelze přímo srovnávat s FLOPS u RDNA2. V ideálním případě je výpočetní výkon 7900 XTX ve FP32 2,6násobný, reálný je ale nižší, proto AMD uvádí 1,7násobný nárůst výkonu.

Kvůli této změně bude asi trochu chaos v udávaných počtech stream procesorů, než se nějak ustálí názvosloví. AMD ve specifikacích uvádí 6144 stream procesorů u RX 6700 XTX a 5376 stream procesorů u RX 7900 XT, v některých materiálech ale najdete i hodnoty dvojnásobné.

Další významnou změnou jsou samostatné jednotky pro akceleraci výpočtů používaných pro AI. O těch AMD zatím moc neprozradilo. Každá CU u RDNA 3 má obsahovat dva akcelerátory AI s podporou nových instrukcí, díky nimž má RX 7900 XTX provádět výpočty s bfloat16 2,7x rychleji než RX 6950 XT. 

Novinky v architektuře RDNA 3 a představení Radeonů RX 7900 XTX a RX 7900 XT
i Zdroj: AMD

AMD je může výhledově použít třeba podobně jako Nvidia pro DLSS, zatím ale nepadlo slovo o tom, že by to vývojáři měli v plánu (a také by to znamenalo u nových iterací FSR omezení na Radeony 7000). Zatím tedy budou mít význam spíše v profesionálním použití.

Další změnou, kterou AMD udělalo, je oddělení taktů shaderů a front-endu. AMD říká, že je to kvůli zajištění vyšší efektivity. Shadery běží na taktu 2,3 GHz (což je uváděný herní takt), front-end čipu pak běží na vyšších 2,5 GHz. Na čipu zabírají shadery podstatně větší plochu než frontend, a tak mírné snížení taktů mělo pozitivní vliv na spotřebu celého čipu. Zároveň to má pomoci k tomu, aby byl výkon obou částí vyváženější a žádná nestrádala.

Novinky v architektuře RDNA 3 a představení Radeonů RX 7900 XTX a RX 7900 XT
i Zdroj: AMD
Předchozí
Další
Reklama
Reklama

Komentáře naleznete na konci poslední kapitoly.

Reklama
Reklama