GeForce GTX280 - nový král 3D přichází | Kapitola 2
Seznam kapitol
Nová generace grafických karet NVIDIA je zde. Měsíce už se spekuluje o jejich výkonu a možnostech. Zapomeňte dnes na všechny domněnky, fámy a "zaručené" zprávy. Skutečný test nejvýkonnější grafické karty bude možná pro mnohé překvapením, v žádném případě ale ne zklamáním. Výkon karty je skutečně velmi vysoký. S touto generací karet nepřichází pouze herní výkon, ale mnohem širší možnosti využití...aktualizováno o architekturu čipu!
Než se podíváme podrobněji na architekturu G200, pojďme si říci, co nové grafiky vlastně nabízejí. Nové grafické jádro G200 přichází na trh ve dvojím provedení. Absolutní high-end představuje GTX 280, střední vyšší třídu GTX 260. Architektura a základ obou čipů je totožný, v GTX 260 jsou ale některé jednotky vypnuté (nebo z výroby vadné) a výkon je tedy uměle snížen.
Výkonnější jádro GTX 280 je určené pouze do nejvýkonnějších sestav, pro opravdové nadšence. Levnější varianta GTX 260 míří do výkonných herních počítačů, kde je hlavní poměr ceny k výkonu. Rozdíly mezi kartami nejsou nikterak zásadní, prohlédněte si je na obrázcích. Specifikaci obou konkrétních modelů se budeme věnovat až v dalších kapitolách.
Více než jen hry - CUDA
Unifikovaná architektura druhé generace, umožňuje u grafických čipů využít jejich výkon, kromě her i v náročných výpočtech. O možnosti nasazení grafických karet GeForce v těchto aplikacích bude samostatná kapitola, zde proto jen velmi krátce.
Každý jediný "Stream procesor" z 240-ti v jádru GTX 280 je možné považovat za výkonný procesor, schopný vykonat určité instrukce ve velmi krátkém čase. Proti klasickým procesorům (CPU) je méně komplexní, jednodušší a jeho možnosti jsou omezené - v instrukcích, které ale zvládá je několikanásobně rychlejší, než běžné CPU. Stejný princip využívaly (a využívají) i RISC-procesorové platformy.
Aby bylo možné využít výpočetní sílu "Stream procesorů" v grafickém jádru (G80, G92, G200), je nutné tyto procesory naprogramovat. K tomu NVIDIA upravila programovací jazyk na bázi "C+", který je uzpůsoben k programování jednoduchých "SP" jednotek v GPU. Tento jazyk se nazývá CUDA, a klade největší důraz na paralelizaci úloh. Pomocí něj je možné efektivně využít výpočetní možnosti GPU beze zbytku. Teoretický výkon 240-ti procesorů v jádru G200 se zdá být obrovskou výpočetní silou, jak je to ale v praxi? To si povíme až v samostatné kapitole, například možnost extrémně rychlého enkódování HD filmů je velmi zajímavá.
PhysX - integrovaná akcelerace fyziky
Pokud jste hráči, jistě znáte fyzikální akcelerátor Ageia PhysX. Naše recenze této PPU karty je zde. Na trhu je několik desítek herních titulů, které tento standard fyziky využívají. Pokud nemáte fyzikální akcelerátor v PCI slotu, musí počítat veškeré kolize a efekty procesor počítače - za pomoci ovladačů, které se u takových her musí nainstalovat do systému.
Již za několik dnů/týdnů ale NVIDIA implementuje do svých ovladačů sadu instrukcí, naprogramovaných v CUDA, které umožní grafickým kartám série GTX 200 počítat reálnou fyziku. Bude to v podstatě stejné, jako byste měli v PCI slotu osazený skutečný akcelerátor od Ageia. Možnosti využití jsou široké, a my se jim budeme také věnovat trochu podrobněji v dalších kapitolách.
SLI
Samotná jediná karta GeForce GTX 280 nabízí velmi vysoký výkon, který podle tohoto obrázku stačí i na hraní Crysis v rozlišení 1920x1200. Stále je zde možnost zapojení těchto karet do SLI a tím razantně navýšit výkon ve většině moderních her (škálování výkonu bude mnohem vyšší, než například v Quad-SLI). Pro naprosté "šílence", je zde i možnost osadit trojici karet do Tri-SLI - využitelnost je potom ale snad jen na dvou 30" LCD současně.
Nové profily spotřeby
Všichni, kdo měli nebo mají kartu GeForce s jádrem G80 vědí, že spotřeba v 2D (idle) a 3D (load) se nijak výrazně neliší, karty mají i v klidu velmi vysokou spotřebu. Proti konkurenčním Radeonům, je to doslova "nebe a dudy". Tato vysoká energetická náročnost karet GeForce ale uvedením řady GTX 200 končí. Přímo v ovladačích jsou implementovány čtyři profily spotřeby.
Logika grafické karty neustále sleduje zatížení všech obvodů, a v případě nevytížení je vypne. Každý z následujících profilů představuje přesný počet zapnutých bloků jádra, napětí a frekvence čipu. Jaké jsou ale ve všech režimech frekvence částí karty, a kolik bloků jádra GPU je aktivováno není jednoduché zjistit, mění se dynamicky dle potřeby. Nicméně profily jsou tyto:
- Idle/2D - 25W - V tomto nejúspornějším režimu, se 90 procent celého GPU zcela vypne. Karta také významně sníží takty jádra, pamětí a "Stream" procesorů. V tomto stavu stále funguje rozhraní Vista Aero, při extrémně nízké spotřebě.
- Blu-Ray DVD playback - 35W - Pro přehrávání HD filmů je potřeba zapnout další skupinu SP jednotek, a zvýšit proti klidovému stavu nepatrně takty. V tomto režimu je spotřeba stále velmi nízká.
- Full 3D Performance - 236W - Při maximálním možném zatížení (lze dosáhnout pouze v laboratorních podmínkách), se všechny části jádra GPU aktivují, a frekvence pamětí a čipu jsou na svých maximech. Spotřeba v testu 3DMark06 se vyšplhá na 150W, ve hře Crysis ještě o několik desítek Wattů stoupne (více až v kapitole spotřeby).
- Hybrid Power - 0W - Pokud využijete možnosti zapojit nové grafiky na desku s plnou podporou této technologie, bude spotřeba v klidu zcela nulová. Grafika v PEG portu se zcela vypne a ventilátor se na ní zcela zastaví.
Shrnutí všech důležitých vlastností
Na závěr této kapitoly se ještě podívejme, co tedy všechno nové grafické karty nabízí v přehledných bodech:
- Unifikovaná architektura druhé generace - Minimálně o 50 procent vyšší výkon, než jádro G80.
- Integrovaná PhysX - Plná hardwarová fyzika počítaná přímo GPU v reálném čase.
- Multi-GPU SLI a Tri-SLI - Pro opravdové nadšence se nabízí možnost osadit GTX 200 do těchto režimů.
- Podpora DirectX 10 - Podpora tohoto API spolu se Shader Model 4.0 nabízí jedinečný výkon pro DX10 hry.
- DirectX 10.1 není podporován - Kvůli implementaci tohoto rozšíření se NVIDIA zeptala předních herních vývojářů, zda to má vůbec cenu. Většina z nich odpověděla, že změny ve vylepšení DX10.1 jsou tak malé, že není důvod je podporovat i hardwarově. Podpora nového API přijde až s DX11.
- Jazyk CUDA - Možnost využití výkonu GPU ve výpočtech, ale i praktických programech je možná důležitější vlastností, než vysoký herní výkon.
- PCI Express 2.0 - Díky poslednímu standardu je možné využít vysokou propustnost rozhraní, a tím umožnit maximální požitek a výkon v moderních hrách.
- Giga Thread Technologie - Díky velkému množství výpočetních procesorů je možné zároveň (paralelně) provádět opravdu mnoho operací.
- Vylepšení obrazu - Lumenex engine umožní velmi přesné zobrazení objektů. Vyhlazování až 16x slibuje vysokou kvalitu výstupního obrazu bez zjevných zubatých hran. 128-bitové HDR osvětlení slibuje dvakrát kvalitnější světelné efekty.
- Dual Link a Display Port - Přes obě rozhraní je možné zobrazit digitálně rozlišení až 2560x1600. Přes moderní Display Port dokonce v 10-bitové přesnosti barev.
- Pure Video HD - Dva HD dekodéry dokáží zobrazit dva HD streamy zároveň. Akcelerace všech současných formátů je naprosto samozřejmá. Díky technologiím Dynamic Contrast a Color Stretch bude sledování HD filmů skutečným zážitkem.
- Vylepšené režimy spotřeby - Velmi nízká spotřeba v klidu a při přehrávání filmů. Maximální spotřeba v náročných hrách nepřesáhne 220W. Ve spojení s Hybrid Power základní deskou, je spotřeba grafické karty v klidu nulová.