Nvidia na CESu 2026 odhalila superpočítač Vera Rubin
Nvidia na CES 2026 představila architekturu Vera Rubin. Slibuje pokrok v AI s pětinásobným výkonem v inferenci a desetinásobně nižšími náklady na token oproti generaci Blackwell.
Veletrh CES 2026 v Las Vegas se nese ve znamení všudypřítomné umělé inteligence a Nvidia opět potvrdila svou pozici lídra v tomto odvětví. Generální ředitel Jensen Huang během své keynote oficiálně odhalil novou generaci architektury pro AI datacentra nazvanou Vera Rubin. Celý systém, označovaný jako Vera Rubin NVL72, je výsledkem tzv. úzké integrace šesti klíčových čipů. Srdcem celého řešení je nový procesor Vera, grafický akcelerátor Rubin, přepínač NVLink 6 a další síťové prvky jako ConnectX-9 či BlueField-4. Tato technologická skládačka má za cíl uspokojit nenasytnou poptávku po výpočetním výkonu pro AI.
Samotné GPU Rubin představuje skok kupředu. S využitím datového typu NVFP4 nabízí inferenční výkon 50 PFLOPS, což je pětinásobek oproti předchozí generaci Blackwell, a tréninkový výkon dosahuje 35 PFLOPS. Aby bylo možné tento výkon uživit, každé GPU je vybaveno osmi stohy paměti HBM4 s kapacitou 288 GB a propustností 22 TB/s. Nvidia proto nasadila novou generaci propojení NVLink 6, která zvyšuje obousměrnou propustnost na čip na 3,6 TB/s.
Významnou inovací je také nasazení procesoru Nvidia Vera s 88 zakázkovými jádry Olympus Arm a technologií "spatial multi-threading", která umožňuje zpracovávat až 176 vláken současně. Nvidia však neřeší jen hrubou sílu, ale i úzká hrdla spojená s pamětí u velkých jazykových modelů. Pomocí jednotek BlueField-4 DPU vytváří novou vrstvu úložného prostoru pro kontext (Inference Context Memory Storage Platform). Toto řešení umožňuje efektivní sdílení a opětovné využití dat z mezipaměti napříč celou infrastrukturou, což zásadně zvyšuje odezvu a propustnost systému při práci s dlouhými kontextovými okny.
Pro investory a provozovatele datacenter je však nejdůležitějším parametrem celková efektivita. Nvidia deklaruje, že díky architektuře Rubin bude k tréninku modelů potřeba pouze čtvrtina grafických čipů ve srovnání s generací Blackwell. Ještě zajímavější je ekonomický dopad. Náklady na jeden vygenerovaný token by měly klesnout až desetinásobně. Sériová výroba systémů Vera Rubin NVL72 je naplánována na druhou polovinu roku 2026.