Taalas implementoval AI modely přímo do křemíku - výkon je brutální
i Zdroj: Taalas
Novinka Taalas implementoval AI modely přímo do křemíku - výkon je brutální

Taalas implementoval AI modely přímo do křemíku - výkon je brutální

Ondřej Lyko

Ondřej Lyko

19

Startup Taalas do svých čipů doslova vypálil umělou inteligenci. Výsledek? Brutální nárůst výkonu a zlomková cena i spotřeba.

Odměníme každého! Vyplňte komunitní průzkum a získejte luxusní ceny

Odměníme každého! Vyplňte komunitní průzkum a získejte luxusní ceny

Kdo jste, na čem a co hrajete, jaký obsah konzumujete a jaký vztah máte k AI? Věnujte nám pár minut a jako dárek za vyplnění získáte slevu na nákup a šanci získat také další luxusní ceny.

Poslechni si audioverzi
00:00:00
00:00:00
Reklama

Startup Taalas trhá rekord. Rychlost odezvy je dnes u velkých jazykových modelů (LLM) alfou a omegou. Zatímco giganti spoléhají na hrubou sílu univerzálních grafických karet a integraci obřích pamětí, mladý startup Taalas na to jde úplně z jiného konce. Rozhodl se totiž vzít konkrétní AI modely a zavést je rovnou na hardwarové úrovni přímo do křemíku. A první výsledky doslova boří dosavadní měřítka.

Místo aby výpočetní jednotka složitě tahala data sem a tam, Taalas mapuje specifické neurální sítě rovnou do návrhu čipu a spojuje úložiště s výpočty v jediném masivním celku o hustotě běžné DRAM. Tím padá bariéra paměťové propustnosti.

Jejich prvotina, čip HC1, je přímo navržený na míru modelu Llama 3.1 8B od Mety. Výsledek této optimalizace je šokující – oproti high-endové infrastruktuře zvládá generovat až 10x více tokenů za sekundu (TPS) při 20x nižších výrobních nákladech. A to vše bez potřeby extrémního chlazení nebo drahých HBM pamětí. Čip HC1 přitom využívá už starší, a tedy cenově dostupnější 6nm procesní uzel od TSMC s plochou 815 mm², což je velikost srovnatelná s moderními čipy od Nvidie.

Taalas implementoval AI modely přímo do křemíku - výkon je brutální
i Zdroj: Taalas

Zatímco 8miliardová Llama se na čip bez problému vejde, dnešní nejmodernější LLM modely atakují hranici bilionu parametrů. Taalas ale nezahálí a už otestoval i clusterové řešení. Propojením 30 čipů dokázali "vpájet" masivní model DeepSeek R1, se kterým dosáhli neuvěřitelné propustnosti 12 000 tokenů za sekundu na uživatele.

Taalas implementoval AI modely přímo do křemíku - výkon je brutální
i Zdroj: Taalas

Jedinou slabinou tohoto odvážného řešení je absolutní ztráta flexibility. Jakmile je čip jednou vyroben, model v něm je dán napevno a nelze u něj měnit parametry. Pokud ale Taalas dokáže na trh chrlit levné čipy s touto rychlostí a brutálním výkonem na míru, může to být pro specifické enterprise využití naprostý game changer.


Reklama
Reklama

Komentáře

Nejsi přihlášený(á)

Pro psaní a hodnocení komentářů se prosím přihlas ke svému účtu nebo si jej vytvoř.

Rychlé přihlášení přes:

Reklama
Reklama
Reklama