Koprocesory TPU: recept na krvavé nároky umělé inteligence

Koprocesory TPU: recept na krvavé nároky umělé inteligence | Kapitola 3

11. 12. 2022 17:30

Seznam kapitol

1. Hardware na míru 2. Spousta počítání 3. TPU: Na tenzory hrubou silou 4. Ve smartphonech pomáhá 5. Další vlna na cestě

O umělé inteligenci se mluví sice často, ale její algoritmy a složitost pro nás zůstávají skryté. Hardwarová akcelerace AI je přitom stejně důležitá jako hardwarové enkódování videa.

Reklama

Zatímco operace sčítání se dá obvodově implementovat levně a je rychlá, násobení je komplikované a složité. Cílem je co nejvíce minimalizovat počet násobení anebo se mu úplně vyhnout. Existují situace, kdy můžeme násobení matic optimalizovat – například u takzvaných řídkých matic, kde je většina prvků nulová. Pro násobení velkých matic se používají pokročilejší algoritmy, jako je Strassenův algoritmus se složitostí přibližně O(n²,807), nedávno se specializované AI AlphaTensor podařilo najít několik algoritmů pro násobení speciálních matic lepších než lidmi vymyšlené algoritmy.

Tenzorové akcelerátory (TPU, Tensor Processing Unit) slouží právě pro akceleraci podobných výpočtů. První podobný akcelerátor navrhl Google v roce 2015 jako speciální zákaznický obvod pro akceleraci učení neuronových sítí s využitím jejich vlastního software TensorFlow. Akcelerátor slouží pro zvýšení rychlosti výpočtů v nižší přesnosti – ale tady jde hlavně o zvýšení celkové propustnosti výpočtů.

Tenzorová jádra se objevila v grafických kartách Nvidie v roce 2017 v Geforce Titan V založeném na architektuře Volta. Šlo ale o specializované řešení určené pro výpočty, do běžných GPU se dostala o rok později s architekturou Turing (řada RTX 20). Tenzorová jádra byla primárně použita pro DLSS, ale je možné je použít i pro raytracing, obecnou AI a nebo jako akcelerátor maticových výpočtů.

Právě DLSS ukazuje onu praktickou AI, která se dnes široce používá, aniž byste si patrně uvědomili, že jde o AI: Hlavní aplikací je dnes zpracování obrazu, za kterým následuje analýza hlasu – a teprve s velkým odstupem se objevují fajnovosti, jako je Stable Diffusion. DLSS představuje speciální případ narrow AI, jejímž úkolem je „domýšlet chybějící části obrazu“, což je docela šílená věc, když to vezmete kolem a kolem.

Předchozí

Další

Reklama