Paměti, SSD, AI: Trojí krize na obzoru? A může být ještě hůře | Kapitola 2
Seznam kapitol
IT zažívá krize periodicky. Měli jsme tu dotcomový krach, nedostatek pevných disků, nedostatek GPU a teď pro změnu přichází poněkud nečekaná krize s prudce rostoucí cenou pamětí, po níž má následovat krize s SSD. A sýčkové říkají, že zlé časy s námi mohou vydržet až do roku 2028!
Proces se zlepšuje a například Samsung uvádí, že zatímco u nových procesů mají u DDR pamětí výtěžnost na wafer asi 70 %, tak u HBM se jim daří 50–60 %, což je určitě zlepšení. Ale to jsme jenom na začátku – a AI modely ze své podstaty žádají co nejvíce co nejrychlejších pamětí, aby se eliminoval memory bottleneck, který vzniká tím, že učení vyžaduje opakované čtení a zápisy obrovských objemů pamětí. Memory bottleneck je tak závažný problém, že se vážně experimentuje s novými modely pamětí, jako jsou paměti se schopností in memory computing, tedy pamětí, které jsou přímo samy v sobě provádět kombinovanou operaci maticového součtu a násobení, což šetří toky dat mezi pamětí a výpočetní jednotkou.
Problém s in memory computingem je v tom, že za prvé tato architektura dovoluje akceleraci jenom určitého typu operací, a to za druhé za cenu zvýšené režie na čipu nebo obětování přesnosti. To znamená, že specializované paměti se vyplatí jenom v určitých konkrétních případech, kdy se typicky stále opakuje jedna a ta samá operace – a uvažuje se s nimi pro aplikace, jako je počítačové vidění v robotice nebo v samořiditelných autech, ale pro obecný computing se nehodí.
Obecný computing v AI serverovnách je obvykle navržen tak, aby nebyl jednoúčelový a dával datacentru flexibilitu, takže se tam sahá po univerzálních řešeních. Protože investoři do AI serveroven nejsou hloupí, mají samozřejmě i plán B pro případ, že by se celá ta věc s umělou inteligencí nechytila, takže by s nimi mělo být možné přejít na nějaký jiný cloud computing. Takže i kdybychom měli zcela jiné faby vyrábějící specializované paměti pro robotiku, tak by to problém s nedostatkem pamětí neřešilo.
Cloud computing je navíc lákavý i pro klasické firmy, protože nabízí možnost poskytovat služby – a služby jsou podle počítačových vizionářů vize budoucnosti. Vám bude stačit tenký klient – a budete si služby kupovat jako předplatné, případně se bude platit podle spotřebovaného výkonu, což je ekvivalent pay per view, o kterém vždy snily kabelovky – a tento jejich sen se naštěstí nikdy nezměnil v uživatelskou noční můru. Kdyby ale dostatečně silný poskytovatel softwaru začal místo softwaru nabízet výhradně jenom „službu“, mohli bychom tu mít tuto noční můru zase zpátky jedna dvě.