NVIDIA opravila konstrukční chybu čipů Blackwell a ty jdou do masové výroby
Zelení hoši měli trochu problém s tím, že návrh čipu Blackwell obsahoval chybu a dodávky velkým zákazníkům tak nemohly být splněny. Někdo nedostane prémie!
Není to obvyklé, ale ředitel NVIDIE Jensen Huang přiznal, že konstrukční chyba v čipu Blackwell byla stoprocentně na straně jeho firmy. Vadu pomohla napravit společnost TSMC, která původně na problém upozornila. Celá situace zřejmě přidělala inkoustům z NVIDIE pár šedých vlasů, protože způsobila pozdržení výroby, přičemž velcí hráči jako Meta, Google nebo Microsoft, jsou po grafikách Blackwell celí diví. Jensen mínil, že Blackwell čipy byly funkční, ale chyba v návrhu způsobovala nízkou výtěžnost. A v plánu bylo, že GPU Blackwelll budou zákazníkům odesílány už ve druhém kvartále tohoto roku.
Problém byl způsoben tím, jak jsou v GPU B100 a B200 propojeny čiplety. Ty používají technologii CoWoS-L od TSMC. Tato technologie dále spoléhá na RDL (Redistribution layer) interposer (v podstatě komunikační interface s křemíkovými můstky). A tady byla závada, jelikož vznikl nesoulad ve vlastnostech tepelné roztažnosti mezi různými součástmi, což způsobilo deformaci a selhání systému (uff). Takže NVIDIA čipy opravila a zvýšila výtěžnost. Obvykle jsou takové opravy dosti zdlouhavé, ale ve spolupráci s TSMC se povedlo chyby opravit velice rychle a Blackwell tak je zpátky na trati. Masová výroba by se už měla rozjíždět a dodávky vypuknou na začátku roku 2025.
A pro zajímavost, Google si objednal 400 000 čipů GB200 za více než 10 miliard dolarů. Také Meta má objednávku za 10 miliard. No, když na to mají, že.