Google představil šestou generaci svého vlastního AI čipu Tensor Processing Unit (TPU), nazvaného Trillium. Oznámený na každoroční vývojářské konferenci I/O v Kalifornii, byl Trillium navržen tak, aby podporoval velké jazykové a doporučovací modely, včetně Google’s Gemini, Imagen a Gemma, s nižší latencí a nižšími náklady.
Společnost popisuje tento nejnovější model jako svůj „nejpokročilejší TPU“. Google uvedl, že tato iterace může dosáhnout 4,7× zvýšení špičkového výpočetního výkonu na čip ve srovnání s TPU v5e. Společnost uvedla, že toho bylo dosaženo rozšířením velikosti maticových vícejednotek (MXU) čipu a zvýšením taktovací frekvence. Je také vybaven třetí generací SparseCore – specializovaným akcelerátorem datového toku, který zpracovává velké vkládání často se vyskytující v systémech hodnocení a doporučování.
Trillium obsahuje dvojnásobnou kapacitu a šířku pásma High Bandwidth Memory (HBM) oproti svému předchůdci a zdvojnásobuje šířku pásma Interchip Interconnect (ICI). Google tvrdí, že je o 67 procent energeticky účinnější než TPU v5e. Procesor může také škálovat až na 256 TPU v jednom podu, který pak může škálovat na stovky podů pomocí technologie multislice, kterou společnost představila minulý rok. Google uvedl, že to umožňuje „desítky tisíc“ čipů propojených prostřednictvím technologie datového centra Google Jupiter.
Google také oznámil, že Trillium TPU budou součástí AI Hypercomputer Google Cloud, který debutoval v prosinci 2023. Cloudová superpočítačová architektura byla navržena pro AI pracovní zátěže a kombinuje výkonově optimalizovaný hardware, otevřený software, strojové učení a flexibilní modely spotřeby.
„Google Cloud TPU jsou špičkou v akceleraci AI, navržené na míru a optimalizované pro podporu velkých modelů umělé inteligence,“ uvedl Amin Vahdat, viceprezident a generální ředitel ML, systémů a Cloud AI ve společnosti Google, v blogovém příspěvku oznamujícím Trillium.
„Trillium TPU budou pohánět další vlnu AI modelů a agentů a těšíme se, že našim zákazníkům pomůžeme s těmito pokročilými schopnostmi,“ dodal.
Zdroj: datacenterdynamics.com
Foto: Google
Zdroj: DATACENTER NETWORK NEWS