Google zpřístupnil své vlastní akcelerátory Trillium AI pro veřejné použití. Oficiálně byly spuštěny 11. prosince 2024 a jsou navrženy pro pracovní zátěže umělé inteligence (AI).
Trillium je šestá generace Tensor Processing Unit (TPU) od Googlu, představený v květnu 2024, Trillium byl popsán jako „nejpokročilejší TPU“ od Googlu, schopný dosáhnout 4,7násobného zvýšení špičkového výpočetního výkonu na čip ve srovnání s TPU v5e.
Podle Googlu toho Trillium dosahuje rozšířením velikosti maticových multiplikativních jednotek (MXU) čipu, zvýšením taktovací frekvence a vybavením třetí generací SparseCore – specializovaného akcelerátoru datových toků, který zpracovává velké vnořené struktury často používané v systémech hodnocení a doporučování.
Kromě toho TPU nabízí 67% zvýšení energetické efektivity oproti předchozí generaci. TPU byly použity k trénování modelu Gemini 2.0 AI a jsou klíčovou součástí AI Hypercomputeru Google Cloud. Kromě zpřístupnění Trillium Google také vylepšuje otevřenou softwarovou vrstvu AI Hypercomputeru, včetně frameworků jako JAX, PyTorch a TensorFlow. Mezi první zákazníky Trillium patří AI21 Labs.
„Jako dlouhodobí uživatelé TPU od verze v4 jsme neuvěřitelně ohromeni schopnostmi Trillium od Google Cloud. Pokroky v měřítku, rychlosti a nákladové efektivitě jsou významné. Věříme, že Trillium bude zásadní pro urychlení vývoje naší další generace sofistikovaných jazykových modelů, což nám umožní poskytovat našim zákazníkům ještě výkonnější a dostupnější AI řešení,“ uvedl Barak Lenz, technický ředitel AI21 Labs.
Zdroj: datacenterdynamics
Zdroj: CLOUD & BACKUP NETWORK NEWS