- Google ha presentado la próxima generación de TPU, dividida en dos series, 8t y 8i
- El Superpod de 8 toneladas puede ofrecer 121 ExaFlops, frente a los 42,5 del año pasado.
- 8i aumenta 3 veces la SRAM y la HBM
Google Cloud anunció sus Unidades de procesamiento tensorial (TPU) de octava generación diseñadas específicamente para el cambio agente que estamos viendo en la IA en este momento.
Lanzadas en Google Cloud Next 2026, las actualizaciones se centran en ventanas de contexto largas, lógica de varios pasos y capacidad de respuesta a escala, remodelando así su infraestructura de nube para admitir memoria persistente, estimación continua y cargas de trabajo multimodelo.
Este año, vemos dos TPU distintos diseñados para soportar el escalamiento masivo de HBM, con énfasis en el ancho de banda de la memoria similar a Google Cloud Compute.
El artículo continúa a continuación.
Entrenamiento de billones de parámetros en clústeres de millones de chips TPU 8t y 8i
El primero de los dos TPU, 8t, está optimizado para distribuirse en grandes clústeres para entrenar modelos básicos. Con una mejora interanual del rendimiento de casi el 80% por dólar, la compañía dice que entrenará modelos de billones de parámetros de manera más eficiente.
Google Cloud explica que un solo TPU 8t SuperPod puede escalar hasta 9600 chips, proporcionando 2 PB de HBM compartido y 121 ExaFlops de cómputo. A modo de comparación, el año pasado Ironwood era un Superpod y obtuvo hasta 9.216 chips a 42,5 ExaFlops.
Google Cloud también advirtió sobre el “muro de latencia” que enfrentamos en una era de agentes siempre activos, por lo que presentó el 8i, un segundo chip que actúa como un motor de inferencia y post-entrenamiento.
El TPU 8i presenta un aumento de casi 3 veces en SRAM en el chip a 384 MB, así como 288 GB de HBM, tamaños de pod ahora de 256 a 1152 chips, que ofrecen 11,6 ExaFlops de rendimiento (en comparación con 1,2 ExaFlops).
En cuanto a energía y eficiencia térmica, Google Cloud cuenta con un rendimiento por vatio dos veces mejor que su predecesor, Ironwood.
“Innovamos en hardware y software para permitir que nuestros centros de datos entreguen seis veces más potencia informática por unidad de electricidad que hace apenas cinco años”, explicó Amin Vahdat, vicepresidente senior y tecnólogo jefe de IA e infraestructura.
Se espera disponibilidad general para los clientes de Google Cloud en los próximos meses y, naturalmente, el TPU 8t y el TPU 8i estarán a la vanguardia de los últimos modelos Gemini.
La compañía está desempeñando un papel en el desbloqueo del hardware de octava generación mediante la distribución de capacitación más allá de un solo SuperPod a cualquier grupo de capacitación más allá de un millón de chips de TPU, algo que el evento confirmó que actualmente es completamente teórico (pero técnicamente posible), y que aún es posible lograr a escala de TPU.
Siga TechRadar en Google News Y Agréganos como fuente preferida Recibe noticias, reseñas y opiniones de nuestros expertos en tu feed. ¡No olvides hacer clic en el botón de seguir!
Y por supuesto que puedes Siga TechRadar en TikTok Reciba nuestras actualizaciones periódicas en forma de noticias, reseñas, unboxing y videos. WhatsApp muy