- La GPU maneja la operación de prellenado convirtiendo las indicaciones en un caché de valores-clave.
- Las RDU SambaNova generan tokens con alto rendimiento y baja latencia
- Los procesadores Intel Xeon 6 manejan cargas de trabajo distribuidas y ejecutan código compilado
Intel y SambaNova Systems han presentado un modelo de hardware conjunto que consta de GPU, RDU SambaNova y procesadores Intel Xeon 6 para cargas de trabajo de inferencia a gran escala.
El sistema asigna tareas de ejecución y orquestación en todo el entorno controlado por agentes a GPU para operaciones de precarga, RDU para decodificación y CPU Xeon.
“La IA agente está entrando en producción, y el patrón ganador que estamos viendo son las GPU para iniciar el trabajo, Intel Xeon 6 para ejecutarlo y las RDU SambaNova para terminarlo más rápido”, dijo Rodrigo Liang, director ejecutivo y cofundador de SambaNova Systems.
El artículo continúa a continuación.
La CPU es la capa de ejecución y control.
Se espera que este diseño esté disponible para empresas, proveedores de nube e implementaciones soberanas en la segunda mitad de 2026.
La arquitectura coloca a los procesadores Intel Xeon 6 en el centro del control del sistema, donde gestionan la distribución de la carga de trabajo, ejecutan código y coordinan las interacciones de las herramientas.
Esto incluye gestionar la compilación, la validación de resultados y mantener la comunicación entre procesos concurrentes.
“Cuando miles de agentes de codificación concurrentes realizan llamadas a herramientas, solicitudes de recuperación, compilaciones de código y mensajes cifrados entre agentes, la CPU no es un componente en segundo plano, es la capa ejecutiva y de acción del sistema”, dijo Harry Alt, CRO de SambaNova.
La declaración define la CPU como la capa principal responsable del comportamiento del sistema en lugar de un componente de soporte.
Según SambaNova, el Xeon 6 proporciona tiempos de compilación LLVM un 50% más rápidos que las CPU de servidor basadas en Arm.
Proporciona un rendimiento de base de datos vectorial hasta un 70 % más rápido que otros sistemas basados en x86.
Estas estadísticas se relacionan con la velocidad de ejecución entre los flujos de trabajo de codificación y recuperación y, en esta configuración, las GPU procesan la etapa de precarga convirtiendo las indicaciones en un caché de valores-clave.
Las RDU SambaNova actúan como capa de decodificación, generando tokens con alto rendimiento y baja latencia.
El procesador Xeon 6 actúa como CPU host y motor de ejecución, manejando operaciones a nivel del sistema y ejecutando cargas de trabajo compiladas.
“Los supuestos de fabricación se están moviendo hacia un hardware heterogéneo: ningún tipo de chip es óptimo en cada etapa de un flujo de trabajo agente”, afirmó Banghua Zhu, cofundador y director de tecnología de RadixArc.
Añadió que la combinación de RDU con CPU Xeon permite que los sistemas mantengan la compatibilidad con los entornos de software existentes.
El sistema está diseñado para funcionar dentro de centros de datos existentes refrigerados por aire sin necesidad de una nueva construcción.
Según las empresas, esto permite ampliar las cargas de trabajo proyectadas sin ejercer presión adicional sobre los recursos hídricos y energéticos.
Mientras Nvidia y Groq continúan enfocándose en mejorar el rendimiento y la latencia, este anuncio agrega una capa de competencia.
Ofrece un enfoque alternativo que distribuye la carga de trabajo entre múltiples capas de hardware en lugar de depender de un único modelo de procesamiento.
Siga TechRadar en Google News Y Agréganos como fuente preferida Recibe noticias, reseñas y opiniones de nuestros expertos en tu feed. ¡No olvides hacer clic en el botón de seguir!
Y por supuesto que puedes Siga TechRadar en TikTok Reciba nuestras actualizaciones periódicas en forma de noticias, reseñas, unboxing y videos. WhatsApp muy