GLM-5.2 supera a Claude Fable 5 en la clasificación HTML de Design Arena mientras el modelo abierto de China detiene el cambio en la clasificación global de IA

GLM-5.2 gana la clasificación de diseño HTML a pesar de limitaciones arquitectónicas menores
La compatibilidad de plantillas genera puntuaciones de preferencia más altas en las evaluaciones de los usuarios
Open Weight Model AI desafía las reglas de fijación de precios en la competencia del mercado

GLM-5.2 de Z.ai desbancó a Fable 5 de Anthropic de la cima de la clasificación de diseño web HTML de un solo turno de Design Arena, una clasificación que la familia Cloud Model había dominado durante meses.

El modelo chino de peso abierto, construido con 744 mil millones de parámetros y con licencia del MIT, ocupa ahora el primer lugar en la clasificación general, cinco puestos por encima de su predecesor, el GLM-5.1.

Lo que lo hace notable es que el Z.ai logró esto sin capacidades de visión y con un modelo del mismo tamaño que el GLM-5.1, mientras que se estima que su rival más cercano es 6,7 veces más grande.

Último vídeo de

Una ventaja de precio a la altura del rendimiento.

GLM-5.2 cuesta $1,40/$4,40 por millón de tokens, frente a los $10/$50 por millón de Fable 5, estableciendo lo que Design Arena llama una nueva frontera de Pareto entre elección y precio.

El modelo no puede vencer a Fable 5 en todas partes: ocupa el segundo lugar en desarrollo de juegos, visualización de datos y tablas de clasificación de diseño 3D y el cuarto en elementos de interfaz de usuario, pero en la creación de sitios web, tres comportamientos específicos explican su liderazgo.

GLM-5.2 implementa un conjunto consistente de plantillas base de alto rendimiento que evitan antipatrones, como los infames degradados morados, que plagaron los diseños anteriores generados por IA.

Maneja dependencias externas como chart.js y three.js de manera más confiable que sus rivales, aumentando la tasa de ganancias en 6,0 puntos porcentuales en el 21% de las sesiones que utilizan esas bibliotecas.

Implementa TailwindCSS en el 91% de las sesiones y Font Awesome en el 51%, en comparación con sólo el 57% del uso de TailwindCSS de Opus 4.8.

Genera un 25% más de caracteres y líneas de código que sus competidores, con un tiempo de generación promedio de 304,7 segundos, casi el doble que Fable 5.

Fable 5, por el contrario, produce un 38% menos de líneas de código y un 29% menos de caracteres que sus competidores, lo que refleja un enfoque más general que cambia la calidad de salida promedio por variedad y velocidad.

Intercambio de línea de tiempo de mitos

El lanzamiento del modelo ha provocado un amplio debate público sobre la rapidez con la que China puede cerrar la brecha de capacidad con la IA de la frontera estadounidense.

Recientemente, el director ejecutivo de Tesla, Elon Musk, se unió a un debate público sobre X y sugirió que China alcanzaría capacidades de IA de clase Fable “en el primer trimestre”, es decir, el primer trimestre del próximo año.

Sin embargo, en una respuesta segura pero descarada, el cofundador de Z.ai, Jie Tang, simplemente respondió con cuatro palabras: “No tomará tanto tiempo”.

El intercambio llamó la atención porque encabezó una clasificación con GLM-5.2 que los modelos de Anthropic habían controlado durante mucho tiempo.

El propio análisis de Design Arena reconoce que el enfoque de “plantilla experta” de GLM-5.2 funciona mejor en las tareas de creación de sitios web al admitir resultados consistentes y de alta calidad sobre la diversidad, pero no necesariamente indica una mayor paridad de capacidades.

En entornos agentes, GLM-5.2 genera un 11 % más de archivos y un 17 % más de llamadas de herramientas que la competencia, pero genera un poco menos de código en general.

La frontera del código abierto claramente se está moviendo más rápido de lo que muchos esperaban, y lo que hace meses era lo último en tecnología ahora está siendo igualado por modelos que cualquiera puede construir, ajustar e implementar libremente.

Sin embargo, encabezar una clasificación de diseño no significa automáticamente que un modelo coincida con las capacidades de razonamiento profundo de la mayoría de los sistemas de inteligencia artificial avanzados.

Logotipo de Google sobre fondo negro junto al texto

Siga TechRadar en Google News Y Agréganos como fuente preferida Recibe noticias, reseñas y opiniones de nuestros expertos en tu feed.

Enlace de origen

Deja un comentario Cancelar respuesta

Related Stories

Oferta de computadora portátil Dell 16 Plus: gran reducción de precio para trabajar y estudiar

¿Una solución para RAM-aggedon? AMD compra una startup para convertir SSD en ‘RAM virtual’ más barata a precios más bajos, tercer intento de abordar los problemas de memoria después de RAMDisk y StoreMI.

Google ajoute l’utilisation du bureau à Gemini 3.5 Flash pour les agents IA avancés

You may have missed

Oferta de computadora portátil Dell 16 Plus: gran reducción de precio para trabajar y estudiar

Nouvelle théorie sexuelle dégoûtante sur la raison pour laquelle un jeune pasteur a tué une femme dans le parc national de Zion en 2006 : des détails sordides révélés alors qu’il se suicide trois jours après son arrestation

Guerra de Medio Oriente: Israel y Líbano en conversaciones para transferir tierras ocupadas durante el conflicto

Amazon Music paga a los creadores el doble de lo que paga Spotify, sugieren los principales bufetes de abogados