- GLM-5.2 gana la clasificación de diseño HTML a pesar de limitaciones arquitectónicas menores
- La compatibilidad de plantillas genera puntuaciones de preferencia más altas en las evaluaciones de los usuarios
- Open Weight Model AI desafía las reglas de fijación de precios en la competencia del mercado
GLM-5.2 de Z.ai desbancó a Fable 5 de Anthropic de la cima de la clasificación de diseño web HTML de un solo turno de Design Arena, una clasificación que la familia Cloud Model había dominado durante meses.
El modelo chino de peso abierto, construido con 744 mil millones de parámetros y con licencia del MIT, ocupa ahora el primer lugar en la clasificación general, cinco puestos por encima de su predecesor, el GLM-5.1.
Lo que lo hace notable es que el Z.ai logró esto sin capacidades de visión y con un modelo del mismo tamaño que el GLM-5.1, mientras que se estima que su rival más cercano es 6,7 veces más grande.
Una ventaja de precio a la altura del rendimiento.
GLM-5.2 cuesta $1,40/$4,40 por millón de tokens, frente a los $10/$50 por millón de Fable 5, estableciendo lo que Design Arena llama una nueva frontera de Pareto entre elección y precio.
El modelo no puede vencer a Fable 5 en todas partes: ocupa el segundo lugar en desarrollo de juegos, visualización de datos y tablas de clasificación de diseño 3D y el cuarto en elementos de interfaz de usuario, pero en la creación de sitios web, tres comportamientos específicos explican su liderazgo.
GLM-5.2 implementa un conjunto consistente de plantillas base de alto rendimiento que evitan antipatrones, como los infames degradados morados, que plagaron los diseños anteriores generados por IA.
Maneja dependencias externas como chart.js y three.js de manera más confiable que sus rivales, aumentando la tasa de ganancias en 6,0 puntos porcentuales en el 21% de las sesiones que utilizan esas bibliotecas.
Implementa TailwindCSS en el 91% de las sesiones y Font Awesome en el 51%, en comparación con sólo el 57% del uso de TailwindCSS de Opus 4.8.
Genera un 25% más de caracteres y líneas de código que sus competidores, con un tiempo de generación promedio de 304,7 segundos, casi el doble que Fable 5.
Fable 5, por el contrario, produce un 38% menos de líneas de código y un 29% menos de caracteres que sus competidores, lo que refleja un enfoque más general que cambia la calidad de salida promedio por variedad y velocidad.
Intercambio de línea de tiempo de mitos
El lanzamiento del modelo ha provocado un amplio debate público sobre la rapidez con la que China puede cerrar la brecha de capacidad con la IA de la frontera estadounidense.
Recientemente, el director ejecutivo de Tesla, Elon Musk, se unió a un debate público sobre X y sugirió que China alcanzaría capacidades de IA de clase Fable “en el primer trimestre”, es decir, el primer trimestre del próximo año.
Sin embargo, en una respuesta segura pero descarada, el cofundador de Z.ai, Jie Tang, simplemente respondió con cuatro palabras: “No tomará tanto tiempo”.
El intercambio llamó la atención porque encabezó una clasificación con GLM-5.2 que los modelos de Anthropic habían controlado durante mucho tiempo.
El propio análisis de Design Arena reconoce que el enfoque de “plantilla experta” de GLM-5.2 funciona mejor en las tareas de creación de sitios web al admitir resultados consistentes y de alta calidad sobre la diversidad, pero no necesariamente indica una mayor paridad de capacidades.
En entornos agentes, GLM-5.2 genera un 11 % más de archivos y un 17 % más de llamadas de herramientas que la competencia, pero genera un poco menos de código en general.
La frontera del código abierto claramente se está moviendo más rápido de lo que muchos esperaban, y lo que hace meses era lo último en tecnología ahora está siendo igualado por modelos que cualquiera puede construir, ajustar e implementar libremente.
Sin embargo, encabezar una clasificación de diseño no significa automáticamente que un modelo coincida con las capacidades de razonamiento profundo de la mayoría de los sistemas de inteligencia artificial avanzados.
Siga TechRadar en Google News Y Agréganos como fuente preferida Recibe noticias, reseñas y opiniones de nuestros expertos en tu feed.