- Anthropic informa que la vista previa de Mythos expuso más de 10,000 vulnerabilidades de gravedad alta y crítica en menos de dos meses, y solo CloudFlare encontró 2,000 errores.
- Las evaluaciones de validación independientes confirmaron que el 90% de los resultados eran reales, aunque los críticos argumentan que este avance puede deberse a cálculos y flujos de trabajo masivos en lugar de una lógica única.
- El problema ha pasado del descubrimiento a la verificación, la divulgación y la aplicación de parches, ya que la IA ahora expone las vulnerabilidades más rápido de lo que las organizaciones pueden solucionarlas.
En menos de dos meses, el antropólogo y sus amigos aparentemente han descubierto más de diez mil vulnerabilidades de seguridad críticas y de alto nivel utilizando la famosa herramienta de inteligencia artificial Mythos Preview.
En una breve actualización sobre el estado del proyecto publicada a fines de la semana pasada, Anthropic dijo que desde el lanzamiento de la herramienta, cada una de las aproximadamente 50 organizaciones que han podido utilizarla han encontrado “cientos” de vulnerabilidades.
“Muchos nos han dicho que su tasa de encontrar errores se ha multiplicado por más de diez”, dijo la compañía. “Por ejemplo, Cloudflare encontró 2.000 errores (de los cuales 400 eran de gravedad alta o crítica) en su sistema de ruta crítica, una tasa de falsos positivos que el equipo de Cloudflare cree que es mejor que la de los probadores humanos”.
Anthropic explicó que compartir detalles sobre vulnerabilidades generalmente se hace con un retraso de 90 días, para dar a los usuarios tiempo suficiente para parchear y no poner a nadie en riesgo de verse comprometido. Por lo tanto, sólo compartió “ejemplos ilustrativos” simples para demostrar, una vez más, cuán poderosa es la herramienta.
Con eso en mente, dice que Mithos encontró una estimación de 6.202 vulnerabilidades de gravedad alta o crítica en estos proyectos (de un total de 23.019, de las cuales estima como de gravedad moderada o baja).
La sospecha persiste
De estos, 1.752 fueron evaluados por investigadores de seguridad independientes y el 90% fueron confirmados como positivos válidos, mientras que el 62,4% fueron confirmados como de gravedad alta o grave.
Pero si bien la respuesta general al avance de Mythos ha sido abrumadoramente positiva, hay rumores de que el revuelo puede ser exagerado. Análisis de revista técnicaPor ejemplo, argumenten que el descubrimiento de vulnerabilidades asistido por IA ya existe en sistemas como el Big Sleep de Google, y que el verdadero desafío sigue siendo la seguridad operativa humana.
Un artículo académico reciente, “Redescubrimiento de errores vinculados a mitos”, descubrió que, en condiciones controladas, los modelos de frontera pública como GPT-5.5 pudieron recuperar algunas de las mismas debilidades atribuidas a Mythos y RedditVarias comunidades se han vuelto más escépticas. La conclusión clave parece ser que Mythos está utilizando cantidades masivas de computación y flujos de trabajo agentes a largo plazo en lugar de poseer capacidades de razonamiento cualitativamente diferentes.
Independientemente, Anthropic ahora dice que el progreso de las vulnerabilidades de software ya no está limitado por la velocidad de descubrimiento, sino por la velocidad de verificación, divulgación y parcheo.

El mejor antivirus para todos los bolsillos
Siga TechRadar en Google News Y Agréguenos como fuente preferida Recibe noticias, reseñas y opiniones de nuestros expertos en tu feed.