Línea superior
Anthropic lanzó el martes Claude Fable 5, la primera versión pública del tan esperado y temido modelo Claude Mythos, equipado con vallas para evitar que los usuarios lo utilicen para explotar vulnerabilidades de ciberseguridad o desarrollar armas biológicas.
Anthropic dijo que la nueva versión, llamada Claude Fable 5, tendrá salvaguardas para evitar el uso indebido en áreas como la ciberseguridad.
Imágenes falsas
Hechos clave
La compañía también dijo que lanzará un modelo más potente, Claude Mythos 5, a “un pequeño grupo de ciberdefensores y proveedores de infraestructura” que ya tienen acceso a Claude Mythos Preview.
Anthropic dice que los dos nuevos modelos sobresalen en ingeniería de software, trabajo de conocimiento como análisis financiero y tareas que requieren “visión” y “contexto amplio”.
La compañía de IA dijo que está trabajando con el gobierno de EE. UU. para “continuar ampliando el acceso” al modelo más avanzado, que, según afirma, tiene “las capacidades de ciberseguridad más sólidas de cualquier modelo en el mundo”.
Claude Fable 5 y Mythos 5 tendrán un precio de 10 dólares por millón de tokens de entrada y 25 dólares por millón de tokens de salida, aproximadamente. el doble de precio de los modelos Claude Opus más avanzados de Anthropic ya están disponibles, pero aún a menos de la mitad del precio del Claude Mythos Preview disponible.
Los rumores sobre el esperado lanzamiento comenzaron a circular después de eso. fuente El primer boletín informó que Anthropic se estaba preparando para lanzar la versión pública con “barandillas importantes” el martes, lo que luego también fue informado por La información.
¿Cómo funcionarán las salvaguardias de Claude Fable?
Anthropic dijo que Claude Fable se lanzará con un nuevo sistema para detectar usos indebidos, como intentos de “hacer jailbreak” al modelo para acceder a información potencialmente dañina. Este sistema, que Anthropic llama “clasificador”, funciona volviendo a ejecutar preguntas sobre ciertos temas a Claude Opus después de la detección. Esta clasificación incluirá preguntas sobre ciberseguridad, incluidos los intentos de utilizar a Claude como “agentes de piratería”, así como ciertas preguntas sobre biología y química que podrían conducir al desarrollo de armas biológicas. La tercera clasificación es lo que Anthropic llama “destilación”, o intentar utilizar a Claude para construir un modelo de IA competitivo.
Antecedentes clave
Anthropic ha estado ofreciendo detalles sobre el próximo modelo durante meses, lo anunció en abril pero se negó a revelarlo al público por motivos de seguridad. En cambio, optó por lanzar versiones a un grupo de empresas de tecnología como Apple, Microsoft y Google a través del Proyecto Glasswing para identificar vulnerabilidades de ciberseguridad. Anthropic publicó Mythos más de una semana después de presentarlo en secreto oferta pública inicial. Según se informa, la empresa debería salir a bolsa a finales de este año, y ahora el precio en 965 mil millones de dólares después de la ronda de recaudación de fondos de mayo.