- Los sistemas de IA de agente dual han resuelto de forma autónoma la conjetura de Anderson desde 2014
- Rethlas explora técnicas de resolución de problemas como lo haría un matemático humano
- Archon convierte evidencia potencial en proyectos para verificadores Lean 4
Un equipo de investigación dirigido por la Universidad de Pekín ha desarrollado un sistema de inteligencia artificial de doble agente capaz de resolver problemas matemáticos avanzados y verificar sus propios resultados.
El sistema resuelve una conjetura propuesta por Dan Anderson en 2014, completando el proceso en 80 horas de ejecución.
“Utilizando este marco, resolvimos con éxito un problema abierto en álgebra variacional y formalizamos automáticamente la prueba sin ninguna intervención humana”, escribieron los investigadores en un artículo preimpreso publicado en arXiv.
El artículo continúa a continuación.
Cómo funcionan realmente los marcos de agente dual
La herramienta de inteligencia artificial implementa un sistema lógico llamado Rethlass, que se basa en un motor de búsqueda de teoremas matemáticos llamado Matlas para explorar estrategias de resolución de problemas.
Cuando Rethlass produce una posible prueba, un segundo sistema llamado Archon convierte esa prueba en un proyecto para un demostrador de teoremas interactivo utilizando otro motor de búsqueda llamado LinSearch.
El proponente del teorema, Lean 4, también es un lenguaje de programación con una biblioteca mantenida por la comunidad que contiene cientos de miles de teoremas y definiciones.
Los investigadores observaron que no se requirió ningún juicio matemático por parte del operador humano durante el proceso de resolución de problemas.
Los sistemas de IA pueden realizar tareas matemáticas más rápido que cualquier ser humano, incluida la realización de tareas de forma independiente que normalmente requerirían la colaboración entre expertos en diferentes campos.
Sin embargo, el equipo también descubrió que un matemático podría acelerar el proceso guiando al arconte cuando fuera necesario.
“Este trabajo proporciona un claro ejemplo de cómo la investigación matemática puede automatizarse sustancialmente utilizando la IA”, dijeron los investigadores.
Las pruebas matemáticas exigen un rigor total, pero incluso las pruebas escritas por expertos pueden contener errores sutiles.
De manera similar, la evidencia producida por modelos de lenguaje grandes es propensa a alucinaciones y es mucho menos confiable que los métodos de verificación formales.
El marco del equipo chino cierra la brecha entre el razonamiento en lenguaje natural y la verificación automática formal, permitiendo que los sistemas de IA resuelvan problemas y verifiquen sus propios resultados.
“Nuestro trabajo ilustra un paradigma prometedor para la investigación matemática en el que los sistemas de razonamiento formal e informal funcionan en conjunto para producir resultados verificables”, señalaron los investigadores.
El documento aún no ha sido revisado por expertos, por lo que la verificación independiente aún está pendiente.
La conjetura de Anderson era un problema relativamente oscuro en álgebra variacional, lo que hizo que el logro de la IA fuera notable.
Sin embargo, esta hazaña no es comparable a resolver desafíos del nivel del Premio del Milenio como la Hipótesis de Riemann o el problema P vs. NP.
Queda por ver si este enfoque se adapta a problemas matemáticos más difíciles.
Dicho esto, para un campo que se ha resistido a la automatización durante siglos, representa un hito importante.
a través de independiente
Siga TechRadar en Google News Y Agréganos como fuente preferida Obtenga nuestras noticias, reseñas y opiniones de expertos en su feed. ¡No olvides hacer clic en el botón de seguir!
Y por supuesto que puedes Siga TechRadar en TikTok Reciba nuestras actualizaciones periódicas en forma de noticias, reseñas, unboxing y videos. WhatsApp muy