Una IA china resolvió un problema matemático de hace una década en 80 horas sin ayuda humana y lo demostró

Los sistemas de IA de agente dual han resuelto de forma autónoma la conjetura de Anderson desde 2014
Rethlas explora técnicas de resolución de problemas como lo haría un matemático humano
Archon convierte evidencia potencial en proyectos para verificadores Lean 4

Un equipo de investigación dirigido por la Universidad de Pekín ha desarrollado un sistema de inteligencia artificial de doble agente capaz de resolver problemas matemáticos avanzados y verificar sus propios resultados.

El sistema resuelve una conjetura propuesta por Dan Anderson en 2014, completando el proceso en 80 horas de ejecución.

“Utilizando este marco, resolvimos con éxito un problema abierto en álgebra variacional y formalizamos automáticamente la prueba sin ninguna intervención humana”, escribieron los investigadores en un artículo preimpreso publicado en arXiv.

El artículo continúa a continuación.

Cómo funcionan realmente los marcos de agente dual

La herramienta de inteligencia artificial implementa un sistema lógico llamado Rethlass, que se basa en un motor de búsqueda de teoremas matemáticos llamado Matlas para explorar estrategias de resolución de problemas.

Cuando Rethlass produce una posible prueba, un segundo sistema llamado Archon convierte esa prueba en un proyecto para un demostrador de teoremas interactivo utilizando otro motor de búsqueda llamado LinSearch.

El proponente del teorema, Lean 4, también es un lenguaje de programación con una biblioteca mantenida por la comunidad que contiene cientos de miles de teoremas y definiciones.

Los investigadores observaron que no se requirió ningún juicio matemático por parte del operador humano durante el proceso de resolución de problemas.

Los sistemas de IA pueden realizar tareas matemáticas más rápido que cualquier ser humano, incluida la realización de tareas de forma independiente que normalmente requerirían la colaboración entre expertos en diferentes campos.

Sin embargo, el equipo también descubrió que un matemático podría acelerar el proceso guiando al arconte cuando fuera necesario.

“Este trabajo proporciona un claro ejemplo de cómo la investigación matemática puede automatizarse sustancialmente utilizando la IA”, dijeron los investigadores.

Las pruebas matemáticas exigen un rigor total, pero incluso las pruebas escritas por expertos pueden contener errores sutiles.

De manera similar, la evidencia producida por modelos de lenguaje grandes es propensa a alucinaciones y es mucho menos confiable que los métodos de verificación formales.

El marco del equipo chino cierra la brecha entre el razonamiento en lenguaje natural y la verificación automática formal, permitiendo que los sistemas de IA resuelvan problemas y verifiquen sus propios resultados.

“Nuestro trabajo ilustra un paradigma prometedor para la investigación matemática en el que los sistemas de razonamiento formal e informal funcionan en conjunto para producir resultados verificables”, señalaron los investigadores.

El documento aún no ha sido revisado por expertos, por lo que la verificación independiente aún está pendiente.

La conjetura de Anderson era un problema relativamente oscuro en álgebra variacional, lo que hizo que el logro de la IA fuera notable.

Sin embargo, esta hazaña no es comparable a resolver desafíos del nivel del Premio del Milenio como la Hipótesis de Riemann o el problema P vs. NP.

Queda por ver si este enfoque se adapta a problemas matemáticos más difíciles.

Dicho esto, para un campo que se ha resistido a la automatización durante siglos, representa un hito importante.

a través de independiente

Siga TechRadar en Google News Y Agréganos como fuente preferida Obtenga nuestras noticias, reseñas y opiniones de expertos en su feed. ¡No olvides hacer clic en el botón de seguir!

Y por supuesto que puedes Siga TechRadar en TikTok Reciba nuestras actualizaciones periódicas en forma de noticias, reseñas, unboxing y videos. WhatsApp muy

Enlace de origen

Related Stories

Le premier centre de données indien d’OpenAI est établi à Visakhapatnam, Pune, alors que TCS sécurise un emplacement critique

Codes d’échange Garena Free Fire MAX aujourd’hui, 22 juillet 2026 révélés ; Découvrez comment utiliser des codes, obtenez des récompenses gratuites comme des diamants, des skins, des armes et plus encore.

El informe advierte que los trabajadores hacen cada vez más a la IA preguntas que antes hacían a sus compañeros

You may have missed

La marque de cosmétiques de Harper Beckham, 15 ans, “découverte” alors qu’elle se prépare à suivre les traces de Victoria – après que son premier choix “s’est vu refuser une marque en Amérique”

Misterio resuelto: se encuentran restos de avión después de un accidente que mató a decenas de personas hace 74 años

Sugerencias, respuestas y tutorial de ‘Pips’ del NYT para el miércoles 22 de julio

Jeff Bezos « discute d’investir à Liverpool » alors que le fondateur d’Amazon envisage de se joindre aux offres pour les géants de la Premier League