Resumen: Proponemos Prueba ++, un marco neuro-simbólico que mejora el teorema automatizado de la prueba al combinar modelos de idiomas grandes (LLM) con mecanismos formales de verificación y autocorrección. Los sistemas actuales basados en LLM sufren pasos lógicos alucinados y razonamiento no verificable. Proofnet ++ mitiga estas limitaciones integrando la supervisión de árboles de prueba simbólica, un bucle de aprendizaje de refuerzo utilizando los verificadores como funciones de recompensa y un módulo de autocorrección iterativo. Nuestros experimentos en Minif2f, Lean’s Mathlib y HOL Light muestran que ProofNet ++ mejora significativamente la precisión de la prueba, la corrección y la verificabilidad formal sobre los modelos anteriores. Proporcionamos un análisis teórico de la convergencia y estabilidad del marco RL guiado por el verificador y liberamos nuestros conjuntos de datos y código de código para futuras investigaciones.
Publicado Originalme en rss.arxiv.org El 1 de junio de 2025.
Ver Fuente Original