Resumen: Grandes modelos de lenguaje (LLM) han mostrado recientemente habilidades de codificación fuertes, permitiendo no solo la generación de código estático sino también el código de autoevolución iterativo a través de marcos de agente. Recientemente, Alphaevolve cite {Novikov2025Alphaevolve} demostró que los agentes de codificación basados en LLM pueden mejorar de forma autónoma algoritmos y superar a los expertos humanos, con alcances limitados a núcleos aislados que abarcan cientos de líneas de código. Inspirados en Alphaevolve, presentamos Satlution, el primer marco para extender la evolución del código basada en LLM a la escala completa del repositorio, que abarca cientos de archivos y decenas de miles de líneas de código C/C ++. Dirigirse a la satisfactuabilidad booleana (SAT), el problema canónico de NP-complete y una piedra angular de la teoría y las aplicaciones. Satlution orquesta a los agentes de LLM para que evolucionen directamente los repositorios de solucionadores bajo garantías estrictas de corrección y retroalimentación distribuida de tiempo de ejecución, mientras que simultáneamente evolucionan sus propias políticas y reglas de evolución. A partir de la competencia SAT 2024, las bases de código y el punto de referencia, la satlución evolucionó solucionadores que superaron decisivamente a los ganadores diseñados por humanos de la competencia SAT 2025, y también superaron a los campeones de 2024 y 2025 en los puntos de referencia de 2024.
Publicado Originalme en export.arxiv.org El 9 de septiembre de 2025.
Ver Fuente Original