Resumen:Si bien los modelos de lenguaje grande (LLM) permiten un comportamiento autónomo complejo, los agentes actuales siguen limitados por indicaciones estáticas diseñadas por humanos que limitan la adaptabilidad. Los marcos de mejora existentes intentan cerrar esta brecha, pero normalmente se basan en bucles recursivos ineficientes de múltiples vueltas que incurren en altos costos computacionales. Para abordar esto, proponemos la Automejora Reflexiva con Agente Metacognitivo (MARS), un marco que logra una autoevolución eficiente dentro de un único ciclo de recurrencia. Inspirándose en la psicología educativa, MARS imita el aprendizaje humano al integrar la reflexión basada en principios (abstraer reglas normativas para evitar errores) y la reflexión procedimental (derivar estrategias paso a paso para lograr el éxito). Al sintetizar estos conocimientos en instrucciones optimizadas, MARS permite a los agentes refinar sistemáticamente su lógica de razonamiento sin retroalimentación continua en línea. Amplios experimentos en seis puntos de referencia demuestran que MARS supera a los sistemas de evolución automática de última generación y, al mismo tiempo, reduce significativamente la sobrecarga computacional.
Publicado originalmente en export.arxiv.org el 20 de enero de 2026.
Ver fuente original
