Alinear el progreso y la viabilidad: un marco de memoria dual neurosimbólica para agentes de LLM de horizonte a largo plazo

Resumen: Los modelos de lenguajes grandes (LLM) han demostrado un gran potencial en tareas de toma de decisiones a largo plazo, como la manipulación encarnada y la interacción web. Sin embargo, los agentes frecuentemente luchan con interminables ciclos de prueba y error o se desvían del objetivo principal en entornos complejos. Atribuimos estos fracasos a dos errores fundamentales: la deriva del progreso global y la violación de la viabilidad local. Los métodos existentes suelen intentar abordar ambas cuestiones simultáneamente utilizando un único paradigma. Sin embargo, estos dos desafíos son fundamentalmente distintos: el primero se basa en una planificación semántica difusa, mientras que el segundo exige restricciones lógicas estrictas y validación de estado. Las limitaciones inherentes de este enfoque de paradigma único plantean un desafío fundamental para los modelos existentes en el manejo de tareas a largo plazo. Motivados por esta idea, proponemos un marco de memoria dual neurosimbólica que desacopla explícitamente la guía de progreso semántico de la verificación de viabilidad lógica. Específicamente, durante la fase de inferencia, el marco invoca ambos mecanismos de memoria de manera sincrónica: por un lado, una Memoria de Progreso basada en una red neuronal extrae planos semánticos de trayectorias exitosas para guiar el avance global de las tareas; por otro lado, una memoria de viabilidad basada en lógica simbólica utiliza funciones de verificación ejecutables de Python sintetizadas a partir de transiciones fallidas para realizar una validación lógica estricta. Los experimentos demuestran que este método supera significativamente las líneas de base competitivas existentes en ALFWorld, WebShop y TextCraft, al tiempo que reduce drásticamente la tasa de acciones no válidas y la longitud promedio de la trayectoria.

Publicado originalmente en export.arxiv.org el 5 de abril de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Aprovechar el procesamiento del lenguaje natural y el aprendizaje automático para la toma de decisiones sobre políticas de seguridad alimentaria basada en evidencia en la toma de datos escasos

¿Pueden las computadoras cuánticas resolver ahora los problemas de atención médica? Pronto lo descubriremos.

Cuenta regresiva para las elecciones anuales del IEEE

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido