En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="2"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Alinear el progreso y la viabilidad: un marco de memoria dual neurosimbólica para agentes de LLM de horizonte a largo plazo

Alinear el progreso y la viabilidad: un marco de memoria dual neurosimbólica para agentes de LLM de horizonte a largo plazo

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Los modelos de lenguajes grandes (LLM) han demostrado un gran potencial en tareas de toma de decisiones a largo plazo, como la manipulación encarnada y la interacción web. Sin embargo, los agentes frecuentemente luchan con interminables ciclos de prueba y error o se desvían del objetivo principal en entornos complejos. Atribuimos estos fracasos a dos errores fundamentales: la deriva del progreso global y la violación de la viabilidad local. Los métodos existentes suelen intentar abordar ambas cuestiones simultáneamente utilizando un único paradigma. Sin embargo, estos dos desafíos son fundamentalmente distintos: el primero se basa en una planificación semántica difusa, mientras que el segundo exige restricciones lógicas estrictas y validación de estado. Las limitaciones inherentes de este enfoque de paradigma único plantean un desafío fundamental para los modelos existentes en el manejo de tareas a largo plazo. Motivados por esta idea, proponemos un marco de memoria dual neurosimbólica que desacopla explícitamente la guía de progreso semántico de la verificación de viabilidad lógica. Específicamente, durante la fase de inferencia, el marco invoca ambos mecanismos de memoria de manera sincrónica: por un lado, una Memoria de Progreso basada en una red neuronal extrae planos semánticos de trayectorias exitosas para guiar el avance global de las tareas; por otro lado, una memoria de viabilidad basada en lógica simbólica utiliza funciones de verificación ejecutables de Python sintetizadas a partir de transiciones fallidas para realizar una validación lógica estricta. Los experimentos demuestran que este método supera significativamente las líneas de base competitivas existentes en ALFWorld, WebShop y TextCraft, al tiempo que reduce drásticamente la tasa de acciones no válidas y la longitud promedio de la trayectoria.

Publicado originalmente en export.arxiv.org el 5 de abril de 2026.
Ver fuente original

admin

Usuario de administración del sitio web