DUPLEX: Planificación de sistema dual agente mediante extracción de información impulsada por LLM

Resumen:Si bien los modelos de lenguaje grande (LLM) brindan flexibilidad semántica para la planificación de tareas robóticas, su susceptibilidad a las alucinaciones y la inconsistencia lógica limitan su confiabilidad en dominios de largo horizonte. Para cerrar la brecha entre los entornos no estructurados y la síntesis rigurosa de planes, proponemos DUPLEX, una arquitectura neurosimbólica de sistema dual agente que limita estrictamente el LLM a la extracción de información guiada por esquemas en lugar de la planificación de un extremo a otro o la generación de código. En nuestro marco, un sistema rápido de retroalimentación utiliza un LLM liviano para extraer entidades, relaciones, etc. del lenguaje natural, mapeándolas de manera determinista en un archivo de problema de lenguaje de definición de dominio de planificación (PDDL) para un planificador simbólico clásico. Para resolver escenarios complejos o poco especificados, un sistema lento se activa exclusivamente cuando falla la planificación, aprovechando los diagnósticos del solucionador para impulsar un LLM de alta capacidad en reflexión y reparación iterativas. Evaluaciones exhaustivas en 12 dominios de planificación doméstica y clásica demuestran que DUPLEX supera significativamente las líneas de base de LLM híbridas y de extremo a extremo existentes tanto en tasa de éxito como en confiabilidad. Estos resultados confirman que la clave no es mejorar el plan de LLM, sino restringir el LLM a la parte en la que es bueno (base semántica estructurada) y dejar la síntesis del plan lógico a un planificador simbólico.

Publicado originalmente en export.arxiv.org el 25 de marzo de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Por qué los chatbots están empezando a comprobar tu edad

Memoria compilada: no más información, sino instrucciones más precisas para agentes lingüísticos

Automatización de procesos E2E Aprovechando el agente de automatización generativo de IA y IDP: un estudio de caso sobre procesamiento de gastos corporativos

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido