Resumen:Si bien los modelos de lenguaje grande (LLM) brindan flexibilidad semántica para la planificación de tareas robóticas, su susceptibilidad a las alucinaciones y la inconsistencia lógica limitan su confiabilidad en dominios de largo horizonte. Para cerrar la brecha entre los entornos no estructurados y la síntesis rigurosa de planes, proponemos DUPLEX, una arquitectura neurosimbólica de sistema dual agente que limita estrictamente el LLM a la extracción de información guiada por esquemas en lugar de la planificación de un extremo a otro o la generación de código. En nuestro marco, un sistema rápido de retroalimentación utiliza un LLM liviano para extraer entidades, relaciones, etc. del lenguaje natural, mapeándolas de manera determinista en un archivo de problema de lenguaje de definición de dominio de planificación (PDDL) para un planificador simbólico clásico. Para resolver escenarios complejos o poco especificados, un sistema lento se activa exclusivamente cuando falla la planificación, aprovechando los diagnósticos del solucionador para impulsar un LLM de alta capacidad en reflexión y reparación iterativas. Evaluaciones exhaustivas en 12 dominios de planificación doméstica y clásica demuestran que DUPLEX supera significativamente las líneas de base de LLM híbridas y de extremo a extremo existentes tanto en tasa de éxito como en confiabilidad. Estos resultados confirman que la clave no es mejorar el plan de LLM, sino restringir el LLM a la parte en la que es bueno (base semántica estructurada) y dejar la síntesis del plan lógico a un planificador simbólico.
Publicado originalmente en export.arxiv.org el 25 de marzo de 2026.
Ver fuente original
