Resumen:La navegación en entornos parcialmente observables presenta un desafío importante para los agentes autónomos, ya que requiere una toma de decisiones eficaz con información sensorial limitada en entornos desconocidos. Los métodos basados en creencias, en particular aquellos que utilizan redes neuronales para aproximar el espacio de creencias, a menudo no logran capturar la multimodalidad inherente de los espacios de creencias, especialmente en casos de alta dimensión con alias perceptuales. Si bien los modelos generativos presentan una alternativa convincente, normalmente requieren datos sustanciales o demostraciones de expertos y carecen de mecanismos explícitos para la planificación a largo plazo. En este artículo, presentamos BeliefDiffusion, un marco novedoso que combina los beneficios de la generación y la planificación. BeliefDiffusion aprovecha los modelos de difusión para caracterizar explícitamente las distribuciones de creencias multimodales y utiliza el control predictivo del modelo (MPC) para planificar el futuro simultáneamente. Consta de dos pasos: (1) Imaginar configuraciones ambientales plausibles basadas en el historial de observaciones y (2) Planificar estrategias de navegación eficientes en configuraciones agregadas. A través de extensos experimentos en entornos de mapas sintéticos, demostramos que BeliefDiffusion supera significativamente tanto las líneas base de aprendizaje por refuerzo sin modelos como otros enfoques generativos en la tasa de éxito de la navegación y la eficiencia de la ruta. Nuestros resultados validan que la incorporación explícita de representaciones de creencias multimodales en la planificación permite una navegación más sólida en entornos parcialmente observables.
Publicado originalmente en export.arxiv.org el 17 de junio de 2026.
Ver fuente original
