Resumen: Los procesos de decisión de Markov parcialmente observables (POMDPS) se utilizan para modelar una amplia gama de aplicaciones, que incluyen robótica, vehículos autónomos y problemas del subsuelo. Sin embargo, representar con precisión la creencia es difícil para los POMDP con estados de alta dimensión. En este artículo, proponemos un enfoque novedoso que utiliza modelos generativos profundos condicionales (CDGM) para representar la creencia. A diferencia de las representaciones de creencias tradicionales, los CDGM son adecuados para estados de alta dimensión y un gran número de observaciones, y pueden generar un número arbitrario de muestras de la creencia posterior. Entrenamos los CDGM en datos producidos por trayectorias de despliegue aleatorias y mostramos su efectividad para resolver un POMDP de exploración mineral con un espacio de estado grande y continuo. Los CDGM superan las líneas de base del filtro de partículas tanto en las medidas de precisión de la creencia de tareas como en la planificación del rendimiento.
Publicado Originalme en rss.arxiv.org El 19 de mayo de 2025.
Ver Fuente Original