Planificación en línea con aversión al riesgo en POMDP utilizando la función de valor CVaR iterado
Resumen: Estudiamos la planificación sensible al riesgo bajo observabilidad parcial utilizando la medida de riesgo dinámico Valor en Riesgo Condicional Iterado (ICVaR). Se desarrolla un algoritmo de evaluación de políticas para ICVaR con garantías de desempeño en tiempo finito que no dependen de la cardinalidad del espacio de acción.
Leer más →