Confuso aprendizaje robusto por refuerzo profundo: un enfoque causal
Resumen:Una tarea clave en la Inteligencia Artificial es aprender políticas efectivas para controlar agentes en entornos desconocidos para optimizar las medidas de rendimiento. Los métodos de aprendizaje fuera de las políticas, como Q-learning, permiten a los alumnos tomar decisiones óptimas basadas en experiencias pasadas.
Leer más →