Aprendizaje por refuerzo fuera de línea entre realizaciones para conjuntos de datos de robots heterogéneos

Resumen:La capacitación previa en políticas de robots escalables se ha visto obstaculizada por el alto costo de recopilar demostraciones de alta calidad para cada plataforma. En este estudio, abordamos este problema uniendo el aprendizaje por refuerzo fuera de línea (RL fuera de línea) con el aprendizaje entre encarnaciones.

Leer más →

Comentarios desactivados en Aprendizaje por refuerzo fuera de línea entre realizaciones para conjuntos de datos de robots heterogéneos

Fin del contenido

No hay más páginas por cargar