Explorar con memoria a largo plazo: un marco de aprendizaje por refuerzo basado en LLM multimodal y de referencia para la exploración incorporada
Resumen: Un agente encarnado ideal debe poseer capacidades de aprendizaje permanente para manejar tareas complejas y de largo plazo, permitiendo una operación continua en entornos generales. Esto no sólo requiere que el agente realice con precisión tareas determinadas, sino también que aproveche la memoria episódica a largo plazo para optimizar la toma de decisiones.
Leer más →