Resumen: Los agentes de capacitación para actuar en entornos incorporados generalmente requieren grandes datos de capacitación o acceso a una simulación precisa, ninguno de los cuales existe para muchos casos en el mundo real. En cambio, los modelos mundiales están emergiendo como una alternativa que aprovecha los datos fuera de línea y recopilados pasivamente, permiten generar diversos mundos para los agentes de capacitación en la simulación. En este trabajo, aprovechamos los modelos mundiales para generar entornos imaginados para capacitar a agentes robustos capaces de generalizar a nuevas variaciones de tareas. Uno de los desafíos al hacer esto es garantizar que el agente trenes en datos útiles generados. Por lo tanto, proponemos un enfoque novedoso, iMac (autocurricules imaginados), aprovechando el diseño del entorno no supervisado (UED), que induce un plan de estudios automático sobre mundos generados. En una serie de entornos desafiantes generados en procedimiento, mostramos que es posible lograr un rendimiento de transferencia sólido en entornos mantenidos, ya que solo se han entrenado dentro de un modelo mundial aprendido de un conjunto de datos más estrecho. Creemos que esto abre el camino para utilizar modelos mundiales de base a gran escala para agentes generalmente capaces.
Publicado Originalme en export.arxiv.org El 17 de septiembre de 2025.
Ver Fuente Original