En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Modulación de difusión mediante modelado de mecanismos ambientales para planificación

Modulación de difusión mediante modelado de mecanismos ambientales para planificación

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Los modelos de difusión han demostrado capacidades prometedoras en la generación de trayectorias para la planificación en el aprendizaje por refuerzo (RL) fuera de línea. Sin embargo, los métodos de planificación convencionales basados ​​en la difusión a menudo no tienen en cuenta el hecho de que generar trayectorias en RL requiere una coherencia única entre las transiciones para garantizar la coherencia en entornos reales. Este descuido puede dar lugar a discrepancias considerables entre las trayectorias generadas y los mecanismos subyacentes de un entorno real. Para abordar este problema, proponemos un novedoso método de planificación basado en la difusión, denominado Modulación de Difusión vía Modelado de Mecanismos Ambientales (DMEMM). DMEMM modula el entrenamiento del modelo de difusión incorporando mecanismos clave del entorno RL, en particular dinámicas de transición y funciones de recompensa. Los resultados experimentales demuestran que DMEMM logra un rendimiento de vanguardia para la planificación con aprendizaje por refuerzo fuera de línea.

Publicado originalmente en export.arxiv.org el 24 de febrero de 2026.
Ver fuente original

admin

Usuario de administración del sitio web