En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Planificación de Monte Carlo asistida por un punto de referencia

Planificación de Monte Carlo asistida por un punto de referencia

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: puntos de referencia $ unicode {x2013} $ condiciones que deben satisfacerse en algún momento de cada plan de solución $ unicode {x2013} $ han contribuido a avances importantes en la planificación clásica, pero rara vez se han utilizado en dominios estocásticos. Formalizamos los puntos de referencia probabilísticos y adaptamos el algoritmo UCT para aprovecharlos como subconocentes para descomponer los MDP; El núcleo de la adaptación se equilibra entre el logro histórico codicioso y el logro final de objetivos. Nuestros resultados en los dominios de referencia muestran que los puntos de referencia bien elegidos pueden mejorar significativamente el rendimiento de la UCT en la planificación probabilística en línea, mientras que el mejor equilibrio del logro de objetivos codicioso versus a largo plazo depende del problema. Los resultados sugieren que los puntos de referencia pueden proporcionar una guía útil para los algoritmos de cualquier momento que resuelvan los MDP.

Publicado Originalme en export.arxiv.org El 17 de agosto de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web