En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Difusión rápida de Monte Carlo: Speedup 100x a través de una planificación escasa paralela

Difusión rápida de Monte Carlo: Speedup 100x a través de una planificación escasa paralela

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Los modelos de difusión han surgido recientemente como un enfoque poderoso para la planificación de la trayectoria. Sin embargo, su naturaleza inherentemente no secuencial limita su efectividad en las tareas de razonamiento de horizonte largo en el momento de la prueba. La recientemente propuesta de difusión del árbol de Monte Carlo (MCTD) ofrece una solución prometedora al combinar la difusión con la búsqueda basada en árboles, lograr un rendimiento de vanguardia en problemas de planificación complejos. A pesar de sus fortalezas, nuestro análisis muestra que MCTD incurre en sobrecarga computacional sustancial debido a la naturaleza secuencial de la búsqueda de árboles y al costo de la renovación iterativa. Para abordar esto, proponemos Fast-MCTD, una variante más eficiente que preserva las fuerzas de MCTD al tiempo que mejora significativamente su velocidad y escalabilidad. Fast-MCTD integra dos técnicas: MCTD paralelo, que permite despliegues paralelos a través de actualizaciones de árboles retrasadas y selección de redundancia; y escaso MCTD, que reduce la longitud del despliegue a través del engrosamiento de la trayectoria. Los experimentos muestran que Fast-MCTD alcanza hasta una velocidad de hasta 100x sobre MCTD estándar mientras mantiene o mejora el rendimiento de la planificación. Sorprendentemente, incluso supera al difusor en la velocidad de inferencia en algunas tareas, a pesar de que el difusor no requiere búsqueda y produce soluciones más débiles. Estos resultados se posicionan Fast-MCTD como una solución práctica y escalable para el razonamiento de tiempo de inferencia basado en difusión.

Publicado Originalme en rss.arxiv.org El 11 de junio de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web