Difusión rápida de Monte Carlo: Speedup 100x a través de una planificación escasa paralela

Resumen: Los modelos de difusión han surgido recientemente como un enfoque poderoso para la planificación de la trayectoria. Sin embargo, su naturaleza inherentemente no secuencial limita su efectividad en las tareas de razonamiento de horizonte largo en el momento de la prueba. La recientemente propuesta de difusión del árbol de Monte Carlo (MCTD) ofrece una solución prometedora al combinar la difusión con la búsqueda basada en árboles, lograr un rendimiento de vanguardia en problemas de planificación complejos. A pesar de sus fortalezas, nuestro análisis muestra que MCTD incurre en sobrecarga computacional sustancial debido a la naturaleza secuencial de la búsqueda de árboles y al costo de la renovación iterativa. Para abordar esto, proponemos Fast-MCTD, una variante más eficiente que preserva las fuerzas de MCTD al tiempo que mejora significativamente su velocidad y escalabilidad. Fast-MCTD integra dos técnicas: MCTD paralelo, que permite despliegues paralelos a través de actualizaciones de árboles retrasadas y selección de redundancia; y escaso MCTD, que reduce la longitud del despliegue a través del engrosamiento de la trayectoria. Los experimentos muestran que Fast-MCTD alcanza hasta una velocidad de hasta 100x sobre MCTD estándar mientras mantiene o mejora el rendimiento de la planificación. Sorprendentemente, incluso supera al difusor en la velocidad de inferencia en algunas tareas, a pesar de que el difusor no requiere búsqueda y produce soluciones más débiles. Estos resultados se posicionan Fast-MCTD como una solución práctica y escalable para el razonamiento de tiempo de inferencia basado en difusión.

Publicado Originalme en rss.arxiv.org El 11 de junio de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

La red de abstracción causal: teoría y aprendizaje

P-CAFE: selección de características incrementales de costo personalizado para registros de salud electrónicos

SAJA: Un marco de ataque conjunto de acción estatal sobre el aprendizaje por refuerzo profundo de múltiples agentes

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido