Resumen: Los modelos de difusión han surgido recientemente como un enfoque poderoso para la planificación de la trayectoria. Sin embargo, su naturaleza inherentemente no secuencial limita su efectividad en las tareas de razonamiento de horizonte largo en el momento de la prueba. La recientemente propuesta de difusión del árbol de Monte Carlo (MCTD) ofrece una solución prometedora al combinar la difusión con la búsqueda basada en árboles, lograr un rendimiento de vanguardia en problemas de planificación complejos. A pesar de sus fortalezas, nuestro análisis muestra que MCTD incurre en sobrecarga computacional sustancial debido a la naturaleza secuencial de la búsqueda de árboles y al costo de la renovación iterativa. Para abordar esto, proponemos Fast-MCTD, una variante más eficiente que preserva las fuerzas de MCTD al tiempo que mejora significativamente su velocidad y escalabilidad. Fast-MCTD integra dos técnicas: MCTD paralelo, que permite despliegues paralelos a través de actualizaciones de árboles retrasadas y selección de redundancia; y escaso MCTD, que reduce la longitud del despliegue a través del engrosamiento de la trayectoria. Los experimentos muestran que Fast-MCTD alcanza hasta una velocidad de hasta 100x sobre MCTD estándar mientras mantiene o mejora el rendimiento de la planificación. Sorprendentemente, incluso supera al difusor en la velocidad de inferencia en algunas tareas, a pesar de que el difusor no requiere búsqueda y produce soluciones más débiles. Estos resultados se posicionan Fast-MCTD como una solución práctica y escalable para el razonamiento de tiempo de inferencia basado en difusión.
Publicado Originalme en rss.arxiv.org El 11 de junio de 2025.
Ver Fuente Original