En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->¿Puedo recibir su pedido? Búsqueda de árbol de Monte-Carlo para ordenar el llenado de espacios en modelos de lenguaje de difusión

¿Puedo recibir su pedido? Búsqueda de árbol de Monte-Carlo para ordenar el llenado de espacios en modelos de lenguaje de difusión

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen:Si bien la decodificación de planificación y relleno en modelos de difusión enmascarada (MDM) es prometedora para el razonamiento matemático y de código, el rendimiento sigue siendo muy sensible al orden de relleno de las ranuras, lo que a menudo produce una variación sustancial de la salida. Presentamos McDiffuSE, un marco que formula la selección de espacios como toma de decisiones y optimiza el llenado de pedidos a través de Monte Carlo Tree Search (MCTS). McDiffuSE utiliza simulaciones anticipadas para evaluar las terminaciones parciales antes del compromiso, explorando sistemáticamente el espacio combinatorio de los pedidos de generación. Los experimentos muestran una mejora promedio del 3,2 % con respecto a las líneas de base autorregresivas y del 8,0 % con respecto a la planificación y el relleno de referencia, con ganancias notables del 19,5 % en MBPP y del 4,9 % en MATH500. Nuestro análisis revela que, si bien McDiffuSE sigue predominantemente el orden secuencial, incorporar generación no secuencial es esencial para maximizar el rendimiento. Observamos que se necesitan constantes de exploración más grandes, en lugar de mayores simulaciones, para superar los sesgos de confianza del modelo y descubrir ordenamientos efectivos. Estos hallazgos establecen que la planificación basada en MCTS es un enfoque eficaz para mejorar la calidad de la generación en los MDM.

Publicado originalmente en export.arxiv.org el 15 de febrero de 2026.
Ver fuente original

admin

Usuario de administración del sitio web