En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->El muestreo restringido para los modelos de idiomas debería ser fácil: una perspectiva de MCMC

El muestreo restringido para los modelos de idiomas debería ser fácil: una perspectiva de MCMC

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: La decodificación restringida permite a los modelos de lenguaje (LMS) producir muestras que sean probablemente satisfacen restricciones difíciles. Sin embargo, los enfoques de decodificación restringidos existentes a menudo distorsionan la distribución del modelo subyacente, una limitación que es especialmente problemática en aplicaciones como la difusión del programa, donde uno quiere generar diversas y válidas entradas de programas para fines de prueba. Proponemos un nuevo marco de muestreo restringido basado en la cadena de Markov Monte Carlo (MCMC) que satisface simultáneamente tres desiderata de núcleo: satisfactoria de restricción (cada muestra satisface la restricción), convergente monotónicamente (el proceso de muestreo converge a la verdadera distribución condicional) y eficientes (muestras de alta calidad emergen en pocos pasos). Nuestro método construye una distribución de propuestas sobre salidas válidas y aplica un criterio de aceptación de metrópolis-Hastings basado en la probabilidad de la LM, asegurando la exploración de principios y eficientes del espacio restringido. Empíricamente, nuestra muestra supera a los métodos existentes tanto en los puntos de referencia sintéticos como en las tareas confusas del programa del mundo real.

Publicado Originalme en rss.arxiv.org El 8 de junio de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web