El muestreo restringido para los modelos de idiomas debería ser fácil: una perspectiva de MCMC

Resumen: La decodificación restringida permite a los modelos de lenguaje (LMS) producir muestras que sean probablemente satisfacen restricciones difíciles. Sin embargo, los enfoques de decodificación restringidos existentes a menudo distorsionan la distribución del modelo subyacente, una limitación que es especialmente problemática en aplicaciones como la difusión del programa, donde uno quiere generar diversas y válidas entradas de programas para fines de prueba. Proponemos un nuevo marco de muestreo restringido basado en la cadena de Markov Monte Carlo (MCMC) que satisface simultáneamente tres desiderata de núcleo: satisfactoria de restricción (cada muestra satisface la restricción), convergente monotónicamente (el proceso de muestreo converge a la verdadera distribución condicional) y eficientes (muestras de alta calidad emergen en pocos pasos). Nuestro método construye una distribución de propuestas sobre salidas válidas y aplica un criterio de aceptación de metrópolis-Hastings basado en la probabilidad de la LM, asegurando la exploración de principios y eficientes del espacio restringido. Empíricamente, nuestra muestra supera a los métodos existentes tanto en los puntos de referencia sintéticos como en las tareas confusas del programa del mundo real.

Publicado Originalme en rss.arxiv.org El 8 de junio de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Respuesta AIOTI al llamado a la evidencia sobre la revisión de la regulación de la estandarización

La demanda de electricidad de Google se está disparando

Asignación de crédito de ventaja multinivel para el aprendizaje cooperativo de refuerzo de múltiples agentes

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido