En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Muestra guieds: directora LLMS hacia diversas soluciones candidatas en tiempo de inferencia

Muestra guieds: directora LLMS hacia diversas soluciones candidatas en tiempo de inferencia

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: El muestreo repetido (RS) es un algoritmo simple de tiempo de inferencia que se ha demostrado que mejora el rendimiento del modelo en tareas complejas. Aunque es una forma eficaz de escalar el tiempo de inferencia, a menudo tiene dificultades para generar diversos candidatos a soluciones, ya que con frecuencia depende del mismo enfoque subyacente para resolver el problema y, por lo tanto, produce muestras redundantes. Para abordar esta limitación, proponemos un nuevo algoritmo de inferencia, GuidedSampling, que desacopla las fases de exploración y generación durante la inferencia, aumentando la diversidad de soluciones candidatas generadas. La fase de exploración identifica múltiples conceptos que pueden utilizarse para resolver el problema, mientras que la fase de generación aplica un concepto específico para proporcionar candidatos a soluciones finales. Primero definimos los límites teóricos de GuidedSampling y luego demostramos empíricamente que mejora el rendimiento del modelo base en pass@50 en un promedio de ~21,6% en varios puntos de referencia en comparación con RS. Además, los modelos entrenados en trayectorias de GuidedSampling exhiben mejoras sustanciales de rendimiento en pass@5 en un promedio de ~9,7%, en comparación con los modelos entrenados en RS tradicional. Además, los modelos entrenados con GuidedSampling aumentan la cantidad promedio de conceptos por instancia (1,67 -> 3,03), lo que genera un conjunto diverso de candidatos que el RS tradicional.

Publicado Originalme en export.arxiv.org El 6 de octubre de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web