En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Latts: escala de tiempo de prueba adaptativa localmente

Latts: escala de tiempo de prueba adaptativa localmente

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Una estrategia común para mejorar el rendimiento de los modelos de idiomas grandes (LLM) en las tareas aguas abajo implica el uso de un SEC {Modelo de verificador} para seleccionar la mejor respuesta de un grupo de candidatos o para dirigir el proceso de generación automático hacia mejores resultados. Esta clase de métodos generalmente resulta en una precisión mejorada a costa de un aumento de la cálculo en el tiempo de prueba, un paradigma conocido como Spt {Test-Time-Scaling}. Sin embargo, la mayoría de los enfoques existentes aumentan el cálculo de manera uniforme en todas las muestras y los pasos de generación, sin considerar la complejidad de las instancias individuales, lo que lleva a un uso ineficiente de recursos. Abordamos esta limitación proponiendo un enfoque, llamado enft {escala de tiempo de prueba adaptativa localmente (Latts)}, que asigna un cálculo variable a través de los pasos de generación. Específicamente, en cada paso de generación, Latts emplea un criterio de aceptación basado en verificadores para decidir si volver a muestrear, retroceder, reiniciar o detener el proceso de generación. Este criterio ajusta efectivamente el esfuerzo computacional por paso basado en una noción precisa de enfl {dificultad local} derivada del modelo de verificador. Los resultados empíricos muestran que Latts logra una precisión significativamente superior: computa las compras en comparación con los métodos estándar basados ​​en verificadores.

Publicado Originalme en export.arxiv.org El 25 de septiembre de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web