En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Repensar la granularidad de verificación óptima para la escala de tiempo de prueba de cómputo-eficiente

Repensar la granularidad de verificación óptima para la escala de tiempo de prueba de cómputo-eficiente

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: La escala de tiempo de prueba (TTS) ha demostrado ser efectiva para mejorar las capacidades de razonamiento de grandes modelos de idiomas (LLM). La verificación juega un papel clave en TTS, influyendo simultáneamente (1) el rendimiento del razonamiento y (2) calcula la eficiencia, debido a la calidad y el costo computacional de la verificación. En este trabajo, desafiamos los paradigmas convencionales de verificación, y hacemos el primer intento de investigar sistemáticamente el impacto de la granularidad de la verificación, es decir, con qué frecuencia se invoca el verificador durante la generación, más allá de verificar solo la salida final o los pasos de generación individual. Con este fin, introducimos la búsqueda de granularidad variable (VG-Search), un algoritmo unificado que generaliza la búsqueda del haz y el mejor muestreo de N a través de un parámetro de granularidad sintonizable g. Experimentos extensos con VG-Search bajo presupuestos de cómputo variables, configuraciones de verificadores generadoras y atributos de tareas revelan que la selección dinámica de G puede mejorar la eficiencia de la cómputo y el comportamiento de escala. Sobre la base de estos hallazgos, proponemos estrategias adaptativas de búsqueda de VG que logran ganancias de precisión de hasta 3.1 % sobre la búsqueda de haz y 3.6 % sobre el mejor de N, al tiempo que reducen los fracasos en más del 52 %. Estaremos de código abierto el código para apoyar la investigación futura.

Publicado Originalme en rss.arxiv.org El 19 de mayo de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web