En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Sticker-TTS: Aprenda a utilizar la experiencia histórica con un marco de escala de tiempo de prueba impulsado por pegatinas

Sticker-TTS: Aprenda a utilizar la experiencia histórica con un marco de escala de tiempo de prueba impulsado por pegatinas

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Grandes modelos de razonamiento (LRMS) han exhibido un fuerte rendimiento en tareas de razonamiento complejos, con mayores ganancias alcanzables a través de mayores presupuestos computacionales en inferencia. Sin embargo, los métodos actuales de escala del tiempo de prueba dependen predominantemente del muestreo redundante, ignorando la utilización de la experiencia histórica, lo que limita la eficiencia computacional. Para superar esta limitación, proponemos Sticker-TTS, un nuevo marco de escala de tiempo de prueba que coordina tres LRM colaborativas para explorar y refinar iterativamente soluciones guiadas por intentos históricos. En el núcleo de nuestro marco se encuentran las calcomanías de condiciones clave destiladas, que impulsan la extracción, el refinamiento y la reutilización de información crítica en múltiples rondas de razonamiento. Para mejorar aún más la eficiencia y el rendimiento de nuestro marco, presentamos una estrategia de optimización de dos etapas que combina el aprendizaje de imitación con la superación personal, lo que permite el refinamiento progresivo. Evaluaciones extensas en tres puntos de referencia de razonamiento matemático desafiantes, incluidos AIME-24, AIME-25 y Olymmath, demuestran que Sticker-TTS supera constantemente las líneas de base fuertes, incluidos los enfoques de aprendizaje de refuerzo de autoconsistencia y avanzados, bajo presupuestos de inferencias comparables. Estos resultados resaltan la efectividad de la utilización de la experiencia histórica guiada por pegatinas. Nuestro código y datos están disponibles en esta URL HTTPS.

Publicado Originalme en export.arxiv.org El 7 de septiembre de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web