En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->CtrlCoT: Compresión de cadena de pensamiento de doble granularidad para un razonamiento controlable

CtrlCoT: Compresión de cadena de pensamiento de doble granularidad para un razonamiento controlable

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Las indicaciones de cadena de pensamiento (CoT) mejoran el razonamiento LLM pero generan una alta latencia y costos de memoria debido a los rastros detallados, lo que motiva la compresión de CoT con corrección preservada. Los métodos existentes acortan los CoT a nivel semántico, lo que a menudo es conservador, o podan los tokens de manera agresiva, lo que puede pasar por alto señales críticas para la tarea y degradar la precisión. Además, combinar los dos no es trivial debido a la dependencia secuencial, la poda independiente de las tareas y la falta de coincidencia en la distribución. Proponemos textbf{CtrlCoT}, un marco de compresión CoT de granularidad dual que armoniza la abstracción semántica y la poda a nivel de token a través de tres componentes: la abstracción de razonamiento jerárquico produce CoT en múltiples granularidades semánticas; La destilación que preserva la lógica entrena a un podador consciente de la lógica para retener claves de razonamiento indispensables (por ejemplo, números y operadores) en todos los índices de poda; y la generación de alineación de distribución alinea las trazas comprimidas con estilos fluidos de razonamiento en tiempo de inferencia para evitar la fragmentación. En MATH-500 con Qwen2.5-7B-Instruct, CtrlCoT utiliza un 30,7% menos de tokens y logra 7,6 puntos porcentuales más que la base de referencia más sólida, lo que demuestra un razonamiento más eficiente y confiable. Nuestro código estará disponible públicamente en esta URL https.

Publicado originalmente en export.arxiv.org el 28 de enero de 2026.
Ver fuente original

admin

Usuario de administración del sitio web