CtrlCoT: Compresión de cadena de pensamiento de doble granularidad para un razonamiento controlable

Resumen: Las indicaciones de cadena de pensamiento (CoT) mejoran el razonamiento LLM pero generan una alta latencia y costos de memoria debido a los rastros detallados, lo que motiva la compresión de CoT con corrección preservada. Los métodos existentes acortan los CoT a nivel semántico, lo que a menudo es conservador, o podan los tokens de manera agresiva, lo que puede pasar por alto señales críticas para la tarea y degradar la precisión. Además, combinar los dos no es trivial debido a la dependencia secuencial, la poda independiente de las tareas y la falta de coincidencia en la distribución. Proponemos textbf{CtrlCoT}, un marco de compresión CoT de granularidad dual que armoniza la abstracción semántica y la poda a nivel de token a través de tres componentes: la abstracción de razonamiento jerárquico produce CoT en múltiples granularidades semánticas; La destilación que preserva la lógica entrena a un podador consciente de la lógica para retener claves de razonamiento indispensables (por ejemplo, números y operadores) en todos los índices de poda; y la generación de alineación de distribución alinea las trazas comprimidas con estilos fluidos de razonamiento en tiempo de inferencia para evitar la fragmentación. En MATH-500 con Qwen2.5-7B-Instruct, CtrlCoT utiliza un 30,7% menos de tokens y logra 7,6 puntos porcentuales más que la base de referencia más sólida, lo que demuestra un razonamiento más eficiente y confiable. Nuestro código estará disponible públicamente en esta URL https.

Publicado originalmente en export.arxiv.org el 28 de enero de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

La descarga: America’s Drone Brothers, y una ventaja del doomerismo de AI

Planificación y ejecución desacopladas: un marco de razonamiento jerárquico para una búsqueda profunda

Hacia la teoría de la medición para la inteligencia artificial

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido