En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->EntroCut: Truncamiento adaptativo guiado por entropía para un razonamiento eficiente en cadena de pensamiento en modelos de razonamiento grandes a pequeña escala

EntroCut: Truncamiento adaptativo guiado por entropía para un razonamiento eficiente en cadena de pensamiento en modelos de razonamiento grandes a pequeña escala

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Los grandes modelos de razonamiento (LRM) destacan en tareas de razonamiento complejas mediante la generación de cadenas de pensamiento extendidas, pero su dependencia de largos pasos intermedios genera un costo computacional sustancial. Encontramos que la entropía de la distribución de salida del modelo en los primeros pasos del razonamiento distingue de manera confiable el razonamiento correcto del incorrecto. Motivados por esta observación, proponemos EntroCut, un método sin entrenamiento que trunca dinámicamente el razonamiento mediante la identificación de estados de alta confianza donde el razonamiento se puede terminar de manera segura. Para evaluar de manera integral el equilibrio entre eficiencia y precisión, presentamos la relación eficiencia-rendimiento (EPR), una métrica unificada que cuantifica el ahorro relativo de tokens por unidad de pérdida de precisión. Los experimentos en cuatro puntos de referencia muestran que EntroCut reduce el uso de tokens hasta en un 40% con un mínimo sacrificio de precisión, logrando compensaciones superiores entre eficiencia y rendimiento en comparación con los métodos existentes sin capacitación. Estos resultados demuestran que el truncamiento dinámico guiado por entropía proporciona un enfoque práctico para mitigar la ineficiencia de los LRM.

Publicado originalmente en export.arxiv.org el 1 de febrero de 2026.
Ver fuente original

admin

Usuario de administración del sitio web