EntroCut: Truncamiento adaptativo guiado por entropía para un razonamiento eficiente en cadena de pensamiento en modelos de razonamiento grandes a pequeña escala

Resumen: Los grandes modelos de razonamiento (LRM) destacan en tareas de razonamiento complejas mediante la generación de cadenas de pensamiento extendidas, pero su dependencia de largos pasos intermedios genera un costo computacional sustancial. Encontramos que la entropía de la distribución de salida del modelo en los primeros pasos del razonamiento distingue de manera confiable el razonamiento correcto del incorrecto. Motivados por esta observación, proponemos EntroCut, un método sin entrenamiento que trunca dinámicamente el razonamiento mediante la identificación de estados de alta confianza donde el razonamiento se puede terminar de manera segura. Para evaluar de manera integral el equilibrio entre eficiencia y precisión, presentamos la relación eficiencia-rendimiento (EPR), una métrica unificada que cuantifica el ahorro relativo de tokens por unidad de pérdida de precisión. Los experimentos en cuatro puntos de referencia muestran que EntroCut reduce el uso de tokens hasta en un 40% con un mínimo sacrificio de precisión, logrando compensaciones superiores entre eficiencia y rendimiento en comparación con los métodos existentes sin capacitación. Estos resultados demuestran que el truncamiento dinámico guiado por entropía proporciona un enfoque práctico para mitigar la ineficiencia de los LRM.

Publicado originalmente en export.arxiv.org el 1 de febrero de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Hacia sistemas de datos que se centran en el negocio semántico y asisten a agentes de IA

Una breve historia del revuelo de Sam Altman

Un marco multimodal para la detección de la depresión durante Covid-19 mediante la recolección de redes sociales: un conjunto de datos y un método novedosos

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido