EntroCut: Truncamiento adaptativo guiado por entropía para un razonamiento eficiente en cadena de pensamiento en modelos de razonamiento grandes a pequeña escala
Resumen: Los grandes modelos de razonamiento (LRM) destacan en tareas de razonamiento complejas mediante la generación de cadenas de pensamiento extendidas, pero su dependencia de largos pasos intermedios genera un costo computacional sustancial.
Leer más →