Resumen: Proponemos textbf{Cognitive Load Traces} (CLT) como un marco de interpretabilidad de nivel medio para modelos profundos, inspirado en la teoría de la carga cognitiva en la cognición humana. Los CLT se definen como funciones simbólicas que varían temporalmente y que cuantifican la asignación de recursos interna del modelo. Formalmente, representamos los CLT como un proceso estocástico de tres componentes $(mathrm{IL}_t, mathrm{EL}_t, mathrm{GL}_t)$, correspondiente a la carga emph{Intrínseca}, emph{Extranea} y emph{Alemana}. Se crea una instancia de cada componente a través de proxies mensurables, como la entropía de atención, la tasa de errores de caché KV, la dispersión de la representación y la estabilidad de la decodificación. Proponemos tanto formulaciones simbólicas como métodos de visualización (curvas de carga, diagramas simplex) que permiten un análisis interpretable de la dinámica del razonamiento. Los experimentos sobre puntos de referencia de razonamiento y planificación muestran que los CLT predicen la aparición de errores, revelan estrategias cognitivas y permiten intervenciones guiadas por carga que mejoran la eficiencia del razonamiento entre un 15% y un 30% manteniendo la precisión.
Publicado originalmente en export.arxiv.org el 20 de octubre de 2025.
Ver fuente original
