Resumen: Proponemos textbf{Cognitive Load Traces} (CLT) como un marco de interpretabilidad de nivel medio para modelos profundos, inspirado en la teoría de la carga cognitiva en la cognición humana. Los CLT se definen como funciones simbólicas que varían temporalmente y que cuantifican la asignación de recursos interna del modelo.
Leer más →
Resumen: Un trabajo reciente informa que los modelos de razonamiento grande (LRM) sufren un colapso en el rendimiento al resolver acertijos más allá de ciertos umbrales de perplejidad. En discursos posteriores, han surgido preguntas sobre si la naturaleza de la tarea confunde la evaluación del verdadero razonamiento.
Leer más →
Resumen: El razonamiento de múltiples saltos para la respuesta a preguntas (QA) desempeña un papel fundamental en la generación de recuperación aumentada (RAG) para modelos de lenguajes grandes (LLM) modernos. La respuesta precisa se puede obtener recuperando la estructura relacional de entidades del gráfico de conocimiento (KG).
Leer más →