Resumen: La evaluación de la confiabilidad del LLM mediante probabilidades escalares a menudo no logra capturar la dinámica estructural del razonamiento. Presentamos TRACED, un marco que evalúa la calidad del razonamiento a través de cinemática geométrica fundamentada teóricamente. Al descomponer las huellas del razonamiento en Progreso (desplazamiento) y Estabilidad (curvatura), revelamos una divergencia topológica distinta: el razonamiento correcto se manifiesta como trayectorias estables y de alto progreso, mientras que las alucinaciones se caracterizan por patrones inestables y de bajo progreso (desplazamiento estancado con fluctuaciones de alta curvatura). Aprovechando estas firmas, nuestro marco probabilístico logra un rendimiento competitivo y una solidez superior en diversos puntos de referencia. Fundamentalmente, TRACED une la geometría y la cognición al asignar una alta curvatura a los “bucles de vacilación” y el desplazamiento a la “acumulación de certeza”, ofreciendo una lente física para decodificar la dinámica interna del pensamiento de la máquina.
Publicado originalmente en export.arxiv.org el 11 de marzo de 2026.
Ver fuente original
