En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Más allá de los escalares: evaluación y comprensión del razonamiento LLM a través del progreso y la estabilidad geométricos

Más allá de los escalares: evaluación y comprensión del razonamiento LLM a través del progreso y la estabilidad geométricos

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: La evaluación de la confiabilidad del LLM mediante probabilidades escalares a menudo no logra capturar la dinámica estructural del razonamiento. Presentamos TRACED, un marco que evalúa la calidad del razonamiento a través de cinemática geométrica fundamentada teóricamente. Al descomponer las huellas del razonamiento en Progreso (desplazamiento) y Estabilidad (curvatura), revelamos una divergencia topológica distinta: el razonamiento correcto se manifiesta como trayectorias estables y de alto progreso, mientras que las alucinaciones se caracterizan por patrones inestables y de bajo progreso (desplazamiento estancado con fluctuaciones de alta curvatura). Aprovechando estas firmas, nuestro marco probabilístico logra un rendimiento competitivo y una solidez superior en diversos puntos de referencia. Fundamentalmente, TRACED une la geometría y la cognición al asignar una alta curvatura a los “bucles de vacilación” y el desplazamiento a la “acumulación de certeza”, ofreciendo una lente física para decodificar la dinámica interna del pensamiento de la máquina.

Publicado originalmente en export.arxiv.org el 11 de marzo de 2026.
Ver fuente original

admin

Usuario de administración del sitio web