En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Índice de conexión a tierra semántica: límites geométricos en la participación del contexto en sistemas RAG

Índice de conexión a tierra semántica: límites geométricos en la participación del contexto en sistemas RAG

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen:Cuando los sistemas de recuperación-generación aumentada (RAG) alucinan, ¿qué huella geométrica deja esto en el espacio de incrustación? Introducimos el Índice de Conexión Semántica (SGI), definido como la relación de distancias angulares desde la respuesta a la pregunta versus el contexto en la hiperesfera unitaria $mathbb{S}^{d-1}$. Nuestro hallazgo central es la emph{pereza semántica}: las respuestas alucinadas permanecen angularmente próximas a las preguntas en lugar de desviarse hacia contextos recuperados. En HaluEval ($n$=5000), observamos tamaños de efecto grandes (el $d$ de Cohen oscila entre 0,92 y 1,28) en cinco modelos de integración con una correlación media entre modelos $r$=0,85. Fundamentalmente, de la desigualdad del triángulo esférico derivamos que el poder discriminativo de SGI debería aumentar con la separación angular del contexto de la pregunta $theta(q,c)$, una predicción teórica confirmada empíricamente: el tamaño del efecto aumenta monótonamente desde $d$=0.61 -bajo $theta(q,c)$, a $d$=1.27 -alto $theta(q,c)$, con el AUC mejorando de 0.72 a 0,83. El análisis de subgrupos revela que SGI sobresale en respuestas largas ($d$=2,05) y preguntas cortas ($d$=1,22), sin dejar de ser sólida en todo el contexto. El análisis de calibración arroja ECE=0,10, lo que indica que las puntuaciones del SGI pueden servir como estimaciones de probabilidad, no simplemente como clasificaciones. Un resultado negativo crítico en TruthfulQA (AUC = 0,478) establece que la geometría angular mide la participación tópica en lugar de la precisión fáctica. SGI proporciona una infraestructura computacionalmente eficiente y teóricamente fundamentada para identificar respuestas que justifican la verificación en implementaciones de RAG de producción.

Publicado originalmente en export.arxiv.org el 16 de diciembre de 2025.
Ver fuente original

admin

Usuario de administración del sitio web