Índice de conexión a tierra semántica: límites geométricos en la participación del contexto en sistemas RAG

Resumen:Cuando los sistemas de recuperación-generación aumentada (RAG) alucinan, ¿qué huella geométrica deja esto en el espacio de incrustación? Introducimos el Índice de Conexión Semántica (SGI), definido como la relación de distancias angulares desde la respuesta a la pregunta versus el contexto en la hiperesfera unitaria $mathbb{S}^{d-1}$. Nuestro hallazgo central es la emph{pereza semántica}: las respuestas alucinadas permanecen angularmente próximas a las preguntas en lugar de desviarse hacia contextos recuperados. En HaluEval ($n$=5000), observamos tamaños de efecto grandes (el $d$ de Cohen oscila entre 0,92 y 1,28) en cinco modelos de integración con una correlación media entre modelos $r$=0,85. Fundamentalmente, de la desigualdad del triángulo esférico derivamos que el poder discriminativo de SGI debería aumentar con la separación angular del contexto de la pregunta $theta(q,c)$, una predicción teórica confirmada empíricamente: el tamaño del efecto aumenta monótonamente desde $d$=0.61 -bajo $theta(q,c)$, a $d$=1.27 -alto $theta(q,c)$, con el AUC mejorando de 0.72 a 0,83. El análisis de subgrupos revela que SGI sobresale en respuestas largas ($d$=2,05) y preguntas cortas ($d$=1,22), sin dejar de ser sólida en todo el contexto. El análisis de calibración arroja ECE=0,10, lo que indica que las puntuaciones del SGI pueden servir como estimaciones de probabilidad, no simplemente como clasificaciones. Un resultado negativo crítico en TruthfulQA (AUC = 0,478) establece que la geometría angular mide la participación tópica en lugar de la precisión fáctica. SGI proporciona una infraestructura computacionalmente eficiente y teóricamente fundamentada para identificar respuestas que justifican la verificación en implementaciones de RAG de producción.

Publicado originalmente en export.arxiv.org el 16 de diciembre de 2025.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Protección de la columna vertebral de Internet

Los microfluidos podrían ser la respuesta para enfriar los chips de IA

Ideación progresiva utilizando un marco de IA agente para la cocreación entre humanos y IA

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido