Leanrag: Generación basada en el conocimiento con agregación semántica y recuperación jerárquica

Resumen: La generación de recuperación aumentada (RAG) juega un papel crucial en la base de modelos de idiomas grandes al aprovechar el conocimiento externo, mientras que la efectividad a menudo se ve comprometida por la recuperación de información contextualmente defectuosa o incompleta. Para abordar esto, los métodos de RAG basados en gráficos de conocimiento han evolucionado hacia estructuras jerárquicas, organizando el conocimiento en resúmenes de niveles múltiples. Sin embargo, estos enfoques aún sufren dos desafíos críticos y no abordados: existen resúmenes conceptuales de alto nivel como “ islas semánticas ” desconectadas, que carecen de las relaciones explícitas necesarias para el razonamiento de comunidades cruzadas; Y el proceso de recuperación en sí mismo permanece estructuralmente inconsciente, a menudo degenerando en una búsqueda plana ineficiente que no explota la rica topología del gráfico. Para superar estas limitaciones, presentamos LeanRag, un marco que presenta un diseño profundamente colaborativo que combina estrategias de agregación y recuperación de conocimiento. LeanRag primero emplea un nuevo algoritmo de agregación semántica que forma grupos de entidades y construye nuevas relaciones explícitas entre los resúmenes a nivel de agregación, creando una red semántica totalmente navegable. Luego, una estrategia de recuperación de abajo hacia arriba y guiada por la estructura ancla las consultas a las entidades de grano fino más relevantes y luego atraviesa sistemáticamente las vías semánticas del gráfico para reunir conjuntos de evidencia concisos pero contextualmente integrales. El LeanRag puede mitigar la sobrecarga sustancial asociada con la recuperación de la ruta en los gráficos y minimiza la recuperación de información redundante. Experimentos extensos en cuatro puntos de referencia de control de calidad desafiantes con diferentes dominios demuestran que LeanRAG superó significativamente los métodos existentes en la calidad de la respuesta al tiempo que reduce el 46 % de redundancia de recuperación. El código está disponible en: esta URL HTTPS

Publicado Originalme en export.arxiv.org El 14 de agosto de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

DISMINUCIÓN: Al reducir el tamaño de los programas ASP de conexión a tierra

Ampliación de la verificación del razonamiento médico mediante el aprendizaje por refuerzo integrado en herramientas

Limpieza de registros de mantenimiento con agentes LLM para un mantenimiento predictivo mejorado

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido