Separe el trigo de la paja: eliminando puntos de vista divergentes en la generación aumentada de recuperación

Resumen: La generación de recuperación aumentada (RAG) mejora los modelos de lenguajes grandes (LLM) al integrar fuentes de conocimiento externas para abordar sus limitaciones en el acceso a información actualizada o especializada. Una estrategia natural para aumentar la probabilidad de recuperar información relevante es ampliar la cantidad de documentos recuperados. Sin embargo, involucrar más documentos podría generar un ruido significativo, ya que muchos documentos pueden ser irrelevantes o engañosos, reduciendo así la precisión general de las respuestas generadas. Para superar el desafío asociado con el manejo de una mayor cantidad de documentos, proponemos WinnowRAG, un novedoso marco RAG diseñado para filtrar sistemáticamente documentos ruidosos y al mismo tiempo preservar contenido valioso, un proceso al que nos referimos como aventamiento. WinnowRAG opera en dos etapas: en la Etapa I, realizamos agrupaciones basadas en consultas para agrupar documentos similares y formar grupos de temas distintos. Cada grupo se asigna a un agente LLM para generar una respuesta única. En la Etapa II, realizamos una selección, en la que un LLM crítico evalúa los resultados de múltiples agentes y separa iterativamente los documentos útiles de los ruidosos. Para conservar documentos útiles al descartar agentes, proponemos dos técnicas de fusión estratégica para garantizar que solo se utilice el conocimiento relevante para generar la respuesta final. Fundamentalmente, WinnowRAG es independiente del modelo y no requiere ningún ajuste fino del modelo, lo que lo hace fácilmente adaptable a diversas tareas. Amplios experimentos con varios conjuntos de datos realistas demuestran la eficacia de WinnowRAG sobre líneas de base de última generación.

Publicado originalmente en export.arxiv.org el 9 de noviembre de 2025.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Secuencia de primavera: una nueva construcción matemática para probar la inferencia simbólica y el razonamiento de IA

Reasonbridge: transferencia de razonamiento eficiente de los modelos de lenguaje cerrado a de código abierto

La alineación de turnos de distribución ayuda a los LLM a simular distribuciones de respuestas a encuestas

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido