Resumen: La generación de recuperación aumentada (RAG) mejora los modelos de lenguajes grandes (LLM) al integrar fuentes de conocimiento externas para abordar sus limitaciones en el acceso a información actualizada o especializada. Una estrategia natural para aumentar la probabilidad de recuperar información relevante es ampliar la cantidad de documentos recuperados. Sin embargo, involucrar más documentos podría generar un ruido significativo, ya que muchos documentos pueden ser irrelevantes o engañosos, reduciendo así la precisión general de las respuestas generadas. Para superar el desafío asociado con el manejo de una mayor cantidad de documentos, proponemos WinnowRAG, un novedoso marco RAG diseñado para filtrar sistemáticamente documentos ruidosos y al mismo tiempo preservar contenido valioso, un proceso al que nos referimos como aventamiento. WinnowRAG opera en dos etapas: en la Etapa I, realizamos agrupaciones basadas en consultas para agrupar documentos similares y formar grupos de temas distintos. Cada grupo se asigna a un agente LLM para generar una respuesta única. En la Etapa II, realizamos una selección, en la que un LLM crítico evalúa los resultados de múltiples agentes y separa iterativamente los documentos útiles de los ruidosos. Para conservar documentos útiles al descartar agentes, proponemos dos técnicas de fusión estratégica para garantizar que solo se utilice el conocimiento relevante para generar la respuesta final. Fundamentalmente, WinnowRAG es independiente del modelo y no requiere ningún ajuste fino del modelo, lo que lo hace fácilmente adaptable a diversas tareas. Amplios experimentos con varios conjuntos de datos realistas demuestran la eficacia de WinnowRAG sobre líneas de base de última generación.
Publicado originalmente en export.arxiv.org el 9 de noviembre de 2025.
Ver fuente original
