En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Ragsynth: datos sintéticos para la optimización de componentes de trapo robustos y fieles

Ragsynth: datos sintéticos para la optimización de componentes de trapo robustos y fieles

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: RAG puede mejorar el rendimiento de los LLM en tareas intensivas en conocimiento. Varios paradigmas de trapo, incluidos la vainilla, la planificación y el trapo iterativo, se basan en 2 núcleos: el Retriever, que debería seleccionar de manera robusta documentos relevantes en consultas complejas y el generador, que debería sintetizar fielmente las respuestas. Sin embargo, los retrieveres existentes dependen en gran medida del conocimiento público y la lucha con consultas de complejidad lógica variable e integridad de la pista, mientras que los generadores con frecuencia enfrentan problemas de fidelidad. En este trabajo, presentamos RagSynth, un marco que incluye un modelado de construcción de datos y una implementación de generación de datos sintética correspondiente, diseñada para optimizar la robustez y la fidelidad del generador de Retriever. Además, presentamos SynthBench, un punto de referencia que abarca 8 documentos específicos de dominio en 4 dominios, con diversas complejidades de consultas, integridad de pista y granularidad de citas de grano fino. Aprovechando Ragsynth, generamos un conjunto de datos sintético a gran escala, que incluye un solo y múltiple salto. Experimentos extensos demuestran que los datos sintéticos mejoran significativamente la robustez de los retrievers y la fidelidad de los generadores. Evaluaciones adicionales confirman que Ragsynth también puede generalizarse bien en diferentes dominios. Al integrar los retrievers optimizados en varios paradigmas de RAG, observamos constantemente el rendimiento mejorado del sistema de RAG. Hemos recibido la implementación de la implementación en esta URL HTTPS.

Publicado Originalme en rss.arxiv.org El 18 de mayo de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web