En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->DMA: Alineación RAG en línea con retroalimentación humana

DMA: Alineación RAG en línea con retroalimentación humana

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Adoptamos un protocolo de evaluación de doble vía que refleja la implementación: (i) ablaciones A/B en línea a gran escala para aislar la utilidad de cada fuente de retroalimentación, y (ii) pruebas fuera de línea de pocas tomas en puntos de referencia de conocimiento intensivo. En línea, un despliegue industrial de varios meses muestra además mejoras sustanciales en la participación humana. Fuera de línea, DMA preserva la recuperación fundamental competitiva al tiempo que genera ganancias notables en el control de calidad conversacional (TriviaQA, HotpotQA). En conjunto, estos resultados posicionan a DMA como un enfoque basado en principios para la adaptación en tiempo real basada en retroalimentación en RAG sin sacrificar la capacidad básica.

Publicado originalmente en export.arxiv.org el 9 de noviembre de 2025.
Ver fuente original

admin

Usuario de administración del sitio web