DMA: Alineación RAG en línea con retroalimentación humana

Resumen: Adoptamos un protocolo de evaluación de doble vía que refleja la implementación: (i) ablaciones A/B en línea a gran escala para aislar la utilidad de cada fuente de retroalimentación, y (ii) pruebas fuera de línea de pocas tomas en puntos de referencia de conocimiento intensivo. En línea, un despliegue industrial de varios meses muestra además mejoras sustanciales en la participación humana. Fuera de línea, DMA preserva la recuperación fundamental competitiva al tiempo que genera ganancias notables en el control de calidad conversacional (TriviaQA, HotpotQA). En conjunto, estos resultados posicionan a DMA como un enfoque basado en principios para la adaptación en tiempo real basada en retroalimentación en RAG sin sacrificar la capacidad básica.

Publicado originalmente en export.arxiv.org el 9 de noviembre de 2025.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Triificación: un planificador estratégico integral basado en árboles y verificación estructural para la verificación de hechos

Modelo de base generativo para registros de salud electrónicos estructurados y no estructurados

Peña junior, cazador de neutrinos

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido