Resumen: Los sistemas de recuperación de agentes de generación aumentada (RAG) combinan búsqueda iterativa, indicaciones de planificación y backends de recuperación, pero las configuraciones implementadas imponen presupuestos explícitos en llamadas a herramientas y tokens de finalización. Presentamos un estudio de medición controlada de cómo la profundidad de la búsqueda, la estrategia de recuperación y el presupuesto de finalización afectan la precisión y el costo bajo restricciones fijas. Utilizando la búsqueda agente con restricciones de presupuesto (BCAS), un instrumento de evaluación independiente del modelo que muestra el presupuesto restante y el uso de herramientas de puertas, realizamos comparaciones entre seis LLM y tres puntos de referencia de respuesta a preguntas. En todos los modelos y conjuntos de datos, la precisión mejora con búsquedas adicionales de hasta un límite pequeño, la recuperación léxica híbrida y densa con una reclasificación ligera produce las mayores ganancias promedio en nuestra cuadrícula de ablación, y los presupuestos de finalización más grandes son más útiles en la síntesis estilo HotpotQA. Estos resultados brindan una guía práctica para configurar canales de recuperación de agentes presupuestados y están acompañados de indicaciones reproducibles y configuraciones de evaluación.
Publicado originalmente en export.arxiv.org el 10 de marzo de 2026.
Ver fuente original
