En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Cuantificación de la precisión y el impacto de los costos de las decisiones de diseño en la búsqueda de LLM agente con presupuesto limitado

Cuantificación de la precisión y el impacto de los costos de las decisiones de diseño en la búsqueda de LLM agente con presupuesto limitado

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Los sistemas de recuperación de agentes de generación aumentada (RAG) combinan búsqueda iterativa, indicaciones de planificación y backends de recuperación, pero las configuraciones implementadas imponen presupuestos explícitos en llamadas a herramientas y tokens de finalización. Presentamos un estudio de medición controlada de cómo la profundidad de la búsqueda, la estrategia de recuperación y el presupuesto de finalización afectan la precisión y el costo bajo restricciones fijas. Utilizando la búsqueda agente con restricciones de presupuesto (BCAS), un instrumento de evaluación independiente del modelo que muestra el presupuesto restante y el uso de herramientas de puertas, realizamos comparaciones entre seis LLM y tres puntos de referencia de respuesta a preguntas. En todos los modelos y conjuntos de datos, la precisión mejora con búsquedas adicionales de hasta un límite pequeño, la recuperación léxica híbrida y densa con una reclasificación ligera produce las mayores ganancias promedio en nuestra cuadrícula de ablación, y los presupuestos de finalización más grandes son más útiles en la síntesis estilo HotpotQA. Estos resultados brindan una guía práctica para configurar canales de recuperación de agentes presupuestados y están acompañados de indicaciones reproducibles y configuraciones de evaluación.

Publicado originalmente en export.arxiv.org el 10 de marzo de 2026.
Ver fuente original

admin

Usuario de administración del sitio web