En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->¿Revisaste el bolsillo correcto? Enrutamiento de almacenamiento económico para agentes con memoria aumentada

¿Revisaste el bolsillo correcto? Enrutamiento de almacenamiento económico para agentes con memoria aumentada

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Los agentes con memoria aumentada mantienen múltiples almacenes especializados, pero la mayoría de los sistemas recuperan de todos los almacenes para cada consulta, lo que aumenta el costo e introduce un contexto irrelevante. Formulamos la recuperación de memoria como un problema de enrutamiento del almacén y la evaluamos utilizando métricas de cobertura, coincidencia exacta y eficiencia de token. En la respuesta a preguntas posteriores, un enrutador Oracle logra una mayor precisión y utiliza sustancialmente menos tokens de contexto en comparación con la recuperación uniforme, lo que demuestra que la recuperación selectiva mejora tanto la eficiencia como el rendimiento. Nuestros resultados muestran que las decisiones de enrutamiento son un componente de primera clase del diseño de agentes con memoria aumentada y motivan mecanismos de enrutamiento aprendidos para sistemas escalables de múltiples tiendas. Además, formalizamos la selección de tiendas como un problema de decisión sensible al costo que intercambia la precisión de la respuesta con el costo de recuperación, proporcionando una interpretación basada en principios de las políticas de enrutamiento.

Publicado originalmente en export.arxiv.org el 17 de marzo de 2026.
Ver fuente original

admin

Usuario de administración del sitio web