En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Memoria compilada: no más información, sino instrucciones más precisas para agentes lingüísticos

Memoria compilada: no más información, sino instrucciones más precisas para agentes lingüísticos

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Los sistemas de memoria existentes para agentes lingüísticos abordan la gestión de la memoria: cómo recuperar y paginar más información dentro de un presupuesto contextual. Abordamos un problema complementario: la utilidad de la memoria: qué experiencia vale la pena conservar y cómo debería cambiar el comportamiento de los agentes. Presentamos Atlas, un núcleo de memoria que compila la experiencia de tareas acumulada en la estructura de instrucciones de un agente, sin ajustes, RAG ni intervención humana. La memoria es destilación, no almacenamiento; la entrega es reescritura de instrucciones, no inyección de contexto. Los hechos extraídos de los fracasos y éxitos de los agentes se verifican a través de una puerta de promoción de tres pasos y se entregan reescribiendo el mensaje del sistema del agente con subviñetas aprendidas. En el análisis de contratos CUAD, el mensaje evolucionado mejora el nivel de token F1 de GPT-4o en $+8,7$pp y la precisión en $+12,5$pp. En el control de calidad de múltiples saltos de HotpotQA, la F1 conjunta mejora $+3.16$pp. Una ablación aísla la propiedad que define el mecanismo: la restricción de la señal de entrenamiento: el mensaje evolucionado aprende exactamente lo que se le enseña, y nada más. Aplicado a Claude Sonnet~4.5 utilizando el mismo mensaje evolucionado (compilado a partir de errores GPT-40, sin cambios), el F1 conjunto mejora $+2.31$pp, con ganancias concentrándose donde la línea de base más fuerte de Claude deja más espacio, lo que confirma que el conocimiento compilado tiene forma de tarea, no de modelo.

Publicado originalmente en export.arxiv.org el 17 de marzo de 2026.
Ver fuente original

admin

Usuario de administración del sitio web