Memoria compilada: no más información, sino instrucciones más precisas para agentes lingüísticos

Resumen: Los sistemas de memoria existentes para agentes lingüísticos abordan la gestión de la memoria: cómo recuperar y paginar más información dentro de un presupuesto contextual. Abordamos un problema complementario: la utilidad de la memoria: qué experiencia vale la pena conservar y cómo debería cambiar el comportamiento de los agentes. Presentamos Atlas, un núcleo de memoria que compila la experiencia de tareas acumulada en la estructura de instrucciones de un agente, sin ajustes, RAG ni intervención humana. La memoria es destilación, no almacenamiento; la entrega es reescritura de instrucciones, no inyección de contexto. Los hechos extraídos de los fracasos y éxitos de los agentes se verifican a través de una puerta de promoción de tres pasos y se entregan reescribiendo el mensaje del sistema del agente con subviñetas aprendidas. En el análisis de contratos CUAD, el mensaje evolucionado mejora el nivel de token F1 de GPT-4o en $+8,7$pp y la precisión en $+12,5$pp. En el control de calidad de múltiples saltos de HotpotQA, la F1 conjunta mejora $+3.16$pp. Una ablación aísla la propiedad que define el mecanismo: la restricción de la señal de entrenamiento: el mensaje evolucionado aprende exactamente lo que se le enseña, y nada más. Aplicado a Claude Sonnet~4.5 utilizando el mismo mensaje evolucionado (compilado a partir de errores GPT-40, sin cambios), el F1 conjunto mejora $+2.31$pp, con ganancias concentrándose donde la línea de base más fuerte de Claude deja más espacio, lo que confirma que el conocimiento compilado tiene forma de tarea, no de modelo.

Publicado originalmente en export.arxiv.org el 17 de marzo de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Porque tenemos LLM, podemos y debemos perseguir la interpretabilidad de los agentes

Inteligencia abundante y demanda deficiente: una prueba de estrés macrofinanciero para la rápida adopción de la IA

Hacia una ciencia de la confiabilidad de los agentes de IA

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido