Resumen: Los agentes de GUI móviles impulsados por grandes modelos básicos permiten la ejecución autónoma de tareas, pero las actualizaciones frecuentes que alteran la apariencia de la interfaz de usuario y reorganizan los flujos de trabajo hacen que los agentes entrenados con datos históricos fallen. A pesar de los cambios superficiales, la semántica funcional y las intenciones de las tareas permanecen fundamentalmente estables. Sobre la base de esta información, presentamos MAGNET, un marco de agente adaptativo basado en memoria con memoria de doble nivel: memoria estacionaria que vincula diversas características visuales con una semántica funcional estable para una base de acción sólida y una memoria procedimental que captura intenciones de tareas estables en diferentes flujos de trabajo. Proponemos un mecanismo dinámico de evolución de la memoria que refina continuamente ambos recuerdos al priorizar el conocimiento al que se accede con frecuencia. Las evaluaciones comparativas en línea de AndroidWorld muestran mejoras sustanciales con respecto a las líneas de base, mientras que las evaluaciones comparativas fuera de línea confirman ganancias constantes bajo los cambios de distribución. Estos resultados validan que aprovechar estructuras estables a través de cambios de interfaz mejora el rendimiento y la generalización del agente en entornos de software en evolución.
Publicado originalmente en export.arxiv.org el 27 de enero de 2026.
Ver fuente original
