Resumen: Los agentes móviles han avanzado hacia la automatización confiable de los teléfonos inteligentes, pero el rendimiento en aplicaciones complejas sigue limitado por un conocimiento incompleto y una generalización débil a entornos invisibles. Introducimos un marco de recuperación de conocimiento impulsado por la curiosidad que formaliza la incertidumbre durante la ejecución como una puntuación de curiosidad. Cuando esta puntuación supera un umbral, el sistema recupera información externa de la documentación, los repositorios de códigos y las trayectorias históricas. El contenido recuperado se organiza en AppCards estructuradas, que codifican semántica funcional, convenciones de parámetros, asignaciones de interfaz y patrones de interacción. Durante la ejecución, un agente mejorado integra selectivamente AppCards relevantes en su proceso de razonamiento, compensando así los puntos ciegos del conocimiento y mejorando la confiabilidad de la planificación. La evaluación en el benchmark AndroidWorld muestra mejoras consistentes en todos los backbones, con una ganancia promedio de seis puntos porcentuales y una nueva tasa de éxito de vanguardia del 88,8% cuando se combina con GPT-5. El análisis indica que las AppCards son particularmente efectivas para tareas de múltiples pasos y entre aplicaciones, mientras que las mejoras dependen del modelo principal. Los estudios de caso confirman además que las AppCards reducen la ambigüedad, acortan la exploración y respaldan trayectorias de ejecución estables. Las trayectorias de tareas están disponibles públicamente en esta URL https.
Publicado originalmente en export.arxiv.org el 27 de enero de 2026.
Ver fuente original
