Resumen: Los agentes basados en el modelo de lenguaje grande (LLM) han demostrado capacidades notables para abordar tareas complejas, permitiendo así la recuperación de información más avanzada y el apoyo a los comportamientos más profundos y más sofisticados de búsqueda de información humana. Sin embargo, la mayoría de los agentes existentes operan de manera puramente reactiva, respondiendo pasivamente a las instrucciones del usuario, lo que limita significativamente su efectividad y eficiencia como plataformas de uso general para la adquisición de información. Para superar esta limitación, este documento propone AppAgent-Pro, un sistema de agente de GUI proactivo que integra activamente la información de dominios múltiples basados en las instrucciones del usuario. Este enfoque permite que el sistema anticipe de manera proactiva las necesidades subyacentes de los usuarios y realice una minería de información multidominio en profundidad, lo que facilita la adquisición de información más completa e inteligente. Appagent-Pro tiene el potencial de redefinir fundamentalmente la adquisición de información en la vida diaria, lo que lleva a un profundo impacto en la sociedad humana. Nuestro código está disponible en: esta URL HTTPS. Nuestro código está disponible en: esta URL HTTPS. El video de demostración se puede encontrar en: esta URL HTTPS.
Publicado Originalme en export.arxiv.org El 26 de agosto de 2025.
Ver Fuente Original