Resumen: Los agentes del Large Language Model (LLM) están surgiendo para transformar la vida diaria. Sin embargo, los agentes LLM existentes siguen principalmente un paradigma reactivo, confiando en instrucciones explícitas del usuario para iniciar los servicios, lo que aumenta la carga de trabajo tanto física como cognitiva. En este artículo, proponemos ProAgent, el primer sistema de agente proactivo de extremo a extremo que aprovecha contextos sensoriales masivos y razonamiento LLM para brindar asistencia proactiva. ProAgent primero emplea un enfoque de extracción de contexto orientado proactivo con percepción escalonada bajo demanda para detectar continuamente el entorno y derivar contextos jerárquicos que incorporan señales tanto sensoriales como personales. Luego, ProAgent adopta un razonamiento proactivo consciente del contexto para asignar estos contextos a las necesidades del usuario y las llamadas de herramientas, brindando asistencia proactiva. Implementamos ProAgent en gafas de Realidad Aumentada (AR) con un servidor perimetral y lo evaluamos exhaustivamente en un banco de pruebas del mundo real, un conjunto de datos públicos y mediante un estudio de usuarios. Los resultados muestran que ProAgent logra una precisión de predicción proactiva hasta un 33,4 % mayor, una puntuación F1 de llamada de herramientas un 16,8 % mayor y mejoras notables en la satisfacción del usuario con respecto a las bases de referencia de última generación, lo que marca un paso significativo hacia los asistentes proactivos. Hay un vídeo de demostración de ProAgent disponible en esta URL https.
Publicado originalmente en export.arxiv.org el 8 de diciembre de 2025.
Ver fuente original
