Resumen: Los agentes impulsados por LLM satisfacen las solicitudes de los usuarios interactuando con entornos, consultando datos e invocando herramientas en un proceso de varios turnos. Sin embargo, la mayoría de los puntos de referencia existentes suponen entornos estáticos con esquemas y conjuntos de herramientas fijos, descuidando la naturaleza evolutiva del mundo real y la solidez de los agentes ante los cambios ambientales. En este artículo, estudiamos un problema crucial: cómo hacer evolucionar el entorno de los agentes de una manera escalable y controlable, evaluando así mejor la adaptabilidad de los agentes a la dinámica del mundo real. Proponemos ProEvolve, un marco basado en gráficos que hace programable la evolución del entorno. En esencia, un gráfico relacional escrito proporciona una representación unificada y explícita del entorno: datos, herramientas y esquema. Según este formalismo, agregar, eliminar o modificar capacidades se expresa como transformaciones de gráficos que propagan de manera coherente las actualizaciones entre herramientas, esquemas y acceso a datos. Sobre la base de esto, ProEvolve puede (1) programar la dinámica evolutiva como transformaciones de gráficos para generar entornos automáticamente y (2) crear instancias de entornos limitados de tareas mediante muestreo y programación de subgrafos. Validamos ProEvolve mediante la evolución de un entorno único a 200 entornos y 3000 espacios aislados de tareas, y comparamos a los agentes representativos en consecuencia.
Publicado originalmente en export.arxiv.org el 8 de marzo de 2026.
Ver fuente original
