El mundo no se quedará quieto: evolución programable para los puntos de referencia de los agentes

Resumen: Los agentes impulsados por LLM satisfacen las solicitudes de los usuarios interactuando con entornos, consultando datos e invocando herramientas en un proceso de varios turnos. Sin embargo, la mayoría de los puntos de referencia existentes suponen entornos estáticos con esquemas y conjuntos de herramientas fijos, descuidando la naturaleza evolutiva del mundo real y la solidez de los agentes ante los cambios ambientales. En este artículo, estudiamos un problema crucial: cómo hacer evolucionar el entorno de los agentes de una manera escalable y controlable, evaluando así mejor la adaptabilidad de los agentes a la dinámica del mundo real. Proponemos ProEvolve, un marco basado en gráficos que hace programable la evolución del entorno. En esencia, un gráfico relacional escrito proporciona una representación unificada y explícita del entorno: datos, herramientas y esquema. Según este formalismo, agregar, eliminar o modificar capacidades se expresa como transformaciones de gráficos que propagan de manera coherente las actualizaciones entre herramientas, esquemas y acceso a datos. Sobre la base de esto, ProEvolve puede (1) programar la dinámica evolutiva como transformaciones de gráficos para generar entornos automáticamente y (2) crear instancias de entornos limitados de tareas mediante muestreo y programación de subgrafos. Validamos ProEvolve mediante la evolución de un entorno único a 200 entornos y 3000 espacios aislados de tareas, y comparamos a los agentes representativos en consecuencia.

Publicado originalmente en export.arxiv.org el 8 de marzo de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

La descarga: iglesias en la era de la IA y cómo ejecutar un LLM en casa

LocationAgent: un agente jerárquico para la geolocalización de imágenes mediante estrategia de desacoplamiento y evidencia del conocimiento paramétrico

Extender FKG.in: hacia una red de trazabilidad de reclamo de alimentos

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido