En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->El mundo no se quedará quieto: evolución programable para los puntos de referencia de los agentes

El mundo no se quedará quieto: evolución programable para los puntos de referencia de los agentes

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Los agentes impulsados ​​por LLM satisfacen las solicitudes de los usuarios interactuando con entornos, consultando datos e invocando herramientas en un proceso de varios turnos. Sin embargo, la mayoría de los puntos de referencia existentes suponen entornos estáticos con esquemas y conjuntos de herramientas fijos, descuidando la naturaleza evolutiva del mundo real y la solidez de los agentes ante los cambios ambientales. En este artículo, estudiamos un problema crucial: cómo hacer evolucionar el entorno de los agentes de una manera escalable y controlable, evaluando así mejor la adaptabilidad de los agentes a la dinámica del mundo real. Proponemos ProEvolve, un marco basado en gráficos que hace programable la evolución del entorno. En esencia, un gráfico relacional escrito proporciona una representación unificada y explícita del entorno: datos, herramientas y esquema. Según este formalismo, agregar, eliminar o modificar capacidades se expresa como transformaciones de gráficos que propagan de manera coherente las actualizaciones entre herramientas, esquemas y acceso a datos. Sobre la base de esto, ProEvolve puede (1) programar la dinámica evolutiva como transformaciones de gráficos para generar entornos automáticamente y (2) crear instancias de entornos limitados de tareas mediante muestreo y programación de subgrafos. Validamos ProEvolve mediante la evolución de un entorno único a 200 entornos y 3000 espacios aislados de tareas, y comparamos a los agentes representativos en consecuencia.

Publicado originalmente en export.arxiv.org el 8 de marzo de 2026.
Ver fuente original

admin

Usuario de administración del sitio web