En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="2"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Generalización de agentes basados ​​en modelos de idiomas grandes: una encuesta integral

Generalización de agentes basados ​​en modelos de idiomas grandes: una encuesta integral

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Los agentes basados ​​en el modelo de lenguaje grande (LLM) han surgido como un nuevo paradigma que extiende las capacidades de LLMS más allá de la generación de texto a la interacción dinámica con entornos externos. Al integrar el razonamiento con percepción, memoria y uso de herramientas, los agentes se implementan cada vez más en diversos dominios como la navegación web y la robótica del hogar. Sin embargo, un desafío crítico radica en garantizar la generalización del agente: la capacidad de mantener un rendimiento constante en variadas instrucciones, tareas, entornos y dominios, especialmente aquellos más allá de los datos de ajuste de los agentes. A pesar del creciente interés, el concepto de generalización en los agentes basados ​​en LLM sigue siendo poco definido, y faltan enfoques sistemáticos para medirlo y mejorarlo. En esta encuesta, proporcionamos la primera revisión integral de la generalización en agentes basados ​​en LLM. Comenzamos enfatizando la importancia del agente generalizabilidad al apelar a las partes interesadas y aclarar los límites de la generalización del agente al situarlo dentro de una ontología jerárquica de tareas de dominio. Luego revisamos conjuntos de datos, dimensiones de evaluación y métricas, destacando sus limitaciones. A continuación, clasificamos los métodos para mejorar la generalización en tres grupos: Métodos para la Backbone LLM, para los componentes de los agentes y para sus interacciones. Además, presentamos la distinción entre marcos generalizables y agentes generalizables y describimos cómo los marcos generalizables pueden traducirse a la generalización a nivel de agente. Finalmente, identificamos desafíos críticos y direcciones futuras, incluido el desarrollo de marcos estandarizados, métricas basadas en la varianza y costos, y enfoques que integran innovaciones metodológicas con diseños a nivel de arquitectura. Al sintetizar el progreso y destacar las oportunidades, esta encuesta tiene como objetivo establecer una base para la investigación de principios sobre la construcción de agentes basados ​​en LLM que se generalizan de manera confiable en diversas aplicaciones.

Publicado Originalme en export.arxiv.org El 22 de septiembre de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web