 Resumen: Los agentes basados en el modelo de lenguaje grande (LLM) han surgido como un nuevo paradigma que extiende las capacidades de LLMS más allá de la generación de texto a la interacción dinámica con entornos externos. Al integrar el razonamiento con percepción, memoria y uso de herramientas, los agentes se implementan cada vez más en diversos dominios como la navegación web y la robótica del hogar. Sin embargo, un desafío crítico radica en garantizar la generalización del agente: la capacidad de mantener un rendimiento constante en variadas instrucciones, tareas, entornos y dominios, especialmente aquellos más allá de los datos de ajuste de los agentes. A pesar del creciente interés, el concepto de generalización en los agentes basados en LLM sigue siendo poco definido, y faltan enfoques sistemáticos para medirlo y mejorarlo. En esta encuesta, proporcionamos la primera revisión integral de la generalización en agentes basados en LLM. Comenzamos enfatizando la importancia del agente generalizabilidad al apelar a las partes interesadas y aclarar los límites de la generalización del agente al situarlo dentro de una ontología jerárquica de tareas de dominio. Luego revisamos conjuntos de datos, dimensiones de evaluación y métricas, destacando sus limitaciones. A continuación, clasificamos los métodos para mejorar la generalización en tres grupos: Métodos para la Backbone LLM, para los componentes de los agentes y para sus interacciones. Además, presentamos la distinción entre marcos generalizables y agentes generalizables y describimos cómo los marcos generalizables pueden traducirse a la generalización a nivel de agente. Finalmente, identificamos desafíos críticos y direcciones futuras, incluido el desarrollo de marcos estandarizados, métricas basadas en la varianza y costos, y enfoques que integran innovaciones metodológicas con diseños a nivel de arquitectura. Al sintetizar el progreso y destacar las oportunidades, esta encuesta tiene como objetivo establecer una base para la investigación de principios sobre la construcción de agentes basados en LLM que se generalizan de manera confiable en diversas aplicaciones.
Resumen: Los agentes basados en el modelo de lenguaje grande (LLM) han surgido como un nuevo paradigma que extiende las capacidades de LLMS más allá de la generación de texto a la interacción dinámica con entornos externos. Al integrar el razonamiento con percepción, memoria y uso de herramientas, los agentes se implementan cada vez más en diversos dominios como la navegación web y la robótica del hogar. Sin embargo, un desafío crítico radica en garantizar la generalización del agente: la capacidad de mantener un rendimiento constante en variadas instrucciones, tareas, entornos y dominios, especialmente aquellos más allá de los datos de ajuste de los agentes. A pesar del creciente interés, el concepto de generalización en los agentes basados en LLM sigue siendo poco definido, y faltan enfoques sistemáticos para medirlo y mejorarlo. En esta encuesta, proporcionamos la primera revisión integral de la generalización en agentes basados en LLM. Comenzamos enfatizando la importancia del agente generalizabilidad al apelar a las partes interesadas y aclarar los límites de la generalización del agente al situarlo dentro de una ontología jerárquica de tareas de dominio. Luego revisamos conjuntos de datos, dimensiones de evaluación y métricas, destacando sus limitaciones. A continuación, clasificamos los métodos para mejorar la generalización en tres grupos: Métodos para la Backbone LLM, para los componentes de los agentes y para sus interacciones. Además, presentamos la distinción entre marcos generalizables y agentes generalizables y describimos cómo los marcos generalizables pueden traducirse a la generalización a nivel de agente. Finalmente, identificamos desafíos críticos y direcciones futuras, incluido el desarrollo de marcos estandarizados, métricas basadas en la varianza y costos, y enfoques que integran innovaciones metodológicas con diseños a nivel de arquitectura. Al sintetizar el progreso y destacar las oportunidades, esta encuesta tiene como objetivo establecer una base para la investigación de principios sobre la construcción de agentes basados en LLM que se generalizan de manera confiable en diversas aplicaciones.
Publicado Originalme en export.arxiv.org El 22 de septiembre de 2025.
Ver Fuente Original

 
 
			 
							 
							 
							