Orquestación del agente consciente de la dificultad en flujos de trabajo alimentados por LLM

Resumen: Los sistemas de agente basados en el modelo de lenguaje grande (LLM) han mostrado fuertes capacidades en varias tareas. Sin embargo, el ejemplo de los marcos de múltiples agentes a menudo dependen de los flujos de trabajo estáticos o de nivel de tareas, que sobreprocesan consultas simples o tienen un rendimiento inferior a los complejos, al tiempo que descuidan las compensaciones de rendimiento de eficiencia entre LLM heterogéneos. Para abordar estas limitaciones, proponemos la orquestación de agentes consciente de la dificultad (DAAO), un marco dinámico que adapta la profundidad del flujo de trabajo, la selección del operador y la asignación de LLM en función de la dificultad de cada consulta de entrada. DAAO comprende tres módulos interdependientes: un autoencoder variacional (VAE) para la estimación de dificultad, un asignador de operador modular y un enrutador LLM consciente de costo y rendimiento. Al aprovechar los LLM heterogéneos y adaptar dinámicamente los flujos de trabajo, DAAO permite estrategias de razonamiento de consulta y de grano fino. DAAO supera a los sistemas anteriores de múltiples agentes en precisión y eficiencia de inferencia en seis puntos de referencia. Lanzaremos nuestro código y los detalles de implementación en la publicación.

Publicado Originalme en export.arxiv.org El 15 de septiembre de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Jornada Oportunidades en Industria en Horizonte Europa. Castilla y León

MCP-Universe: Benchmarking Modelos de idiomas grandes con servidores de protocolo de contexto del modelo de mundo real

Jeff Tao: Ayer, TdenGine lanzó oficialmente TDengine IDMP, una plataforma de gestión de datos industriales nativos de IA.

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido