Resumen: Los sistemas de agente basados en el modelo de lenguaje grande (LLM) han mostrado fuertes capacidades en varias tareas. Sin embargo, el ejemplo de los marcos de múltiples agentes a menudo dependen de los flujos de trabajo estáticos o de nivel de tareas, que sobreprocesan consultas simples o tienen un rendimiento inferior a los complejos, al tiempo que descuidan las compensaciones de rendimiento de eficiencia entre LLM heterogéneos. Para abordar estas limitaciones, proponemos la orquestación de agentes consciente de la dificultad (DAAO), un marco dinámico que adapta la profundidad del flujo de trabajo, la selección del operador y la asignación de LLM en función de la dificultad de cada consulta de entrada. DAAO comprende tres módulos interdependientes: un autoencoder variacional (VAE) para la estimación de dificultad, un asignador de operador modular y un enrutador LLM consciente de costo y rendimiento. Al aprovechar los LLM heterogéneos y adaptar dinámicamente los flujos de trabajo, DAAO permite estrategias de razonamiento de consulta y de grano fino. DAAO supera a los sistemas anteriores de múltiples agentes en precisión y eficiencia de inferencia en seis puntos de referencia. Lanzaremos nuestro código y los detalles de implementación en la publicación.
Publicado Originalme en export.arxiv.org El 15 de septiembre de 2025.
Ver Fuente Original