En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="1"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Orquestación del agente consciente de la dificultad en flujos de trabajo alimentados por LLM

Orquestación del agente consciente de la dificultad en flujos de trabajo alimentados por LLM

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: Los sistemas de agente basados ​​en el modelo de lenguaje grande (LLM) han mostrado fuertes capacidades en varias tareas. Sin embargo, el ejemplo de los marcos de múltiples agentes a menudo dependen de los flujos de trabajo estáticos o de nivel de tareas, que sobreprocesan consultas simples o tienen un rendimiento inferior a los complejos, al tiempo que descuidan las compensaciones de rendimiento de eficiencia entre LLM heterogéneos. Para abordar estas limitaciones, proponemos la orquestación de agentes consciente de la dificultad (DAAO), un marco dinámico que adapta la profundidad del flujo de trabajo, la selección del operador y la asignación de LLM en función de la dificultad de cada consulta de entrada. DAAO comprende tres módulos interdependientes: un autoencoder variacional (VAE) para la estimación de dificultad, un asignador de operador modular y un enrutador LLM consciente de costo y rendimiento. Al aprovechar los LLM heterogéneos y adaptar dinámicamente los flujos de trabajo, DAAO permite estrategias de razonamiento de consulta y de grano fino. DAAO supera a los sistemas anteriores de múltiples agentes en precisión y eficiencia de inferencia en seis puntos de referencia. Lanzaremos nuestro código y los detalles de implementación en la publicación.

Publicado Originalme en export.arxiv.org El 15 de septiembre de 2025.
Ver Fuente Original

admin

Usuario de administración del sitio web