Enrutamiento de modelos explicables para flujos de trabajo agentes

Resumen: Los flujos de trabajo agentes modernos descomponen tareas complejas en subtareas especializadas y las dirigen a diversos modelos para minimizar costos sin sacrificar la calidad. Sin embargo, las arquitecturas de enrutamiento actuales se centran exclusivamente en la optimización del rendimiento, dejando sin registrar las compensaciones subyacentes entre la capacidad del modelo y el costo. Sin una justificación clara, los desarrolladores no pueden distinguir entre eficiencia inteligente (usando modelos especializados para tareas apropiadas) y fallas latentes causadas por la selección de modelos basada en el presupuesto. Presentamos Topaz, un marco que introduce la auditabilidad formal al enrutamiento agente. Topaz reemplaza las asignaciones de modelos silenciosos con un enrutador inherentemente interpretable que incorpora tres componentes: (i) creación de perfiles basados en habilidades que sintetiza el rendimiento a través de diversos puntos de referencia en perfiles de capacidad granulares (ii) algoritmos de enrutamiento totalmente rastreables que utilizan optimización multiobjetivo y basada en el presupuesto para producir rastros claros de cómo se compararon las puntuaciones de habilidades con los costos, y (iii) explicaciones orientadas al desarrollador que traducen estos rastros al lenguaje natural, lo que permite a los usuarios auditar la lógica del sistema y ajustar iterativamente el compensación costo-calidad. Al hacer que las decisiones de enrutamiento sean interpretables, Topaz permite a los usuarios comprender, confiar y dirigir de manera significativa los sistemas agentes enrutados.

Publicado originalmente en export.arxiv.org el 6 de abril de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

MITS: Razonamiento de búsqueda de árbol mejorado para LLM a través de información mutua puntual

Mejora de los flujos de trabajo de migración de VMware con IA agente

Cómo la IA está convirtiendo el conflicto de Irán en un teatro

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido