Resumen: Los flujos de trabajo agentes modernos descomponen tareas complejas en subtareas especializadas y las dirigen a diversos modelos para minimizar costos sin sacrificar la calidad. Sin embargo, las arquitecturas de enrutamiento actuales se centran exclusivamente en la optimización del rendimiento, dejando sin registrar las compensaciones subyacentes entre la capacidad del modelo y el costo. Sin una justificación clara, los desarrolladores no pueden distinguir entre eficiencia inteligente (usando modelos especializados para tareas apropiadas) y fallas latentes causadas por la selección de modelos basada en el presupuesto. Presentamos Topaz, un marco que introduce la auditabilidad formal al enrutamiento agente. Topaz reemplaza las asignaciones de modelos silenciosos con un enrutador inherentemente interpretable que incorpora tres componentes: (i) creación de perfiles basados en habilidades que sintetiza el rendimiento a través de diversos puntos de referencia en perfiles de capacidad granulares (ii) algoritmos de enrutamiento totalmente rastreables que utilizan optimización multiobjetivo y basada en el presupuesto para producir rastros claros de cómo se compararon las puntuaciones de habilidades con los costos, y (iii) explicaciones orientadas al desarrollador que traducen estos rastros al lenguaje natural, lo que permite a los usuarios auditar la lógica del sistema y ajustar iterativamente el compensación costo-calidad. Al hacer que las decisiones de enrutamiento sean interpretables, Topaz permite a los usuarios comprender, confiar y dirigir de manera significativa los sistemas agentes enrutados.
Publicado originalmente en export.arxiv.org el 6 de abril de 2026.
Ver fuente original
