Enrutamiento LLM de múltiples agentes eficiente e interpretable mediante la optimización de colonias de hormigas

Resumen: Los sistemas multiagente (MAS) impulsados por modelos de lenguaje grande (LLM) han demostrado una gran capacidad en razonamiento complejo y uso de herramientas, y los grupos de agentes heterogéneos amplían aún más el espacio de compensación entre calidad y costo. A pesar de estos avances, la implementación en el mundo real a menudo se ve limitada por un alto costo de inferencia, latencia y transparencia limitada, lo que dificulta el enrutamiento escalable y eficiente. Las estrategias de enrutamiento existentes generalmente se basan en costosos selectores basados en LLM o políticas estáticas, y ofrecen una controlabilidad limitada para el enrutamiento semántico bajo cargas dinámicas e intenciones mixtas, lo que a menudo resulta en un rendimiento inestable y una utilización ineficiente de los recursos. Para abordar estas limitaciones, proponemos AMRO-S, un marco de enrutamiento eficiente e interpretable para sistemas multiagente (MAS). AMRO-S modela el enrutamiento MAS como un problema de selección de ruta condicionado semántica, mejorando el rendimiento del enrutamiento a través de tres mecanismos clave: primero, aprovecha un modelo de lenguaje pequeño supervisado y afinado (SFT) para la inferencia de intenciones, proporcionando una interfaz semántica de baja sobrecarga para cada consulta; en segundo lugar, descompone la memoria de enrutamiento en especialistas en feromonas para tareas específicas, lo que reduce la interferencia entre tareas y optimiza la selección de rutas bajo cargas de trabajo mixtas; Finalmente, emplea un mecanismo de actualización asincrónica dependiente de la calidad para desacoplar la inferencia del aprendizaje, optimizando el enrutamiento sin aumentar la latencia. Amplios experimentos en cinco puntos de referencia públicos y pruebas de estrés de alta concurrencia demuestran que AMRO-S mejora consistentemente la relación calidad-costo sobre bases de enrutamiento sólidas, al tiempo que proporciona evidencia de enrutamiento rastreable a través de patrones estructurados de feromonas.

Publicado originalmente en export.arxiv.org el 15 de marzo de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Predicción eficiente de Aircraft en tiempo real ETA a través del transformador de tokenización de características

La descarga: chatbots para la salud y luchas en EE.UU. por la regulación de la IA

Sesión informativa en línea: Apoyo del EIC a las pymes y empresas emergentes tecnológicas ucranianas

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido