Resumen: En este artículo, presentamos un novedoso controlador en línea de caja negra que utiliza solo mediciones de extremo a extremo en segmentos cortos, sin instrumentación interna, y escalada para maximizar el buen rendimiento, definido como el rendimiento de las solicitudes que satisfacen el objetivo de nivel de servicio. Proporcionamos evidencia empírica de que este diseño está bien fundamentado. Utilizando este avance en LLM como ejemplo concreto, luego analizamos la importancia de integrar el rendimiento del sistema y las métricas de sostenibilidad en las hojas informativas para las organizaciones que adoptan sistemas de IA.
Publicado originalmente en export.arxiv.org el 12 de marzo de 2026.
Ver fuente original
