Resumen: Los modelos a gran escala suelen adaptarse para satisfacer los diversos requisitos de los propietarios y usuarios de modelos. Sin embargo, mantener múltiples versiones especializadas del modelo es ineficiente. En respuesta, proponemos AIM, un nuevo paradigma de modulación de modelos que permite que un solo modelo exhiba diversos comportamientos para cumplir con los requisitos finales específicos. AIM habilita dos modos de modulación clave: modulaciones de utilidad y de enfoque. El primero proporciona a los propietarios de modelos un control dinámico sobre la calidad de la salida para ofrecer distintos niveles de utilidad, y el segundo ofrece a los usuarios un control preciso para cambiar las características de entrada enfocadas del modelo. AIM introduce una estrategia de redistribución de logits que opera de manera independiente de los datos de capacitación y sin reentrenamiento. Establecemos una base formal para garantizar la capacidad de regulación de AIM, basada en las propiedades estadísticas de los logits que se ordenan mediante distribuciones de probabilidad conjuntas. Nuestra evaluación confirma la practicidad y versatilidad de AIM para la modulación del modelo Al, con tareas que abarcan clasificación de imágenes, segmentación semántica y generación de texto, y arquitecturas predominantes que incluyen ResNet, SegFormer y Llama.
Publicado originalmente en export.arxiv.org el 15 de marzo de 2026.
Ver fuente original
