ARIADNE: Enrutamiento agnóstico para la selección dinámica del adaptador de tiempo de inferencia

Resumen: La creciente implementación del ajuste eficiente de parámetros (PEFT) ha llevado a ecosistemas modelo en los que una única red troncal se combina con muchos adaptadores especializados en tareas. En esta configuración, las consultas en tiempo de inferencia a menudo llegan sin etiquetas de tareas, lo que requiere que el sistema seleccione automáticamente el adaptador más apropiado de un grupo de adaptadores heterogéneo y en crecimiento. Los métodos de enrutamiento existentes dependen del acceso a los componentes internos del adaptador, como descomposiciones de peso o estadísticas basadas en gradientes, o requieren capacitación adicional del enrutador, lo que limita la escalabilidad y la portabilidad a medida que se agregan nuevos adaptadores. Presentamos ARIADNE, un marco de enrutamiento independiente del adaptador y sin capacitación para la selección dinámica de adaptadores en el momento de la inferencia. ARIADNE representa cada adaptador a través de un conjunto de centroides calculados a partir de incorporaciones de su conjunto de entrenamiento, capturando la distribución de datos asociada con ese adaptador. Dada una entrada sin etiquetar, selecciona un adaptador midiendo la proximidad a estos centroides en el espacio latente. Debido a que el enrutamiento se realiza completamente en el espacio de inserción de entrada, ARIADNE es compatible con métodos PEFT arbitrarios y no requiere modificaciones en los adaptadores ni en los procedimientos de capacitación. Evaluado principalmente con Llama 3.2 1B Instruct en 23 tareas diferentes de PNL, ARIADNE recupera el 97,44% del rendimiento límite superior. Al ampliarse a 44 tareas, logra una precisión de selección promedio del 89,7%, sin capacitación adicional ni acceso a los componentes internos del adaptador.

Publicado originalmente en export.arxiv.org el 17 de junio de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Guardia genérica ai en juego sigiloso con campos de potencial compuesto

Una medida de conflicto no basada en superposición para conjuntos de permutaciones aleatorias

DeepFact: puntos de referencia y agentes en evolución conjunta para la factualidad de la investigación profunda

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido