En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="2"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->ARIADNE: Enrutamiento agnóstico para la selección dinámica del adaptador de tiempo de inferencia

ARIADNE: Enrutamiento agnóstico para la selección dinámica del adaptador de tiempo de inferencia

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen: La creciente implementación del ajuste eficiente de parámetros (PEFT) ha llevado a ecosistemas modelo en los que una única red troncal se combina con muchos adaptadores especializados en tareas. En esta configuración, las consultas en tiempo de inferencia a menudo llegan sin etiquetas de tareas, lo que requiere que el sistema seleccione automáticamente el adaptador más apropiado de un grupo de adaptadores heterogéneo y en crecimiento. Los métodos de enrutamiento existentes dependen del acceso a los componentes internos del adaptador, como descomposiciones de peso o estadísticas basadas en gradientes, o requieren capacitación adicional del enrutador, lo que limita la escalabilidad y la portabilidad a medida que se agregan nuevos adaptadores. Presentamos ARIADNE, un marco de enrutamiento independiente del adaptador y sin capacitación para la selección dinámica de adaptadores en el momento de la inferencia. ARIADNE representa cada adaptador a través de un conjunto de centroides calculados a partir de incorporaciones de su conjunto de entrenamiento, capturando la distribución de datos asociada con ese adaptador. Dada una entrada sin etiquetar, selecciona un adaptador midiendo la proximidad a estos centroides en el espacio latente. Debido a que el enrutamiento se realiza completamente en el espacio de inserción de entrada, ARIADNE es compatible con métodos PEFT arbitrarios y no requiere modificaciones en los adaptadores ni en los procedimientos de capacitación. Evaluado principalmente con Llama 3.2 1B Instruct en 23 tareas diferentes de PNL, ARIADNE recupera el 97,44% del rendimiento límite superior. Al ampliarse a 44 tareas, logra una precisión de selección promedio del 89,7%, sin capacitación adicional ni acceso a los componentes internos del adaptador.

Publicado originalmente en export.arxiv.org el 17 de junio de 2026.
Ver fuente original

admin

Usuario de administración del sitio web