QuickMerge ++: Fusión de token rápido con Autorregressive Prior

Resumen: Quickmerge selecciona dinámicamente un número reducido de tokens basado en la magnitud de la norma de atención, guiado por un estimador de presupuesto basado en entropía. Para preservar la compatibilidad autorregresiva, presentamos un transformador liviano previo entrenado sobre la secuencia de token fusionado. Al combinar la estimación semántica de relevancia, los presupuestos de tokens flexibles y la alineación de AR, QuickMerge permite una generación precisa con menos tokens.
Evaluamos la cima rápida entre los dominios de la modalidad múltiple, lo que demuestra mejoras consistentes en las compensaciones de precisión de la cómputo. Específicamente, Quickmerge reduce los recuentos de tokens sustancialmente mientras coincide y excede el rendimiento de los tokenizadores aprendidos y las líneas de base de parches fijos.

Publicado Originalme en export.arxiv.org El 19 de agosto de 2025.
Ver Fuente Original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

Evaluación de la creatividad in silico: una revisión de expertos de las composiciones de ajedrez con IA

Salamander: Atribución de expresión matemática basada en Shapley y métrica para el razonamiento de la cadena de pensamiento

Reparación de funciones de recompensa con comentarios humanos para mitigar el pirateo de recompensas

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido