CollectiveKV: Desacoplar y compartir información colaborativa en recomendación secuencial
Resumen: Los modelos de recomendación secuencial se utilizan ampliamente en aplicaciones, pero enfrentan estrictos requisitos de latencia. Los modelos convencionales aprovechan el mecanismo de atención de Transformer para mejorar el rendimiento, pero su complejidad computacional crece con la longitud de la secuencia, lo que genera un desafío de latencia para secuencias largas.
Leer más →