Eliminación de ruido de comentarios implícitos para la recomendación de arranque en frío

Resumen: La retroalimentación implícita se usa ampliamente en los sistemas de recomendación debido a su accesibilidad y generalidad, sin embargo, generalmente presenta muestras ruidosas (por ejemplo, clickbait, sesgo de posición). Mientras tanto, los recomendadores inevitablemente enfrentan el problema del arranque en frío de los artículos debido a la afluencia continua de nuevos artículos. Identificamos que los artículos fríos son más propensos a generar muestras ruidosas debido a los factores antes mencionados, y los investigadores a menudo pasan por alto la importancia de eliminar la retroalimentación implícita de ruido para los artículos fríos. Los estudios de eliminación de ruido anteriores generalmente identifican muestras ruidosas basándose en patrones heurísticos, como valores de pérdida más altos, y mitigan el ruido mediante la selección de muestras o la reponderación. Sin embargo, estos métodos tienen una adaptabilidad limitada y son ineficaces en escenarios de arranque en frío. Para lograr la retroalimentación implícita de eliminación de ruido para la recomendación de arranque en frío, proponemos un método de eliminación de ruido independiente del modelo llamado DIF. Primero, las preferencias del usuario por el contenido permanecen estables, lo que nos permite inferir pseudoetiquetas que indican si un usuario está interesado en un elemento frío a través de elementos cálidos de contenido similar. Además, para mejorar la precisión de las pseudoetiquetas, modelamos la confianza de las pseudoetiquetas en función de la similitud de contenido entre el elemento frío y el elemento cálido, y luego agregamos múltiples pseudoetiquetas para cada muestra. Finalmente, estimamos explícitamente la incertidumbre de la etiqueta de muestra ruidosa considerando su entropía relativa y el estado de inicio en frío del elemento, lo que guía de forma adaptativa el papel de las pseudoetiquetas para corregir las etiquetas ruidosas a nivel de muestra. La superioridad de DIF está respaldada tanto por una justificación teórica como por extensos experimentos en conjuntos de datos del mundo real. El método se ha implementado en una aplicación de vídeos cortos a escala de mil millones de usuarios, Kuaishou, y ha mejorado significativamente varias métricas comerciales en escenarios de arranque en frío.

Publicado originalmente en export.arxiv.org el 18 de junio de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

El descuento de la factura de energía de £ 250 no gana sobre los locales opuestos a la infraestructura energética cercana

La trampa del razonamiento: el razonamiento lógico como vía mecanicista hacia la conciencia situacional

Descubrimiento causal no monótono con mapas cognitivos difusos de Kolmogorov-Arnold

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido