En este momento estás viendo 
<span class="bsf-rt-reading-time"><span class="bsf-rt-display-label" prefix="Tiempo de lectura"></span> <span class="bsf-rt-display-time" reading_time="2"></span> <span class="bsf-rt-display-postfix" postfix="mins"></span></span><!-- .bsf-rt-reading-time -->Detección multimodal de reseñas falsas utilizando BERT y ResNet-50

Detección multimodal de reseñas falsas utilizando BERT y ResNet-50

  • Autor de la entrada:
  • Categoría de la entrada:Noticias externas

Resumen:En el panorama actual del comercio digital, las reseñas generadas por los usuarios desempeñan un papel fundamental en la configuración del comportamiento del consumidor, la reputación del producto y la credibilidad de la plataforma. Sin embargo, la proliferación de reseñas falsas o engañosas, a menudo generadas por bots, agentes pagos o modelos de inteligencia artificial, plantea una amenaza importante a la confianza y la transparencia dentro de los ecosistemas de reseñas. Los modelos de detección existentes se basan principalmente en datos unimodales, típicamente textuales, y por lo tanto no logran capturar inconsistencias semánticas entre diferentes modalidades. Para abordar esta brecha, se propone un marco robusto de detección de reseñas falsas multimodal, que integra características textuales codificadas con BERT y características visuales extraídas con ResNet-50. Estas representaciones se fusionan a través de un encabezado de clasificación para predecir conjuntamente la autenticidad de la revisión. Para respaldar este enfoque, se utilizó un conjunto de datos curado que comprende 21,142 imágenes cargadas por usuarios en los dominios de entrega de alimentos, hotelería y comercio electrónico. Los resultados experimentales indican que el modelo multimodal supera las líneas de base unimodales, logrando una puntuación F1 de 0,934 en el conjunto de prueba. Además, la matriz de confusión y el análisis cualitativo resaltan la capacidad del modelo para detectar inconsistencias sutiles, como elogios textuales exagerados combinados con imágenes no relacionadas o de baja calidad, que comúnmente se encuentran en contenido engañoso. Este estudio demuestra el papel fundamental del aprendizaje multimodal en la salvaguardia de la confianza digital y ofrece una solución escalable para la moderación de contenido en varias plataformas en línea.

Publicado originalmente en export.arxiv.org el 4 de noviembre de 2025.
Ver fuente original

admin

Usuario de administración del sitio web