Resumen: Proponemos una tubería automatizada para realizar revisiones de literatura utilizando similitud semántica. A diferencia de los sistemas de revisión sistemáticos tradicionales u métodos basados en la optimización, este trabajo enfatiza la sobrecarga mínima y la alta relevancia mediante el uso de incrustaciones basadas en transformadores y similitud de coseno. Al proporcionar un título en papel y un resumen, genera palabras clave relevantes, obtiene documentos relevantes del repositorio de acceso abierto y los clasifica en función de su cercanía semántica con la entrada. Se evaluaron tres modelos de incrustación. Luego se aplica un enfoque de umbral estadístico para filtrar documentos relevantes, lo que permite una tubería de revisión de literatura efectiva. A pesar de la ausencia de retroalimentación heurística o etiquetas de relevancia de verdad terrestre, el sistema propuesto se muestra prometedor como una herramienta escalable y práctica para la investigación preliminar y el análisis exploratorio.
Publicado Originalme en export.arxiv.org El 21 de septiembre de 2025.
Ver Fuente Original