Resumen: Las estrategias de muestreo negativo (NS) juegan un papel crucial en la representación de gráficos de conocimiento. Para superar las limitaciones de las estrategias de muestreo negativo existentes, como la vulnerabilidad a falsos negativos, la generalización limitada y la falta de control sobre la dureza de la muestra, proponemos DANS-KGC (muestreo negativo adaptativo basado en difusión para completar gráficos de conocimiento). DANS-KGC consta de tres componentes clave: el Módulo de Evaluación de Dificultad (DAM), el Módulo de Muestreo Negativo Adaptativo (ANS) y el Mecanismo de Entrenamiento Dinámico (DTM). DAM evalúa la dificultad de aprendizaje de las entidades integrando características semánticas y estructurales. Con base en esta evaluación, ANS emplea un modelo de difusión condicional con programación de ruido consciente de la dificultad, aprovechando la información semántica y de vecindad durante la fase de eliminación de ruido para generar muestras negativas de diversa dureza. DTM mejora aún más el aprendizaje al ajustar dinámicamente la distribución de dureza de las muestras negativas a lo largo del entrenamiento, lo que permite una progresión estilo plan de estudios de ejemplos fáciles a difíciles. Amplios experimentos en seis conjuntos de datos de referencia demuestran la eficacia y la capacidad de generalización de DANS-KGC, y el método logra resultados de última generación en las tres métricas de evaluación para los conjuntos de datos UMLS y YAGO3-10.
Publicado originalmente en export.arxiv.org el 11 de noviembre de 2025.
Ver fuente original
