Resumen: La finalización del gráfico de conocimiento tiene como objetivo abordar las brechas de las bases de conocimiento agregando nuevos triples que representan hechos. La complejidad de esta tarea depende de cuántas partes de un triple ya se conocen. La finalización de la instancia implica predecir el par de la cola de relación cuando solo se da la cabeza (h,?,?). En particular, las bases de conocimiento modernas a menudo contienen descripciones y tipos de entidades, que pueden proporcionar un contexto valioso para inferir hechos faltantes. Al aprovechar estas descripciones textuales y la capacidad de los grandes modelos de lenguaje para extraer hechos de ellos y reconocer los patrones dentro del esquema de gráficos de conocimiento, proponemos un enfoque de finalización de instancias de extremo a extremo con motor LLM. Específicamente, presentamos Genic: un marco de finalización de instancia generativo de dos pasos. El primer paso se centra en la predicción de la propiedad, tratada como una tarea de clasificación de múltiples etiquetas. El segundo paso es la predicción de enlaces, enmarcada como una tarea de secuencia a secuencia generativa. Los resultados experimentales en tres conjuntos de datos muestran que nuestro método supera a las líneas de base existentes. Nuestro código está disponible en esta URL HTTPS.
Publicado Originalme en rss.arxiv.org El 1 de junio de 2025.
Ver Fuente Original