 Resumen: La llegada de los grandes modelos de lenguaje (LLM) ha revolucionado la integración de gráficos de conocimiento (KG) en las ciencias biomédicas y cognitivas, superando las limitaciones de los métodos tradicionales de aprendizaje automático para capturar vínculos semánticos intrincados entre genes, enfermedades y procesos cognitivos. Presentamos MultiCNKG, un marco innovador que fusiona tres fuentes de conocimiento clave: el gráfico de conocimiento de neurociencia cognitiva (CNKG) con 2,9 mil nodos y 4,3 mil aristas en 9 tipos de nodos y 20 tipos de aristas; Gene Ontology (GO) con 43.000 nodos y 75.000 aristas en 3 tipos de nodos y 4 tipos de aristas; y Ontología de enfermedades (DO), que comprende 11,2 000 nodos y 8,8 000 aristas con 1 tipo de nodo y 2 tipos de aristas. Aprovechando los LLM como GPT-4, realizamos alineación de entidades, cálculo de similitud semántica y aumento de gráficos para crear un KG cohesivo que interconecta mecanismos genéticos, trastornos neurológicos y funciones cognitivas. El MultiCNKG resultante abarca 6,9K nodos en 5 tipos (por ejemplo, genes, enfermedades, procesos cognitivos) y 11,3K aristas que abarcan 7 tipos (por ejemplo, causas, asociadas con, regulaciones), lo que facilita una visión de múltiples capas desde dominios moleculares hasta dominios de comportamiento. Las evaluaciones que utilizan métricas como precisión (85,20%), recuerdo (87,30%), cobertura (92,18%), consistencia gráfica (82,50%), detección de novedades (40,28%) y validación de expertos (89,50%) afirman su solidez y coherencia. Las evaluaciones de predicción de enlaces con modelos como TransE (MR: 391, MRR: 0,411) y RotatE (MR: 263, MRR: 0,395) muestran un rendimiento competitivo frente a puntos de referencia como FB15k-237 y WN18RR. Este KG avanza en aplicaciones en medicina personalizada, diagnóstico de trastornos cognitivos y formulación de hipótesis en neurociencia cognitiva.
Resumen: La llegada de los grandes modelos de lenguaje (LLM) ha revolucionado la integración de gráficos de conocimiento (KG) en las ciencias biomédicas y cognitivas, superando las limitaciones de los métodos tradicionales de aprendizaje automático para capturar vínculos semánticos intrincados entre genes, enfermedades y procesos cognitivos. Presentamos MultiCNKG, un marco innovador que fusiona tres fuentes de conocimiento clave: el gráfico de conocimiento de neurociencia cognitiva (CNKG) con 2,9 mil nodos y 4,3 mil aristas en 9 tipos de nodos y 20 tipos de aristas; Gene Ontology (GO) con 43.000 nodos y 75.000 aristas en 3 tipos de nodos y 4 tipos de aristas; y Ontología de enfermedades (DO), que comprende 11,2 000 nodos y 8,8 000 aristas con 1 tipo de nodo y 2 tipos de aristas. Aprovechando los LLM como GPT-4, realizamos alineación de entidades, cálculo de similitud semántica y aumento de gráficos para crear un KG cohesivo que interconecta mecanismos genéticos, trastornos neurológicos y funciones cognitivas. El MultiCNKG resultante abarca 6,9K nodos en 5 tipos (por ejemplo, genes, enfermedades, procesos cognitivos) y 11,3K aristas que abarcan 7 tipos (por ejemplo, causas, asociadas con, regulaciones), lo que facilita una visión de múltiples capas desde dominios moleculares hasta dominios de comportamiento. Las evaluaciones que utilizan métricas como precisión (85,20%), recuerdo (87,30%), cobertura (92,18%), consistencia gráfica (82,50%), detección de novedades (40,28%) y validación de expertos (89,50%) afirman su solidez y coherencia. Las evaluaciones de predicción de enlaces con modelos como TransE (MR: 391, MRR: 0,411) y RotatE (MR: 263, MRR: 0,395) muestran un rendimiento competitivo frente a puntos de referencia como FB15k-237 y WN18RR. Este KG avanza en aplicaciones en medicina personalizada, diagnóstico de trastornos cognitivos y formulación de hipótesis en neurociencia cognitiva.
Publicado originalmente en export.arxiv.org el 8 de octubre de 2025.
Ver fuente original

 
 
			 
							 
							 
							