Resumen: Los gráficos de conocimiento han surgido como estructuras fundamentales para representar datos relacionales complejos en dominios científicos y empresariales. Sin embargo, los métodos de integración existentes enfrentan limitaciones críticas al modelar diversos tipos de relaciones a escala: los modelos euclidianos luchan con las jerarquías, los modelos de espacio vectorial no pueden capturar la asimetría y los modelos hiperbólicos fallan en las relaciones simétricas. Proponemos HyperComplEx, un marco de integración híbrido que combina de forma adaptativa espacios hiperbólicos, complejos y euclidianos a través de mecanismos de atención aprendidos. Una estrategia de ponderación espacial específica de la relación selecciona dinámicamente geometrías óptimas para cada tipo de relación, mientras que una pérdida de consistencia en múltiples espacios garantiza predicciones coherentes en todos los espacios. Evaluamos HyperComplEx en gráficos de conocimiento de investigación en ciencias de la computación que van desde 1K artículos (~25K triples) hasta 10M artículos (~45M triples), lo que demuestra mejoras consistentes con respecto a las líneas de base de última generación, incluidas TransE, RotatE, DistMult, ComplEx, SEPA y UltraE. Pruebas adicionales en puntos de referencia estándar confirman resultados significativamente más altos que todos los puntos de referencia. En el conjunto de datos de papel de 10 millones, HyperComplEx logra 0,612 MRR, una ganancia relativa del 4,8% sobre la mejor línea de base, mientras mantiene un entrenamiento eficiente, logrando una inferencia de 85 ms por triple. El modelo escala casi linealmente con el tamaño del gráfico mediante la asignación de dimensiones adaptativa. Lanzamos nuestra familia de implementaciones y conjuntos de datos para facilitar la investigación reproducible en incorporaciones de gráficos de conocimiento escalables.
Publicado originalmente en export.arxiv.org el 17 de noviembre de 2025.
Ver fuente original
