Mejora del razonamiento de LLM con compresión de gráficos atribuida a texto semántico y estructural consciente de la homofilia

Resumen: Los modelos de lenguajes grandes (LLM) han demostrado capacidades prometedoras en la comprensión de gráficos atribuidos a texto (TAG). Los estudios recientes generalmente se centran en verbalizar las estructuras del gráfico a través de indicaciones hechas a mano, alimentando el nodo objetivo y su contexto de vecindario en los LLM. Sin embargo, limitados por la ventana de contexto, los métodos existentes recurren principalmente al muestreo aleatorio, a menudo implementado mediante la eliminación aleatoria de nodos/bordes, lo que inevitablemente introduce ruido y provoca inestabilidad en el razonamiento. Argumentamos que los gráficos contienen inherentemente rica información estructural y semántica, y que su explotación efectiva puede desbloquear ganancias potenciales en el desempeño del razonamiento de los LLM. Con este fin, proponemos una compresión estructural y semántica consciente de la homofilia para LLM (HS2C), un marco centrado en explotar la homofilia de gráficos. Estructuralmente, guiados por el principio de minimización de entropía estructural, realizamos una partición jerárquica global que decodifica la topología esencial del gráfico. Esta partición identifica comunidades homófilas y naturalmente cohesivas, al tiempo que descarta el ruido estocástico de la conectividad. Semánticamente, entregamos la homofilia estructural detectada al LLM, permitiéndole realizar una agregación semántica diferenciada basada en el tipo de comunidad predefinido. Este proceso comprime contextos de fondo redundantes en un consenso conciso a nivel comunitario, preservando selectivamente información semánticamente homófila alineada con los nodos objetivo. Amplios experimentos en 10 puntos de referencia a nivel de nodo en LLM de diferentes tamaños y familias demuestran que, al alimentar a los LLM con entradas estructural y semánticamente comprimidas, HS2C mejora simultáneamente la tasa de compresión y la precisión de la inferencia posterior, validando su superioridad y escalabilidad. Las extensiones a 7 puntos de referencia diversos a nivel de gráficos consolidan aún más la generalización de tareas de HS2C.

Publicado originalmente en export.arxiv.org el 13 de enero de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

El perro guardián de IA de Estados Unidos está perdiendo su mordisco

Un sistema basado en Llama-4 109b de Generation Llama-4 109 de recuperación automatizada para evaluar los planes de tratamiento de radioterapia

Planificación categórica difusa: satisfacción autónoma de objetivos con restricciones semánticas graduadas

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido