Resumen: El marco emplea una estrategia de fusión estructurada en la que estructuras KE seleccionadas por expertos guían las indicaciones de LLM para facilitar el descubrimiento de triples de conocimiento alineados semánticamente. Evaluamos esta metodología en la biblioteca LangExtract de Google e investigamos el impacto de la utilización de la ventana de contexto comparando la inferencia localizada basada en segmentos con el procesamiento a nivel de documento. Contrariamente a observaciones empíricas previas sobre la degradación del contexto prolongado en los LLM, el procesamiento a nivel de documentos mejora la recuperación de dependencias procesales no lineales.
Para garantizar la procedencia de alta fidelidad requerida en las operaciones aeroportuarias, el marco propuesto fusiona un modelo probabilístico para el descubrimiento y un algoritmo determinista para anclar cada extracción a su fuente terrestre. Esto garantiza una trazabilidad y verificabilidad absolutas, cerrando la brecha entre los resultados generativos de “caja negra” y la transparencia requerida para las herramientas operativas. Finalmente, presentamos un marco automatizado que pone en funcionamiento este canal para sintetizar flujos de trabajo operativos complejos a partir de corpus textuales no estructurados.
Publicado originalmente en export.arxiv.org el 29 de marzo de 2026.
Ver fuente original
