Extracción de gráficos procesales de múltiples agentes con refinamiento estructural y lógico

Resumen:La extracción automática de flujos de trabajo como gráficos de procedimientos a partir del lenguaje natural es prometedora pero poco explorada y exige tanto validez estructural como alineación lógica. Si bien los modelos de lenguajes grandes (LLM) recientes muestran potencial para la extracción de gráficos de procedimientos, a menudo producen estructuras mal formadas o malinterpretan los flujos lógicos. Presentamos model{}, un marco de trabajo de múltiples agentes que formula la extracción de gráficos de procedimiento como un proceso de razonamiento de múltiples rondas con refinamiento estructural y lógico dedicado. El marco se repite a través de tres etapas: (1) una fase de extracción de gráficos con el agente constructor de gráficos, (2) una fase de retroalimentación estructural en la que un agente de simulación diagnostica y explica defectos estructurales, y (3) una fase de retroalimentación lógica en la que un agente semántico alinea la semántica entre la lógica de flujo y las señales lingüísticas en el texto fuente. Los comentarios importantes se priorizan y se expresan en lenguaje natural, que se inyecta en indicaciones posteriores, lo que permite un refinamiento interpretable y controlable. Este diseño modular permite a los agentes centrarse en distintos tipos de errores sin supervisión ni actualizaciones de parámetros. Los experimentos demuestran que model{} logra mejoras sustanciales tanto en la corrección estructural como en la coherencia lógica sobre líneas de base sólidas.

Publicado originalmente en export.arxiv.org el 27 de enero de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

ChiEngMixBench: Evaluación de modelos de lenguaje grandes en generación mixta de código chino-inglés natural y espontáneo

Rechazo dependiente del estado e incapacidad aprendida en modelos lingüísticos alineados con RLHF

¿Qué mide realmente tu punto de referencia? Un marco para una inferencia robusta de capacidades de IA

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido