Resumen:La extracción automática de flujos de trabajo como gráficos de procedimientos a partir del lenguaje natural es prometedora pero poco explorada y exige tanto validez estructural como alineación lógica. Si bien los modelos de lenguajes grandes (LLM) recientes muestran potencial para la extracción de gráficos de procedimientos, a menudo producen estructuras mal formadas o malinterpretan los flujos lógicos. Presentamos model{}, un marco de trabajo de múltiples agentes que formula la extracción de gráficos de procedimiento como un proceso de razonamiento de múltiples rondas con refinamiento estructural y lógico dedicado. El marco se repite a través de tres etapas: (1) una fase de extracción de gráficos con el agente constructor de gráficos, (2) una fase de retroalimentación estructural en la que un agente de simulación diagnostica y explica defectos estructurales, y (3) una fase de retroalimentación lógica en la que un agente semántico alinea la semántica entre la lógica de flujo y las señales lingüísticas en el texto fuente. Los comentarios importantes se priorizan y se expresan en lenguaje natural, que se inyecta en indicaciones posteriores, lo que permite un refinamiento interpretable y controlable. Este diseño modular permite a los agentes centrarse en distintos tipos de errores sin supervisión ni actualizaciones de parámetros. Los experimentos demuestran que model{} logra mejoras sustanciales tanto en la corrección estructural como en la coherencia lógica sobre líneas de base sólidas.
Publicado originalmente en export.arxiv.org el 27 de enero de 2026.
Ver fuente original
