Refinamiento del flujo de trabajo impulsado por fallas

Resumen: La optimización de los flujos de trabajo basados en LLM generalmente se formula como una búsqueda global, donde los flujos de trabajo candidatos se evalúan en función de una métrica escalar. Este paradigma, sin embargo, adolece de un defecto crítico: el colapso de la información. Al reducir los rastros de ejecución enriquecidos de varios pasos a simples señales de éxito/fracaso, los métodos existentes se vuelven ciegos a la estructura subyacente de los fallos, lo que fundamentalmente les impide modelar la distribución de fallos del flujo de trabajo. Reconceptualizamos este desafío como un problema distributivo. Proponemos un nuevo paradigma donde el objetivo de optimización no es maximizar una puntuación escalar, sino minimizar directamente la masa de falla esperada de un flujo de trabajo, es decir, la integral de su función de densidad de probabilidad de falla definida sobre un espacio de firma de falla (FSS) de alta dimensión. Esta lente distributiva nos permite pasar de una optimización ineficiente de orden cero a un descenso basado en principios, similar a un gradiente, en el propio panorama de fallas. Presentamos CE-Graph, un marco que pone en práctica este paradigma a través de un proceso de refinamiento novedoso impulsado por fallas. CE-Graph aproxima la distribución de fallas a partir de un conjunto de contraejemplos, identifica sus regiones más densas como modos de falla recurrentes y aplica ediciones de gráficos específicas y limitadas por el operador a través de un mecanismo de propuesta y verificación para reducir con avidez la masa de fallas. En los puntos de referencia de matemáticas, código y control de calidad, nuestro CE-Graph logra una mayor solidez a un costo significativamente menor que las líneas de base sólidas. Esto sugiere que la confiabilidad de un sistema surge no de evitar fallas, sino de aprender y remodelar sistemáticamente la estructura geométrica de sus distribuciones de fallas.

Publicado originalmente en export.arxiv.org el 13 de octubre de 2025.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

El plan de acción de AI de Trump es una distracción

MathBode: huellas dactilares de dominio de frecuencia del razonamiento matemático LLM

Grupos de certificación europea de ciberseguridad Grupo sobre criptografía Mecanismos criptográficos acordados

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido