Resumen:La rápida integración de algoritmos de IA en aplicaciones críticas para la seguridad, como la conducción autónoma y la atención médica, está generando importantes preocupaciones sobre la capacidad de cumplir con estrictos estándares de seguridad. Las herramientas tradicionales para la verificación formal de la seguridad luchan con la naturaleza de caja negra de los sistemas impulsados por IA y carecen de la flexibilidad necesaria para adaptarse a la complejidad de las aplicaciones del mundo real. En este artículo, presentamos un enfoque basado en datos para la verificación y síntesis de la seguridad de sistemas de caja negra con dinámica estocástica de tiempo discreto. Empleamos el concepto de certificados de barrera de control, que pueden garantizar la seguridad del sistema, y aprendemos el certificado directamente de un conjunto de trayectorias del sistema. Usamos incrustaciones de medias condicionales para incrustar datos del sistema en un espacio de Hilbert del núcleo de reproducción (RKHS) y construimos un conjunto de ambigüedad RKHS que se puede inflar para robustecer el resultado ante un comportamiento fuera de distribución. Proporcionamos los resultados teóricos sobre cómo aplicar el enfoque a clases generales de especificaciones lógicas temporales más allá de la seguridad. Para el cálculo de barreras de seguridad basado en datos, aprovechamos una expansión finita de Fourier para plantear un problema de optimización semiinfinito típicamente intratable como un programa lineal. La barrera espectral resultante nos permite aprovechar la rápida transformada de Fourier para generar el problema relajado de manera eficiente, ofreciendo un marco escalable pero distributivamente robusto para verificar la seguridad. Nuestro trabajo va más allá de los supuestos restrictivos sobre la dinámica y la incertidumbre del sistema, como lo demuestran dos estudios de caso que incluyen un sistema de caja negra con un controlador de red neuronal.
Publicado originalmente en export.arxiv.org el 20 de enero de 2026.
Ver fuente original
