Resumen: La IA se ha vuelto integral a áreas críticas de seguridad como los sistemas de conducción autónomos (AD) y la robótica. La arquitectura de los sistemas autónomos recientes está en tendencia hacia las arquitecturas monolíticas de extremo a extremo (E2E), como los modelos de idiomas grandes (LLM) y los modelos de lenguaje de visión (VLMS). En este documento, revisamos diferentes soluciones arquitectónicas y luego evaluamos la eficacia de los análisis de seguridad comunes, como los modos de falla y el análisis de efectos (FMEA) y el análisis de árbol de fallas (TLC). Mostramos cómo estas técnicas pueden mejorarse para la naturaleza compleja de los modelos fundamentales, particularmente en cómo se forman y utilizan representaciones latentes. Introducimos el marco de análisis arquitectónico de seguridad híbrido Hysafe-AI para sistemas de IA, un marco híbrido que adapta los métodos tradicionales para evaluar la seguridad de los sistemas de IA. Por último, ofrecemos toques de trabajo futuro y sugerencias para guiar la evolución de los futuros estándares de seguridad de IA.
Publicado Originalme en export.arxiv.org El 23 de julio de 2025.
Ver Fuente Original