FAME: Explicación mínima abstracta formal para redes neuronales

Resumen: Proponemos FAME (Explicaciones mínimas abstractas formales), una nueva clase de explicaciones abductivas basadas en la interpretación abstracta. FAME es el primer método que escala a grandes redes neuronales y al mismo tiempo reduce el tamaño de la explicación. Nuestra principal contribución es el diseño de dominios de perturbación dedicados que eliminan la necesidad de un orden transversal. FAME reduce progresivamente estos dominios y aprovecha los límites basados en LiRPA para descartar características irrelevantes, convergiendo en última instancia en una explicación mínima abstracta formal. Para evaluar la calidad de la explicación, introducimos un procedimiento que mide la distancia en el peor de los casos entre una explicación mínima abstracta y una explicación mínima verdadera. Este procedimiento combina ataques adversarios con un paso de refinamiento VERIX+ opcional. Comparamos FAME con VERIX+ y demostramos ganancias consistentes tanto en el tamaño de la explicación como en el tiempo de ejecución en redes neuronales de mediana y gran escala.

Publicado originalmente en export.arxiv.org el 11 de marzo de 2026.
Ver fuente original

admin

Aviso de privacidad

Súbete a la ola del IoT

Contacto

Please Share This Compartir este contenido

admin

También podría gustarte

LARC: Hacia la planificación de retrosínesis restringida a nivel humano a través de un marco de agente

El índice de exageración de la IA: la gente no se cansa del desperdicio de la IA

Aprendizaje por refuerzo profundo consciente de las previsiones para una programación eficiente de la carga eléctrica en granjas lecheras

Aviso de privacidad

test

Súbete a la ola del IoT

Contacto

Compartir este contenido