Resumen: Puede haber muchas explicaciones competidoras y contradictorias para una sola predicción de modelo, lo que dificulta la selección de cuál usar. Los marcos de evaluación de explicaciones actuales miden la calidad de la calidad comparando con explicaciones ideales de “verdad terrestre”, o verificando la sensibilidad del modelo a entradas importantes. Describimos las limitaciones de estos enfoques y proponemos tres principios deseables para fundamentar el desarrollo futuro de las estrategias de evaluación de explicaciones para las explicaciones de importancia de características locales. Proponemos un Marco de Evaluación de Explicación Agnóstica de la verdad en tierra (AX) para evaluar y comparar las explicaciones del modelo que satisface estos principios. A diferencia de los enfoques anteriores, AX no requiere acceso a explicaciones ideales de verdad en tierra para la comparación, o confía en la sensibilidad del modelo, proporcionando una medida independiente de calidad de explicación. Verificamos AX en comparación con las líneas de base y mostramos cómo se puede usar para detectar explicación de lavado fanto. Nuestro código está disponible en esta URL HTTPS.
Publicado Originalme en rss.arxiv.org El 15 de mayo de 2025.
Ver Fuente Original