Resumen: Los métodos de atribución de características basados en la teoría de juegos son ubicuos en el campo de la inteligencia artificial explicable (XAI). Los trabajos recientes propusieron una rigurosa atribución de características utilizando explicaciones basadas en la lógica, específicamente dirigidos a los usos de alto riesgo de los modelos de aprendizaje automático (ML). Por lo general, tales obras explotan la explicación abductiva débil (WAXP) como la función característica para asignar importancia a las características. Sin embargo, una posible desventaja es que se descuida la contribución de los conjuntos no WAXP. De hecho, los conjuntos no WAXP también pueden transmitir información importante, debido a la relación entre explicaciones formales (XPS) y ejemplos adversos (AEX). En consecuencia, este documento aprovecha el valor de Shapley y el índice Banzhaf para diseñar dos puntajes de importancia de características novedosas. Tenemos en cuenta los conjuntos no WAXP al calcular la contribución de las características, y los puntajes novedosos cuantifican cuán efectiva es cada característica para excluir AEX. Además, el documento identifica las propiedades y estudia la complejidad computacional de los puntajes propuestos.
Publicado Originalme en export.arxiv.org El 18 de agosto de 2025.
Ver Fuente Original