Resumen: Los contrafactuales se usan ampliamente en AI para explicar cómo los cambios mínimos en la entrada de un modelo pueden conducir a una salida diferente. Sin embargo, los métodos establecidos para calcular los contrafactuales generalmente se centran en la toma de decisiones de un solo paso, y no son directamente aplicables a las tareas de toma de decisiones secuenciales. Este documento llena este vacío al introducir estrategias contrafactuales para los procesos de decisión de Markov (MDP). Durante la ejecución de MDP, una estrategia decide cuál de las acciones habilitadas (con efectos probabilísticos conocidos) ejecuta a continuación. Dada una estrategia inicial que alcanza un resultado no deseado con una probabilidad por encima de algún límite, identificamos cambios mínimos en la estrategia inicial para reducir esa probabilidad por debajo del límite. Codificamos las estrategias contrafactuales como soluciones a los problemas de optimización no lineales, y ampliamos aún más nuestra codificación para sintetizar diversas estrategias contrafactuales. Evaluamos nuestro enfoque en cuatro conjuntos de datos del mundo real y demostramos su viabilidad práctica en tareas de toma de decisiones secuenciales sofisticadas.
Publicado Originalme en rss.arxiv.org El 14 de mayo de 2025.
Ver Fuente Original